
1 p7IySTldqB 286 天前 今年 AI 大爆发令人兴奋。 |
2 chipipi 286 天前 “工作中常见到的炮弹问题” |
3 Satansickle 286 天前 咋?老哥是华为驻非洲工程师? |
4 paopjian 286 天前 妈耶, 老哥是军工设计师么, 为什么会有弹道预测的问题 |
5 mingtdlb 286 天前 怎么认为他很强?  |
8 me1onsoda 286 天前 大模型好像都是发布一开始强无敌,然后开始降智了。大模型质量问题,应该要有个监管的机制。 |
9 lthon 286 天前 还在等 Claude 4 |
10 sunny352787 286 天前 哈哈哈哈哈哈这例子要吓死了,其实是做游戏的吧? |
11 LaTero OP |
12 LaTero OP @mingtdlb 判断字符本来就不是 AI 该做的事,因为原理上 AI 收到的都是 token ,一个 token 可能有好几个字。而且假如真的有了 AGI ,和人类一样的智力水平,你觉得它会浪费算力去数吗?假如是一个聪明的人类,他应该做的是使用工具。AGI 也应该是写一个程序去数,不是自己数。最近 AI 进步也都是在数学、逻辑推理等方面。 |
14 hiveex 286 天前 Poe 用户等上线体验 |
15 pizone 286 天前 不知什么时候能用上 Grok 3 的 api ,还是有点期待。 |
16 CodeAllen 286 天前 没必要问 AI 字符问题,这个跟 NLP 的 token 分词技术有关系,没什么意义。 这就有点像一个人口头问你,计算“饕餮盛宴”这几个字有几个笔画,能当面正确写下这四个字的人都不多吧,还得数笔画,有什么意义? |
17 sunny352787 286 天前 @LaTero 哎,同行的敏锐性~ |
18 stone9527 286 天前 |
19 LaTero OP @stone9527 没问题呀,现在主流的模型这个都不会错的吧。我平时主用 openrouter ,这个网站的 chatroom ,预设的几个问题就有 9.9 和 9.11 哪个大,还有 strawberry 里几个 r 。后者还有些模型会错,但是前者这样比大小的基本都是没问题的。 |
20 pkoukk 286 天前 强是很强.. 但是老用了快 10 万张 h100 ,居然只获得了 1400 分出头,仅仅比 R1 强 40 多分,3%左右 而且这么大的训练规模,预计参数量也不小,推理消耗估计也挺大 有点不及预期了 |
21 br00k 286 天前 试了下,感觉没有多少差距。不及预期。 |
23 yukino 286 天前 via Android 要不你跟隔壁 openai 楼的老哥打一架 |
24 kaedea 286 天前 via Android 做一下今年考公的行测题试试 |
25 Ehend 285 天前 编程领域感觉不如 chatgpt 和 deepseek |
26 gitxuzan 284 天前 编程方面不行,比 gpt 差 |
27 gitxuzan 284 天前 deepseek 如果有这么强的算力,不是要排行老大了。 |