今天开始体验国产大模型 DeepSeek ,前端时间刷到了一些短视频、文章的介绍,对这块国产大模型的评价还是挺高的,美其名曰国产之光。 那么想知道有没有一些问题可以简单测试不同大模型之间的综合能力的? 大家可以踊跃讨论呀,可以作为收藏

今天开始体验国产大模型 DeepSeek ,前端时间刷到了一些短视频、文章的介绍,对这块国产大模型的评价还是挺高的,美其名曰国产之光。 那么想知道有没有一些问题可以简单测试不同大模型之间的综合能力的? 大家可以踊跃讨论呀,可以作为收藏
1 CapNemo Jan 23, 2025 一套问题如果流行起来,很容易被针对优化。基本上是无解的。 |
2 ijk0 Jan 25, 2025 via iPhone 看看 livebench.ai |
3 GHvyuR7N Jan 26, 2025 via iPhone 问自己擅长的东西呀,判断是不是适合自己很重要,也很容易判断。 |
4 maymay5 Feb 12, 2025 自己不需要的生产力,很强又有什么意义 |