admin 发表于 2024-10-1 22:17:11

AI面临的棘手测试问题。

甲携来一本亮色书,它们分别有什么特点?它们的命名依据是什么?目前测试智谱和通义在不使用搜索的情况下都无法答对,它们完全无法理解这说的是什么(八种必需氨基酸)。看看哪位AI的知识面能涵盖到这一点?
通义最终搜索出来的结果(自然有他自己发挥的地方)更好一些。
发帖十分钟后,新增测试:4o-mini 3.5-turbo glm-4-alltool,claude3.5 gpt4-o-alltool,deepseek双版本全部宣告失败。
贴个正确答案做参考: [图片]
页: [1]
查看完整版本: AI面临的棘手测试问题。