OpenAI 发布 o1 模型,背后是精密的营销策略。
OpenAI的o1-preview模型让人眼前一亮,但实际情况并非如此。网传模型在IMO测试中取得83%正确率,实际上是针对美国高中生水平的AIME考试,并且并非模型一次性解答,而是通过生成64个答案并进行投票得出结果。真正达到83%正确率的是尚未开放访问的o1模型,并非o1-preview。更详细的测试结果请查看 (https://openai.com/index/learning-to-reason-with-llms/).
页:
[1]