号称博士生水准！OpenAI最新模型仍分不出9.11和9.8哪个大

9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。

按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页游戏。

这个游戏的目标是控制一只考拉躲避不断增加的草莓，并在3秒后找到出现的松鼠。这类游戏的逻辑相对复杂，更考验OpenAI o1的逻辑推理能力。

号称博士生水准！OpenAI最新模型仍分不出9.11和9.8哪个大第1张

官方还表示，相较于GPT-4o等现有的大模型，OpenAI o1能够解决更加困难的推理问题，同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理，在着手写代码前，把整个回答的流程全部思考完一遍，再动手输出代码。

不过，经过实测，OpenAI o1依然无法解决“9.11和9.8哪个大”的经典难题，严重扣分。

因为9.11和9.8哪个大这个问题，之前AI大模型集体失智，所以....

号称博士生水准！OpenAI最新模型仍分不出9.11和9.8哪个大第2张

☆未收藏(0)

本文由 @江畔何人初见月于 2024-09-14 发布在酷瑞百科，如有疑问，请联系我们。
本文链接：https://www.krbk.com/qydt/351986.html

江畔何人初见月,不畏浮云遮望眼，只缘身在最高层