OpenAI 的 o1-preview 展现了更强的推理能力。尽管新型语言模型 GPT-4o 已经相当先进,但它在识别单词 “strawberry” 中字符 “r” 的数量这样简单推理能力时却显得差强人意。

这一现象似乎佐证了麻省理工学院近期在《自然》上发表的一篇文章《Language is primarily a tool for communication rather than thought》,该文认为 “语言主要是用于交流的工具,而非思考的工具,对任何经过测试的思维形式并非必需。” 虽然 GPT-4o 能够解析和生成语言,但它并不具备形式化推理的能力。

或许 OpenAI 在训练 o1 模型时使用了更多语言以外的数据,这使得 o1 具有了更强的推理能力。不过,实际效果如何,仍需进一步观察和测试。