2月7日,OpenAI突然宣布了一个重磅消息:他们决定公开最新模型o3-mini以及o3-mini(high)的思维链。简单来说,就是用户现在可以看到这两个模型是如何“思考”并得出结论的了。这一举措,无疑让AI的透明度又上了一个新台阶。
据了解,OpenAI的研究科学家Noam Brown在X平台上兴奋地发文称:“在o1-Preview发布前,我们向大家介绍草莓时,看到思维链(CoT)实时运行往往是他们的‘顿悟’时刻,这让他们意识到这将是一件大事。现在,我们很高兴能与世界分享这一体验!”他进一步解释说,o3-mini是首个能够持续准确解答井字棋问题的大语言模型,虽然概括后的思维链看起来有些混乱,但模型最终还是成功找到了正确答案。
不过,值得注意的是,OpenAI这次虽然公开了思维链,但也没完全公开。据外媒TechCrunch报道,他们仍然不会完全公开o3-mini的完整推理步骤,而是找到了一个“平衡点”。现在,o3-mini可以“自由思考”,然后整理出更详细的推理摘要供用户查看。这一调整,显然是出于竞争考虑的。在此之前,为了保护自己的技术秘密,OpenAI仅向用户提供推理摘要,甚至这些摘要有时并不准确。
为了提高清晰度和安全性,OpenAI还引入了一个额外的后处理步骤。模型会首先对“思维链”进行审查,剔除潜在的不安全内容,并对复杂概念进行适度简化。这一步骤还支持非英语用户,确保他们可以用自己的母语查看“思维链”,让体验更加友好和易懂。OpenAI发言人解释说:“我们致力于让AI更加透明和可信,同时也要保护我们的技术不被竞争对手轻易获取。”
实际上,推理透明度在AI领域正在成为一个重要的竞争点。让AI展示完整的推理步骤,不仅能提高用户信任度,还能让AI更容易被研究和改进。然而,公开思维链也可能带来风险,比如被竞争对手通过蒸馏技术提取模型的推理逻辑。在上周Reddit的AMA活动中,OpenAI首席产品官Kevin Weil就曾表示,他们正在努力展示比现在更多的推理过程,但是否展示完整的“思维链”仍未确定,因为这涉及竞争问题。
说到这里,就不得不提一下DeepSeek R1了。与OpenAI的o3-mini相比,DeepSeek R1的思维链是无条件公开透明的,其深度思考过程更是赢得了不少网友的点赞。AI旋风认为,OpenAI这次的“被迫”调整,显然是为了应对DeepSeek及其他AI公司的压力。
为了更直观地对比两个模型的差异,有网友@thegenioo第一时间上手实测了这次思维链的更新。他表示:“新版本不仅提供了更流畅的用户界面,还让模型的思考过程更加透明。”随后,他展示了DeepSeek R1与OpenAI o3-mini(high)在同一问题上的思考对比。
以“如何用5升和6升的水壶从池塘里取得3升的水”为例,DeepSeek R1的推理过程循序渐进、思路周密细腻,而o3-mini(high)则更加简洁明快、直指问题核心。这种差异也进一步反映在响应速度上:DeepSeek R1的思考时间相对较长,但答案更加完整详实;而o3-mini(high)则更快,但显得“公事公办”。
看完这些对比,AI旋风认为,两个模型各有千秋、难分伯仲。DeepSeek R1更像文科生,注重推理过程的完整性和逻辑性;而o3-mini(high)则更像理科生,追求效率和简洁。这种差异也反映了AI领域多元化的发展趋势。
然而,正如一位网友一针见血地指出:“如果没有DeepSeek,我们还能看到o3-mini哪怕是‘阉割版’的思维链吗?”这句话道出了OpenAI此次公开思维链背后的无奈和压力。在AI领域日益激烈的竞争环境下,各大公司都在努力提升自己的技术实力和透明度以赢得用户的信任和支持。
面对争议和质疑声,OpenAI CEO Sam Altman也在X平台上迅速作出了解释:“我们尝试整理原始的思维链使其更易读,并在需要时进行翻译,但尽量保持其原始风格。”这一回应虽然未能完全平息争议,但也显示出OpenAI对于用户反馈和透明度的重视。
总的来说,OpenAI公开o3-mini思维链这一举措无疑为AI领域带来了新的活力和话题。无论是DeepSeek R1还是o3-mini(high),它们都在用自己的方式推动着AI技术的进步和发展。