使用ChatGPT plus的用户今天打开ChatGPT后会发现,相比之前的模型选项,多了两个新的模型:o1-preview ,和o1-mini。 距离上次发布模型更新感觉有好长一段时间了,这次这个模型有什么特点呢?
打开openAI官网的介绍 Introducing OpenAI o1-preview,以及twitter上面发布的更新,真是不看不知道,一看吓一跳呀,这次更新对于编程简直是重大利好。根据介绍,相比之前的模型,它尤其在科学、编程和数学方面,解决复杂问题又了大的提高。并且,这是一个全新的一个系列的模型,命名从 o1 开始。
并且在国际数学奥林匹克(IMO)的资格考试中,GPT-4o 仅正确解决了 13% 的问题,而推理模型得分为 83%。他们的编程能力在比赛中得到了评估,并在 Codeforces 竞赛中达到了第 89 个百分位,可见在数据上面,提升是相当的大。
但是,其模型的用量也是相当珍贵的。o1-preview 的每周消息限制为 30 条,o1-mini 为 50 条。相比之前每小时30条、50条的限制,这个听上去着实有些少了。
# 01-preview 真实体验
那么,正好手头上有个比较麻烦的问题,就用它来尝试一下,看看这个怎么样。在一个安卓旧项目中,写一个复杂的交互时候,有个奇怪的bug一直没有解决。在用o1-preview之前,已经用 GPT-4o 和 claude 3.5 sonnet 尝试了多次,但是依然没能解决问题。
这个问题涉及的代码比较多,并且分布在多个文件中。我直接将问题和代码一次性粘贴到输入框,然后等待奇迹。到这一步就发现了区别,相比之前稍微等待然后立马给出结果, o1-preview 有了一个思考的过程,打开之后,可以看到类似这样的流程。
这个流程,不是妥妥的类似于真人思考和调试的步骤吗?观察、分析、查看、测量、计算,真的有点意思。等这个流程结束之后,开始输出结果。
输出的结果相比GPT-4o 模型要详细太多了。 首先,它说明了问题所在,以及要用什么样的解决方案。然后,会一步一步说明具体要修改的文件及方法,这个跟之前的巨大区别是,这个代码是非常全的,并且完成之后,给出具体的说明,每一个文件或者方法的修改都是这样的。 最后,再给出这个解决方法的具体总结。
如果说以前ChatGPT可以用来处理具体的代码问题,帮我们完成一些功能的话,那么,o1-preview则是可以直接给出一个问题的完全的解决方案。以前可能需要拆分出很多个小问题的问题或者方案,现在可以直接一步完成了。这么看来,一周30条的限制也是合理的,毕竟o1-preview一条对话就可以完成之前很多步都不一定完成的事情,对于大多数人来说,需要用o1-preview来解决的问题,可以每周并不会遇到那么多。
之前还在考虑是订阅claude pro还是ChatGPT plus的同学,如果你的使用目的是编程、科学或者数学的话,暂时可以直接无脑订阅ChatGPT plus了,毕竟,它的表现确实让人很惊艳。参考 《掌握Claude Pro: 打造学习与效率的终极利器》。