昨晚半夜,OpenAI正式发布了o1 预览版!这是一系列新的 AI 模型,旨在在做出响应之前花更多时间进行思考。

为什么取名叫o1,OpenAI是这么说的:

For complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1.

翻译过来就是:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1

简单来说,这次模型的强悍,甚至让OpenAI不惜推掉了过去GPT系列的命名,重新起了一个o系列。

OpenAI o1发布,也标志着,AI行业,将快速推进AGI。

OpenAI最新o1模型怎么样

OpenAI最新版本的o1模型在数学能力、代码能力、和各种其他理科类的问题上表现得非常不错。

AIME 2024,一个高水平的数学竞赛,GPT4o准确率为13.4%,而这次的o1 预览版,是56.7%,还未发布的o1正式版,是83.3%。

代码竞赛,GPT4o准确率为11.0%,o1 预览版为62%,o1正式版,是89%

而最牛逼的博士级科学问题 (GPQA Diamond),GPT4o是56.1,人类专家水平是69.7,o1达到了恐怖的78%。

OpenAI最新o1模型能力测试

特别是在测试测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1 的表现全面超过了人类博士专家,这也是有史以来,第一个获得此成就的模型。

以后,文科类的问题使用Claude回答,理科相关的问题使用OpenAI最新的o1-preivew模型。

需要注意的是,目前OpenAI最新的o1模型在功能上阉割挺大,但是毕竟早期,表示理解。

o1模型限制

ChatGPT大玩家 很早就升级了ChatGPT Plus,并且一直都是ChatGPT Plus的用户。OpenAI发布了o1模型之后,那自然,第一时间试一试。

ChatGPT o1 模型使用次数限制

目前不支持曾经的所有功能,也就是没有图片理解、图片生成、代码解释器、网页搜索等等,只有一个可以对话的裸模型。

怎么使用OpenAI的o1模型

目前,o1模型已经逐步向所有ChatGPT Plus和 Team用户开放,也就是目前只有付费升级过的用户才可以使用最新的o1模型。

  • o1,新的大模型天花板,过于强大目前不方便对外公开。
  • o1-preiview,o1的预览版,可以立即提供给ChatGPT付费用户和API用户。
  • o1-mini,速度更快、性价比更高,适用于需要推理和无需广泛世界知识的任务。

o1-mini就是更快更小更便宜,推理啥的都不错,极度适合数学和代码,就是世界知识会差很多,适用于需要推理但不需要广泛世界知识的场景。

使用ChatGPT o1 模型

但是按照OpenAI的一贯特点,越是最新最强大的模型,使用限制就是越多的,而且价格也是越贵。

o1预览版使用限制30条/每周,o1-mini的50条/每周。

当前只有付费升级到ChatGPT Plus的用户才可以使用最新版本的o1模型。

如果你不知道怎么升级订阅ChatGPT Plus 会员的话,可以参考教程:国内如何升级订阅ChatGPT Plus教程

OpenAI最新o1模型好用吗

我使用o1模型,问了一个其他的大语言模型几乎都回答不上来的问题,看看o1模型能否正确回答。

问题是:

农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

OpenAI最新o1模型测试

思考了6秒时间,给了我一个很完美的回答,真的太牛了。

再来一个更难的,就是曾经姜萍那个比赛的奥数题,我甚至连题目都没有看懂,但是o1模型在思考了整整1分多钟之后,他给出了答案,而且完全正确!

OpenAI最新o1模型提示词

目前我自己试下来,感觉Prompt,未来可能也要重新摸索,在GPT为代表的快思考大模型时代,我们有很多所谓的一步一步思考之类的玩意,现在全都无效了,对o1甚至还有负效果。

目前针对OpenAI最新o1模型,我实践发现,使用下面这些提示词能够有效提高回答质量。

  • 保持提示简单直接:模型擅长理解和响应简短、清晰的指令,而不需要大量的指导。

  • 避免思路链提示:由于这些模型在内部进行推理,因此不需要提示它们“逐步思考”或“解释你的推理”。

  • 使用分隔符来提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来清楚地指示输入的不同部分,帮助模型适当地解释不同的部分。

  • 限制检索增强生成 (RAG) 中的附加上下文:提供附加上下文或文档时,仅包含最相关的信息,以防止模型过度复杂化其响应。

OpenAI最新o1模型的使用限制是多少

按照目前官方最新的通知:

o1预览版使用限制30条/每周,o1-mini的50条/每周。

注意是每周,这个使用限制真的非常严格,次数实在是太少了。当使用超过了限制就会有如下提示:

You’ve hit the Plus plan limit for o1-preview

Response will use another model until your limit resets September 18, 2024

出现类似上面的提示o1-preview使用已经超过了次数限制。

o1模型的使用限制

那么此时就只能使用其他的模型,等到o1-preview重新解锁之后才可以使用。

OpenAI最新o1模型值得升级使用吗?

就我个人来看,o1模型不愧是目前最为强大的大语言模型,但是鉴于它针对每个问题需要花费的思考时间、已经每周的使用次数,目前o1模型可能并不适合大部分人,也不适合日常使用。

但是o1的未来,在我看到,也绝对不止是一个普普通通的ChatGPT。而是我们前往下个时代,最伟大的基石。

所以说,建议大家都可以尝试,但是日常使用还是以GPT-4o为主。

OpenAI最新o1模型怎么升级使用

目前o1模型已经全面向所有ChatGPT Plus和 Team用户开放,也就是目前只有升级到ChatGPT Plus的用户才可以使用最新的o1模型。

但是因为OpenAI限制了国内银行卡,所以使用国内银行卡绑定支付OpenAI升级时,会提示绑卡支付失败。

目前最好升级的方式需要借助海外虚拟信用卡进行付费升级,目前最好用的虚拟海外信用卡是 WildCard

主要是,WildCard针对ChatGPT Plus的付费升级做了针对性优化,可以很方便完成升级,基本上2分钟就可以完成丝滑升级。

完美解决没有国外信用卡的问题:WildCard | 一分钟开卡,轻松订阅海外软件服务!

首先进入wildcard虚拟卡官网之后,选择 『立即开通』,这个才是虚拟卡。

wildcard开通虚拟卡

选择 『立即开通』 之后,就可以跳到 『我的卡片』 页面,进行开通虚拟卡就行,选择2年的就可以。

使用官方邀请码 GOGPT 是可以优惠开卡的,大家一定要记得用!!!

注册WildCard虚拟信用卡使用GOGPT邀请码

成功注册之后,进入WildCard首页,点击右边导航栏进入 [ ChatGPT Plus一键升级 ]

WildCard升级

然后按照官方给出的教程,一步步完成升级就可以啦,基本上整个流程非常的简单。

这就是国内用户使用支付宝充值购买ChatGPT Plus的完整流程!

在开通和使用ChatGPT Plus的过程中,如遇到任何问题,咨询在线客服就行了!在线客服响应速度很快。