AI领域再一次迎来了重大突破!

北京时间今日凌晨,OpenAI正式发布名为OpenAI o1的新模型,即之前所传的“草莓”(Strawberry)模型,该模型可以执行一些类似人类的推理任务,在回复用户询问前会“花更多时间思考”。

OpenAI的CEO萨姆·奥尔特曼(Sam Altman)称其为“新范式的开始”。“o1”新一代大模型能够解决多步骤问题,在复杂推理、数学和编程问题方面,能够像人类一样思考解决问题的过程。

相较于过往的大模型,OpenAI o1大模型的核心逻辑是通过学习大量数据集中的模式,进而预测单词生成的序列,严格意义上来讲并未真正理解客户提问。

Open AI此次发布的新一代大模型“o1”,可谓打破了我们对LLM固有水平的认知。“对于复杂的推理任务而言,这是一个重大进步,代表了人工智能能力的新水平,”Open AI表示。

会像人类一样“花时间思考”

Open AI发布的新一代大模型“o1”,在接收到用户询问后,在作出回答钱,会像人类一样“花时间思考”,用时约10—20秒,进而产生一个内部思路链,从而尝试不同的策略并识别自身的错误。

因具备更为强大到推理能力,因而“o1”在多个行业具有更多应用潜力,尤其是复杂的科学、数学和编程任务。

譬如,在处理物理、化学等问题时,“o1”的表现甚至和该领域的博士生水平不相上下;

再譬如,在国际数学奥林匹克的资格考试中,“o1”的正确率为83%,能够成功进入美国前500名学生的行列,而GPT-4o模型的正确率仅为13%;在编程能力比赛Codeforces中,“o1”模型拿到89%百分位的成绩,而GPT-4o只有11%。

*对复杂数学问题的思路链

未来,该模型还有更多潜在的应用场景,如医疗研究人员可利用该模型来标注细胞测序数据;物理学家可借助o1模型生成量子光学所需的复杂数学公式;软件开发者则可借助它来构建和执行复杂的工作流程等。

在这里插入图片描述

缺点与局限

作为“o1”大模型的最初始版本,其也有着明显的缺点与局限。

首先,其使用价格非常昂贵。

据悉,“o1”系列共包含三款模型:OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。这两款模型从今天开始对用户开放使用:

  • OpenAI o1:高级推理模型,暂不对外开放;

  • OpenAI o1-preview:这个版本更注重深度推理处理,每周可使用30次;

  • OpenAI o1-mini:这个版本更高效、划算,适用于编码任务,每周可以使用50次。

然而,OpenAI o1-preview版定价是每百万个输入tokens 15美元,每百万个输出tokens价格为60美元,分别是GPT-4o的3倍和4倍(一百万tokens大致相当于75万个英文单词)。

其次,该模型无法浏览实时网页、无法上传文件和图片、缺乏广泛的世界知识等。

目前,“o1”大模型只是一款“纯文字版”,暂时无法浏览网页信息以及上传文件和图片,这意味着它不具备ChatGPT的许多使用功能,在许多常见用例中不如GPT-4o那么强大,而且还有用量限制,o1-preview版每周上限为30条消息,o1-mini版每周上限为50条。

此外,“o1”大模型在很多领域的能力不如GPT-4o,譬如在关于世界的事实知识方面表现不佳;有的用例下推理能力较慢,需要更长的时间来回答问题;目前o1只是一个纯文本模型,缺乏针对特定文档进行推理,或者从网络收集实时信息的能力。

此外,让AI模型玩井字棋(Tic-Tac-Toe)一直被认为是个业界难题,拥有推理能力的“o1”大模型也还是会在这个游戏中出错,无法完全攻克技术难关。

那么,如何系统的去学习大模型LLM?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~

篇幅有限,部分资料如下:

👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点,扫盲必看!
在这里插入图片描述
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。

路线图很大就不一一展示了 (文末领取)
在这里插入图片描述

👉大模型入门实战训练👈

💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥两本《中国大模型落地应用案例集》 收录了近两年151个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)
在这里插入图片描述

👉GitHub海量高星开源项目👈

💥收集整理了海量的开源项目,地址、代码、文档等等全都下载共享给大家一起学习!
在这里插入图片描述

👉LLM大模型学习视频👈

💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)
在这里插入图片描述

👉640份大模型行业报告(持续更新)👈

💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

👉获取方式:

这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐