AI竞赛加速!
不过,AI领域的竞争依然非常激烈。中国AI初创公司DeepSeek的爆火,正在推动海外AI巨头加速上新。
当地时间2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版,并在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking实验版,作为对近期走红的推理模型DeepSeek-R1和OpenAI旗下模型o3-mini的回应。
另外,2月7日,OpenAI公司在X平台发布推文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。
来看详细报道!
DeepSeek超越谷歌Gemini
在成功亮相仅两个月后,中国AI初创公司DeepSeek一飞冲天,成为全球第二大最受欢迎的AI聊天机器人。
据The Information报道,网站跟踪公司SimilarWeb估计,上周,在短短一周时间内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI。
DeepSeek和Gemini之间的差距在美国以外更大。SimilarWeb数据显示,1月31日,这个中国聊天AI在全球的访问量为2920万次,是 Gemini的三倍多。
据报道,DeepSeek成功的主要驱动力是开放式V3模型的推出,该模型吸引了全球开发人员和公司的关注。V3的训练成本为550万美元,明显低于美国类似解决方案的成本。同时,它的能力与ChatGPT的功能相当,但有一个重要的区别:该模型可以免费下载并在本地服务器上运行。这使得它对希望采用AI技术而不必依赖云服务的组织具有吸引力。
DeepSeek公司成立于2023年7月,是一家致力于实现通用人工智能的创新型科技公司。2024年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型。据官方技术论文披露,V3模型的总训练成本为557.6万美元,对比GPT-4o等模型的训练成本约为1亿美元。
, DeepSeek的人工智能助手在140个市场下载次数最多的移动应用程序排行榜上名列前茅。国外大型科技公司如微软、英伟达、亚马逊等已先后上线部署支持用户访问DeepSeek-R1模型。
招商证券指出,DeepSeek-V3奠定模型高效训练基础,R1通过大规模强化学习使开源模型推理能力追平o1。开源模型直接带来AI 产业模型能力普遍提升,同时低廉的使用成本搭配卓越的性能倒逼OpenAI降低GPT使用成本、加速模型迭代,促进产业生态繁荣。大模型能力普遍提升首先利好AI 应用开发,尤其小模型易于在端侧落地,长期看DeepSeek 带来的应是算力层面的杰文斯悖论,整体AI 应用生态繁荣应将带来推理算力的更大需求。
OpenAI、Google应对竞争
当地时间2月2日,OpenAI发布了一款名为“深层研究”的功能,并上传了演示视频。这项代理功能使用推理综合大量线上信息,并为用户完成多步骤研究任务。简单来说,就是“深层研究”可以从互联网上收集信息,并将其合成为简明的报告。
它将由OpenAI o3的一个版本提供支持,该模型针对网页浏览和数据分析进行了优化,可利用推理来搜索、解释和分析网上大量文本、图像和PDF,并根据信息做出必要的调整。OpenAI声称,deep research“只需数十分钟就能完成人类需要数小时才能完成的工作。”其首席产品官Kevin Weil也提到,它完成的任务对人类来说可能需要30分钟到30天不等。
另外,2月7日,OpenAI公司在X平台发布推文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。
像o3-mini这样的推理模型会在输出结果前进行彻底的事实核查,这有助于它们避免一些通常会困扰模型的陷阱,但推理模型需要更长时间才能得出解决方案。
OpenAI公司表示已经找到了一种平衡,让o3-mini可以“自由思考”,然后将其“想法”组织成详细的摘要,接下来通过额外的后处理步骤,审查原始思维链,删除任何不安全的内容,并简化任何复杂的思想,后续处理步骤还支持非英语用户以其母语接收思维链,从而创造更易于访问和友好的体验。
在AI领域,科技巨头谷歌也有大动作。据澎湃新闻消息,当地时间2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版,并在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking实验版,作为对近期走红的推理模型DeepSeek-R1和OpenAI旗下模型o3-mini的回应。
据介绍,性能强劲的Gemini 2.0 Pro实验版在编码等复杂任务上表现突出,拥有200万tokens的超长上下文窗口,可以编写完整的代码并包括所有正确的数据结构和搜索算法,使用数据结构的准确性很高。在通用、代码、推理、多模态、数学、长文本、图像、音视频等13项测试中,Gemini 2.0 Pro实验版在Gemini大家庭里拿下了11个第一名。目前,Gemini Advanced的订阅用户已经可以在App上试用2.0 Pro。
另一边,作为主力模型的Gemini 2.0 Flash在2024年的谷歌开发者大会上初次亮相,现在已经被集成到谷歌的AI产品中并开放API。该模型适用于大规模、高频率的任务,能够处理多达100万tokens的上下文窗口,拥有强大的多模态推理能力。Gemini 2.0 Flash支持多模态输入和文本单模态输出,在未来几个月内将提供多模态Live API。
校对:赵燕
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。