小樱知识 > 生活常识 > 「谁是」10余家大厂争做ChatGPT，谁是有实力，谁在蹭热度？

「谁是」10余家大厂争做ChatGPT，谁是有实力，谁在蹭热度？

提问时间：2023-02-13 14:12:01来源：Tech星球

来源 | Tech 星球

文 | 王琳陈桥辉杨晓鹤

最近，360 创始人周鸿祎又点评了互联网圈：在 ChatGPT 领域美国领先了我们，中国公司和科研人员要奋起直追。

ChatGPT 确实让国内外互联网公司有点上火。2 月 8 日，为了抵御 ChatGPT 带来的冲击，谷歌仓促推出人工智能聊天机器人 Bard。国内这边，百度宣布在 3 月初推出 " 文心一言 "，其他家互联网公司也争先恐后。

截止 2 月 10 日，宣布有类 ChatGPT 技术储备、准备发布和已经发布类 ChatGPT 产品服务的国内大厂有：阿里巴巴、腾讯、华为、字节跳动、京东、360、科大讯飞、快手、网易有道等，超过 10 余家互联网大厂进军火热的 ChatGPT。

风口之下，泥沙混杂。国内最早官宣进军 ChatGPT 的互联网企业，其实是二手奢侈品交易平台寺库，ChatGPT 概念股让其股价应声上涨 120%。很多网友吐槽，不是寺库主动发声，还想不起来寺库对消费者的欠款。

此外，互联网垂类赛道企业也有参与者，Tech 星球独家获悉，好未来将在未来引入类 ChatGPT 技术，目前正着手筹备研发 ChatGPT 的教育项目。商汤也正在探索搭建通用型 AIGC 模型，该项目由商汤研究院牵头。

中小科技公司在蹭热度，大公司也并非轻松掌控 "ChatGPT"。诸如谷歌 Bard 发布时，演示视频中犯了一个事实性错误，首秀大 " 翻车 "，致使谷歌股价大跌，目前市值已经跌去了 1700 亿美元。

放眼国内互联网企业，谁更有科研实力做 ChatGPT？谁在真刀真枪的投入研发，谁在追风口、蹭热点概念？

扎堆入局 ChatGPT 竞赛

在搜索和 AI 领域积累最深的百度，自然被市场寄予厚望。

百度计划在今年 3 月推出与 ChatGPT 类似的人工智能聊天机器人服务，该项目名字确定为 " 文心一言 "，英文名 ERNIE Bot，3 月份完成内测后，将面向公众开放。不同的是，最初版本将嵌入其搜索服务中。这项工具将允许用户获得对话式的搜索结果。

去年 9 月，百度 CEO 李彦宏判断人工智能发展在 " 技术层面和商业应用层面，都有方向性改变 "。据推测，百度那时候就开始做 " 文心一言 "，另按照谷歌和微软节奏，" 文心一言 " 开放内测还有可能提前。

尽管没有率先发布 ChatGPT，但在相关技术方面，百度同时具备人工智能需要的算力、算法和数据，在芯片、框架、模型、应用四层技术栈均有布局，是国内少数的具备 AI 全栈能力的企业。

相比百度的技术研发储备，阿里和字节跳动可能是另外两个较早布局的玩家。

2 月 9 日，阿里内测中的达摩院版 ChatGPT 提前曝光。新产品可实现的功能包括知识问答、AI 绘画、代码生成、小说续写、文案撰写、写诗作词等。从人工问答的水平看，达摩院版 ChatGPT 也实现了相对真实的回答，而且也实现了多轮问答。

实际上，在 2022 年 5 月份，在超大规模多模态预训练模型 M6 的发布之后，阿里就曾公布过相应的能力，在 AIGC 方面，生成的实景图片已经十分逼真。

根据介绍，M6 将模型参数规模扩展到了十万亿，平均单卡可承载 200 亿参数。据阿里方面公布的数据显示，M6 在同等参数规模能耗仅为此前业界标杆的 1%，极大降低大模型训练门槛。

字节在研发 ChatGPT 的道路上，虽然全栈技术不是很突出，但在商用方面走的比较靠前。Tech 星球了解到，从去年年底开始，字节就在研发类 ChatGPT 项目，目前已在内部上线了测试插件，由 AI Lab 主导，当前还在探索当中。并且在此前，字节的 AML 团队内部开发了火山引擎大模型训练框架 veGiantModel。这一模型类似于为 ChatGPT 提供支持的 GPT-3.5 系列模型。

而在 GPT-3.5 之前，一位火山引擎的前开发人员告诉 Tech 星球，字节很早就着手研究基于 GPT2、GPT3 的训练模型和产品，并且字节旗下的火山引擎也在 NLP（自然语言处理）应用方面有研究积累。

目前，字节对话机器人、机器翻译、机器写作上有不少研究，特别是针对内容创作这一块。在 ChatGPT 被用作写文章前，字节跳动就研发了 Xiaomingbot 自动写稿平台，自 2016 年上线以来，已经累计写了 60 万篇文章，覆盖了 17 项的体育赛事，支持 6 种语言。

近日，快手也对外表示，正在开展大规模语言模型（LLM Large Language Model）相关研究，并启动了相应专项，覆盖 LLM 模型训练、文案自动创作与生成、对话系统开发等领域。

此外，京东云言犀也宣布将推出产业版 ChatGPT：ChatJD ，预计参数量为千亿级，主要应用在零售和金融 2 个领域。

国内大厂为何没能抢得先机？

大厂扎堆涌入，但有实力的玩家并不多。

有研究估测，训练 1750 亿参数语言大模型 GPT-3，需要有上万个 CPU/GPU24 小时不间输入数据，所需能耗相当于开车往返地球和月球，且一次运算就要花费 450 万美元（约合 3000 万元）。

高昂的研发成本意味着，主流的大模型只能由大型科技公司或是少数研究机构掌握。

从参数数量来说，百度的文心大模型有 2600 亿参数，远高于 GPT-3 的 1700 亿参数。但参数数量并不代表模型结果。国内并不缺数据，百度、字节跳动这样的公司都有海量的数据积累，不过后续包括数据清洗、标注以及模型的结构设计，训练、推理等都需要时间积累。这可能是国内大模型表现结果不如国外惊艳的重要原因。

拉开差距的关键时间点是在 2020 年年中，也就是 GPT3.0 刚出来时。一份流传的专家纪要显示，当时可能很多人觉得 GPT3.0 不仅是技术，体现了 AI 模型的发展新理念，因为 ChatGPT 的开发商 OpenAI 对这一块有技术的独到见解，也领先了国外的 Google，大概 Google 比 OpenAI 差了半年到一年的时间，国内公司差了两年的时间。

这与国内外很多科技企业认为，ChatGPT 并不是革命性的技术也有关系。ChatGPT 是 OpenAI 对其 2020 年发布的 GPT-3 模型微调后开发出的对话机器人，严格来说，ChatGPT 并未实现底层模型的显著突破，它巧妙地采用了理解、生成和交互相结合的方式，基于人类反馈进行强化训练，在体验上带给人智能的感觉。

Meta 首席人工智能科学家 Yann LeCun，不久前在一次小型媒体和高管在线聚会上发表了自己对 ChatGPT 的看法：" 就底层技术而言，ChatGPT 并没有什么特别的创新，也不是什么革命性的东西。许多研究实验室正在使用同样的技术，开展同样的工作。"

一位百度员工告诉 Tech 星球，其实国内很多大厂做了很久，但都不是 GPT 方向，而是其他产业方向。2022 年很多开发者基于百度文心做的应用，多是心理咨询、寻医问药、高考志愿等场景。阿里「通义」大模型也覆盖 200+ 服务场景，包括 AIGC，智能对话也有，但不是很强。

没有意识到 ChatGPT 对现有搜索模式的颠覆，没有准确预测到 ChatGPT 对脑力劳动者产生替代的关系。问题的关键在于，很多互联网企业认为 "chat" 这是一个很浅的应用，从现在的场景上，就是一个更强的聊天机器人，有一定的问答属性，暂时看不到商用的点。

有着上述相同看法的一位字节 NPL 算法工程师告诉 Tech 星球，ChatGPT 是一种不确定性极高的项目，国内没有成功先例，如果真的 All-in 去做，上面并不一定会提供资源，更别说提上优先级。另外，国内的技术确实是能力有限，比如想做一个大模型，缺少的不仅仅是资金，还有人力和基础模型，对于互联网大厂这种商业公司而言，有着较大的难度。

不仅认知层面存在局限，技术上的局限也有。

目前，ChatGPT 的信息截止到了 2021 年，这意味着如果把它当做搜索工具使用，显然无法获得实时信息。一位百度员工表示，百度现在正在解决信息实时性的问题。同时，ChatGPT 已经在准备推出基于 GPT-4 的迭代产品，国内企业又有新的目标需要追赶。

跟风热潮中，谁在硬蹭热点？

" 有大模型的企业能做 ChatGPT，没有的则是在蹭热点。"

前阿里云大模型负责人杨红霞犀利点评了当下互联网公司，蜂拥扎堆做 ChatGPT 的现状。她认为：" 大模型只有达到了 100B 以上的水平，才有 GOT 能力 ( 或者提供较难推理问题的回答 ) 。"

从这方面看，百度有 20 多万企业用户的飞桨平台，也有文心大模型，预计能做出最接近 ChatGPT 水平的对话产品；阿里有 " 通义 " 大模型，目前已经实现万亿参数训练，在产业端 M6 开发的应用场景也比较丰富；华为则是在 2020 年对大模型开始有布局，2021 年发布了鹏城盘古大模型，是业界首个千亿级生成和理解中文 NLP 大模型。

相比之下，目前宣布进军 ChatGPT 的一些互联网企业，技术研发和进度则处在第二梯队。比如，360 有深度学习平台 Xlearning，但没有相关大模型。同样宣布进军 ChatGPT 的网易有道，是 AI 芯片、深度学习框架、AI 大模型都没有，只是有应用场景在线教育，这与传出要参与 ChatGPT 的学而思类似，企业只是有学习机的应用场景，但没有相关技术储备。

还有一些企业则被认为是追风口概念。汉王科技受益于 ChatGPT 概念股，在 1 月 30 日开始的七个涨停板。根据 2022 年半年报显示，其接近 chatGPT 的文本大数据业务营收为 7797.95 万，仅占总营收的 14%，不仅营收占比较小，还同比下滑 7.14%。企业发展困难，却借助 ChatGPT 概念实现了股价一飞冲天。

这还不算最引人注目的，2 月 6 日，寺库宣布将探索将 AIGC 和 ChatGPT 技术应用于奢侈品相关业务。当天，寺库每股股价上涨 124.4%。实际这家企业已经被纳入 " 老赖 " 名单，很多供应商欠款和消费者退款都没即时结算，多次被市场监管总局登上失信名单。

与这些主动蹭 ChatGPT 的热度企业不同，也有什么都没做的企业，借助 ChatGPT 躺赢。2 月 8 日，微软集成 ChatGPT 技术的新版必应上线，回答内容中有不少答案来自知乎，当天午后知乎股价一度涨超 56%。由于 ChatGPT 可能会对社区问答产生颠覆，所以知乎对 ChatGPT 相关事宜一直保持沉默。但也被市场热捧，送上了股价增长列车。

当然，有行业人士表示，很多中小企业没有技术实力，也可借助开源的 Transformer 大模型，一定程度实现 ChatGPT 功能服务。

不过，达摩院专家告诉 Tech 星球，现在大规模预训练的 Transformer-based 模型虽然能够很好地解决感知智能相关任务，但缺乏精心设计的纯 Transformer 模型，基本无法完成对于实现认知智能的尝试。

正如字节跳动的情况，Tech 星球向火山引擎的售前支持人员咨询火山引擎是否有类 ChatGPT 的产品？对方表示，平台并没有该产品，但是可以通过 " 机器学习平台 " 结合自家产品，经过二次开发，能够实现类 ChatGPT 的效果。

Tech 星球还发现，在 ChatGPT 爆火后，前美团 "2 号人物 " 王慧文疑似复出，宣称要带资 5000 万美元入局人工智能。同时，与 NPL、AIGC 等相关的岗位被不少人关注，算法岗成为了新的求职热门。在脉脉的职位热度榜单中，前十位中，有 8 个是和算法相关的岗位。