小樱知识 > 生活常识 > 「谁是」10余家大厂争做ChatGPT,谁是有实力,谁在蹭热度?

「谁是」10余家大厂争做ChatGPT,谁是有实力,谁在蹭热度?

提问时间:2023-02-13 14:12:01来源:Tech星球


来源 | Tech 星球

| 王琳 陈桥辉 杨晓鹤

最近,360 创始人周鸿祎又点评了互联网圈:在 ChatGPT 领域美国领先了我们,中国公司和科研人员要奋起直追。

ChatGPT 确实让国内外互联网公司有点上火。2 月 8 日,为了抵御 ChatGPT 带来的冲击,谷歌仓促推出人工智能聊天机器人 Bard。国内这边,百度宣布在 3 月初推出 " 文心一言 ",其他家互联网公司也争先恐后。

截止 2 月 10 日,宣布有类 ChatGPT 技术储备、准备发布和已经发布类 ChatGPT 产品服务的国内大厂有:阿里巴巴、腾讯、华为、字节跳动、京东、360、科大讯飞、快手、网易有道等,超过 10 余家互联网大厂进军火热的 ChatGPT。

风口之下,泥沙混杂。国内最早官宣进军 ChatGPT 的互联网企业,其实是二手奢侈品交易平台寺库,ChatGPT 概念股让其股价应声上涨 120%。很多网友吐槽,不是寺库主动发声,还想不起来寺库对消费者的欠款。

此外,互联网垂类赛道企业也有参与者,Tech 星球独家获悉,好未来将在未来引入类 ChatGPT 技术,目前正着手筹备研发 ChatGPT 的教育项目。商汤也正在探索搭建通用型 AIGC 模型,该项目由商汤研究院牵头。

中小科技公司在蹭热度,大公司也并非轻松掌控 "ChatGPT"。诸如谷歌 Bard 发布时,演示视频中犯了一个事实性错误,首秀大 " 翻车 ",致使谷歌股价大跌,目前市值已经跌去了 1700 亿美元。

放眼国内互联网企业,谁更有科研实力做 ChatGPT?谁在真刀真枪的投入研发,谁在追风口、蹭热点概念?

扎堆入局 ChatGPT 竞赛

在搜索和 AI 领域积累最深的百度,自然被市场寄予厚望。

百度计划在今年 3 月推出与 ChatGPT 类似的人工智能聊天机器人服务,该项目名字确定为 " 文心一言 ",英文名 ERNIE Bot,3 月份完成内测后,将面向公众开放。不同的是,最初版本将嵌入其搜索服务中。这项工具将允许用户获得对话式的搜索结果。

去年 9 月,百度 CEO 李彦宏判断人工智能发展在 " 技术层面和商业应用层面,都有方向性改变 "。据推测,百度那时候就开始做 " 文心一言 ",另按照谷歌和微软节奏," 文心一言 " 开放内测还有可能提前。

尽管没有率先发布 ChatGPT,但在相关技术方面,百度同时具备人工智能需要的算力、算法和数据,在芯片、框架、模型、应用四层技术栈均有布局,是国内少数的具备 AI 全栈能力的企业。

相比百度的技术研发储备,阿里和字节跳动可能是另外两个较早布局的玩家。

2 月 9 日,阿里内测中的达摩院版 ChatGPT 提前曝光。新产品可实现的功能包括知识问答、AI 绘画、代码生成、小说续写、文案撰写、写诗作词等。从人工问答的水平看,达摩院版 ChatGPT 也实现了相对真实的回答,而且也实现了多轮问答。

实际上,在 2022 年 5 月份,在超大规模多模态预训练模型 M6 的发布之后,阿里就曾公布过相应的能力,在 AIGC 方面,生成的实景图片已经十分逼真。

根据介绍,M6 将模型参数规模扩展到了十万亿,平均单卡可承载 200 亿参数。据阿里方面公布的数据显示,M6 在同等参数规模能耗仅为此前业界标杆的 1%,极大降低大模型训练门槛。

字节在研发 ChatGPT 的道路上,虽然全栈技术不是很突出,但在商用方面走的比较靠前。Tech 星球了解到,从去年年底开始,字节就在研发类 ChatGPT 项目,目前已在内部上线了测试插件,由 AI Lab 主导,当前还在探索当中。并且在此前,字节的 AML 团队内部开发了火山引擎大模型训练框架 veGiantModel。这一模型类似于为 ChatGPT 提供支持的 GPT-3.5 系列模型。

而在 GPT-3.5 之前,一位火山引擎的前开发人员告诉 Tech 星球,字节很早就着手研究基于 GPT2、GPT3 的训练模型和产品,并且字节旗下的火山引擎也在 NLP(自然语言处理)应用方面有研究积累。

目前,字节对话机器人、机器翻译、机器写作上有不少研究,特别是针对内容创作这一块。在 ChatGPT 被用作写文章前,字节跳动就研发了 Xiaomingbot 自动写稿平台,自 2016 年上线以来,已经累计写了 60 万篇文章,覆盖了 17 项的体育赛事,支持 6 种语言。

近日,快手也对外表示,正在开展大规模语言模型(LLM Large Language Model)相关研究,并启动了相应专项,覆盖 LLM 模型训练、文案自动创作与生成、对话系统开发等领域。

此外,京东云言犀也宣布将推出产业版 ChatGPT:ChatJD ,预计参数量为千亿级,主要应用在零售和金融 2 个领域。

国内大厂为何没能抢得先机?

大厂扎堆涌入,但有实力的玩家并不多。

有研究估测,训练 1750 亿参数语言大模型 GPT-3,需要有上万个 CPU/GPU24 小时不间输入数据,所需能耗相当于开车往返地球和月球,且一次运算就要花费 450 万美元(约合 3000 万元)。

高昂的研发成本意味着,主流的大模型只能由大型科技公司或是少数研究机构掌握。

从参数数量来说,百度的文心大模型有 2600 亿参数,远高于 GPT-3 的 1700 亿参数。但参数数量并不代表模型结果。国内并不缺数据,百度、字节跳动这样的公司都有海量的数据积累,不过后续包括数据清洗、标注以及模型的结构设计,训练、推理等都需要时间积累。这可能是国内大模型表现结果不如国外惊艳的重要原因。

拉开差距的关键时间点是在 2020 年年中,也就是 GPT3.0 刚出来时。一份流传的专家纪要显示,当时可能很多人觉得 GPT3.0 不仅是技术,体现了 AI 模型的发展新理念,因为 ChatGPT 的开发商 OpenAI 对这一块有技术的独到见解,也领先了国外的 Google,大概 Google 比 OpenAI 差了半年到一年的时间,国内公司差了两年的时间。

这与国内外很多科技企业认为,ChatGPT 并不是革命性的技术也有关系。ChatGPT 是 OpenAI 对其 2020 年发布的 GPT-3 模型微调后开发出的对话机器人,严格来说,ChatGPT 并未实现底层模型的显著突破,它巧妙地采用了理解、生成和交互相结合的方式,基于人类反馈进行强化训练,在体验上带给人智能的感觉。

Meta 首席人工智能科学家 Yann LeCun,不久前在一次小型媒体和高管在线聚会上发表了自己对 ChatGPT 的看法:" 就底层技术而言,ChatGPT 并没有什么特别的创新,也不是什么革命性的东西。许多研究实验室正在使用同样的技术,开展同样的工作。"

一位百度员工告诉 Tech 星球,其实国内很多大厂做了很久,但都不是 GPT 方向,而是其他产业方向。2022 年很多开发者基于百度文心做的应用,多是心理咨询、寻医问药、高考志愿等场景。阿里「通义」大模型也覆盖 200+ 服务场景,包括 AIGC,智能对话也有,但不是很强。

没有意识到 ChatGPT 对现有搜索模式的颠覆,没有准确预测到 ChatGPT 对脑力劳动者产生替代的关系。问题的关键在于,很多互联网企业认为 "chat" 这是一个很浅的应用,从现在的场景上,就是一个更强的聊天机器人,有一定的问答属性,暂时看不到商用的点。

有着上述相同看法的一位字节 NPL 算法工程师告诉 Tech 星球,ChatGPT 是一种不确定性极高的项目,国内没有成功先例,如果真的 All-in 去做,上面并不一定会提供资源,更别说提上优先级。另外,国内的技术确实是能力有限,比如想做一个大模型,缺少的不仅仅是资金,还有人力和基础模型,对于互联网大厂这种商业公司而言,有着较大的难度。

不仅认知层面存在局限,技术上的局限也有。

目前,ChatGPT 的信息截止到了 2021 年,这意味着如果把它当做搜索工具使用,显然无法获得实时信息。一位百度员工表示,百度现在正在解决信息实时性的问题。同时,ChatGPT 已经在准备推出基于 GPT-4 的迭代产品,国内企业又有新的目标需要追赶。

跟风热潮中,谁在硬蹭热点?

" 有大模型的企业能做 ChatGPT,没有的则是在蹭热点。"

前阿里云大模型负责人杨红霞犀利点评了当下互联网公司,蜂拥扎堆做 ChatGPT 的现状。她认为:" 大模型只有达到了 100B 以上的水平,才有 GOT 能力 ( 或者提供较难推理问题的回答 ) 。"

从这方面看,百度有 20 多万企业用户的飞桨平台,也有文心大模型,预计能做出最接近 ChatGPT 水平的对话产品;阿里有 " 通义 " 大模型,目前已经实现万亿参数训练,在产业端 M6 开发的应用场景也比较丰富;华为则是在 2020 年对大模型开始有布局,2021 年发布了鹏城盘古大模型,是业界首个千亿级生成和理解中文 NLP 大模型。

相比之下,目前宣布进军 ChatGPT 的一些互联网企业,技术研发和进度则处在第二梯队。比如,360 有深度学习平台 Xlearning,但没有相关大模型。同样宣布进军 ChatGPT 的网易有道,是 AI 芯片、深度学习框架、AI 大模型都没有,只是有应用场景在线教育,这与传出要参与 ChatGPT 的学而思类似,企业只是有学习机的应用场景,但没有相关技术储备。

还有一些企业则被认为是追风口概念。汉王科技受益于 ChatGPT 概念股,在 1 月 30 日开始的七个涨停板。根据 2022 年半年报显示,其接近 chatGPT 的文本大数据业务营收为 7797.95 万,仅占总营收的 14%,不仅营收占比较小,还同比下滑 7.14%。企业发展困难,却借助 ChatGPT 概念实现了股价一飞冲天。

这还不算最引人注目的,2 月 6 日,寺库宣布将探索将 AIGC 和 ChatGPT 技术应用于奢侈品相关业务。当天,寺库每股股价上涨 124.4%。实际这家企业已经被纳入 " 老赖 " 名单,很多供应商欠款和消费者退款都没即时结算,多次被市场监管总局登上失信名单。

与这些主动蹭 ChatGPT 的热度企业不同,也有什么都没做的企业,借助 ChatGPT 躺赢。2 月 8 日,微软集成 ChatGPT 技术的新版必应上线,回答内容中有不少答案来自知乎,当天午后知乎股价一度涨超 56%。由于 ChatGPT 可能会对社区问答产生颠覆,所以知乎对 ChatGPT 相关事宜一直保持沉默。但也被市场热捧,送上了股价增长列车。

当然,有行业人士表示,很多中小企业没有技术实力,也可借助开源的 Transformer 大模型,一定程度实现 ChatGPT 功能服务。

不过,达摩院专家告诉 Tech 星球,现在大规模预训练的 Transformer-based 模型虽然能够很好地解决感知智能相关任务,但缺乏精心设计的纯 Transformer 模型,基本无法完成对于实现认知智能的尝试。

正如字节跳动的情况,Tech 星球向火山引擎的售前支持人员咨询火山引擎是否有类 ChatGPT 的产品?对方表示,平台并没有该产品,但是可以通过 " 机器学习平台 " 结合自家产品,经过二次开发,能够实现类 ChatGPT 的效果。

Tech 星球还发现,在 ChatGPT 爆火后,前美团 "2 号人物 " 王慧文疑似复出,宣称要带资 5000 万美元入局人工智能。同时,与 NPL、AIGC 等相关的岗位被不少人关注,算法岗成为了新的求职热门。在脉脉的职位热度榜单中,前十位中,有 8 个是和算法相关的岗位。

图注:脉脉职位热榜。

包括腾讯、阿里、字节、小红书、菜鸟等互联网公司,已经在 NPL 算法工程师等相关招聘岗位中,加入了从业者需了解熟悉 GPT-3 等相关模型的要求。而招聘的月薪多在 4 万元左右,最高可达 10 万元。

2023 年,ChatGPT 点燃的这把火,可以淬炼出真金的企业和人才,也可以蒸发掉虚妄的概念。

以上内容就是为大家推荐的「谁是」10余家大厂争做ChatGPT,谁是有实力,谁在蹭热度?最佳回答,如果还想搜索其他问题,请收藏本网站或点击搜索更多问题

内容来源于网络仅供参考
二维码

扫一扫关注我们

版权声明:所有来源标注为小樱知识网www.cnfyy.com的内容版权均为本站所有,若您需要引用、转载,只需要注明来源及原文链接即可。

本文标题:「谁是」10余家大厂争做ChatGPT,谁是有实力,谁在蹭热度?

本文地址:https://www.cnfyy.com/shcs/915717.html

相关文章