首批8家大模型“持证上岗”，中国版OpenAI终将花落谁家？

作者｜闫妍

出品｜网易科技《态℃》栏目

今日凌晨，百度、百川智能等8家国产大模型通过首批备案，可面向全社会开放。

具体的企业机构包括：五家北京企业机构，百度（文心一言）、抖音（云雀大模型）、智谱AI（GLM大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）。以及三家上海企业机构，商汤（日日新大模型）、MiniMax（ABAB大模型）、上海人工智能实验室（书生通用大模型）。阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中。

产品获批后，8月30日晚23点前后，文心一言的APP已经能公开使用，此前则需要排队领取内测资格。随后，王小川的百川智能和商汤日日新大模型旗下自然语言应用“商量SenseChat”也宣布向全社会全面开放，有信心拿出强有力的大模型产品，接受C端消费者的“用脚投票”。

今年年初，由现象级产品ChatGPT引发的AIGC浪潮，让人们看到了人工智能技术给千行百业带来的巨大的革新潜力，尤其是通用大模型这个万亿赛道，被认为是最值得长期深耕的赛道。

半年多时间，国产ChatGPT之争，历史被一次次刷新。

政策层面，4月11日，国家互联网信息办公室发布的关于《生成式人工智能服务管理办法（征求意见稿）》提出。8月15日，《生成式人工智能服务管理暂行办法》正式施行，这也是我国首个针对生成式人工智能产业的规范性政策，大力支持国产大模型为代表的人工智能产业的发展。

技术层面，国内过去在移动互联网时代所积累的云计算、数据中心、算力中心等领先全球的数字化基础设施，为AIGC的落地运行提供了坚实基础。在中国，互联网科技公司迅速点燃了“百模大战”的硝烟，对于大模型和生成式AI的技术突破，近乎达到了白热化的程度。

AI赛道风云再起，谁将抓住下一个时代？中国版OpenAI，又将花落谁家？

李彦宏、王小川交手二十年再度重相逢

面对AIGC巨浪，李彦宏和王小川两位大佬都展现了非凡的行动力。

在国内互联网大厂中，百度今年3月率先推出文心一言并开启邀测。当时，李彦宏就表示，生成式AI代表着新的技术范式，是任何企业都不应错过的大机会。

百度方面曾表示，近十年，百度累计研发投入超1400亿元，是应用、模型、框架、芯片四层全栈布局的AI公司，并在各个层面都有关键自研技术。2022年百度核心研发费用214.16亿元，占百度核心收入比例达到22.4%。李彦宏在近日的电话财报会上还谈到，年底将推文心大模型4.0版。

据了解，百度智能云已经和300多个合作伙伴，在400多个具体的场景中取得测试效果。同时，百度文心大模型已拥有规模庞大的产业落地合作伙伴，覆盖政务、互联网、能源电力、汽车、消费电子、金融、教育、办公等众多重点行业。

这次与文心一言同时获批上线的，还有李彦宏20年的老对手王小川。在搜索引擎、输入法、浏览器等领域交手多番后，双方于2023年重逢大模型新战场。

百川智能成立于2023年4月10日，由前搜狗公司CEO王小川创立。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI人才组成。

王小川曾向网易科技《态℃》栏目等媒体表示，百模大战下，一起起步的公司动辄5亿美金估值，第二轮可能就是10亿美金的状态，这个竞争不是“小清新”状态，而是要迅速投入到这场大战役之中。“更多的大厂、更多的钱、更多人、更多的算力互相卷，这种情况下要迅速形成战斗力，因此优先把搜狗的老班底拉起来，大家能迅速磨合，才能适应这么大的挑战。”

成立仅四个月，百川智能便相继发布了三款通用大语言模型。此前6月和7月，先后发布了70亿参数的 baichuan-7B和130亿参数的 baichuan-13B 后，在8月8日发布了530亿参数的大模型 baichuan-53B。

王小川谈到，中国谁做了最好的大模型，还没有结论。“我们跟美国不太一样，美国通用大模型闭源模型头部几家已经定下来了，OpenAI的ChatGPT有了，Google有一张门票，在美国做通用大模型已经没有悬念，投资也不会再去投。但是在中国不是，中国谁做出了最好的大模型并没有结论，大家都在争取的机会，且不一定落在大厂里面。”

在他看来，历史上每次发生大的变化，都有创业公司的机会。创业公司会比大公司跑得快，为什么会不行？

大模型能力谁优谁劣众说纷纭

伴随AI产业的火爆，国内AI相关模型、产品、平台不断涌现，据公开资料显示，国内市场在半年时间里已发布近百个AI大模型，共同掀起一场“百模大战”，但大模型能力谁优谁劣，各项评估报告给出的结果众说纷纭。

近期，IDC发布的《AI大模型技术能力评估报告，2023》，尝试为这个问题找到一些解决方案。该报告创建了一个AI大模型技术能力的评估模型，并对国内14家厂商的大模型能力进行了评估。

评估模型主要分为三个维度，产品技术、服务生态以及行业应用三大维度。其中，产品技术又细分为算法模型能力、通用能力、创新能力、平台能力、安全可解释；服务生态，细分为服务能力和生态合作；行业应用则主要看行业覆盖能力。

国内主流大模型，包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商参与了本次评估。百度、阿里巴巴、科大讯飞、智谱AI的各项指标表现如下：

首批8家大模型“持证上岗”，中国版OpenAI终将花落谁家？

其中，百度文心大模型3.5拿下12项指标的7个满分，并且综合评分第一，算法模型第一，行业覆盖第一。

文心一言自今年3月发布至今快速成长，熟练掌握的创作体材超过200个，内容丰富度是发布初期的1.6倍，思维链长度是初期的2.1倍，知识点覆盖达到初期的8.3倍。效率方面，通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化，文心大模型训练速度达到原来的3倍，推理速度达到原来的30多倍。

而在SuperCLUE（中文通用大模型综合性测评基准）公布的8月榜单，百川智能的Baichuan-13B一举拿下国内大模型评测榜首，紧随其后的是Minimax-abab5和百度文心一言，三家大模型产品体现了高质量数据处理、算法优化方面的出色能力。

首批8家大模型“持证上岗”，中国版OpenAI终将花落谁家？1

值得注意的是，Minimax也是如今国内估值最高的大模型初创公司之一。据路透6月报道，Minimax完成了新一轮2.5亿美元融资后，整体估值超过12亿美元。

Minimax成立于2021年，由前商汤科技副总裁、通用智能技术负责人闫俊杰成立。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构，推出自研通用大模型“ABAB”，以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。

在王小川看来，今天不管是十家、百家、千家参与，最后一定要看两件事情：

第一个，是否能拿出足够好的AGI来，能与GPT3.5、GPT4去比肩，这件事情大家都有相应的距离，我们现在也没做到，往下看今年内有哪些企业能达到3.5甚至逼近4的能力。

第二个，是否能做出超级应用来。有可能中国的超级应用会比美国跑得快，中国做科学问题会差一些，但是应用是我们的强项，能够优先达到国际水平。

创新与监管，ChatGPT被控侵权等六大罪

AIGC实现了人类的创造力从1提升到100的飞跃，但AIGC的发展与治理还有许多问题和风险仍待解决，包括算法缺陷、伦理问题、版权问题、信息安全等等。

大洋彼岸，人工智能研究公司OpenAI本周回应了两起几乎相同的集体诉讼，这些诉讼的原告包括多位作家。他们声称，ChatGPT接受了他们被盗版书籍的培训，侵犯了他们作品的版权。

对此，OpenAI声称，原告“误解了版权覆盖的范围，没有考虑到限制和例外(包括合理使用)情况。而这些限制和例外适当地为创新留出了空间，比如现在处于人工智能前沿的大语言模型。”

根据OpenAI的说法，即使上述作家的书籍只是ChatGPT庞大数据集的“一小部分”，“创新者以变革方式使用受版权保护的材料也并未侵犯版权”。与那些试图通过分发受版权保护的材料直接获利的剽窃者不同，OpenAI辩称，它的目标是“教会其大模型推导出人类语言背后的规则”，以此来帮助人们“节省工作时间”、“让日常生活变得更轻松”，或者通过在ChatGPT中输入提示来自娱自乐。

在此之前，OpenAI的CEO Sam Altman就AI监管问题还参加了美国国会听证，讨论的核心要点之一便是版权问题。对此，Sam Altman表示，OpenAI将会拿出保护地方新闻业的相关举措，但也没有具体回应如何在AI模型训练过程中保护内容创作者版权权益的问题。

Sam Altman还表示，目前 AI 技术处于早期阶段，仍会出现错误。如果 AI 技术出了问题，后果会相当严重，尤其 AI 不是社交媒体，它需要不同的应对方式。他呼吁政府对 AI 技术应进行更严厉的监管，并表示OpenAI以及谷歌等同行都应当承受压力。

但风险的另一面则是巨大的机遇。

ChatGPT在发布之后至今七个多月的时间里，一直维持着令人“头晕目眩”的增长。在发布后的短短第5天，ChatGPT就获得了100万用户；又过了两个月，ChatGPT迈过了1亿用户大关，成为有史以来达成这两项指标最快的产品。

虽然ChatGPT的流量在6月份环比下滑了10%，但其绝对值仍然高达16亿次。在SimilarWeb的网站排名中，ChatGPT位列全球网站流量排行榜第17名。

国产ChatGPT面向公众开放后，同样引发了流量的狂飙。

百度文心一言APP宣布对全社会开放后12小时，迅速登上Apple Store免费应用排行榜首位。该应用自凌晨开放下载后，海量用户涌入，一度引发排队等待。百度官方对此回应称，“流量超预期”。

对此次文心一言面向C端消费者正式开放，李彦宏表示，“当文心一言向数以亿计互联网用户大规模开放服务后，能够获得大量真实世界中的人工反馈，这将进一步改进基础模型，并以更快速度迭代文心一言，创造更好的用户体验。”

狂飙200天，随着更多国产大模型通过备案面向全社会开放，这场如火如荼的大模型之战又将重新开始加速，决定权还是在市场和技术本身，也需要交给时间去检验。

发表回复 取消回复

发表回复取消回复