大佬隔空叫阵，王兴拯救兄弟

来源：市界 2023-07-01 10:58:16

国内AIGC领域的最大一笔收购案诞生了。创业仅四个多月后，大模型创业公司光年之外被美团以20.65亿元全资收购。

而就在消息传出前几天，光年之外创始人、美团联合创始人王慧文被曝出现健康问题，不得不离岗。4个月之前，王慧文一头扑进大模型时，美团王兴当即表示，要用真金白银去支持这个睡在他下铺的兄弟。而今，王兴更是直接把这个摊子给全盘接手了。

(资料图)

光年之外回归美团的事件，也令数日前一场关于“大模型创业是否还有价值”的讨论，更加引人深思。

6月26日，猎豹移动董事长兼CEO傅盛，和金沙江创投主管合伙人朱啸虎之间，隔空进行了一番“创业价值”的争论。

傅盛在微信上转载了关于朱啸虎的一篇文章。该文引述了朱啸虎的如下观点：“ChatGPT对创业公司很不友好，未来两三年内请大家放弃融资幻想。”但傅盛对此表示反对：“硅谷一半的创业企业都围绕ChatGPT开始了，我们的投资人还能这么无知者无畏。”

接下来，两位大佬展开了一番唇枪舌剑。从表面看来，这是他们站在投资人和创业者不同立场上的意见分歧。但在辩论之后，他们却在另一层面上形成共识——通用大模型之路上，很难再出现像BAT一样的公司了。而光年之外的被收购，似乎也成为了这个观点的佐证之一。

大模型创业，已经太卷了。科技部下属中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示，截至5月28日，国内10亿级参数规模以上基础大模型至少已发布了79个。但现在，新的问题，也随之而来：我们是否需要这么多的大模型？到底什么样的大模型创业才是真正有价值的？火爆的大模型领域，是否也会泡沫碎一地？

01、通用大模型，只能活5家？

曾几何时，再造一个“中国版ChatGPT”成为科技圈竞相追逐的目标。

从今年3月开始，国内科技企业纷纷发布了自己的大模型产品。除了百度、阿里等大厂外，其他二线互联网大佬也按捺不住激情，纷纷跳下海创业。以5000万美元“高调进场”的王慧文多次提出“通用大模型是必干的”；搜狗创始人王小川成立了百川智能，并在不久前发布了70亿参数大模型baichuan-7b。

但现在，关于AI大模型的一些担忧正在逐渐浮出水面。

回顾之前两位大佬的争论，在傅盛的朋友圈发布后不到半个小时，朱啸虎的留言反驳就来了，他认为现在99%的价值都是GPT创造的，所以创业公司在这个领域就没有什么机会，创造不了太多价值了。

傅盛则回应称，通用大模型解决不了所有问题，这就是创业公司的机会，像BAT这样的创业梦，他已经放弃了。

6月27日，朱啸虎又发文解释说，之前的对话造成了很多误解，其实他应该是国内垂直AIGC领域真正出手最多的早期投资人了。他也强调，实际上，自己核心的观点是让大家不要再“迷信”通用大模型——到了明年，GPT-3.5将成为日用品，3年后GPT-4大模型也将如此。

这并不是新鲜的观点了。今年4月，百度董事长李彦宏就表示，国内AI大模型创业公司想成为“下一个OpenAI”的机会很低，没有必要重复造轮子。当时，王小川很不服气，“历史上每次发生大的变化，都有创业公司的机会，并且创业公司会比大公司跑得快。”

但眼下，关于大模型“泡沫”的焦虑，在业界悄然蔓延开来。

今年2月就积极投身大模型创业的出门问问创始人李志飞，在两个月之后表示自己已经是“大模型劝退派”。他认为国内将会有几十家聚焦落地的大模型，“卷出天际，大概率跟上一代AI公司一样商业化异常艰难”。

实际上，大模型对人才和资金密度的需求，远非消费互联网时代的项目可比。据估算，ChatGPT这类大模型的训练一次的成本接近千万美元，运营成本一个月要数百万美元。此外，算力也成为一大制约瓶颈。英伟达曾透露，训练GPT-3大约使用了1000张A100 GPU芯片，该芯片官方价格约1万美元/张。在国内市场上，受制于贸易限制，英伟达高性能芯片供给也严重不足。

大厂之所以能在大模型上狂奔猛进，是基于它们本身的长项：在大算力、算法研发方面的持续投入能力，在人工智能领域的长期积累，在数据和产业场景方面的天然优势。百度和阿里这样的巨头已经占据了先机、开始布局生态的情况下，后续入场的选手们面临的压力也可想而知。

原微软全球执行副总裁、奇绩创坛创始人兼CEO陆奇在一次分享活动中透露，据其了解，国内约有20万张A100芯片，今天的国际头部大模型团队可能需要用1万张H100芯片（H100的性能比A100更高，1万张H100相当于10万张A 100），而从目前的算力情况来看，国内未来能有这样资源体量的团队可能不超过两个。

另一方面，通用大模型的商业化前景仍然不明晰。即使是ChatGPT，大家对它的热情也有点消退了。

利用AI写论文、写代码，ChatGPT在C端应用的铺开，让它在今年年初瞬间“火爆”。其开发厂商OpenAI也在通过开放API端口给开发者，以及对C端用户收费变现。但现在，ChatGPT对C端市场的吸引力正在下降。

根据数据分析工具SimilarWeb的数据，ChatGPT的访问量增速出现明显下降，其环比增长率从今年1月的131.6%下降到了5月的2.8%，并预计在6月可能达到负数。OpenAI还开放了ChatGPT的第三方插件商店，但目前为止，其中大部分插件的下载数量也仅有几万次。

因此，以朱啸虎为代表的投资人们的纠结也就可以理解了：从投资回报率考虑，他们当然期待投出下一个平台级的企业。但目前看来，通用大模型似乎只能是大厂才能“玩得起”的游戏。

时间进入6月之后，关于大模型的市场情绪也出现了明显下跌。

从2月高调入局后，光年之外还没有推出相应的大模型和应用，王慧文就离开了岗位，让外界猜测是否大模型创业“压力太大”。今年端午节前，昆仑万维创始人周亚辉前妻李琼以支持AI大模型为名套现22亿元，引发昆仑万维股价当日暴跌。一系列事情的发生，也给大模型产业的未来，抹上了一丝冷色。

这次浪潮来得突然而猛烈，又缺乏可以对标的对象。尽管截至今年5月底国内已有了79个大模型，但有多少做通用大模型的公司能够在竞争中活下来，尚在未定之天。远望资本创始合伙人、迅雷创始人程浩认为：“中国版ChatGPT”只会在5家公司里产生：BAT+字节+华为。“创业公司和那些借概念炒股价的上市公司，很难有机会。”

在程浩看来，大厂比创业公司有流量、烧得起钱，更重要的是，大厂还拥有“自带场景”的核心优势。对于创业公司，“它们唯一的机会是开源。但是，这一点巨头也能够做到。”他告诉「市界」。

02、大模型创业的机会在哪里？

对通用大模型的创业机会表示悲观之后，朱啸虎建议大部分创业者应当“场景优先，数据为王”。

“如果说国内上半年大模型创业是火热状态的话，那么我可以说，硅谷的热度是它的十倍。”一位大模型领域从业人员说。一位投资人也认可：“在美国，如果一家科技公司没有提到过如何和大模型相结合，反而是奇怪的。”

程浩说，这波技术革命之所以能带动业界的高亢情绪，主要是，和上一次AI浪潮重点集中在计算机视觉领域的发展相比，这轮大语言模型代表的自然语言处理（NLP）技术的进步。这意味着，比起以前机器的视觉能力，现在是AI“大脑”和交互能力得到了提升，ChatGPT更是让终端用户也感知到了这一点。技术突破和前所未有的全新应用结合，能够带来更为广阔的市场机会。

这一点是没有人能否认的。回顾点燃傅盛和朱啸虎争论的“导火索”，是朱啸虎在一次活动中的演讲。他表示，GPT-4大模型问世后，企业服务领域可能还要面对“漫漫无期”的寒冬。但这是因为ChatGPT太强大了，已经拥有使用场景的企业，通过ChatGPT很容易就能为自己的产品加上AI功能。可利用它的玩家多了，这种情况对于创业公司反而是不利的，是一种降维打击。

从这一点上来看，朱啸虎讲得也没有问题。“这类有场景的企业，通过ChatGPT大模型，它们很容易地就能把AI能力加在自己的产品上。”程浩说。对于“AI+”企业来说，大家都能够调用ChatGPT，在大模型上做应用壁垒太低，价值也随之被削薄了，新玩家再要进入的难度也就加大了。

但他也认为，这并不意味着大模型创业价值的消失。正如傅盛所表达的：大模型是公有数据的缩略图，但是公有数据解决不了所有流程。

架构在大模型之上，即使是在细分场景上的创业，或对已有场景效率的提升，都能带来新的机会。这就是创业的价值所在。

开放API端口，让大模型变得更加易用。“任何技术的突破都会存在明、暗两条线。”澜码科技创始人、CEO周健说，“明线是应用场景不断被解锁，暗线是技术应用的成本下降、技术走向平民化。”在他看来，大语言模型技术的不断突破和发展，将使得NLP能力可以如同云计算、水、电等基础设施一样，可以被随需取用。更重要的是，其使用成本将大幅下降，这会改变很多商业逻辑。“对于软件产业来说，大模型让软件的边界变得更加灵活，可以使用自然语言进行交互。”

澜码科技作为大模型产业中的中间层创业公司，就是基于底层的⼤语⾔模型，为企业提供智能体应用平台。通俗一点来说，可以将之理解为提供一个基于大模型的“AI中台”，让企业实现智能调用智能体。例如，澜码科技内部开发了一个行程安排助手，通过分析用户的邮件、微信聊天记录，就能给出下周的行程安排。

在通用大模型上搞不过大厂，创业公司们只好一边拓展新的业务场景，一边也“卷”起了垂直行业大模型。

实际上，对不少行业应用场景而言，通用大模型也并非全然适合。程浩就曾指出，这方面更核心的问题是各行各业都有自己的“Know-How”，而这更多地是在企业自己的私有数据库里。

达观数据副总经理吕文超曾告诉「市界」，对于其服务的多数金融客户而言，使用大模型，基于公网调用数据是具有数据安全问题的，同时，出于成本以及和行业场景更好地结合这方面的考虑，它们对大模型私有化也提出了要求。对此，达观数据也进行了可私有化部署的“曹植”大模型的研发。

在自动驾驶领域，毫末智行也在今年上半年，发布了自动驾驶生成式大模型DriveGPT，中文名为“雪湖·海若”。

通义千问大模型发布时，阿里云智能集团董事长、CEO张勇曾说：“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍。”对于垂直行业中的龙头们来说，这同样也是不应该错过的机会。越来越多的腰部公司，也加入了垂直大模型的赛道。

“GPT”的前缀，开始五花八门，变得越来越丰富。今年5月，学而思宣布进行自研数学大模型MathGPT的研发，面向全球数学爱好者和科研机构。半个月后，深信服发布了国内首个自研安全大模型，成为安全领域GPT技术应用首秀。在房地产领域，我爱我家联合第四范式，推出了业内首个房产经纪大模型。互联网医疗行业中，医联率先推出了医疗大语言模型MedGPT。

事实上，这是大厂们也关注到的趋势。百度、阿里的通用语言大模型，也已经迈入了各行各业。6月19日，腾讯云的大模型终于揭开了面纱。但这次，它并没有发布一个类似ChatGPT的通用大模型，而是将重点放在了行业大模型上。腾讯云公布了其MaaS全景图，依托腾讯云TI平台打造行业大模型精选商店，面向金融、文旅、政务等十大行业，提供了超过50个解决方案。

大模型卷向了千行百业。有业内人士表示，接下来，行业大模型或将迎来一波发布的高潮。

大模型泡沫或许存在。但程浩认为，如果真能实现落地，泡沫也终将消失。陆奇也提出，当前 AI 大模型时代还处于早期阶段，经过高速增长之后，泡沫破裂将是必然现象，然而，在泡沫破裂之后，新的黎明将降临；届时，新一代更强大的企业将从破碎的泡沫中崛起，占据产业制高点。

除了具备先发优势的企业外，对于其他创业者来说，做不成平台级的公司，只要对行业场景的理解能力更强、落地能力更强，未来的商业空间也就越可期待。

即使能像光年之外一样，及时被大厂收购，也未必不是一条很好的路。

（作者 | 杨洁，编辑 | 孙春芳）