连续两天,领先的人工智能初创公司智普和MiniMax双双在香港联交所首次公开募股。与移动互联网时代的上市热潮不同,大型模型行业的IPO并不是战后的庆祝活动,而是一场战后的庆祝活动。它们标志着下一轮竞争的开始,而不是获胜者的奖品。

随着智浦和MiniMax相继进入二级市场,两者都将推出更大规模的私募。这是一个商业化仍不确定的领域,但持续的研发投资是必然的。对于这些公司来说,IPO的真正价值在于以更高的效率获得更多的资源。

在MiniMax上市前夕,我们采访了MiniMax团队和几位投资者,重构了过去三年市场对大模型创业机会的不同看法,并突显了该公司的鲜明特征。

在七轮 IPO 前融资中,30 家机构总共向 MiniMax 投资了 15 亿美元。阿里巴巴贡献最大份额;高瓴资本首轮领投,按股本计算,是仅次于阿里巴巴的第一大外部股东;明狮参加的轮数最多。

1月9日上午,在前往香港联交所参加敲钟仪式之前,MiniMax创始人严俊杰向LatePost分享了他的感想:

我们希望有机会为整个行业的智能化进步做出更大的贡献。我们探索了一条人工智能创业的草根之路。尽管挑战依然存在,但如果我们的旅程能够激发更广泛的人工智能创新生态系统,我们将深感荣幸。

截至午盘收盘,MiniMax股价已飙升逾78%,从发行价165港元升至294港元,市值达898亿港元。

MiniMax 的融资故事:4 年 7 轮——谁在推动中国首场人工智能资本盛宴?

领先于繁荣

高瓴资本:第一投资者、最大外部财务股东

MiniMax 成立于 2022 年初,就在 ChatGPT 浪潮之前,高瓴资本是其首个投资者。

在MiniMax北京办公室的初创公司规划阶段,高瓴合伙人李亮花了三个小时与严俊杰和云业毅讨论,然后提交了一份空白估值的投资意向书,邀请他们说出他们的首选估值和投资金额。严俊杰提出:融资3000万美元,估值2亿美元。

在创立MiniMax之前,严俊杰和云野一是商汤科技的同事。严先生,1989年出生,在河南长大,于中国科学院自动化研究所获得博士学位。在商汤科技工作七年多的时间里,他从研究员晋升为公司最年轻的副总裁,担任执行院长,主管智慧城市和游戏部门。云毕业于约翰霍普金斯大学,曾在商汤科技首席执行官办公室领导战略。

第一个接触 MiniMax 的高瓴投资人薛子钊告诉《晚点晚报》,就在见到李亮的前几天,严俊杰给高瓴团队做了一场长达 9 小时的“技术讲座”,内容涵盖 Transformer 缩放定律、GPT-3 进展、DeepMind 的强化学习、图像生成的扩散模型,以及 CLIP 如何连接图像和语言。 “当时很少有人能把所有这些技术连接起来。我个人怀疑是否可以做到,但事后看来,IO(严俊杰)在各个方面都是正确的。”

MiniMax 融资故事:4 年 7 轮——谁在推动中国首场人工智能资本盛宴?
在 MiniMax 的早期,团队在白板上剖析了技术转变和市场机会。

MiniMax 的战略是同时开发文本、语音和图像模型,利用大型模型和多模态技术为日常用户创建人工智能应用程序。这一愿景——让每个人都拥有智能——是公司成立之初就设定的。

高瓴资本认为这是一个系统工程挑战;该团队需要算法、硬件、数据、工程和应用方面的专业知识。颜先生曾在商汤科技领导过1000多人的团队,在算法、工程、组织和人工智能商业化方面拥有丰富的经验。

在不到两周的时间里,高瓴资本完成了条款清单和投资批准,领投了 MiniMax 的天使轮融资。一周后,Sequoia 接洽 MiniMax,但错过了这一轮。一年半后,即 2023 年 7 月,红杉资本在第四轮 15.5 亿美元预投资中成为 MiniMax 股东。

2022年11月,张雷与一批精选的企业家组织了一次小型中东之旅,其中包括比亚迪创始人王传福、地平线创始人于凯,以及刚刚开始创业的相对不知名的严俊杰。

在卡塔尔世界杯的贵宾休息室里,颜老师用仍在发展中的英语向中东伙伴讲解AGI(人工智能)。仅仅两周后,随着 ChatGPT 的发布,这个术语(当时的小众市场)在全球范围内传播开来。

最早接触 MiniMax 的高瓴投资人薛子钊于 2023 年正式加入公司:“我自己投资了它。”

高瓴资本在天使轮融资后继续投资。 IPO前持有MiniMax 7.14%的股份,仅次于阿里巴巴,成为最大的外部财务投资者。

miHoYo 的刘伟:“超级聪明被高估了;韧性被高估了”被低估”

2021年初,米哈游创始人蔡浩宇宣称:“到2030年,我们的目标是建立一个10亿人居住的虚拟世界。” MiniMax最初的应用愿景是一致的:利用多模态技术创建与普通用户交互的AI角色(这里的“AI角色”指的是AI角色,而不是现在的AI Agent概念)。 miHoYo创始人刘伟(“大伟哥”)和罗宇豪(“罗爷”)与MiniMax团队相识已久,并在高瓴同时了解到严俊杰的创业计划,投资水到渠成。

miHoYo 是创始人理想投资者的缩影。云夜依告诉《晚点晚报》,他们很少干预公司运营;会议更多地关注植根于团队信任的“人生哲学”。

严俊杰经历了之前人工智能热潮的高潮和低谷。 “我忍受了一年半的损失,然后在做对事情后取得了一系列的胜利。”在最近接受罗永浩采访时,严岩回忆了商汤科技在人脸识别方面遇到的挑战,以及如何克服巨大的压力增强了他的技术信心。

他也见证了行业在计算机视觉时代的挣扎。一位人工智能“四龙”创始人曾评价:颜老师吃过AI 1.0的苦。

去年,在讨论大模型时,刘伟告诉我们:在大模型创始人中,“超级聪明”总是被高估,而韧性却一直被低估。然而创业是一场马拉松——韧性是无价的。

云栖、IDG 加盟结束天使轮

在商汤科技任职期间,云野一结识了多位投资人,其中包括约翰·霍普金斯大学校友、云启管理合伙人陈宇,以及曾多轮投资商汤科技的 IDG 合伙人牛奎光。

两人都很快加入了 MiniMax 的天使轮。陈宇此前曾与颜、云讨论过技术趋势。在Yan决定推出MiniMax之后,在上海的一次晚宴上,陈宇当场承诺:“我想赌一条能够颠覆现有技术的道路。以前都是小模型,Yan很早就看到了基础大模型的价值。”

在miHoYo和高瓴资本发布投资意向书后不久,牛奎光联系了云;他早上打了电话,晚上就飞到了上海,与颜老师和核心团队会面后很快就敲定了投资。

MiniMax 的天使轮融资以 2 亿美元的估值筹集了 3100 万美元,与团队最初的计划(3000 万美元的融资和 2 亿美元的投后估值)非常吻合。 MiniMax 拒绝了更多资金和更高估值的报价。

MingShi:MiniMax第二轮唯一新股东,最常股东投资者

在ChatGPT发布之前,MiniMax完成了两轮融资。明石资本是第二轮唯一的新股东。明实创始合伙人黄明明和合伙人夏凌第一次见到严某是在北京一家酒店大堂,当时严某正在用iPad看报纸。他仍然尝试每天花一个小时回顾新研究。

他们的第一次会议持续了两个多小时,Yan 重点讨论了技术变革。夏绫第一次从严那里听说AGI,并进行了直播搜索。如今,很多遇到类似情况的人会问ChatGPT或豆宝,而不是百度。

“老实说,当时我对 AGI 不太敏感,但他很快解释说 GPT 是一个端到端的、数据驱动的模型。”明视已七次投资理想汽车,自2021年以来,端到端模型推动了智能驾驶的重大进展。

颜还讨论了技术变革如何改变商业逻辑:以前的人工智能公司举步维艰,因为模型不够通用,需要针对每个场景进行重新训练。大型模型提供“一个模型为所有人”服务多种场景和任务,使人工智能商业化摆脱定制的to-B和to-G开发。

2022年初,夏绫又见到了严两次。不久前,在明视的年终总结上,夏老师对未来五年的AI技术趋势进行了展望,告诉严老师,多模态技术可以重塑Adobe,并讨论了Agency和更智能的机器人。颜老师放下筷子,分享了MiniMax的具体应用方向。

他们的下一次会议是在2月14日。Xia想确认一下:MiniMax更喜欢to-C还是to-B? “To-C,”Yan 回答道,并发誓不会遵循旧有的 to-B 路线。这正符合夏的想法。讨论非常激烈,他们几乎没吃东西,夏为家人打包了鱿鱼花,而不是节日鲜花。

与高瓴一样,明石也看重严在算法、工程和商业方面的全面经验。这一点在当年得到了验证:2022 年末,MiniMax 在训练了多个文本模型后,开始在全国范围内寻找 GPU。随着自动驾驶公司退出,很多GPU可用,MiniMax也得益于大型车型的热潮,能够半价租用算力。

明视创始人黄明明这样描述颜的决心:“当时ChatGPT还没有上线,OpenAI也冷淡,颜到了商汤科技的高层,就跳出来创办了一家公司。” MingShi 是 MiniMax 最频繁的投资者之一,参与了八轮中的六轮,包括 IPO 基石轮和七轮 IPO 前轮。

ChatGPT 改变一切

快速达成共识,投资热潮

2022 年 10 月,MiniMax 推出了首款产品 Glow,仅用了很少的宣传,就在两个月内迅速吸引了超过 100 万动漫用户。对于一家运营不到一年并探索 AI to-C 的初创公司来说,这是一个良好的开端。但 ChatGPT 11 月的发布引起了轩然大波,Glow 也成为了一小片涟漪。

在迅速达成的共识下,MiniMax 直接受益,于 2023 年初启动第三轮融资,融资 2.6 亿美元,是前两轮融资总额的三倍,投后估值达到 11.57 亿美元。腾讯、小米、小红书等战略投资者加入,新股东顺为、绿洲也加入,此前所有投资者继续参与。

与此同时,MiniMax 不再是市场上为数不多的选择之一。 “百模大战”打响,初创企业各有千秋:王惠文自资5000万美元创办了光年超越;搜狗输入法创始人王小川创立百川智能;李开复创立了零一宇宙。成立于 2019 年初的智浦就是其中之一。 Moonshadow由XLNet和Transformer-XL的开发者杨志林创立,其学术背景与大型语言模型直接相关。这些公司很快就获得了融资,一些投资者支持了多家公司,包括阿里巴巴、腾讯和顺为。

MiniMax 的策略是保留更多控制权并避免快速稀释。腾讯希望对MiniMax第三轮进行更多投资,但最终MiniMax从腾讯手中拿走了5000万美元。

字节跳动退出,红杉加入

2023年5月,王慧文因健康原因退出广年超越。中国大型模特市场的另一家关键参与者字节跳动做出了决定。

字节跳动已经组建了庞大的模型团队,并考虑外部投资,类似于谷歌对 Anthropic 的投资,以及腾讯/阿里巴巴内部研发和投资的双重策略。到2023年6月,字节跳动已向两家大型模型公司发出了投资意向:MiniMax和新成立的StepStar。

不过,在年中高管会议后,字节跳动决定不再对外投资大型模型公司。张一鸣的立场:为什么不建立我们自己的大模型?我们应该自己做,而且我们也能做好。

与此同时,红杉中国领投了MiniMax的A+轮融资,因为高瓴资本的三轮超级按比例配股权已经到期。

本轮融资,MiniMax 融资 5000 万美元,投后估值 16 亿美元。红杉资本在后续几轮中继续投资,使其成为迄今为止在大型模型领域的最大投资。 IPO前,红杉中国持有MiniMax 3.81%的股份,成为第三大财务投资者。红杉还投资了光年超越、Moonshadow 和 StepStar。

据 LatePost 报道,红杉资本和高瓴资本在本轮谈判中将各自的股份下调至小数点后第三位。

阿里巴巴重大投资:改变许多未来的春节

在之前的人工智能热潮中,阿里巴巴既是初创公司的重要支持者,也是微妙的竞争对手,这反映了当今科技巨头和人工智能企业之间的动态。

阿里巴巴是商汤科技和旷视科技的董事会成员。 2017年,两家公司都试图通过收购母公司千方科技来收购中国安全领域的传统硬件厂商宇视科技。最终,阿里巴巴以37亿元收购千方,将宇视纳入旗下,支持阿里云政企扩张。

随着时间的推移,阿里云逐渐从政企业务转向私有部署。大模热潮过后,阿里巴巴第六位员工吴永明于2023年回归,出任集团CEO兼云CEO,推出阿里云新战略:人工智能驱动、公有云优先。

阿里巴巴开始广泛投资大型模型公司,这些公司是基于云的人工智能计算的主要客户。 2023年下半年,阿里巴巴投资了智普、百川智能、零一宇宙。

到 2023 年底,阿里巴巴开始与 MiniMax 和 Moonshadow 合作。

这是月影的关键回合。最初,月影以9亿美元的投前估值寻求小红书等公司的投资,但春节前,阿里巴巴介入,将估值提高至15亿美元,投资近8亿美元。

由于股权稀释程度较高,早期公司普遍对接受如此大规模的投资持谨慎态度。但阿里巴巴的影响力是立竿见影的:8 亿美元的投资很快成为人工智能行业的头条新闻。结合 Kimi 在 2024 年初的产品发布和增长,Moonshadow 的形象达到了顶峰。

阿里巴巴最初的目标是持有 MiniMax 30%–40% 的股份,但最终投资了 4 亿美元。这是 MiniMax 的第五轮融资,于 2024 年 3 月完成,融资总额为 6.54 亿美元,投后估值为 25.5 亿美元。新投资者包括经纬中国和中国人寿。

IPO前,阿里巴巴持有MiniMax超过13%的股份,成为第一大外部股东。

保险和制造业家族办公室:更多机构支持大型模型

阿里巴巴在2024年初大举投资之后,基础模型融资在2024年和2025年急剧放缓。字节跳动、阿里巴巴等科技巨头加大了对AI模型和产品的全面投资,资源和流量远远超过初创公司。目前只专注于模型研发而忽略商业化的DeepSeek极端、简单、纯粹,将典型的融资初创公司赶出了聚光灯。只有少数公司仍然可以筹集资金,并且只有精选的投资者可以部署大量资金。

除了风险投资之外,更多类型的投资者成为MiniMax的股东,其中包括中国最早的保险股权投资者——国寿投资;李泽楷的电讯盈科;博瑞资本,由宁德时代联合创始人、副董事长李平创立。这些投资者为大型模型行业带来了新的视角。

中国人寿:一支激发信心的团队

“年轻、坚定、总是微笑、说话冷静。”这是顾夜池对言俊杰的第一印象。顾先生现任中国人寿投保资管公司股权投资部主管,拥有十年监管工作经验和十年股权投资经验。

作为一家保险公司,中国人寿不能承受错误——避免错误比巨额回报更重要。在与几乎所有领先的大型模型创始人会面后,顾和中国人寿投资团队选择了MiniMax,并于2024年初和年底进行了两轮投资。

顾每两个月与颜见面一次。他认为严为“真诚、具有前瞻性、致力于技术并且始终如一”。 “2023年,俊杰开始讨论MoE(专家混合),然后训练MoE模型,这是现在业界的主流架构。一年多前,他告诉我大型模型公司应该主要依靠技术,而不是流量购买,他们就是这样做的。现在,这是行业的主流叙述。”

“这给了我们信心,”顾说。

博瑞资本:寻找可以成为企业家的科学家

“如果没有 MiniMax,我们可能不会投资大型模型。”博瑞资本管理合伙人王利民告诉 LatePost。

博瑞资本是一家由宁德时代副董事长李平单独支持的风险投资公司,李平于2010年联合创始人宁德时代,现任副董事长。

继ChatGPT之后,之前专注于先进制造和硬科技的博瑞开始研究大语言模型驱动的生成式AI革命,但并不急于投资。

2023年11月,李平和博瑞团队在上海与颜先生会面了三个小时,产生了初步的投资意向。博瑞随后于 2024 年初加入了 MiniMax 的第四轮投资,这是其对软件和 IT 的第一笔投资。

博瑞对颜氏对成本控制的重视、MiniMax对计算资源的早期规划、对应用的批量探索以及早期的研发变现感到熟悉。宁德时代在汽车电池领域的早期经历了类似的流程:利用客车和商用车业务形成第一个商业循环,然后将这些收入投入到研发中,以提高电池性能并大幅降低成本。

“严对于当今的大型模型初创公司有着清醒的认识,尤其是在中国。没有无尽的资金可以烧,也没有最先进的计算集群。中国的大型模型公司必须找到自己的道路,在成本和计算限制下开发基础模型。”

“我们从罗宾(曾毓群)身上学到的是,顶尖的科学家还需要顶尖的商业头脑才能打造一家伟大的公司,”王说。

“保持潮流”

过去三年,共识迅速形成,推翻的速度更快:2023年是追逐领先者的一年,大家都聚焦GPT-4; 2024年,以阿里巴巴的大举押注开始,以豆宝的后期暴涨结束; 2025年,DeepSeek以超低成本开源了世界一流的推理模型,全球顶级初创公司的估值达到数千亿美元,谁将成为中国的OpenAI的问题已不再重要。

MiniMax 的生存策略不是最大化单一优势,而是不断调整并朝着让 AI 服务于日常生活的方向前进。

它开发大型语言模型并追求多模态生成,因为严认为面向普通用户的AI必须是智能的并且支持多模态交互——视觉和语音。它构建模型和应用程序;严曾说过:“如果没有产品的采用,即使是技术进步也不是真正属于你的。” MiniMax 服务于国内和国际市场。

Xingye/Talkie 等配套人工智能应用、Hailuo AI 和 MiniMax Voice 的视频和语音内容生成以及开放平台 API 业务分别贡献了 MiniMax 收入的约 30%,比例为 1:1:1。

在颜直接主管的技术领域,他愿意承担风险。 2023年下半年,MiniMax投入了几乎所有的研发资源来构建MoE模型,两次失败; 2024年,投入80%的资源,采用线性注意力架构的新模型,成为2025年初发布的M1。他一贯押注于当时最有前景的技术方向。

探索商业化和聚焦技术开发对于 MiniMax 来说是同一枚硬币的两个方面。顾名思义,在巨大的不确定性中,它寻求以有限的资源获得最小的成功概率。

2025年初,严说他希望永远留在浪潮中:“第一,帮助浪潮继续前进;第二,确保公司不断前进。”

所以,留在浪潮中。