两家国产大模型公司MiniMax和智谱AI已经向港交所提交了招股说明书,很快将在香港上市。招股书中所披露的一些基本情况,网上的介绍文章已经很多,这里就不多赘述了。我们主要透过一些财务数据,来剖析这些头部AI初创企业的收入成本结构和商业模式。毕竟,脱离数字而争论泡沫与否,只能是空谈而已。

推理成本仍然很高

先来看毛利率,MiniMax 2023年毛利亏损,2024年转正到12.2%,2025年爬到23.3%。智谱好一些,最近3年稳定在50%-60%,这是由于toB/toG的单子通常要求本地化部署(占比接近70%),也就是客户自己承担了大部分的推理开销。2025上半年云端部署的毛利率甚至是负的,

智谱AI毛利及毛利率明細

以目前AI基建(芯片、服务器、数据中心、电力)的状况看,C端低毛利的状况很难在中短期内改变,成本降不下来,扩张也要对抗算力瓶颈,AI toC的生意其实是很难做的。要是转去B端G端想拿一个高毛利,比起toC生意肯定是高了,但60%的毛利率也很难谈得上优秀,只能说中规中矩。业界标杆Palantir能超过80%,Salesforce 70%,百分之五六十的毛利率大概相当于IBM、C3.ai这些公司的水平。

另一方面,随着业务规模扩大和本地化部署项目的增加,应收账款的周转时间显著变长:从2022年的23天一路涨到了2025年上半年的112天,这和海外同行比,是比较弱的。但在中国大型政企主导的市场环境下,这个数字其实还处于“中等偏优”的位置。在业务继续扩张的情况下,这个数能不能维持住甚至有所改善,是值得关注的。

产品交付了,钱还没收到,算是toC所没有的烦恼。

失控的研发支出

任何读了这两份招股书的人,都很难不注意到那惊人的研发开支,醒目到那一行的长度都和别行不一样。MiniMax 2023、2024年的研发支出分别达到了$70M和$189M(对比收入$3.5M和$30M);智谱2022年、2023年、2024年的研发支出(按照人民币/美元1:7兑换)分别为$12M,$75M,$314M(对比收入$8.2M,$17.8M,$44.6M)。

什么东西要占那么多研发费用?当然是训练模型所需的算力,智谱披露的数据显示这一项占比高达70.7%,第二项工资成本占14.8%:

智谱AI研发开支明细

自研基座模型往往被视作AI公司的核心竞争力。然而在各家模型能力日渐趋同,互相拉不开身位的情况下,就很难差异化竞争。最好的结局是经历几轮残酷竞争后,大部分玩家退出,留下两三家能够持续迭代模型的通用能力,等待算力成本下降;最坏的情况是,scaling law失效,算力成本下降导致更多的竞争者出现,开源模型遍地开花,基座模型生意就真正变成了采矿生意,你采的矿和他采的矿没有区别,你的铲子和他的铲子也没有区别,在一个完全市场化的环境下,这就是最差的生意。

如果最后落地还是要引入大量垂直数据,如何去论证基座模型每年几亿美金的训练开销,是一个迟早要被回答的问题。

烧钱的还有广告

哪怕忽略研发支出,净利润也被营销成本拖了后腿。

MiniMax 2023、2024年的营销费用高达$23M和$87M,分别是当年收入的6.5倍和2.9倍。依旧是互联网时代烧钱买流量的思路。但问题是,买来的流量有没有形成足够强的网络效应?2025年前9个月,在大幅降低广告投放之后,MiniMax的平均MAU较同期下降了34%,新用户数更是跌了5成,这个成绩恐怕是很难让人满意的。

MiniMax平均月活跃用户数明细
MiniMax新增用户数明细

智谱那边的情况也好不到哪里去,营销费用基本和收入持平。事实上,这也是国内SaaS行业的普遍现状:毛利率50%左右,叠加营销成本高、应收账款周转时间长。这有部分是商业环境的问题。但从另一个角度看,AI商业化在短期内还没有形成一条颠覆性的路径,国内SaaS一直都不好做,现在换了个名字叫MaaS,换汤不换药,从前的坑一个没少,还要兼顾算力成本带来的新问题。

开源模型有没有商业模式

顺便聊几句开源的问题。

很多人会按照惯性思维,认为开源模型是能够商业化的,就像RedHat Linux,Docker,ElasticSearch,Apache Spark等等,都是非常成功的开源商业案例。然而,大模型开源和基础软件开源存在一个本质的区别:大模型开源是没有生态的。

传统的开源软件,虽然也是大部分人在白嫖,但有一部分的开发者会选择回馈社区,提交需求、bug修复、以及自己开发的新功能。这些开发者在改进软件的同时,自己也变成了这些软件的推广者,从而吸引身边更多的同事朋友加入到这个生态里来,这又增加了开发者的数量,进一步加快了软件的迭代。开源软件背后的企业其实是通过这样一个社区生态,实现了软件产品的网络效应:用的人越多,产品越好用,进一步吸引更多的人来用,形成良性循环。而企业作为主导的一方,就能通过提供服务来捕获附加价值。

这里面的关键,是你不能藏着。而开源模型呢?要数据没有训练数据,要代码没有训练代码,只开源一个模型权重。这就好比你写了个C++程序,编译之后把执行文件给“开源”了,这能叫开源吗,这叫免费。

同样的,别人把你的开源模型拿过去再做微调对齐,他们也不会把数据和训练代码返还到你的生态里。相比开源软件,开源模型的生态是非常非常弱的,如果再考虑到成本,这里面是不存在商业模式的。

到最后,大模型开源变成了打口碑打广告,本质上是把天量研发费用变成了营销费用。

——当然还有技术沉淀,

最后说说情怀

我时常会想,我们究竟该怎样看待一场科技泡沫?

美国对投资者征收最多20%的长期资本利得税,对个人征收最高37%的收入税,企业税虽然已经从最高点的52.8%一路降到了21%,但仍然负担了大量的社会福利、医疗、养老成本。躺平的富人竟然比辛勤劳动的普通人有更多的税收优势(我知道马上有人要说buy-borrow-die了,我也知道还有很多国家甚至不对资本利得征税)。在一个制度性鼓励被动收入的世界,要如何去回答这个公平性的问题?

虽然税制在偏袒资本,但科技却在另一维度完成“平权”。它让信息与基础设施的使用权高度趋同——顶级富豪与普通人共享着同样的数字终端和底层网络。更重要的是,科技进步是过去50年最有效的财富洗牌机,它不断开辟新的上升通道,冲击那些靠被动收入“躺平”的存量阶层。而这种普惠式的跨越,从来都以巨大的资本损耗为入场券。

科技泡沫只是以一个更激烈的方式,加速了这个技术平权的过程。我看了很多人的采访,贝佐斯是难得很诚实的,他说,当前的AI热潮应被视为一场“工业泡沫”,而非纯粹的“金融泡沫”。类似2008年银行业危机那样的金融泡沫对社会“只有坏处”,但工业泡沫即便破裂,也能留下宝贵的遗产。

泡沫破裂所带来的价值毁灭,从来也不是技术价值的毁灭,它所毁灭的只是贪婪和懒惰。