导读:昨天凌晨,当大多数人还在睡梦中时,一则公告在开发者圈子里炸开了锅。 小米MiMo大模型团队正式宣布:MiMo-V2.5系列API永久降价,最高降幅达到惊人的99%,而且不再区分上下文窗口长度。 雷军随后转发并配文:“欢迎更多开发者接入Xiaomi MiMo大模型!” 这不是一次普通促销,这是一场蓄谋已久的“掀桌”。
01 DeepSeek出题,小米光速交卷
四天前,DeepSeek率先“动刀”。梁文锋团队宣布,V4-Pro模型的临时折扣转为永久有效,输入缓存命中价格压到0.025元/百万tokens,成为名副其实的“价格屠夫”。
当时很多人以为,其他厂商至少会观望一阵。毕竟算力和存储芯片价格正在疯涨,阿里云、腾讯云上个月刚宣布涨价,智谱华章甚至涨了83%,API价格已经看齐GPT和Claude。
没想到,小米只用了四天。
5月27日凌晨,小米的降价公告准时发出,价格几乎是“复制粘贴”式对标。
具体来看,MiMo-V2.5-Pro调价后,输入缓存命中价格仅为0.025元/百万tokens,比原价最高降了99%;输出价格6元/百万tokens,较原价最高降了86%。
更值得关注的是,小米取消了此前按上下文窗口长度区分价格的做法——无论是256K还是1M窗口,统一按同一价格计费。
雷军昨天还说,未来三年要在AI领域投入600亿元,预计全年研发投入超400亿元。显然,降价只是开胃菜。
02 Token Plan同步升级:加量不加价
除了API降价,小米还同步升级了Token Plan套餐体系。
同等价格下,Token用量提升到了原来的5到8倍。以最便宜的Lite套餐为例,39元的月费,在高缓存命中场景下,实际可用Token可以达到5亿以上。
这是什么概念?一个普通开发者,每月花39元,可以调用相当于几百万次对话的算力,成本几乎可以忽略不计。
小米还披露了一个数据:此前推出的“百万亿Token创造者激励计划”,100T Tokens已经提前发放完毕。显然,开发者对低价Token的需求是真实的,而且是饥渴的。
小米甚至对所有仍在有效期内的Token Plan用户“反向操作”——不管之前用到什么程度,Credits额度全部重置,按新规则执行。这种“老用户与狗”的担忧直接被扼杀在摇篮里。
03 别人在涨价,小米凭什么敢降价?
最有意思的地方在于:小米降价的时机,恰恰是整个行业成本压力最大的时候。
今年3月以来,阿里云、腾讯云相继宣布部分模型API价格上调,智谱华章更是经过多轮涨价,API价格已看齐GPT和Claude。
为什么小米和DeepSeek敢逆势而为?
答案不在于硬件成本下降,而在于推理效率的工程优化。
很多人不知道,大模型在生成回答时是逐字逐句进行的。如果没有缓存机制,每次生成都要重新回溯所有历史信息,既消耗算力,又拖慢速度。
小米这次的关键技术突破是SGLang HiCache和SWA(滑动窗口注意力)——简单说,就是把多级存储间的缓存数据搬运量降到了优化前的七分之一,可缓存Token数量提升了近5倍。
当别人还在拼硬件的时候,小米已经开始拼“巧劲”了。
技术优化带来的成本下降,最终转化成了定价的自由度。
04 价格一样,谁更有“含金量”?
当价格被抹平到同一水平线,决定胜负的唯一指标就变成了Token的生产力价值。
DeepSeek是个偏科生,编程和逻辑推理能力领先,但多模态是它的短板——目前的识图功能也只能算“聊胜于无”。
小米则是个全能选手,从一开始就强调“全模态”。同样的API价格下,小米的Token能处理图像、音频和视频等多种复杂交互形式。
这一点在智能体时代尤为重要。当AI不再只是“聊天”,而是需要“看”“听”“理解”时,多模态能力的价值会越来越突出。
花同样的钱,能买到更多功能,这个账开发者算得明白。
05 行业格局正在被重构:从“技术差”到“成本战”
小米的快速跟进,验证了一个残酷的逻辑:当智能水平无法产生代差时,性价比就成了唯一的护城河。
国内模型在“最顶尖的智能”领域与国际顶尖水平仍有差距,但在“非复杂任务”的规模化应用场景下,各厂商之间的智能水平其实拉不开绝对差距。
那还能拼什么?拼价格,拼生态,拼谁能先让开发者“用上瘾”。
花旗也在最新研报中指出,小米此项激进的定价策略将推动Token使用量激增,同时也有助于训练和提升其大语言模型的性能。
“用户规模与缓存命中形成正向循环”——用的人越多,缓存命中率越高,推理成本越低,价格还可以更低。
这就是小米要构建的“成本护城河”。
06 更大的局:国产芯片正在悄悄“上位”
还有一个细节值得关注。
小米和DeepSeek敢于降价,底层还有一个重要支撑——国产芯片的替代正在加速。
DeepSeek首次将华为昇腾与英伟达并列写入硬件验证清单。结果显示,DeepSeek-V4在昇腾芯片上的推理速度较初期版本提升了35倍,华为CANN与英伟达CUDA的代码兼容性已逼近95%。
小米MiMo-V2.5同样适配了阿里平头哥、天数智芯、燧原科技、沐曦、昆仑芯等多家国产推理芯片,几乎覆盖了所有国产主流产品。
“国模+国芯”正在从口号变成现实。
当国产芯片的性价比优势进一步释放,API价格还有可能继续下探。
写在最后
从DeepSeek到小米,价格战的大幕已经拉开。
这对开发者来说是好事——算力成本正在变得像水电一样便宜,更多创意可以低成本落地。对整个行业来说,这也是一个分水岭:靠“卖算力”赚钱的时代正在结束,真正能活下来的,是那些能把技术效率做到极致、能在同等价格下提供更高“含金量”的玩家。
小米用技术优化换来了定价自由,DeepSeek用激进策略抢占了用户心智。
这场牌局,才刚刚开始。
免责声明:凡注明来源中国制造网的所有作品,均为中国制造网合法拥有版权或有权使用的作品,欢迎转载并注明出处。非本网站作品均来自互联网,仅代表作者本人的观点,中国制造网转载目的在于传递信息,并不代表本网赞同其观点或对其真实性负责。因作者信息不明等原因,中国制造网使用的部分作品报酬未及时支付,相关权利人可与本网联系。
