🎯 情报来源:量子位
2025年9月11日,估值120亿美元(约840亿人民币)的AI初创公司Thinking Machines发布首篇研究博客,由OpenAI前CTO Mira Murati领衔团队提出解决大模型推理非确定性问题的技术方案。该研究通过改造RMSNorm、矩阵乘法和注意力机制内核,在Qwen3-235B模型测试中实现1000次推理结果完全一致,性能损失仅20%。
公司同步披露首款产品命名为”Connection Machine”,其团队汇聚John Schulman(PPO算法发明者)、Barret Zoph(ChatGPT后训练负责人)等OpenAI核心成员,今年6月曾创下20亿美元种子轮融资纪录,投资方包括a16z、英伟达等顶级机构。
💡 核心要点
- 技术突破:实现LLM推理100%确定性,测试中1000次相同输入输出完全一致
- 性能代价:采用批次不变性内核导致20%性能下降,但仍在可接受范围
- :首款产品定名Connection Machine,团队2/3成员来自OpenAI
- 资本表现:2025年6月完成20亿美元种子轮融资,估值达120亿美元
- :解决在线策略RL训练稳定性问题,KL散度保持0(无需离线校正)
📌 情报分析
技术价值:极高
首次系统性解决LLM推理非确定性难题,实验数据显示完全消除结果波动,对科研复现、金融医疗等严谨场景具有颠覆性价值。技术方案涉及计算架构底层改造,具备较高技术壁垒。
商业价值:高
120亿美元估值反映资本对技术团队的认可,但首款产品尚未面世。确定性推理在B端高价值场景(如法律、金融)有明确付费意愿,但20%性能折损可能影响部分实时性要求高的应用。
趋势预测:高
LLM推理确定性将成为下一代模型基础设施的标配需求,该研究可能推动行业标准化进程。团队背景预示其可能快速迭代出完整产品矩阵,但需警惕Meta等大厂跟进研发。