阶跃星辰以”智能阶跃,十倍每一个人的可能”为使命,已完成Step-1千亿参数语言大模型和Step-1V千亿多模态大模型的研发,在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到业界领先水平,是国内AI大模型领域的重要力量。

智人AI工具导航 - 阶跃AI | 万亿参数国产大模型平台

一、工具概览

阶跃星辰于2023年4月成立,是一家专注于通用人工智能(AGI)平台研发的公司,团队由微软、字节跳动等企业核心成员组成,创始人姜大昕博士曾主导Bing、Cortana等产品开发。2024年估值达20亿美元,获阿里、腾讯及国有资本投资,在大模型赛道中具有重要地位。

阶跃AI的核心技术优势体现在其完整的模型矩阵上。目前已发布Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型等多款产品,形成了从语言理解到多模态生成的全栈能力。公司坚持自研路线,在算力、数据等关键资源方面积极布局。

从技术架构来看,Step-2采用特殊的MoE(Mixture of Experts)架构,通过选择性地激活部分专家网络,在提升模型性能的同时保持了较高的计算效率。这种架构设计使得阶跃AI在保持强大能力的同时,具备了良好的成长性和扩展潜力。

二、核心功能深度解析

语言大模型Step-2系列

Step-2万亿参数大模型在国际权威榜单LiveBench中位列国产基座大模型第一,成绩逼近OpenAI的o1-mini,超越gpt-4o、gemini-1.5-pro等国际主流模型,是唯一进入榜单前十名的中国语言大模型,位列全球第五。

在指令遵从能力方面表现尤为突出。根据LiveBench的IF Average测试,Step-2拿到了86.57的平均分,超越了gemini-1.5-flash-002的84.55分,在指令遵从的能力上力压了当今所有国内外语言大模型。

Step-2 mini作为轻量级版本,基于新一代自研Attention架构MFA开发,仅用3%的参数量就保留了Step-2超过80%的性能,显著提升了生成速度和性价比。在输入4000 tokens时,平均首字时延仅为0.17秒,展现出极快的响应能力。

多模态能力

Step-1.5V多模态模型在图像感知和理解能力上全面提升,并具备出色的视频理解能力,能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。该模型不仅具备视觉理解能力,还能根据图像内容进行数学题解答、代码编写、诗歌创作等高级推理任务。

Step-1X图像生成大模型采用全链路自研的DiT架构,支持600M、2B、8B三种不同的参数量,具备更加强大的语义对齐和指令跟随能力,还针对中国元素和文化进行了深度优化,这是其区别于其他模型的重要特色。

新兴模态拓展

阶跃星辰在视频和语音领域也有重要布局。Step-Video-T2V是全球最大开源文生视频模型,参数量达300亿,支持204帧540P视频生成。Step-Audio是首个产品级开源语音交互模型,支持多语言、方言及个性化语音生成。

三、商业模式与定价

阶跃AI采用多层次的商业模式,涵盖API服务、C端应用和B端解决方案。

API服务定价

Step-2 mini(推荐):输入1元/百万tokens,输出2元/百万tokens,是目前性价比最高的选择。

Step-2 16k:输入38元/百万tokens,输出120元/百万tokens,适合对性能要求较高的场景。

多模态和图像生成模型定价更加多样化,step-1o-turbo-vision为输入2.5元/百万tokens,输出8元/百万tokens;step-1x-medium图像生成为0.1元/张。

限速策略

平台采用阶梯充值限速机制,从V0级别(0元充值)的1并发、6RPM,到V5级别(1万元充值)的70并发、1400RPM,为不同规模用户提供差异化服务。

产品化收入

C端产品跃问(StepChat)和冒泡鸭(MaoPaoYa)提供免费基础功能和付费增值服务。不过根据最新消息,角色扮演类Agent产品”冒泡鸭”将停止大范围投入,团队合并至对话产品”阶跃AI”,显示公司正在调整C端战略重心。

四、适用场景与目标用户

开发者与企业客户

阶跃AI的API服务主要面向有技术开发能力的团队和企业。Step-2 mini的高性价比特别适合初创公司和中小企业进行AI能力集成,而Step-2 16k则适合对模型性能有更高要求的大型企业。

多模态能力使其在内容创作、教育培训、智能客服等场景中具有显著优势。已与吉利汽车、OPPO等企业达成合作,在智能座舱AI和手机”一键问屏”功能中实现落地应用。

个人用户

跃问(StepChat)支持文字/图片/语音/文档输入,提供AI写作、代码生成、视频/图像创作、数据分析等功能,可解析图表、识别地标建筑并完成逻辑推理,适合有内容创作、学习辅助、日常查询需求的个人用户。

特定行业应用

在科研领域,Step-2 mini能帮助科研人员进行逻辑推理、数据分析,整合跨学科知识,推动科研项目进展。在教育、金融、汽车等垂直领域也有相应的解决方案。

五、市场地位与竞品对比

与国际主流模型对比

在LiveBench权威榜单中,Step-2位列全球第五,超越了gpt-4o-2024-08-06、gemini-1.5-pro-002等国际主流模型,这标志着国产大模型在技术水平上已经具备与国际顶级模型竞争的实力。

与国内竞品对比

在国内大模型竞争中,阶跃AI与文心一言、通义千问、智谱清言等处于同一梯队。Step-2是唯一进入LiveBench榜单前十名的中国语言大模型,在国产基座大模型中排名第一,体现了其技术领先优势。

从模型规模来看,万亿参数的Step-2在参数量级上与主流竞品相当,但其MoE架构在效率和性能平衡方面具有独特优势。在多模态能力方面,阶跃AI的布局相对完整,涵盖了语言、视觉、语音、视频等多个模态。

差异化优势

阶跃AI的核心差异化体现在:

  1. 技术架构创新:MoE架构在效率和性能方面的平衡
  2. 多模态全栈能力:从理解到生成的完整链路
  3. 中国文化优化:Step-1X特别优化了对中国元素和文化的理解
  4. 开源战略:2025年以来加大开源力度,提升生态影响力

六、用户体验评价

技术性能表现

从实际应用效果来看,阶跃AI在多个维度表现出色。Step-2 mini在数学问题解答中能构建合理的推理链,对复杂数学问题进行规划和逐步求解;在逻辑推理任务中,能自主尝试多种解题思路。

多模态交互方面,用户反馈”多模态交互流畅,视频生成连贯性与美学表现突出”,显示其在视觉生成方面的技术实力。

产品易用性

基于Step系列通用大模型的强大能力,跃问能准确地描述和理解图像中的文字、数据、图表等信息,不仅能出色地完成内容创作、逻辑推理、数据分析等任务,也能满足人们在生活场景中的各种需求。

发展挑战

用户也指出”复杂运动场景生成仍需优化,部分功能需付费解锁”,显示在某些特定场景下仍有改进空间。同时,公司正在从C端转移到模型研发和ToB/G上,C端产品的长期发展策略存在调整。

总结评价

阶跃AI凭借其万亿参数规模的Step-2模型和完整的多模态技术栈,在国产大模型中建立了技术领先地位。其MoE架构设计在性能和效率方面找到了良好平衡,API定价策略具有明显的成本优势。

在商业化方面,阶跃AI正在从C端向B端和开发者服务转型,这种策略调整体现了对市场现实的理性认识。与头部企业的合作案例证明了其技术实力的商业价值。

从技术发展趋势来看,阶跃AI在多模态融合、开源生态建设等方面的布局为其长期发展奠定了基础。虽然在某些复杂场景下仍有优化空间,但整体技术水平已达到国际先进水平。

推荐指数:★★★★☆

推荐理由:技术实力强劲、性价比突出、多模态能力完整、具有良好的产业落地前景。适合有AI集成需求的开发者和企业客户,特别是对成本敏感且需要多模态能力的场景。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索