阶跃星辰Step 3大模型发布:重新定义国产算力与大模型协同新范式

2025年7月25日,上海世博中心外的黄浦江畔泛起夏日的涟漪,而在会场内,一场将深刻影响中国人工智能产业格局的技术发布会正在紧锣密鼓地筹备。次日(7月26日),作为2025世界人工智能大会(WAIC 2025)的”预热大戏”,阶跃星辰正式对外发布了其新一代基础大模型——Step 3,并宣布将于7月31日向全球企业与开发者开源。这款被称为”全尺寸原生多模态推理模型”的AI新品,不仅以321B的总参数量与38B的激活参数量刷新了行业对”高效能大模型”的认知,更凭借与国产算力芯片的深度协同能力,为中国AI产业的自主可控发展注入了强劲动能。

从”能用”到”好用”:Step 3的技术突破与性能突围

在AI大模型发展的”深水区”,”模型效果”与”推理成本”的矛盾始终是制约行业落地的核心痛点。此前,多数大模型要么追求参数规模的”暴力堆砌”,导致推理时算力消耗剧增;要么过度优化特定硬件(如国际高端GPU),难以适配国内广泛的中端芯片与国产算力。而Step 3的诞生,正是阶跃星辰针对这一矛盾给出的系统性解决方案。

作为阶跃星辰技术路线图中的里程碑产品,Step 3首次实现了”全尺寸原生多模态推理能力”的深度融合。所谓”全尺寸”,指的是模型在设计之初便覆盖从输入到输出的全流程,而非通过后期微调适配多模态任务;”原生多模态推理”则意味着其视觉感知、跨模态理解与复杂推理能力并非多模块拼接的结果,而是通过统一的神经网络架构自然生长出的能力。这种设计让Step 3在MMMU(多模态理解)、MathVision(数学与视觉交叉分析)、SimpleVQA(日常视觉问答)、AIME 2025(数学推理)、LiveCodeBench(代码生成)等全球权威榜单上,均取得了开源多模态推理模型的SOTA(最先进)成绩。例如,在侧重实际应用场景的SimpleVQA测试中,Step 3对复杂生活场景(如”根据超市价签与菜品图片计算优惠后的总价”)的理解准确率达到92.7%,较上一代模型提升15个百分点。

更值得关注的是,Step 3通过”模型架构创新+算法工程协同”的双轮驱动,打破了”大参数=高成本”的固有认知。其采用的MoE(混合专家)架构通过动态路由机制,让321B的总参数中仅38B被激活参与每一次推理,既保证了模型的深度表达能力,又大幅降低了单次推理的计算量。这种”按需调用”的智能分配策略,使得Step 3在保证效果的同时,推理效率实现了质的飞跃。

从”适配芯片”到”定义芯片”:国产算力的协同进化之路

在大模型与算力的关系中,中国企业长期面临着”卡脖子”困境:一方面,国际高端芯片(如NVIDIA A100/H100)因算力优势成为大模型训练的主流选择,但受限于供应链风险;另一方面,国内涌现的中端及国产芯片(如华为昇腾、沐曦、壁仞等)虽具备性价比与自主可控优势,却因大模型适配不足,难以发挥其真实算力潜力。

Step 3的发布,正是阶跃星辰针对这一”算力鸿沟”的破局之举。据官方技术负责人透露,Step 3在设计阶段便摒弃了”为特定芯片调优”的传统思路,转而采用”硬件特性优先”的架构设计——通过分析不同芯片的指令集、内存带宽、并行计算能力等底层特性,将模型层与系统层进行深度协同优化。这种”从芯片中来,到芯片中去”的设计理念,让Step 3在国产芯片上的推理效率实现了跨越式提升:

  • 在华为昇腾芯片上,基于昇腾AI基础软硬件平台(包括昇腾CANN、MindSpore等技术),Step 3通过算子融合、内存复用等优化技术,推理效率最高可达同期开源模型DeepSeek-R1的300%。这意味着,同样完成一次复杂多模态推理任务,使用昇腾芯片的成本可降低60%以上。
  • 在NVIDIA Hopper架构芯片上,通过分布式推理优化,Step 3的吞吐量相较DeepSeek-R1提升超70%。这一成绩在不牺牲激活参数量、不降低注意力容量的前提下实现,验证了其在国际主流算力上的兼容性优势。

目前,Step 3已与近10家芯片及基础设施厂商达成合作,共同发起”模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。其中,华为昇腾芯片已率先完成Step 3的搭载与运行测试,沐曦、天数智芯、燧原等厂商的适配工作也已进入收尾阶段,预计8月底前将陆续开放试用。这一联盟的成立,标志着中国AI产业正从”单点突破”转向”生态共建”,通过模型与算力的深度协同,加速构建自主可控的AI基础设施。

从”实验室”到”产业场”:Step 3的开源逻辑与生态愿景

对于大模型行业而言,”开源”不仅是一种技术共享模式,更是推动产业落地的关键抓手。Step 3选择在7月31日面向全球开源,正是阶跃星辰对”技术普惠”理念的践行。

据了解,Step 3的开源版本将完整开放模型权重、训练代码与推理框架,开发者可直接调用其多模态推理能力,快速开发垂直领域应用(如医疗影像分析、工业质检、智能教育等)。更值得关注的是,阶跃星辰同步推出了”Step 3开发者计划”,通过提供算力补贴、技术培训、生态资源对接等方式,降低开发者使用门槛。例如,针对中小企业用户,平台将提供”按需付费”的推理服务,确保即使没有高性能本地算力,也能低成本使用Step 3的能力。

“我们希望Step 3不仅是一个模型,更是一个’智能底座’。”阶跃星辰CEO在发布会上表示,”通过与国产芯片的深度适配、与开发者的共创共享,我们期待Step 3能成为连接前沿技术与产业需求的桥梁,推动AI从’炫技’走向’实用’,真正赋能千行百业。”

中国AI的”破局”与”超越”

在全球AI竞争日益激烈的今天,Step 3的发布具有多重标志性意义:它不仅是一款技术领先的多模态推理模型,更是中国AI产业在”算力自主+模型创新”道路上的一次重要突破。通过与国产芯片的深度协同、开源生态的构建,Step 3正在重新定义”大模型与算力的关系”——不再是”模型依赖算力”的单向索取,而是”模型定义算力、算力反哺模型”的双向赋能。

正如现场一位来自制造业的开发者所言:”以前我们用大模型做工业质检,要么忍受高昂的算力成本,要么牺牲精度;现在Step 3在昇腾芯片上的高效运行,让我们第一次看到了’用得起、用得好’的国产AI解决方案。”这或许正是Step 3最大的价值所在——它不仅是一项技术创新,更是一场推动中国AI产业从”跟跑”到”并跑”、甚至”领跑”的生态革命。随着7月31日的开源日期临近,Step 3能否点燃中国AI产业的新一轮创新热潮,我们拭目以待。

为您推荐