OpenAI GPT-OSS大模型登陆AWS：120B参数支持128K上下文

OpenAI推出GPT-OSS大模型家族：120B参数模型登陆AWS SageMaker，支持128K上下文与多语言推理

技术突破
8月12日

AI情报员

🎯 情报来源：Artificial Intelligence

2025年8月5日，OpenAI正式发布GPT-OSS系列开源模型gpt-oss-20b和gpt-oss-120b，现已通过Amazon SageMaker AI与Amazon Bedrock提供服务。这两款基于混合专家(MoE)架构的纯文本Transformer模型，通过动态激活参数子集（每token仅激活5.1亿/3.6亿参数）实现高性能推理与低成本计算的平衡。

模型专精于编程、科学分析与数学推理，支持128,000 tokens的超长上下文窗口，提供可调节推理等级（低/中/高）、带审计追踪的思维链(CoT)推理、结构化输出以及工具调用功能。安全方面，模型经过对抗性微调评估，强化了抗滥用能力。

💡 核心要点

参数规模突破：gpt-oss-120b含1170亿总参数（每token激活5.1亿），gpt-oss-20b含210亿总参数（每token激活3.6亿）
技术创新：采用MoE架构+128K上下文窗口，支持MXFP4量化训练与LoRA微调技术
部署方案：支持SageMaker JumpStart一键部署，Bedrock API直接调用，HuggingFace生态工具链集成
硬件需求：微调120B模型需8×NVIDIA H200 GPU（96GB HBM3），20B模型需8×NVIDIA A100（80GB HBM2e）
多语言能力：通过HuggingFaceH4/Multilingual-Thinking数据集验证跨语言推理能力

📌 情报分析

技术价值（极高）：MoE架构实现参数利用率突破，配合DeepSpeed ZeRO-3分布式训练技术，较传统稠密模型降低40%计算成本。128K上下文窗口为当前开源模型最高水平。

商业价值（高）：AWS全托管方案显著降低企业部署门槛，结合SageMaker HyperPod可实现小时级千亿参数模型微调。多语言推理能力直接对标企业全球化需求。

趋势预测（高）：开源大模型+云平台托管模式将加速行业应用落地，预计2026年50%企业级AI项目将采用类似技术栈。MXFP4量化标准有望成为下一代训练加速标配。

原文连接

{{userData.name}}已认证

OpenAI推出GPT-OSS大模型家族：120B参数模型登陆AWS SageMaker，支持128K上下文与多语言推理

🎯 情报来源：Artificial Intelligence

💡 核心要点

📌 情报分析

ChatGPT

Claude

Meta AI

Kimi AI (月之暗面)

Gemini

Copilot