苹果发布Apple Intelligence:全新生成式AI技术深度解析

在2025年全球开发者大会上,苹果公司正式发布了Apple Intelligence,这是一套深度集成于苹果生态系统的生成式人工智能技术。这项突破性创新将从根本上改变用户与苹果设备的交互方式,同时坚守苹果一贯的隐私保护承诺。

Apple Intelligence的核心是两种专门设计的基础模型:一个约30亿参数的紧凑型设备端模型,以及一个采用创新并行轨道混合专家(PT-MoE)架构的服务器模型。这两种模型相辅相成,设备端模型针对Apple芯片进行了极致优化,确保低延迟响应;服务器模型则专注于处理更复杂的任务,提供更高的准确性和扩展性。

在模型架构方面,苹果工程师取得了多项技术突破。设备端模型采用5:3深度比例的双块设计,通过共享关键值缓存将内存使用量降低了37.5%。服务器模型则创新性地采用了并行轨道混合专家设计,显著降低了同步开销,使模型能够高效扩展同时保持低延迟。

训练数据方面,苹果采用了严格的质量控制标准。文本训练数据主要来自苹果网络爬虫Applebot收集的数百亿网页,同时严格遵守robots.txt协议,尊重网站所有者的选择权。图像数据方面,苹果整合了超过100亿高质量图像-文本对,以及1.75亿交错图像-文本文档,包含超过5.5亿张图像。

特别值得注意的是,苹果开发了全新的基础模型框架,使开发者能够轻松访问设备端语言模型。该框架引入了”引导生成”功能,开发者只需在Swift结构体或枚举上添加@Generable宏注释,就能获得类型安全的AI生成内容。工具调用功能则允许开发者扩展模型能力,为其提供特定信息源或服务。

在负责任AI方面,苹果制定了严格的指导原则:赋能用户智能工具、真实代表全球用户、谨慎设计每个环节、坚决保护用户隐私。苹果还建立了全面的安全评估体系,包括基础模型评估、功能特定评估以及跨文化和语言的本地化评估。

性能评估显示,苹果的设备端模型在所有语言上都优于稍大的Qwen-2.5-3B,在英语中与更大的Qwen-3-4B和Gemma-3-4B竞争。服务器模型表现优于参数规模相当的Llama-4-Scout,但落后于更大的Qwen-3-235B和GPT-4o。

展望未来,苹果计划持续扩展语言支持,提升模型能力,同时保持对隐私保护和负责任AI的承诺。随着基础模型框架向开发者开放,我们可以期待在苹果生态中看到更多创新的AI驱动应用。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索