苹果强大的人工智能技术:不仅仅是ChatGPT

探索苹果强大的设备内和基于云的 AI 模型,旨在提升您的日常任务,同时优先考虑隐私和负责任的开发。探索他们用于高效、高性能 AI 处理的创新技术。

2025年2月14日

party-gif

苹果公司的新人工智能系统Apple Intelligence不仅仅提供类似ChatGPT的体验。通过与iOS、iPadOS和macOS深度集成,苹果公司开发了专门的模型,可以高效地完成用户的各种日常任务,从写作和总结到创作视觉内容。本博客文章深入探讨了苹果公司创新方法背后的技术细节和负责任的人工智能原则,突出了其改变我们与设备互动方式的潜力。

强大的设备端和基于云的 AI 模型

苹果公司开发了一套高度能力的生成式 AI 模型,深度集成到其 iOS、iPadOS 和 macOS 生态系统中。这些模型旨在解决用户的日常任务,并提供针对个人需求的个性化智能。

苹果 AI 工作的基础是一个拥有 30 亿参数的设备内语言模型,可直接在苹果设备上运行,利用苹果硅芯片的强大功能实现快速高效的推理。这个模型还配有一个更大的基于服务器的语言模型,可在必要时处理更复杂的任务,运行在苹果私有云基础设施上。

这些模型已针对各种用户体验进行了微调,包括编写和完善文本、优先级和总结通知、为对话创建有趣的图像,最重要的是,支持应用内操作以简化跨应用的交互。

苹果公司高度重视负责任的 AI 开发,其原则旨在赋能用户、真实代表他们的需求、精心设计,并保护用户隐私。该公司开发了新颖的数据策划、模型优化和动态适应技术,确保其 AI 工具高度强大、高效和安全。

负责任的 AI 开发原则

苹果公司负责任的 AI 开发方法围绕四个关键原则:

  1. 用智能工具赋能用户: 苹果公司确定了 AI 可以负责任地用于创造满足特定用户需求的工具的领域。他们的重点是构建深度个性化的产品,真实代表用户,避免延续stereotypes或偏见。

  2. 精心设计: 苹果公司在每个阶段都采取预防措施,包括设计、模型训练、功能开发和质量评估,以识别潜在的误用或危害。他们不断根据用户反馈改进 AI 工具。

  3. 保护隐私: 苹果公司通过设备内处理和私有云计算基础设施保护用户隐私。他们不使用个人数据或用户交互来训练基础模型。

  4. 代表我们的用户: 苹果公司不断努力,避免在其 AI 工具和模型中延续stereotypes和系统性偏见,目标是真实代表全球用户。

通过遵循这些原则,苹果公司旨在开发赋能用户、保护隐私并避免潜在危害或误用的 AI 系统。这种负责任的方法是苹果 AI 战略的关键差异化。

数据处理和模型训练流程

苹果的基础模型是使用许可数据和其网络爬虫 Apple Bot 收集的公开数据进行训练的。他们已实施几项措施,确保训练数据的质量和安全性:

  1. 数据过滤: 他们应用过滤器,从公开数据中删除个人身份信息、粗俗语言和其他低质量内容。
  2. 数据提取和重复数据删除: 他们执行数据提取、重复数据删除,并应用基于模型的分类器来识别高质量文档。
  3. 混合数据策略: 他们采用混合数据策略,在训练管道中结合人工标注和合成数据。
  4. 彻底的数据策划和过滤: 他们进行彻底的数据策划和过滤,确保高质量的训练数据。

在训练后阶段,苹果开发了两种新颖的算法进一步优化模型:

  1. 带有教师委员会的拒绝采样微调算法: 该算法使用教师委员会和来自人类反馈的强化学习来微调模型。
  2. 利用镜像下降策略优化和留一优势估计器的来自人类反馈的强化学习算法: 该算法利用镜像下降策略优化和留一优势估计器,将人类反馈纳入模型训练过程。

为了优化模型的速度和效率,苹果采用了几种技术:

  1. 组查询注意力: 设备内和基于服务器的模型都使用组查询注意力。
  2. 共享输入和输出词汇嵌入表: 这减少了内存需求和推理成本。
  3. 低位并行化: 设备内模型使用低位并行化来满足必要的内存、功率和性能要求。
  4. 混合 2 位和 4 位配置策略: 这种策略结合使用 Lora 适配器,在保持模型质量的同时实现平均每权重 3.5 位。
  5. Taria 交互式模型延迟和功耗分析工具: 该工具指导每个操作的比特率选择。
  6. 激活和嵌入量化: 采用额外的量化技术优化模型。
  7. 高效的键值缓存更新: 开发了一种方法,在神经引擎上实现高效的键值缓存更新。

这些优化使得设备内模型实现了 6 毫秒的首个令牌延迟和每秒 30 个令牌的生成速率,甚至在采用令牌推测技术之前就达到了这一水平。

针对速度和效率的模型优化

苹果公司利用了一系列创新技术来优化其生成模型,以实现设备内和基于服务器的部署。重点是实现高速和高效,以支持无缝的用户体验。

对于设备内推理,这个 30 亿参数的语言模型使用了低位并行化,这是一种关键的优化技术,满足必要的内存、功率和性能要求。为了保持质量,苹果开发了一个新框架,使用 Lora 适配器结合 2 位和 4 位的混合配置策略,平均每权重 3.5 位,实现了相同的准确性。

此外,苹果发明了一个名为 Taria 的工具,这是一个交互式模型延迟和功耗分析工具,可更好地指导每个操作的比特率选择。他们还利用了激活量化、嵌入量化,以及一种在神经引擎上实现高效键值缓存更新的方法。

通过这些优化,iPhone 15 Pro 可以实现 6 毫秒的首个令牌延迟和每秒 30 个令牌的生成速率,甚至在采用令牌推测技术之前就达到了这一水平,这些技术提供了进一步的增强。

对于基于服务器的大型语言模型,苹果也专注于速度和效率。他们使用共享的输入和输出词汇嵌入表来减少内存需求和推理成本。服务器模型的词汇量为 10 万,而设备内模型为 4.9 万。

通过利用这些创新的优化技术,苹果能够交付高性能的 AI 模型,可以在用户设备和私有云基础设施上高效运行,提供无缝和响应迅速的用户体验。

模型适应和个性化

苹果的基础模型针对用户的日常活动进行了微调,并可以动态地针对特定任务进行专门化。他们使用适配器 - 小型神经网络模块,可以插入预训练模型的各个层,对模型进行微调以支持特定任务。通过仅微调适配器层,基础预训练模型的原始参数保持不变,保留了模型的一般知识,同时调整适配器层以支持特定任务。

这种方法使苹果的 AI 模型能够根据用户的需求和偏好进行自适应和个性化,提供高度定制和高效的用户体验。这些模型可以快速专门化于总结、写作、编码等任务,而不会损害基础模型的核心知识和能力。这种动态适应是苹果方法的关键差异化,使其 AI 能够深度融入用户的日常生活,代表他们完成实际有价值的任务。

基准评估和安全比较

苹果公司广泛进行了基准测试和评估,评估了其设备内和基于服务器的基础模型。他们更注重人工评估,因为这些结果与实际用户体验高度相关。

对于特定功能的性能,他们将设备内模型与微软的 53 mini 模型进行了比较。在电子邮件总结和通知总结任务中,苹果的设备内模型实现了显著更高的人类满意度得分,分别为 87.5% 和 79%,而 53 mini 为 73% 和 73%。

除了特定功能的评估,苹果还评估了其设备内和服务器模型的一般能力。他们使用涵盖创意思维、分类、问答、编码等多种实际任务的综合性提示集。与 Gemini、Mistral、53、GPT-3.5 Turbo 和 GPT-4 Turbo 等模型相比,苹果的设备内模型表现良好,赢过 Gemini 的 62%、Mistral 的 46% 和 53 的 43%。

基于服务器的苹果模型的表现更好,只在这个一般能力评估中输给了 GPT-4 Turbo 模型。

重要的是,苹果公司高度重视安全性和有害性。在对输出有害性的人工评估中,苹果的设备内模型明显优于竞争对手。基于服务器的苹果模型在有害性得分方面也远远优于封闭源的前沿模型,如 GPT-3.5 Turbo、GPT-4 Turbo 等。

苹果公司在整个方法中都体现了对负责任的 AI 开发的重视。他们开发了新颖的技术,在设备内和私有云基础设施上优化模型的速度和效率,同时保持高性能和高质量。

结论

苹果公司在其研究论文中概述的人工智能方法是该领域一种令人耳目一新和创新的方法。通过专注于构建高度专业化、个性化的模型,并能在设备上高效运行,苹果有望提供比其竞争对手更通用、基于云的模型更优秀的用户体验。

苹果 AI 战略的关键亮点包括:

  1. 个性化模型: 苹果的基础模型针对用户的日常任务进行了微调,并可以根据每个用户的具体需求动态适应,利用苹果生态系统内丰富的个人数据。

  2. 设备内推理: 这个 30 亿参数的设备内语言模型允许快速高效的推理,每个提示令牌的延迟仅为 6 毫秒,生成速率为每秒 30 个令牌,同时仍然高度关注用户隐私和安全。

  3. 负责任的 AI 开发: 苹果公司明显投入了大量思考和努力,确保其 AI 模型的开发和部署是负责任的,并设有强大的保护措施,防止误用或潜在危害。

  4. 优化技术: 苹果采用了一系列创新的优化技术,如低位并行化、激活和嵌入量化,以及高效的键值缓存更新,以实现其设备内和基于服务器的模型所需的性能和效率要求。

总的来说,苹果的 AI 方法展示了他们致力于交付智能、个性化的工具,真正增强用户体验,同时优先考虑隐私、安全和负责任的开发。这一策略与苹果的品牌和生态系统很好地吻合,未来这些模型如何发展并融入公司的产品和服务,将是令人兴奋的。

FAQ