苹果加入OpenAI董事会,OpenAI遭黑客攻击,越狱,以及更多人工智能新闻

探索最新的人工智能新闻和发展,包括苹果公司在OpenAI董事会上的席位、设备内人工智能的进步、一种新的语音隔离工具,以及围绕OpenAI内部黑客活动的安全问题。探索人工智能计算不断发展的格局及其对媒体和技术未来的影响。

2025年12月12日

这篇博客文章提供了人工智能行业最新发展的全面概述,涵盖了从苹果公司参与OpenAI到新的人工智能模型和工具发布等各种主题。读者将了解人工智能技术不断发展的景观,包括设备内人工智能处理、语音功能和3D资产生成方面的进步。此外,该文章还讨论了人工智能社区内重要的安全问题和漏洞,为该领域的当前状况提供了全面的视角。

苹果加入OpenAI董事会:一个令人惊讶的举动
Salesforce推出Einstein Tiny Giant:设备端AI的崛起
Open Science的Moshi:击败OpenAI的语音能力
计算的未来:范式转变
11 Labs的创新音频工具:语音隔离和名人声音
Perplexity Pro Search:推进多步推理和编码能力
Meta 3D Gen:改变3D资产创作
GPT-4All 3.0:开源本地LLM桌面应用程序
Anthropic的模型评估计划:确保安全性和一致性
Skeleton Key AI Jailbreak:绕过安全协议
OpenAI的安全困扰:被黑的消息系统和未加密的聊天记录
结论

苹果加入OpenAI董事会:一个令人惊讶的举动

据报道,苹果公司正获得在OpenAI董事会上的观察员席位。这是一个令人惊讶的举动,因为微软不得不购买OpenAI的一半股权才能获得一个董事会席位,而苹果公司不需要向OpenAI支付任何费用就获得了一个董事会席位。这个席位已经被选定给苹果公司前营销主管菲尔·施勒。

这个消息很有趣,因为在苹果公司宣布其人工智能计划后,人们认为它与OpenAI的合作关系会更加密切。大家都认为ChatGPT会深度融入苹果生态系统,但事实证明,苹果公司已经在内部开发了大量自己的人工智能技术,用于在其设备和私有云上运行。任何需要世界知识的任务都会被卸载并发送到OpenAI的API,但每次都需要确认用户的意图。

看来苹果公司正在获得双赢的局面 - 它们利用OpenAI的能力,同时也在开发自己的内部人工智能解决方案。这一举措表明,苹果公司正在战略性地定位自己,在人工智能领域占据优势地位。

Salesforce推出Einstein Tiny Giant:设备端AI的崛起

销售力公司CEO马克·贝尼奥夫宣布推出Salesforce Einstein Tiny Giant,这是一个拥有10亿参数的模型,在设备上的性能优于7倍大小的模型,包括GPT-3.5和Claude。这一发展是朝着未来人工智能处理的重要一步,小型高效的模型将在其中发挥关键作用。

Salesforce Einstein Tiny Giant的主要亮点包括:

它是一个拥有10亿参数的模型,在大型语言模型的世界里属于"微型"模型。
尽管体积较小,但它在设备上的性能优于更大的模型,如GPT-3.5和Claude。
这个模型代表了设备端人工智能处理的兴起,计算在用户设备上本地进行,而不是依赖于云基础设施。
设备端人工智能处理提供了多方面的优势,包括隐私保护、安全性、低延迟和成本效率。
贝尼奥夫对未来人工智能堆栈的愿景是,由一个通用模型协调多个小型、专用模型,以实现最大的效率和性能。
像Salesforce Einstein Tiny Giant这样的开源微型模型的出现,是实现这一人工智能堆栈愿景的重要一步。

总的来说,Salesforce Einstein Tiny Giant的推出证明了设备端人工智能处理的日益重要性,以及小型专用模型在某些用例中可能超越大型模型的潜力。

Open Science的Moshi:击败OpenAI的语音能力

一家名为Open Science的公司似乎在OpenAI之前实现了全面的语音功能。他们发布了Moshi,这是一个实时的原生多模态基础模型,可以听和说,类似于OpenAI在5月展示的GPT-4。然而,GPT-4的语音功能推迟了,目前还不清楚什么时候会发布。

Moshi有几个令人印象深刻的功能:

能够表达和理解情感
说话带有类似法语的口音
能够听和生成语音
边说边思考
支持同时听和说两个音频流
在合成数据上进行联合预训练,然后在10万个口语化合成对话上进行微调
从由单独的TTS模型生成的合成数据中学习了自己的声音
端到端延迟为200毫秒
有一个更小的版本可以在MacBook或消费级GPU上运行
使用水印技术来检测AI生成的音频
很快就会完全开源,包括演示、代码、模型和论文

虽然作者尝试了这个演示,发现它表现不太稳定,但他很期待在开源版本可用后再次测试。拥有一个实时的多模态基础模型,能够听和说,这是一个重大进步,让人很期待看看Moshi与OpenAI未来语音功能的表现对比。

计算的未来:范式转变

根据OpenAI的联合创始人、人工智能领域的著名人物安德鲁·卡帕西的说法,计算的本质正在发生根本性的变化。我们正在进入一个新的计算范式,类似于20世纪80年代的计算。

与中央处理器对字节进行指令操作不同,我们现在有大型语言模型作为中央处理器,对令牌(小字符串片段)进行操作。此外,我们有一个令牌的上下文窗口,而不是字节的RAM,以及其他计算组件的等价物。

卡帕西将这种新的"计算机"称为大型语言模型(LLM),他认为这是一个我们正在学习编程的新系统。了解其优势、局限性以及如何有效地将其纳入产品中,在未来几年将至关重要。

这种计算范式的转变意味着,传统的操作系统和应用程序可能不再必要。未来可能涉及直接与大型语言模型对话,后者可以在任何终端设备上执行所需的计算,而无需传统的软件开发。

这种对未来的愿景挑战了当前开发者的角色,卡帕西认为,在未来10年内,开发者的需求可能会大幅减少。计算格局正在发生变化,有效利用大型语言模型将成为推动创新和进步的关键驱动力。

11 Labs的创新音频工具:语音隔离和名人声音

11 Labs,这家AI语音公司,发布了两款新的令人兴奋的产品:

语音隔离器: 这个工具可以录制语音,并从任何音频样本中提取清晰的语音,即使存在大量背景噪音。演示展示了它去除背景噪音并提供高质量音频的能力,这对于在嘈杂环境中录制采访或视频通话非常有用。
名人之声: 11 Labs正在将名人之声引入其iOS应用程序,让用户可以让好莱坞传奇人物詹姆斯·迪恩、朱迪·嘉兰、伯特·雷诺兹和劳伦斯·奥利弗说出他们想说的话。这个功能展示了媒体的未来,知识产权所有者可以将复制一个人的声音和形象的权利出售给人工智能公司。

11 Labs的这些创新音频工具展示了语音技术的进步,以及人工智能转变各行各业(从内容创作到通信)的潜力。语音隔离功能可以显著提高音频录制的质量,而名人之声功能则开辟了个性化媒体体验的新可能性。

Perplexity Pro Search:推进多步推理和编码能力

Perplexity宣布更新了Pro Search版本,可以对更复杂的查询进行更深入的研究,具有多步推理能力,以及高级数学和编程功能。

Perplexity Pro Search更新的主要功能包括:

多步推理: 该系统现在可以以更多步骤的推理方式处理复杂的问题。它理解何时需要规划,逐步工作,并以更高的效率综合深入的答案。
Wolfram Alpha和代码执行: Perplexity Pro Search增加了高级数学和编程功能,允许它解决需要代码执行的复杂问题,例如100跳的"夜拨号"问题。
查询处理改进: 更新后的系统可以处理更复杂的查询,将其分解为多个步骤,以提供全面和经过深思熟虑的答案。

这些增强使Perplexity Pro Search成为一个更强大的研究工具,能够处理需要规划、推理和整合各种信息源的复杂问题。增加高级数学和编码功能进一步扩展了该系统的问题解决能力。

虽然作者没有广泛使用过Perplexity,但更新的功能表明它可能是一个有价值的资源,适用于寻求对复杂查询进行深入、多方面回答的人。是否使用Perplexity Pro Search将取决于个人需求和它相对于其他可用工具的价值。

Meta 3D Gen:改变3D资产创作

科技巨头Meta推出了一个突破性的新系统,称为Meta 3D Gen。这个创新的AI驱动工具旨在革新3D资产的创建方式,提供无缝高效的端到端解决方案。

Meta 3D Gen是一个综合的AI系统,可以从简单的文本提示生成高质量的3D资产,包括详细的纹理和材质贴图。这种卓越的功能使创作者能够以传统方法通常需要的时间分之一的速度生产出惊艳的3D内容。

该系统的性能确实令人印象深刻,它能够生成超越现有解决方案的结果,同时以3到10倍的速度运行。这种显著的效率和质量提升,是3D资产创作行业的一个游戏规则改变者。

通过利用人工智能的力量,Meta 3D Gen使创作者能够专注于他们的创意愿景,而不会被3D建模和纹理制作的技术复杂性所困扰。这种创作工作流程的转变,有望释放新的可能性,并引领3D内容创作进入一个全新的时代。

Meta还通过发表两篇研究论文来支持这个项目,为广大社区提供宝贵的见解和技术细节,供他们探索和建立。

随着媒体格局的不断发展,动态和按需生成3D资产的能力将成为一项关键资产。Meta 3D Gen的功能与个性化和定制内容的新兴趋势相吻合,在这种趋势下,视频游戏、电影和其他媒体可以实时生成,以满足个人偏好。

Meta这项创新技术是该公司致力于推动3D资产创作领域极限的一个证明。有了Meta 3D Gen,媒体和内容生成的未来正处于变革的边缘。

GPT-4All 3.0:开源本地LLM桌面应用程序

允许您在本地运行模型的原始项目称为GPT-4All,现在他们发布了GPT-4All 3.0。去年,Meta AI的原始LLaMA模型被泄露,Nomic AI的创造者(GPT-4All的创造者)能够构建一个应用程序,让您实际上可以在本地运行LLaMA。

GPT-4All 3.0是这个开源的本地LLM桌面应用程序的最新版本。它现在支持数千个模型和所有主要操作系统,并进行了重大的用户界面和用户体验改进。我已经查看并使用过它,它确实很不错,干净利落,适合那些不想考虑在本地运行模型复杂性的人。这是一种在不用担心技术细节的情况下运行模型的好方法。

这个软件完全开源,采用MIT许可,您今天就可以下载并安装。它内置了本地文件聊天功能,使其成为一种用户友好的方式来与您自己的设备上的大型语言模型进行交互。

Anthropic的模型评估计划:确保安全性和一致性

人工智能公司Anthropic(开发了高度强大的语言模型Claude 3.5)宣布了一项新的举措,旨在解决开发高质量、安全相关的先进AI模型评估的挑战。对这些评估的需求正在超过供给,Anthropic正采取措施来解决这一问题。

这项举措的关键点如下:

开发有效的评估: Anthropic认识到,为AI模型开发强大和全面的评估仍然是一项具有挑战性的任务。目标是为第三方组织提供资金,以创建能够有效衡量先进功能和安全性的评估。
解决静态基准的局限性: 现有评估框架的一个问题是它们可能是静态的,允许模型开发人员只需在特定问题上训练他们的模型。这可能导致过度拟合和对模型真实能力的错误认知。Anthropic旨在支持创建动态、多样的问题集,以测试广泛的功能,包括安全性。
资助第三方评估: 为了解决供给-需求差距,Anthropic正在推出一项新的举措,为能够开发这些高质量、安全相关评估的第三方组织提供资金。这将有助于确保评估的独立性和公正性,提供更准确的模型评估。

通过支持这些先进评估框架的开发,Anthropic旨在提高模型评估的透明度和可靠性。这对于依赖这些模

FAQ

苹果加入OpenAI董事会的意义是什么?

Salesforce Einstein Tiny Giant是什么,它与其他语言模型相比如何?

Open Science的多模态基础模型Moshi与OpenAI的GPT-4在语音功能方面有何不同?

Andrew Karpathy对计算的未来及大型语言模型的作用有何看法?

更新后的Perplexity Pro Search有哪些新功能和能力?

Meta的新3D生成系统是什么,它与现有解决方案相比如何?

GPT-4-All新版本的主要功能和更新是什么?

Anthropic的新第三方模型评估计划是什么,为什么很重要?

什么是'骨钥匙'AI越狱技术,哪些模型受到影响?

OpenAI系统发现了哪两个主要的安全问题?