애플, OpenAI 이사회 합류, OpenAI 해킹, 탈옥, 그리고 기타 AI 뉴스

AI 최신 뉴스와 발전 사항을 발견하세요. 여기에는 Apple의 OpenAI 이사회 참여, 디바이스 내 AI 발전, 새로운 음성 분리 도구, OpenAI의 내부 해킹에 대한 보안 우려 등이 포함됩니다. AI 컴퓨팅의 진화하는 landscape와 미디어 및 기술의 미래에 대한 영향을 탐색하세요.

2025년 2월 17일

party-gif

이 블로그 게시물은 AI 산업의 최신 동향에 대한 종합적인 개요를 제공합니다. Apple의 OpenAI 참여부터 새로운 AI 모델 및 도구 출시까지 다양한 주제를 다룹니다. 독자들은 on-device AI 처리, 음성 기능, 3D 자산 생성 등 AI 기술의 발전상을 이해할 수 있습니다. 또한 이 게시물은 AI 커뮤니티 내의 중요한 보안 문제와 침해 사례를 다루어 이 분야의 현재 상황에 대한 균형 잡힌 관점을 제공합니다.

애플, OpenAI 이사회 합류: 놀라운 움직임

애플이 OpenAI의 이사회 옵저버 자리를 얻었다고 보고되었습니다. 이는 놀라운 움직임으로, Microsoft는 OpenAI의 이사회 자리를 얻기 위해 절반을 구매해야 했지만, 애플은 OpenAI에 아무것도 지불하지 않고도 이사회 자리를 얻었습니다. 이 자리는 애플의 전 마케팅 책임자인 Phil Schiller이 선택되었습니다.

이 소식은 흥미로운데, 애플의 AI 발표 이후 그들이 파트너십 면에서 OpenAI와 거리를 두고 있다는 것이 분명했기 때문입니다. 모두가 ChatGPT가 애플 생태계에 깊이 통합될 것이라고 생각했지만, 결과적으로 애플은 자사 기기와 사설 클라우드에서 실행되는 자체 인공지능을 많이 개발해왔습니다. 세계 지식이 필요한 모든 작업은 OpenAI의 API로 오프로드되고 전송되지만, 사용자의 의도를 매번 확인한 후에만 그렇게 합니다.

애플이 양쪽의 이점을 얻고 있는 것 같습니다. 그들은 OpenAI의 기능을 활용하면서도 자체 인하우스 AI 솔루션을 개발하고 있습니다. 이 움직임은 애플이 모두를 제압하고 AI 환경에서 전략적으로 자신의 위치를 잡고 있음을 시사합니다.

세일즈포스, 아인슈타인 타이니 자이언트 공개: 온디바이스 AI의 부상

세일즈포스 CEO 마크 베니오프는 세일즈포스 아인슈타인 타이니 자이언트라는 10억 개의 매개변수 모델을 출시했다고 발표했습니다. 이 모델은 GPT-3.5와 Claude를 포함한 자체 크기의 7배 모델을 능가하는 온디바이스 성능을 보여줍니다. 이 개발은 더 작고 효율적인 모델이 중요한 역할을 할 미래의 AI 처리 방향으로 향하는 중요한 한 걸음입니다.

세일즈포스 아인슈타인 타이니 자이언트의 주요 특징은 다음과 같습니다:

  • 10억 개의 매개변수를 가진 "마이크로" 모델입니다.
  • 더 큰 모델들보다 온디바이스 성능이 뛰어납니다.
  • 이는 사용자 기기에서 로컬로 계산을 수행하는 온디바이스 AI 처리의 부상을 나타냅니다.
  • 온디바이스 AI 처리는 프라이버시, 보안, 낮은 지연 시간, 비용 효율성 등의 이점을 제공합니다.
  • 베니오프는 일반화된 모델에 의해 조율되는 더 작은 작업별 모델의 조합으로 AI 스택의 미래를 구상하고 있습니다.
  • 세일즈포스 아인슈타인 타이니 자이언트와 같은 오픈소스 마이크로 모델의 등장은 이러한 미래 AI 스택 실현을 향한 중요한 한 걸음입니다.

오픈 사이언스의 모시: OpenAI를 앞서는 음성 기능

오픈 사이언스라는 회사가 OpenAI보다 먼저 완전한 음성 기능을 개발한 것 같습니다. 그들은 Moshi라는 실시간 네이티브 멀티모달 파운데이션 모델을 출시했는데, 이는 5월에 OpenAI가 GPT-4로 선보인 것과 유사하게 듣고 말할 수 있습니다. 그러나 GPT-4의 음성 기능은 지연되고 있으며 언제 출시될지 불분명합니다.

Moshi는 다음과 같은 인상적인 기능들을 가지고 있습니다:

  • 감정을 표현하고 이해할 수 있습니다.
  • 프랑스어 같은 억양으로 말합니다.
  • 오디오 음성을 듣고 생성할 수 있습니다.
  • 말하면서 생각합니다.
  • 동시에 두 개의 오디오 스트림을 지원하여 듣고 말할 수 있습니다.
  • 합성 데이터로 사전 학습되었고, 10만 개의 구어체 합성 대화로 미세 조정되었습니다.
  • 별도의 TTS 모델로 생성된 합성 데이터에서 음성을 학습했습니다.
  • 200밀리초의 엔드-투-엔드 지연 시간을 가집니다.
  • MacBook 또는 일반 GPU에서 실행되는 더 작은 버전이 있습니다.
  • AI 생성 오디오를 감지하는 워터마킹을 사용합니다.
  • 데모, 코드, 모델, 논문 등이 곧 완전히 공개될 예정입니다.

저자는 데모를 사용해 보았지만 일관성이 없다고 느꼈지만, 오픈소스 버전이 출시되면 다시 테스트해 볼 것입니다. 실시간으로 듣고 말할 수 있는 멀티모달 파운데이션 모델을 갖는 것은 중요한 진보이며, Moshi가 OpenAI의 향후 음성 기능과 어떻게 비교될지 흥미로울 것입니다.

계산의 미래: 패러다임의 전환

OpenAI의 공동 설립자이자 인공지능 분야의 선구자인 Andrew Karpathy에 따르면, 계산의 본질이 근본적으로 변화하고 있습니다. 우리는 1980년대 컴퓨팅과 유사한 새로운 컴퓨팅 패러다임으로 들어가고 있습니다.

중앙 처리 장치가 바이트 단위의 명령을 처리하는 대신, 이제 우리는 토큰(작은 문자열 조각) 단위로 작동하는 대형 언어 모델을 중앙 처리 장치로 사용하고 있습니다. 또한 바이트 단위의 RAM 대신 토큰 단위의 컨텍스트 창이 있으며, 다른 컴퓨팅 구성 요소의 등가물도 있습니다.

Karpathy는 이 새로운 "컴퓨터"를 대형 언어 모델(LLM)이라고 부르며, 이를 우리 모두가 프로그래밍을 배워야 하는 새로운 시스템으로 보고 있습니다. 그 강점, 한계, 그리고 제품에 효과적으로 통합하는 방법을 이해하는 것이 향후 몇 년 동안 중요할 것입니다.

이러한 컴퓨팅 패러다임의 변화는 기존의 운영 체제와 애플리케이션이 더 이상 필요하지 않을 수 있음을 시사합니다. 미래에는 대형 언어 모델에 직접 말하고, 모델이 원하는 계산을 어떤 엔드 디바이스에서든 수행할 수 있게 될 것입니다.

Karpathy는 이러한 미래 비전이 개발자의 현재 역할에 도전한다고 믿습니다. 그는 향후 10년 내에 개발자의 필요성이 크게 줄어들 것이라고 예측합니다. 컴퓨팅 환경이 진화하고 있으며, 대형 언어 모델을 효과적으로 활용할 수 있는 능력이 향후 혁신과 발전을 주도할 핵심 요인이 될 것입니다.

11 랩스의 혁신적인 오디오 도구: 음성 분리 및 유명 음성

AI 음성 회사 11 Labs가 두 가지 새로운 흥미로운 제품을 출시했습니다:

  1. 음성 분리기: 이 도구는 음성을 녹음하고 상당한 배경 소음이 있는 오디오 샘플에서 결정적인 음성을 추출할 수 있습니다. 데모에서는 배경 소음을 제거하고 고품질 오디오를 제공하는 기능을 보여주는데, 이는 시끄러운 환경에서 인터뷰나 화상 통화를 녹음할 때 매우 유용할 수 있습니다.

  2. 유명 음성: 11 Labs는 iOS 앱에 유명 음성을 가져오고 있으며, 사용자가 제임스 딘, 주디 갈랜드, 버트 레이놀즈, 시어 로렌스 올리비에와 같은 역사적인 할리우드 아이콘들이 원하는 말을 하도록 할 수 있습니다. 이 기능은 지적 재산권 소유자가 AI 회사에 사람의 음성과 모습을 재현할 권리를 판매할 수 있는 미디어의 미래를 보여줍니다.

11 Labs의 이러한 혁신적인 오디오 도구는 음성 기술의 발전과 AI가 콘텐츠 창작에서 커뮤니케이션에 이르는 다양한 산업을 변화시킬 수 있는 잠재력을 보여줍니다. 음성 분리 기능은 오디오 녹음의 품질을 크게 향상시킬 수 있으며, 유명 음성 기능은 개인화된 미디어 경험을 위한 새로운 가능성을 열어줍니다.

퍼플렉시티 프로 검색: 다단계 추론 및 코딩 기능 향상

Perplexity는 다단계 추론, 고급 수학 및 프로그래밍 기능을 수행할 수 있는 업데이트된 Pro Search 버전을 발표했습니다.

Perplexity Pro Search의 주요 기능은 다음과 같습니다:

  1. 다단계 추론: 이 시스템은 이제 더 복잡한 문제에 대해 다단계 추론으로 접근합니다. 질문이 계획을 필요로 할 때 이해하고, 단계별로 목표를 달성하며, 더 효율적으로 심층적인 답변을 종합합니다.

  2. Wolfram Alpha와 코드 실행: Perplexity Pro Search에는 복잡한 문제를 해결하기 위한 고급 수학 및 프로그래밍 기능이 추가되었습니다. 이를 통해 100번 홉의 "야간 다이얼" 문제와 같이 코드 실행이 필요한 문제를 해결할 수 있습니다.

  3. 향상된 쿼리 처리: 업데이트된 시스템은 더 복잡한 쿼리를 처리할 수 있으며, 이를 여러 단계로 분해하여 포괄적이고 잘 구성된 답변을 제공합니다.

이러한 향상으로 Perplexity Pro Search는 계획, 추론, 다양한 정보 소스의 통합이 필요한 복잡한 질문을 해결할 수 있는 더 강력한 연구 도구가 되었습니다. 고급 수학 및 코딩 기능의 추가는 시스템의 문제 해결 능력을 더욱 확장합니다.

저자는 Perplexity를 광범위하게 사용하지 않았지만, 업데이트된 기능은 복잡한 쿼리에 대한 심층적이고 다면적인 답변을 찾는 데 도움이 될 수 있음을 시사합니다. Perplexity Pro Search를 사용할지 여부는 개인의 필요와 다른 도구와 비교했을 때 제공하는 가치에 따라 결정될 것입니다.

메타 3D 젠: 3D 자산 생성 변혁

메타(Meta)가 혁신적인 새로운 시스템인 Meta 3D Gen을 공개했습니다. 이 AI 기반 도구는 3D 자산 생성 방식을 혁명적으로 변화시킬 것으로 보입니다.

Meta 3D Gen은 간단한 텍스트 프롬프트만으로 고품질 3D 자산, 세부적인 텍스처 및 재질 맵을 생성할 수 있는 통합 AI 시스템입니다. 이 놀라운 기능을 통해 창작자들은 전통적인 방법을 사용할 때보다 훨씬

자주하는 질문