AI 뉴스: AI 발전 및 개발에 바쁜 한 주

지난 주 OpenAI의 고급 음성 기능, GPT-4의 긴 출력 기능, Microsoft의 AI 경쟁 주장, Google, Anthropic, Meta 등의 업데이트를 포함한 최신 AI 발전 및 동향을 발견하세요. 끊임없이 변화하는 AI 세계에서 앞서 나가세요.

2025년 2월 15일

party-gif

이 블로그 게시물은 OpenAI의 ChatGPT의 새로운 음성 기능부터 Canva의 Leonardo AI 인수에 이르기까지 AI 세계의 최신 발전에 대한 종합적인 개요를 제공합니다. 독자들은 급속도로 발전하는 AI 환경과 이 기술의 미래를 형성하는 흥미로운 발전에 대한 통찰력을 얻게 될 것입니다.

OpenAI의 고급 음성 기능

Open AI가 일부 사용자들에게 고급 음성 기능을 제공하기 시작했습니다. 이 새로운 기능을 통해 사용자들은 스칼렛 요한슨과 같은 유명인의 목소리를 모방할 수 있는 사실적인 음성을 생성할 수 있습니다.

고급 음성 모드의 주요 특징은 다음과 같습니다:

  • 액세스 권한이 있는 사용자는 채팅 창 하단의 "고급 음성 모드" 옵션을 사용할 수 있습니다.
  • 유명인과 공인의 목소리를 모방할 수 있는 매우 사실적인 음성을 생성할 수 있습니다.
  • 사용자는 음성이 말하는 동안 이를 중단할 수 있는데, 이는 표준 채팅 GPT 앱에서는 사용할 수 없는 기능입니다.
  • 데모에서는 음성 모델이 숨을 쉬는 것처럼 매우 빨리 세기를 셀 수 있음을 보여줍니다.

GPT-4 장문 출력

Open AI는 최근 "GPT-4 Long Output"이라는 GPT-4의 실험적 버전을 출시했습니다. 이 새로운 모델은 요청당 최대 64,000개의 토큰을 출력할 수 있어, 표준 GPT-4 모델에 비해 훨씬 더 긴 길이와 자세한 응답을 제공할 수 있습니다.

GPT-4 Long Output 모델은 현재 일부 Alpha 참여자들에게만 제공되며, 일반 대중에게는 아직 접근할 수 없습니다. 이 실험적 버전은 사용자들이 매우 긴 길이와 자세한 출력을 생성할 수 있도록 설계되었습니다.

모델의 아키텍처와 학습 과정에 대한 세부 사항은 공개되지 않았지만, 출력 길이 증가는 모델의 메모리와 추론 능력 향상을 통해 달성된 것으로 보입니다. 이를 통해 모델은 더 긴 텍스트 범위에 걸쳐 문맥과 일관성을 유지할 수 있게 되었습니다.

GPT-4 Long Output 모델의 잠재적 활용 분야는 광범위하며, 연구 및 분석 작업부터 보고서, 에세이, 심지어 책과 같은 장문 콘텐츠 생성에 이르기까지 다양합니다. 그러나 강력한 AI 기술이라는 점에서 잠재적 오용 또는 의도하지 않은 결과에 대한 우려도 있습니다.

Open AI는 GPT-4 Long Output 모델의 책임감 있는 개발과 배포를 위해 규제 기관 및 기타 이해관계자들과 긴밀히 협력하고 있다고 밝혔습니다. 이는 모델이 해로운 목적이나 비윤리적으로 사용되는 것을 방지하기 위한 안전장치와 지침을 포함합니다.

Microsoft에 대한 OpenAI의 경쟁자

이번 주 마이크로소프트는 Open AI가 AI와 검색 분야의 경쟁자라고 주장하고 있습니다. 이는 흥미로운데, 마이크로소프트가 Open AI에 130억 달러를 투자했고 회사의 49%를 소유하고 있기 때문입니다.

마이크로소프트의 재무 보고서에 따르면, Anthropic, Open AI, Meta 및 기타 오픈 소스 제품들이 자사의 AI 제품에 대한 경쟁자로 나열되어 있습니다. 이는 Open AI가 마이크로소프트의 지분 49%를 보유하고 있고 Meta와도 파트너십 계약을 맺고 있다는 점에서 매우 이례적입니다.

이는 마이크로소프트가 자사의 검색 및 뉴스 광고 사업에 대한 경쟁자로 Open AI를 보고 있다는 것을 보여줍니다. 이는 두 회사 간에 흥미로운 역학 관계가 발전했음을 나타냅니다.

OpenAI의 AI 규제 지지

Open AI는 이번 주 AI 규제 및 안전과 관련된 몇 가지 상원 법안을 지지했습니다. 여기에는 미국 AI 안전 연구소를 연방 기관으로 공식 승인하여 AI 모델에 대한 표준과 지침을 수립하도록 하는 "Future of AI Innovation Act"가 포함됩니다.

Open AI는 또한 NSF AI 교육법과 CREATE AI법도 지지했는데, 이 법안들은 AI 연구를 위한 연방 장학금을 제공하고 대학 및 K-12 학교 내에 AI 교육 자원을 설립합니다.

Open AI의 이러한 지지는 향후 AI 규제에 관한 논의에서 자사의 입장을 대변할 수 있는 발판을 마련하기 위한 것으로 보입니다. 주요 AI 기업인 Open AI는 향후 규제 대상이 될 가능성이 크기 때문에, 이러한 법안 지지를 통해 규제 방향 설정에 영향을 미치고자 하는 것으로 보입니다.

또한 Open AI는 다음 모델에 대한 조기 접근권을 미국 AI 안전 연구소에 제공하겠다고 약속했습니다. 이는 Open AI가 더 강력한 생성 AI 기술 개발에 우선순위를 두었다는 비판을 해소하려는 노력으로 보입니다.

전반적으로 Open AI의 움직임은 해당 기업이 미국 정부와 더 가까워지고 AI 규제 및 안전 기준 개발의 핵심 이해관계자로 자리매김하려 한다는 것을 보여줍니다.

Anthropic, 브라질에서 Claud 출시

브라질 사용자들에게 반가운 소식입니다. Anthropic이 이번 주 자사의 AI 어시스턴트 Claud를 브라질에 출시했습니다. Claud를 이용하여 브라질 사용자들도 상호작용할 수 있게 되었습니다.

Google의 Gemini 1.5 Pro 및 기타 AI 모델

구글도 이번 주 AI 분야에서 큰 움직임을 보였습니다. 그들은 Gemini 1.5 Pro의 새로운 버전 0801을 출시했으며, 이를 Google의 AI Studio에서 바로 사용할 수 있습니다.

AI Studio(ai.studio.google.com)에 접속하여 "Model" 드롭다운 메뉴에서 "Gemini 1.5 Pro experimental 0801"을 선택하면 이 모델을 사용할 수 있습니다.

이 새로운 Gemini 1.5 Pro 모델과 대화를 나누면 lm.org 리더보드에서 GPT-4, GPT-4 Mini, CLAE 3.5, Sonet 등을 능가하는 성과를 보여줍니다.

구글은 또한 이번 주 자사의 Gemini 2 모델의 더 작은 버전을 출시했습니다. 이는 2억 개의 매개변수를 가진 모델로, 더 빠른 성능과 효율성을 위해 설계되었으며, 모바일 기기에 적합할 것으로 보입니다. 흥미롭게도 이 2억 개 매개변수 모델은 Mixdral 8X 7B, GPT-3.5 Turbo, LLaMA 2 70 billion과 같은 훨씬 더 큰 모델들을 능가하는 성능을 보여줍니다.

새로운 Gemini 모델 출시 외에도 구글은 Chrome에 Google Lens 통합, 제품 비교 기능 등 인상적인 새로운 AI 기능을 추가했습니다.

전반적으로 구글은 대형 언어 모델과 Chrome의 AI 기능 발전을 계속 주도하며, AI 분야에서의 혁신과 리더십을 입증하고 있습니다.

Google의 새로운 Chrome AI 기능

이번 주 구글은 Chrome 브라우저에 새로운 AI 기반 기능을 추가했습니다:

  1. Chrome 데스크톱의 Google Lens: 이제 Chrome 브라우저에서 Google Lens를 사용하여 이미지 속 물체에 대한 정보를 검색할 수 있습니다. 이미지의 특정 영역을 선택하면 Lens가 유사한 제품을 찾거나 물체를 식별합니다.

  2. 제품 비교: Chrome에 내장된 새로운 기능을 통해 다른 탭과 웹사이트에서 제품을 비교할 수 있습니다. 이를 통해 탭을 전환하지 않고도 제품을 연구하고 비교할 수 있습니다.

  3. 자연어 검색 기록: 이제 Chrome 브라우징 기록을 자연어로 검색할 수 있습니다. 예를 들어 "지난주에 봤던 아이스크림 가게가 어디였지?"라고 물어보면 관련 정보가 표시됩니다.

이러한 Chrome의 새로운 AI 기반 기능은 구글이 지능형 기능을 자사의 핵심 제품과 서비스에 통합하려는 노력을 보여줍니다. 컴퓨터 비전과 자연어 처리 기술을 활용하여 사용자가 정보를 찾고, 제품을 비교하며, 브라우징 기록을 탐색할 수 있도록 지원합니다. AI 기술이 발전함에 따라 이러한 지능형 기능이 구글의 다양한 도구와 애플리케이션에 더욱 일반화될 것으로 예상됩니다.

Meta의 AI 채팅봇 폐기 및 새로운 AI 스튜디오

이번 주 Meta는 지난해 Meta Connect에서 발표했던 기능 중 하나를 없앴습니다. 그들은 유명인의 모습을 사용하지만 실제 그 유명인의 채팅봇이 아닌 AI 채팅봇을 선보였었는데, 이에 대한 반응이 좋지 않아 Meta가 이 기능을 없앴습니다.

하지만 그 대신 새로운 기능을 선보였습니다 - 이제 누구나 자신만의 맞춤형 AI를 만들 수 있습니다. Meta가 AI Studio를 출시했고, 제 친구 Don Allen Stevenson 씨는 이 기능의 초기 접근권을 받은 사람 중 한 명입니다.

이 새로운 기능을 통해 사람들은 자신의 관심사에 기반한 AI 캐릭터를 만들 수 있습니다. ai.meta.com/AI-Studio에 가서 AI 애완동물, 개인 과외 선생님, 팬 동료, 상상력 넘치는 예술가, 사운딩 보드, 창의적 디자이너, 개인 스타일리스트 등 다양한 옵션 중에서 선택할 수 있습니다.

이 과정에서 AI가 캐릭터 이미지를 생성하고 이름과 태그라인을 부여하며, 사용자가 이 AI가 어떤 역할을 하기를 원하는지 추가로 커스터마이징할 수 있습니다. 현재는 아직 약간의 새로운 기능 같지만, 향후 사용자가 대량의 문서나 대본을 가져와 자신의 AI 아바타와 대화할 수 있는 기능이 추가될 것으로 보입니다.

Meta가 이번 주 선보인 더 인상적인 기능은 Segment Anything Model 2(SAM 2)입니다. 이 모델은 이미지나 동영상에서 특정 부분을 정확하게 분할할 수 있으며, 움직이는 물체도 추적할 수 있습니다. 이전 분할 모델에 비해 큰 향상을 보여주며, 로토스코핑과 같은 비디오 편집 작업에 유용할 것으로 보입니다. sam2.metademolab.com에서 SAM 2를 직접 사용해볼 수 있습니다.

전반적으로 Meta는 소비자 대상 기능이 다소 기술적으로 보일 수 있지만, AI의 가능성을

자주하는 질문