애플의 강력한 AI 기술: ChatGPT 그 이상
애플의 강력한 온디바이스 및 클라우드 기반 AI 모델을 발견하세요. 이는 개인정보 보호와 책임감 있는 개발을 우선으로 하면서 일상적인 작업을 향상시키도록 설계되었습니다. 효율적이고 고성능의 AI 처리를 위한 혁신적인 기술을 탐색해보세요.
2025년 2월 15일

애플의 새로운 AI 시스템인 애플 인텔리전스는 ChatGPT와 유사한 경험 이상을 제공합니다. iOS, iPadOS, macOS와의 깊은 통합을 활용하여 애플은 사용자들이 글쓰기, 요약, 시각적 콘텐츠 생성 등 다양한 일상적인 작업을 효율적으로 수행할 수 있는 특화된 모델을 개발했습니다. 이 블로그 게시물은 애플의 혁신적인 접근 방식 뒤에 있는 기술적 세부 사항과 책임감 있는 AI 원칙을 살펴봅니다. 이를 통해 우리가 기기와 상호 작용하는 방식이 어떻게 변화할 수 있는지 보여줍니다.
강력한 온디바이스 및 클라우드 기반 AI 모델
책임감 있는 AI 개발 원칙
데이터 처리 및 모델 학습 절차
속도와 효율성을 위한 모델 최적화
모델 적응 및 개인화
벤치마크 평가 및 안전성 비교
결론
강력한 온디바이스 및 클라우드 기반 AI 모델
강력한 온디바이스 및 클라우드 기반 AI 모델
애플은 iOS, iPadOS 및 macOS 생태계에 깊이 통합된 매우 능력 있는 생성형 AI 모델 제품군을 개발했습니다. 이러한 모델은 사용자의 일상적인 작업을 처리하고 개인의 요구에 맞춤화된 지능을 제공하도록 설계되었습니다.
애플의 AI 노력의 기반은 애플 디바이스에서 직접 실행될 수 있는 30억 개의 매개변수를 가진 온디바이스 언어 모델입니다. 이 모델은 애플 실리콘 칩의 힘을 활용하여 빠르고 효율적인 추론을 제공합니다. 이 모델은 필요한 경우 더 복잡한 작업을 처리할 수 있는 더 큰 서버 기반 언어 모델로 보완됩니다.
이러한 모델은 텍스트 작성 및 정제, 알림 우선순위 지정 및 요약, 대화를 위한 재미있는 이미지 생성, 그리고 무엇보다도 애플리케이션 간 상호 작용을 간소화하는 앱 내 작업 활성화와 같은 다양한 사용자 경험을 위해 미세 조정되었습니다.
애플은 사용자를 권한화하고, 그들의 요구를 진실하게 대변하며, 세심하게 설계하고, 사용자 프라이버시를 보호하는 원칙으로 책임감 있는 AI 개발에 중점을 두고 있습니다. 회사는 데이터 큐레이션, 모델 최적화 및 동적 적응을 위한 새로운 기술을 개발했습니다.
책임감 있는 AI 개발 원칙
책임감 있는 AI 개발 원칙
애플의 책임감 있는 AI 개발 접근법은 다음과 같은 4가지 핵심 원칙을 중심으로 합니다:
-
사용자를 지능형 도구로 권한화하기: 애플은 AI를 책임감 있게 사용하여 특정 사용자 요구를 해결할 수 있는 도구를 만드는 영역을 파악합니다. 그들의 초점은 사용자를 진실하게 대변하고 고정관념이나 편견을 영속화하지 않는 깊이 있는 개인화된 제품을 구축하는 것입니다.
-
세심한 설계: 애플은 잠재적 오용 또는 피해를 식별하기 위해 설계, 모델 교육, 기능 개발 및 품질 평가 등 모든 단계에서 예방 조치를 취합니다. 그들은 사용자 피드백을 기반으로 지속적으로 AI 도구를 개선합니다.
-
프라이버시 보호: 애플은 온디바이스 처리와 비공개 클라우드 컴퓨팅 인프라를 통해 사용자 프라이버시를 보호합니다. 그들은 개인 데이터 또는 사용자 상호 작용을 기반 모델 교육에 사용하지 않습니다.
-
사용자 대표: 애플은 전 세계 사용자를 진실하게 대표하는 것을 목표로 AI 도구와 모델 전반에 걸쳐 고정관념과 체계적 편견을 영속화하지 않도록 지속적으로 노력합니다.
데이터 처리 및 모델 학습 절차
데이터 처리 및 모델 학습 절차
애플의 기반 모델은 라이선스가 있는 데이터와 웹 크롤러 Apple Bot이 수집한 공개적으로 사용 가능한 데이터를 사용하여 교육됩니다. 그들은 교육 데이터의 품질과 안전성을 보장하기 위해 다음과 같은 여러 가지 조치를 취했습니다:
- 데이터 필터링: 개인 식별 정보, 욕설 및 기타 저품질 콘텐츠를 제거하기 위한 필터를 적용합니다.
- 데이터 추출 및 중복 제거: 데이터 추출, 중복 제거 및 모델 기반 분류기 적용을 수행하여 고품질 문서를 식별합니다.
- 하이브리드 데이터 전략: 사람이 주석을 단 데이터와 합성 데이터를 모두 활용하는 하이브리드 데이터 전략을 사용합니다.
- 철저한 데이터 큐레이션 및 필터링: 고품질 교육 데이터를 보장하기 위해 철저한 데이터 큐레이션 및 필터링을 수행합니다.
교육 후 단계에서 애플은 모델을 추가로 최적화하기 위해 두 가지 새로운 알고리즘을 개발했습니다:
- 교사 위원회를 사용한 거부 샘플링 미세 조정 알고리즘: 이 알고리즘은 교사 위원회와 인간 피드백 강화 학습을 사용하여 모델을 미세 조정합니다.
- 거울 하강 정책 최적화 및 Leave-one-out 이점 추정기를 사용한 인간 피드백 강화 학습 알고리즘: 이 알고리즘은 거울 하강 정책 최적화와 Leave-one-out 이점 추정기를 활용하여 인간 피드백을 모델 교육 과정에 통합합니다.
속도와 효율성을 위한 모델 최적화
속도와 효율성을 위한 모델 최적화
속도와 효율성을 최적화하기 위해 애플은 다음과 같은 기술을 사용했습니다:
- 그룹 쿼리 주의: 온디바이스 및 서버 기반 모델 모두 그룹 쿼리 주의를 활용합니다.
- 공유 입력 및 출력 어휘 임베딩 테이블: 이를 통해 메모리 요구 사항과 추론 비용을 줄일 수 있습니다.
- 저비트 병렬화: 온디바이스 모델은 필요한 메모리, 전력 및 성능 요구 사항을 달성하기 위해 저비트 병렬화를 사용합니다.
- 혼합 2비트 및 4비트 구성 전략: 이 전략은 Lora 어댑터 사용과 결합되어 모델 품질을 유지하면서 평균 3.5비트/가중치를 달성합니다.
- Taria 대화형 모델 대기 시간 및 전력 분석 도구: 이 도구는 각 작업에 대한 비트율 선택을 안내합니다.
- 활성화 및 임베딩 양자화: 추가 양자화 기술을 사용하여 모델을 최적화합니다.
- 효율적인 키-값 캐시 업데이트: 신경 엔진에서 효율적인 키-값 캐시 업데이트를 가능하게 하는 접근 방식이 개발되었습니다.
모델 적응 및 개인화
모델 적응 및 개인화
애플은 온디바이스 및 서버 기반 배포를 위해 생성 모델을 최적화하기 위해 다양한 혁신적인 기술을 활용했습니다. 초점은 원활한 사용자 경험을 가능하게 하는 높은 속도와 효율성을 달성하는 것이었습니다.
온디바이스 추론의 경우, 30억 개의 매개변수를 가진 언어 모델은 저비트 병렬화를 사용하여 필요한 메모리, 전력 및 성능 요구 사항을 달성합니다. 품질을 유지하기 위해 애플은 Lora 어댑터를 사용하는 새로운 프레임워크를 개발했으며, 이는 평균 3.5비트/가중치의 혼합 2비트 및 4비트 구성 전략을 포함합니다.
또한 애플은 Taria라는 대화형 모델 대기 시간 및 전력 분석 도구를 발명했는데, 이는 각 작업에 대한 비트율 선택을 더 잘 안내합니다. 그들은 또한 활성화 양자화, 임베딩 양자화 및 신경 엔진에서 효율적인 키-값 캐시 업데이트를 위한 접근 방식을 활용했습니다.
이러한 최적화를 통해 iPhone 15 Pro는 토큰 추측 기술을 사용하기 전에도 6밀리초의 첫 토큰 대기 시간과 초당 30토큰의 생성 속도를 달성할 수 있습니다.
서버 기반 대규모 언어 모델의 경우, 애플은 속도와 효율성에 초점을 맞추었습니다. 그들은 메모리 요구 사항과 추론 비용을 줄이기 위해 공유 입력 및 출력 어휘 임베딩 테이블을 사용합니다. 서버 모델의 어휘 크기는 49,000개인 온디바이스 모델에 비해 100,000개입니다.
벤치마크 평가 및 안전성 비교
벤치마크 평가 및 안전성 비교
애플의 기반 모델은 사용자의 일상적인 활동을 위해 미세 조정되며 필요에 따라 동적으로 전문화될 수 있습니다. 그들은 어댑터 - 사전 교육된 모델의 다양한 레이어에 플러그인할 수 있는 작은 신경망 모듈 - 를 활용합니다. 이를 통해 어댑터 레이어만 미세 조정하여 기본 사전 교육 모델의 원래 매개변수를 변경하지 않고도 특정 작업에 맞춤화할 수 있습니다.
이러한 접근 방식을 통해 애플의 AI 모델은 사용자의 요구와 선호도에 맞춰 자신을 적응시키고 개인화할 수 있어, 매우 맞춤화되고 효율적인 사용자 경험을 제공할 수 있습니다. 모델은 요약, 작성, 코딩 등의 작업을 위해 신속하게 전문화될 수 있으며, 기본 모델의 핵심 지식과 기능을 손상시키지 않습니다. 이러한 동적 적응은 사용자의 일상 생활에 깊이 통합되고 대신 실제 가치 있는 작업을 수행할 수 있게 하는 애플의 접근 방식의 핵심 차별화 요소입니다.
결론
결론
애플은 온디바이스 및 서버 기반 기반 모델에 대한 광범위한 벤치마킹 및 평가를 수행했습니다. 그들은 실제 사용자 경험과 높은 상관관계를 보이는 것을 발견했기 때문에 인간 평가에 중점을 둡니다.
기능별 성능의 경우, 온디바이스 모델을 Microsoft의 53 mini 모델과 비교합니다. 이메일 요약 및 알림 요약 작업에서 애플의 온디바이스 모델은 각각 87.5%와 79%의 높은 인간 만족도 점수를 달성하는 반면, 53 mini는 각각 73%와 73%입니다.
기능별 평가 외에도 애플은 온디바이스 및 서버 모델의 일반적인 기능도 평가합니다. 그들은 브레인스토밍, 분류, 질문 답변, 코딩 등의 실제 세계 프롬프트를 포함하는 포괄적인 세트를 활용합니다. Gemini, Mistral, 53, GPT-3.5 Turbo, GPT-4 Turbo와 같은 모델과 비교할 때 애플의 온디바이스 모델은 잘 수행하며, Gemini의 62%, Mistral의 46%, 53의 43%를 이깁니다.
애플의 서버 기반 모델은 일반적인 기능 평가에서 GPT-4 Turbo 모델을 제외하고는 더 나은 성능을 보입니다.
중요하게도 애플은 안전성과 해로움에 강한 중점을 둡니다. 출력 해로움에 대한 인간 평가에서 애플의 온디바이스 모델은 경쟁 모델을 크게 능가합니다. 서버
자주하는 질문
자주하는 질문