عالم الذكاء الاصطناعي هذا الأسبوع: إعلانات مثيرة للاهتمام من جوجل وأوبن إيه آي

انطلق في أحدث الاختراقات الذكاء الاصطناعي من Google و OpenAI. اكتشف القدرات المتقدمة لـ GPT-4 ، وتغييرات القيادة في OpenAI ، وزخم إعلانات الذكاء الاصطناعي لدى Google في I/O 2024. ابق على رأس المشهد السريع التطور للذكاء الاصطناعي.

١٤ فبراير ٢٠٢٥

party-gif

شهدت هذا الأسبوع زخما من الإعلانات الرئيسية عن الذكاء الاصطناعي من شركات التكنولوجيا الرائدة مثل Google و OpenAI. من إطلاق GPT-4، وهو نموذج لغوي جديد قوي، إلى التطورات المثيرة في مجالات مثل توليد الفيديو والواقع المعزز، هذه لحظة حاسمة في عالم الذكاء الاصطناعي المتطور بسرعة. انغمس في اكتشاف أحدث الاختراقات التي من المرجح أن تشكل المستقبل.

GPT-40: المساعد الذكي متعدد الوسائط

نموذج GPT-40 الأحدث من Open AI هو مساعد ذكاء اصطناعي متعدد الوسائط ثوري يمكنه التعامل مع مجموعة واسعة من المدخلات والمخرجات. أبرز النقاط الرئيسية:

  • القدرات المتعددة الوسائط: يمكن لـ GPT-40 فهم وإنشاء محتوى في صيغ مختلفة، بما في ذلك النص والصوت والصور والفيديو. هذا يسمح بتفاعلات أكثر طبيعية وسياقية.

  • الوصول المجاني للجميع: الميزات المتقدمة لـ GPT-40، مثل تصفح الإنترنت وتفسير الرموز وتحليل البيانات، متاحة الآن لجميع مستخدمي ChatGPT المجانيين. يحصل أعضاء ChatGPT Plus على مزايا إضافية مثل أوقات استجابة أسرع وحدود إخراج أعلى.

  • القدرات الحوارية: يمكن لـ GPT-40 المشاركة في محادثات شبيهة بالبشر، مع القدرة على فهم النبرة وتقديم الدعم العاطفي وحتى سرد القصص بتوصيل تعبيري.

  • الفهم البصري: يمكن للنموذج تفسير المعلومات المرئية، مثل حل المشكلات الرياضية من خلال تحليل الصور، وإنشاء صور بناءً على وصف نصي.

  • التكامل مع سطح المكتب: أصدرت Open AI تطبيقًا لسطح المكتب يسمح للمستخدمين بالوصول إلى GPT-40 مباشرةً على أجهزة الكمبيوتر الخاصة بهم، مع إمكانية مشاركة محتوى الشاشة والحصول على المساعدة السياقية.

استكشاف قدرات GPT-40

نموذج GPT-40 الجديد من Open AI هو نموذج لغوي قوي ومتعدد الاستخدامات يتجاوز مجرد توليد النص. فيما يلي بعض القدرات الرئيسية لـ GPT-40 التي تم عرضها:

القدرات المتعددة الوسائط

GPT-40 هو نموذج متعدد الوسائط، مما يعني أنه يمكنه التعامل مع وفهم أنواع مختلفة من الوسائط مثل الصوت والفيديو والصور بالإضافة إلى النص. هذا يسمح له بأداء مهام تجمع بين عدة وسائط، مثل وصف محتوى صورة أو فيديو.

المحادثة المتقدمة

أظهر النموذج قدرات محادثة مвпرة، حيث شارك في حوار متبادل وحتى اتخذ نبرات وشخصيات عاطفية مختلفة. كان قادرًا على فهم السياق وتقديم ردود ذات صلة ومترابطة.

حل المشكلات خطوة بخطوة

عندما تم تقديم مشكلة رياضية له، لم يقدم GPT-40 مجرد الإجابة النهائية. بدلاً من ذلك، سار خلال العملية الخطوة بخطوة لحل المشكلة، مع شرح تفكيره في الطريق.

إخراج الصوت القابل للتخصيص

يمكن لـ GPT-40 إنشاء إخراج الكلام مع نبرة وعاطفة وتعبيرية قابلة للتخصيص. هذا يسمح له بالبدو أكثر طبيعية وشبيهًا بالبشر أثناء المحادثة.

إنشاء الصور

بالإضافة إلى النص، يمتلك GPT-40 القدرة على إنشاء صور. تضمنت الأمثلة المعروضة إنشاء صور مفصلة مع نص مقروء، وكذلك إنشاء تصاميم شخصيات متسقة عبر مشاهد متعددة.

تركيب الكائنات ثلاثية الأبعاد

يمكن للنموذج أخذ صور ثنائية الأبعاد وإنشاء إعادة بناء ثلاثية الأبعاد، وتحريكها ووضع شعارات أو عناصر أخرى على الكائنات ثلاثية الأبعاد.

إيليا سوتسكيفر يغادر OpenAI

قرر إيليا سوتسكيفر، أحد المؤسسين الأصليين لـ OpenAI، الابتعاد عن الشركة. بعد قرابة عقد من العمل في OpenAI، اتخذ سوتسكيفر قرار المغادرة.

كان سوتسكيفر جزءًا من مجلس الإدارة الذي اتخذ قرار إقالة الرئيس التنفيذي لـ OpenAI، سام ألتمان، في نوفمبر 2023. ومع ذلك، ندم سوتسكيفر لاحقًا على هذا القرار وعتذر علنًا، مؤكدًا أنه كان خطأ التخلص من ألتمان.

بينما لا تبدو أسباب مغادرة سوتسكيفر واضحة تمامًا، يبدو أنه لم يكن منسجمًا تمامًا مع الاتجاه الذي تتجه إليه OpenAI. بصفته باحثًا وأكاديميًا، من المرجح أن يكون سوتسكيفر أكثر اهتمامًا بالعلم والتكنولوجيا وراء الذكاء الاصطناعي، بدلاً من تسويق التكنولوجيا وتجاريتها.

في رسالة وداعه، أعرب سوتسكيفر عن ثقته في قيادة OpenAI تحت قيادة ألتمان وغريغ بروكمان وميرا موراتي، وأعرب عن حماسه لما سيأتي في مشروعه الشخصي القادم، والذي سيشارك تفاصيله في الوقت المناسب.

يُعد رحيل سوتسكيفر خسارة كبيرة لـ OpenAI، حيث كان أحد أعضاء التأسيس للشركة وأحد الأعمدة الرئيسية في مجال الذكاء الاصطناعي. ومع ذلك، تبدو الشركة متقدمة في خططها الطموحة، بما في ذلك الإصدار الأخير للنموذج القوي GPT-4.

سيكون من المثير للاهتمام رؤية كيف سيؤثر رحيل سوتسكيفر على مسار OpenAI، ولكن من الواضح أن الشركة تمر بتحول كبير وهي تواصل دفع حدود الذكاء الاصطناعي.

الرحيلات الرئيسية من فريق التوافق الفائق

وفقًا للتقارير، غادر عدد من الأعضاء الرئيسيين في فريق المحاذاة الفائقة في OpenAI الشركة. ويشمل ذلك يان لكون وليوبولد أشنبرنر وويليام ساندرز.

كان هؤلاء الأفراد جزءًا من الفريق المسؤول عن ضمان بقاء أنظمة الذكاء الاصطناعي التي طورتها OpenAI، مثل GPT-4، آمنة ومفيدة. إن رحيلهم مقلق، حيث يشير إلى وجود مشكلات أو خلافات محتملة داخل الشركة حول اتجاه وسلامة نماذجهم المتقدمة للذكاء الاصطناعي.

يلعب فريق المحاذاة الفائقة دورًا حاسمًا في محاولة تخفيف مخاطر أنظمة الذكاء الاصطناعي القوية. قد يشير خروجهم إلى وجود توترات داخلية أو تحول في الأولويات في OpenAI يعطي الأولوية للتطوير السريع على حساب تدابير السلامة الصارمة.

تأتي هذه الأخبار بعد فترة وجيزة من رحيل إيليا سوتسكيفر، أحد مؤسسي OpenAI، الذي أعلن أنه سيغادر الشركة لمتابعة مشروع "ذي معنى شخصي" جديد.

إن خسارة هؤلاء الأشخاص الرئيسيين، خاصة أولئك الذين يركزون على سلامة الذكاء الاصطناعي، هي تطور مقلق يستحق المراقبة الوثيقة. وهذا يثير تساؤلات حول الاتجاه المستقبلي وأولويات OpenAI حيث يواصلون دفع حدود نماذج اللغة الكبيرة وقدرات الذكاء الاصطناعي المتقدمة الأخرى.

Google IO 2024: نماذج جيميني، مشروع أسترا، والمزيد

كان أكبر إعلان من Google IO 2024 هو تقديم نماذج الذكاء الاصطناعي Gemini. Gemini 1.5 Flash و Gemini 1.5 Pro هما نماذج اللغة الكبيرة الجديدة من Google.

Gemini 1.5 Flash هو نموذج أسرع، بينما تم تصميم Gemini 1.5 Pro للحصول على أفضل إخراج ممكن. يتمتع كلا النموذجين بنافذة سياق تبلغ 1 مليون رمز، مع خطط لزيادتها إلى 2 مليون رمز في المستقبل. هذا يسمح بإدخال وإخراج حوالي 1.5 مليون كلمة.

كان أحد أبرز النقاط هو مشروع Astra، الذي يسمح لهاتف محمول برؤية ما تراه الكاميرا والإجابة على الأسئلة حوله. أظهر العرض التوضيحي أن الهاتف تذكر تفاصيل مثل موقع نظارة، وتمكن المقدم من المتابعة بالتفاعل مع النظام باستخدام نظارات الواقع المعزز، مما يوحي بقدرات مستقبلية شبيهة بـ Google Glass.

كما أظهرت Google نموذجها الجديد للتحويل من نص إلى صورة، Imagine 3، والذي يقترب من واقعية نماذج مثل Midjourney. كما عرضوا نموذج توليد الفيديو الجديد المسمى Veo، والذي يمكنه إنشاء مقاطع فيديو بدقة 1080p تزيد عن دقيقة واحدة، على الرغم من أنه لا يضاهي جودة Sorai من Anthropic.

تضمنت الإعلانات الأخرى ترقيات لبحث Google وGmail وأدوات مجموعة Google الأخرى، مع إضافة ميزات تعتمد على الذكاء الاصطناعي مثل الاستدلال متعدد الخطوات والتنظيم التلقائي للبريد الإلكتروني وفهم سياق الصور.

تحديثات AI أخرى: Anthropic، Hume، ومستقبل المواعدة

بدءًا من Anthropic، قامت الشركة بتعيين مايك كريجر، المؤسس المشارك لإنستغرام، كرئيس جديد للمنتجات. سيكون مهمة كريجر، الذي كان أحد مؤسسي إنستغرام وكذلك مؤسس تطبيق الأخبار Artifact، هي هندسة تجارب مستخدمة جيدة لإثارة حماس المزيد من الناس واستخدامهم لأدوات Anthropic مثل Claude.

أصدرت Anthropic أيضًا ميزة جديدة لمولد المطالبات في وحدتها التحكمية. يمكن للمستخدمين الآن إنشاء مطالبات جاهزة للإنتاج من خلال وصف ما يريدون تحقيقه، وسيستخدم النظام تقنيات هندسة المطالبات مثل التفكير في سلسلة الأفكار لإنشاء مطالبات أكثر فعالية ودقة و

التعليمات