جوجل آي/أو 2024: كشف النقاب عن مشروع أسترا - مستقبل المساعدين الذكيين

اكتشف مستقبل المساعدين الذكيين بتقنية جوجل بروجكت أسترا، الذي تم الكشف عنه في مؤتمر آي/أو 2024. تعرف على ميزاته المتقدمة، بما في ذلك الفهم البصري، وذاكرة السياق، والتكامل مع خدمات جوجل. استكشف أحدث التطورات في الذكاء الاصطناعي من جوجل ديبماينд، بما في ذلك جيميني، وإيماجن 3، وفيو.

١٤ فبراير ٢٠٢٥

اكتشف أحدث التطورات في تكنولوجيا الذكاء الاصطناعي من خلال حدث Google I/O 2024، بما في ذلك مساعد عام يمكنه تذكر إجراءاتك، ونموذج لغوي فائق السرعة، وقدرات مвпечатляющие للنص إلى الصورة والنص إلى الفيديو. استكشف الابتكارات الحديثة التي تشكل مستقبل الذكاء الاصطناعي.

مشروع أسترا: المساعد الشامل الذي يتذكر
جيميني 1.5 فلاش: ذكاء اصطناعي سريع كالبرق مع نافذة سياق واسعة
إيماجن 3: تحسين الذكاء الاصطناعي من النص إلى الصورة
فيو: إجابة جوجل على سورا لشركة OpenAI للنص إلى الفيديو
جيميني: المساعد الذكي القوي المتكامل مع خدمات جوجل
الخاتمة

مشروع أسترا: المساعد الشامل الذي يتذكر

مشروع أسترا هو المساعد الشامل الجديد لشركة جوجل الذي يهدف إلى أن يكون معك في جميع الأوقات، مقدمًا مجموعة واسعة من القدرات. وتشمل بعض الميزات الرئيسية لمشروع أسترا ما يلي:

الوعي السياقي: يمكن لأسترا التعرف على الأشياء والإجابة على الأسئلة حولها، وحتى رسم أسهم لتحديد أجزاء محددة، شبيهة بالميزات الموجودة في GPT-4 من OpenAI.
فهم الشفرة: يمكن لأسترا تحليل الشفرة وشرح ما تفعله، مما يجعلها أداة قيمة للمطورين.
الذاكرة الحلقية: إحدى أكثر الميزات إثارة للإعجاب في أسترا هي قدرتها على تذكر المكان الذي وضعت فيه الأشياء، مثل نظارتك، وتوفير هذه المعلومات عندما تحتاجها.
نافذة السياق الواسعة: يمتلك Gemini 1.5 Flash AI التابع لأسترا نافذة سياق تصل إلى مليون رمز، مما يتيح له فهم المحتوى الطويل مثل أطروحتك بالكامل، بما في ذلك مقاطع الفيديو والوسائط المتعددة الأخرى.
أداء فائق السرعة: تشير المعايير إلى أن نموذج Gemini 1.5 Flash قد يكون قريبًا من ضعف سرعة GPT-4، مما يجعله مساعدًا استجابة بشكل لا يصدق.
نماذج قابلة للتطوير: تخطط جوجل لإصدار إصدارات أصغر وأكثر إمكانية للوصول إليها من أسترا، مثل Gemma2 و Gemini Nano، للتشغيل على أجهزة الكمبيوتر المكتبية وحتى الأجهزة المحمولة.

بشكل عام، يمثل مشروع أسترا خطوة كبيرة إلى الأمام في تطوير المساعدين الذكيين الشاملين والواعين سياقيًا الذين يمكنهم الاندماج بسلاسة في حياتنا اليومية والمهام.

جيميني 1.5 فلاش: ذكاء اصطناعي سريع كالبرق مع نافذة سياق واسعة

يتباهى الذكاء الاصطناعي Gemini 1.5 Flash الجديد من Google DeepMind بميزة مذهلة - نافذة سياق واسعة تصل إلى مليون رمز. هذا يعني أنه يمكنك تحميل أطروحتك بالكامل، بما في ذلك مقاطع الفيديو والمحاضرات، وسؤال الذكاء الاصطناعي أن يلعب دور لجنة أطروحتك، ويتحداك بأسئلة صعبة.

إن قدرة الذكاء الاصطناعي على معالجة كمية كبيرة من المعلومات مذهلة. على سبيل المثال، عند إعطائه سؤالاً عن مقطع فيديو مدته 10 دقائق بدقة عالية (حوالي 160 ألف رمز)، يمكن للذكاء الاصطناعي تقديم إجابة في غضون 30 ثانية. على الرغم من عدم الكمال، إلا أن هذا الأداء مذهل للغاية.

مقارنة بالإصدار السابق 1.5 Pro، الذي كان له نافذة سياق واسعة مماثلة ولكن تعقيد حسابي تربيعي، يُوعد الجديد Gemini 1.5 Flash بأن يكون أسرع بكثير. في الواقع، تشير أول المعايير إلى أنه قد يكون قريبًا من ضعف سرعة GPT-4 الفائقة السرعة.

علاوة على ذلك، ستقوم Google DeepMind بإصدار إصدار نموذج مفتوح المصدر يُدعى Gemma2، والذي سيأتي في حزمة مكونة من 27 مليار معلمة، مما يجعله مناسبًا للتشغيل على جهاز كمبيوتر مكتبي قوي. كما ستكون هناك إصدارات أصغر، مثل Gemini Nano، متاحة للاستخدام على الأجهزة المحمولة.

إيماجن 3: تحسين الذكاء الاصطناعي من النص إلى الصورة

عرضت Google DeepMind أحدث إصدار من نموذج الذكاء الاصطناعي الخاص بها للتحويل من النص إلى الصورة، Imagen 3. يعد هذا الإصدار الجديد أنه سيولد صورًا بمزيد من التفاصيل وتحسين جودة النص مقارنة بالإصدارات السابقة.

تشمل النقاط الرئيسية لـ Imagen 3:

القدرة على إنشاء صور بتفاصيل أكثر تعقيدًا بناءً على نص الإدخال.
تحسينات كبيرة في جودة وترابط التسميات النصية المولدة، معالجة نقطة ضعف أنظمة التحويل من النص إلى الصورة السابقة.
استمرار التقدم في قدرة النموذج على ترجمة النص إلى صور بصرية جذابة وواقعية.

في حين أن إصدارات Imagen السابقة قد أظهرت قدرات مвпечатляющة للتحويل من النص إلى الصورة، فإن Imagen 3 تهدف إلى دفع حدود هذه التكنولوجيا إلى الأمام، منافسة نماذج متطورة أخرى مثل DALL-E من OpenAI.

تركيز Google DeepMind على تعزيز الجودة البصرية والترابط النصي لـ Imagen 3 يسلط الضوء على التزامهم بتقديم تجربة أكثر شمولاً وسهولة استخدام للتحويل من النص إلى الصورة.

فيو: إجابة جوجل على سورا لشركة OpenAI للنص إلى الفيديو

كشفت جوجل عن Veo، أحدث نظام ذكاء اصطناعي لديها للتحويل من النص إلى الفيديو، كاستجابة مباشرة لـ Sora من OpenAI. يمكن لـ Veo إنشاء مقاطع فيديو بدقة HD كاملة تصل إلى دقيقة واحدة، بناءً على تعليمات نصية. هذا يمثل تقدمًا كبيرًا في مجال إنشاء النص إلى الفيديو، بناءً على العمل السابق لجوجل في هذا المجال، مثل Phenaki و VideoPoet و Lumiere.

في حين أن الجودة المرئية لـ Veo قد تكون لا تزال أقل قليلاً من Sora الخاص بـ OpenAI، تركز جوجل على تحسين أدوات التحكم الإبداعي للمستخدمين. يهدف هذا النهج إلى توفير تجربة أكثر تخصيصًا وقابلية للتخصيص، مما يتيح للمستخدمين التأثير بشكل أكبر على محتوى الفيديو المولد.

إحدى الميزات الرئيسية لـ Veo هي قدرته على الحفاظ على الترابط الزمني طويل المدى. هذا يعني أن مقاطع الفيديو المولدة ستكون لها بيئة وعناصر متسقة، حتى عندما ينظر المشاهد بعيدًا ثم يعود مرة أخرى. تساعد هذه الميزة على إنشاء تجربة مشاهدة أكثر سلاسة وغمرًا.

بشكل عام، يمثل Veo جهود جوجل المستمرة لدفع حدود إنشاء النص إلى الفيديو، مما يوفر للمستخدمين أداة قوية لتحويل أفكارهم إلى الواقع من خلال قوة الذكاء الاصطناعي.

جيميني: المساعد الذكي القوي المتكامل مع خدمات جوجل

كشف المساعد الذكي Gemini من جوجل عن بعض الميزات الجديدة المذهلة التي تبرز قدراته. أحد أبرز النقاط البارزة هو نافذة السياق الواسعة الخاصة به، والتي تسمح له بمعالجة ما يصل إلى مليون رمز. هذا يعني أنه يمكنك تحميل أطروحتك بالكامل، بما في ذلك مقاطع الفيديو والمحاضرات، وسيتفاعل Gemini معك كلجنة أطروحة، ويسألك أسئلة صعبة لاختبار فهمك.

تعزز قدرة Gemini على فهم المحتوى الطويل والتفاعل معه أيضًا من خلال أدائه الفائق السرعة. تشير المعايير إلى أن Gemini 1.5 Flash قد يكون قريبًا من ضعف سرعة GPT-4o الشهير، مما يجعله أداة فعالة للغاية للمهام التي تتطلب سياقًا واسعًا.

علاوة على ذلك، سيتوفر Gemini في إصدارات مختلفة، بما في ذلك النموذج مفتوح المصدر Gemma2، والذي سيكون حزمة مكونة من 27 مليار معلمة مناسبة للتشغيل على جهاز كمبيوتر مكتبي قوي. كما ستكون هناك إصدارات أصغر، مثل Gemini Nano، يمكن نشرها حتى على الأجهزة المحمولة.

بالإضافة إلى قدراته اللغوية المвпечатляющة، يتم تكامل Gemini مع خدمات جوجل الأخرى، مثل البحث والبريد الإلكتروني. يسمح هذا التكامل لـ Gemini باستخدام بيانات المستخدم، مثل معلومات الرحلات أو الفنادق، للمساعدة في تخطيط الرحلات وإدارة المهام المالية، مما يجمع بين فهمه للغة الطبيعية وموارد جوجل الشاملة.

بشكل عام، يمثل Gemini خطوة كبيرة إلى الأمام في تطوير المساعدين الذكيين، مما يُظهر التزام جوجل بدفع حدود ما هو ممكن في مجال الذكاء الاصطناعي.

الخاتمة

أثار الكشف عن مشروع أسترا، المساعد الشامل لشركة جوجل، حماسًا كبيرًا في مجتمع الذكاء الاصطناعي. إن قدرة هذا المساعد على التذكر والتفاعل مع المستخدمين بطريقة سياقية، باستخدام موارد جوجل الشاملة مثل البحث والبريد الإلكتروني، هي إنجاز هندسي مذهل.

إن إطلاق Gemini 1.5 Flash، مع نافذة السياق الواسعة وسرعة المعالجة البرق، يعزز موقف جوجل كرائد في نماذج اللغة الكبيرة. يعد الإصدار القادم Gemma2، بمعلماته البالغة 27 مليار معلمة، وعدًا بإحضار قدرات الذكاء الاصطناعي القوية إلى جمهور أوسع، حتى على الأجهزة الشخصية.

تُظهر تقدمات جوجل في التحويل من النص إلى الصورة والتحويل من النص إلى الفيديو، مع Imagen 3 و Veo على التوالي، التزامها بدفع حدود المحتوى المولد بواسطة الذكاء الاصطناعي. على الرغم من أن الجودة المرئية قد تتخلف لا تزال عن Sora من OpenAI، إلا أن التركيز على أدوات التحكم الإبداعي هو اتجاه واعد.

إن دمج Gemini مع الخدمات القائمة ل

التعليمات

ما هو مشروع Astra؟

كيف يعمل Gemini 1.5 Flash AI؟

ما هي تقنيات الذكاء الاصطناعي الجديدة الأخرى التي عرضتها Google؟

متى ستتوفر هذه التقنيات الذكاء الاصطناعي الجديدة؟

ما هو تطبيق ChatGPT الجديد لنظام MacOS؟

قم بإنشاء صديقة الذكاء الاصطناعي الخاصة بك

قم ببناء رفيقك المثالي باستخدام AI Girlfriend Builder