الجوزاء 1 برو

تحديث Gemini 1.5 Pro يجعل الذكاء الاصطناعي يستمع وينشئ المحتوى

الصورة الرمزية جواو لوكاس باتيستا
ومع التحديث الجديد، أصبح الآن الذكاء الاصطناعي لدى Google يفهم الصوت ويحلله. بإمكان Imagen 2 الآن إضافة عناصر الصورة وإزالتها وإنشاء صور GIF مدتها 4 ثوانٍ

A جوجل الذكاء الاصطناعيأو الجوزاء، تلقى تحديثًا جديدًا ومبتكرًا يوم الثلاثاء 9 أبريل خلال جوجل سحابة التالي. مع الترقية، الجوزاء 1.5 برو، حصل على القدرة على فهم وتحليل خطوط الصوت والفيديو، وإنتاج محتوى بناءً على ما يتم إدخاله في التطبيق.

في البداية، الميزة الجديدة متاحة فقط لمستخدمي فيرتكس الذكاء الاصطناعي، البرمجيات التي تهدف إلى آلة التعلم (التعلم الآلي)، يستخدمه المبرمجون والعلماء لتطوير أنظمة ذكاء اصطناعي جديدة.

ماذا يفعل برج الجوزاء، الذكاء الاصطناعي التابع لجوجل؟

تحديث Gemini 1 pro يجعلني أستمع وأنشئ المحتوى. ومع التحديث الجديد، أصبح الذكاء الاصطناعي لدى Google يفهم الصوت ويحلله. بإمكان Imagen 5 الآن إضافة عناصر الصورة وإزالتها وإنشاء صور GIF مدتها 2 ثوانٍ
واجهة الجوزاء. الصورة: لوكاس جوميز/ شوميتيك

O الجوزاءتم إطلاق الذكاء الاصطناعي لشركة جوجل في ديسمبر من العام الماضي، استبدال بارد، وتتميز بقدرتها على التعامل مع المهام المعقدة للغاية، بدءًا من البرمجة وحتى التفكير المنطقي المكرر.

يتمتع الذكاء الاصطناعي بوظائف يمكنها مساعدة المستخدم في المهام الأكثر تنوعًا، ومعالجة مجموعة واسعة من الملفات، بغرض الجمع بين أنواع مختلفة من المعلومات، بالإضافة إلى تنظيمها. تتيح لك إمكانياته استخدام تنسيقات محتوى مختلفة، بما في ذلك:

  • النصوص؛
  • الصور.
  • صوتيات.
  • أشرطة فيديو؛ إنها
  • لغات البرمجة.

O الجوزاء لديها ثلاثة أوضاع تشغيل، مع خصائص مختلفة:

  • الجوزاء الترا - أكبر وأكثر قدرة على القيام بمهام معقدة للغاية؛
  • الجوزاء برو - الأفضل لتوسيع نطاق مجموعة واسعة من المهام؛
  • الجوزاء نانو - أكثر كفاءة للمهام المتنقلة.

تحديث Gemini 1.5 Pro ووظائفه الجديدة

تحديث Gemini 1 pro يجعلني أستمع وأنشئ المحتوى. ومع التحديث الجديد، أصبح الذكاء الاصطناعي لدى Google يفهم الصوت ويحلله. بإمكان Imagen 5 الآن إضافة عناصر الصورة وإزالتها وإنشاء صور GIF مدتها 2 ثوانٍ
الجوزاء اي ايه. الصورة: رافاريس / شترستوك)

ويمثل هذا النموذج الجديد، الذي قدمته شركة التكنولوجيا العملاقة، تقدما كبيرا مقارنة بالنموذج السابق، مع تحسينات في الأداء وفهم السياقات الطويلة. الجوزاء 1.5 برو، وهو الإصدار الأولي المتاح للاختبار، تم تحسينه لمجموعة متنوعة من المهام وهو أكثر كفاءة من حيث الحساب، كونه إصدارًا أكثر قوة وقادرًا على تلبية متطلبات الأنشطة الأكثر تعقيدًا.

بالإضافة إلى ذلك ، فإن الجوزاء 1.5 برو يحتوي على مورد تجريبي، والذي، من الناحية النظرية، يمكنه معالجة ما يصل إلى 1 مليون الرموز للنماذج الأساسية واسعة النطاق، والتي ستكون ثورية. وفقا لجوجل، يمثل هذا المبلغ الهائل 700.000 كلمة و 30.000 سطر من التعليمات البرمجية، وهو ما يعادل ساعة واحدة من الفيديو ou 11 ساعة من الصوت.

تسمح الأدوات الجديدة في Gemini 1.5 Pro للتطبيق بالتفكير بين الصور (الإطارات) والصوت (الكلام) لمقاطع الفيديو التي يتم تحميلها على استوديو جوجل للذكاء الاصطناعيمما سيسهل إنتاج المحتوى. وفقًا للمعلومات الرسمية، يتوفر تحديث Google AI في أكثر من البلدان 180 من خلال Gemini API (واجهة برمجة التطبيقات، باللغة البرتغالية)، مع قدرة أصلية غير مسبوقة على فهم الصوت وواجهة برمجة تطبيقات جديدة تسهل معالجة الملفات.

يتميز الإصدار أيضًا بتعليمات النظام الجديدة وميزات الوضع. JSON (تنسيق بيانات خفيف الوزن لتبادل المعلومات بين أنظمة الكمبيوتر). وإيمانًا منها بإمكانيات التحديث الجديد، تعد جوجل بأن نموذج تضمين النص يتفوق على المنافسين بوظائف مماثلة.

O الجوزاء 1.5 برو متاح حاليا فقط من خلال فيرتكس الذكاء الاصطناعي.

يمكن لـ Imagen 2 إنشاء صور GIF

خلال الحدث جوجل سحابة التالي، أصدرت Google إعلانًا مهمًا آخر: نموذج الذكاء الاصطناعي IMAGEN 2والتي يمكنها إنشاء صور ومقاطع فيديو قصيرة من مطالبات من النص. باستخدام هذا، من الممكن إنشاء صور GIF لمدة تصل إلى أربع ثوانٍ من زوايا مختلفة للكاميرا وإظهار الحركة أيضًا.

الفرق مع هذه الأداة هو بالتحديد إمكانية الاستكشاف زوايا مختلفة، مع المزيد من الديناميكية في المشاهد، بما يتجاوز بكثير مقاطع فيديو الذكاء الاصطناعي التي تم إنشاؤها باستخدام صور ثابتة وحركات محدودة.

مثال على الإبداعات من Imagen 2 في Vertex IA. فيديو: جوجل كلاود/ يوتيوب

O IMAGEN 2 لديه القدرة على إنتاج مقاطع فيديو، تُعرف أيضًا باسم الصور الحية، بدقة منخفضة 640 س 360. علاوة على ذلك، تستخدم جوجل تقنيتها معرف Synth لتطبيق أ علامة مائية غير مرئية في المقاطع والصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي. تدعي الشركة أن معرف Synth يمكن أن يدعم عمليات التحرير وحتى الضغط، وهي التدابير التي تهدف إلى الترويج أمن البيانات.

حتى الآن، موارد IMAGEN 2 متاحة فقط من خلال فيرتكس الذكاء الاصطناعي، والذي يتضمن الآن دعمًا للرسم الداخلي والخارجي، بالإضافة إلى القدرة على تحرير الصور باستخدام الذكاء الاصطناعي، مما يسمح لك بتوسيع الحدود أو إضافة/إزالة أجزاء معينة من الصورة. أدوات تستهدف محترفي التسويق وإنشاء المحتوى للحملات، من بين قطع إعلانية ومنصات فيديو أخرى.

فيرتكس الذكاء الاصطناعي

تحديث Gemini 1 pro يجعلني أستمع وأنشئ المحتوى. ومع التحديث الجديد، أصبح الذكاء الاصطناعي لدى Google يفهم الصوت ويحلله. بإمكان Imagen 5 الآن إضافة عناصر الصورة وإزالتها وإنشاء صور GIF مدتها 2 ثوانٍ
منصة فيرتكس للذكاء الاصطناعي. الصورة: جوجل / الاستنساخ

O فيرتكس الذكاء الاصطناعي هي منصة آلة التعلم (ML) الذي يتيح تدريب ونشر أدوات وتطبيقات الذكاء الاصطناعي، بما في ذلك تخصيص نماذج اللغات الكبيرة (LLMs) لاستخدامها في التطبيقات التي تعمل بالذكاء الاصطناعي.

تجمع المنصة إمكانيات وتطبيقات Google المتنوعة، وتدمج هندسة البيانات وعلوم البيانات وسير عمل هندسة البيانات. آلة التعلم، مما يتيح التعاون بين الفرق من خلال مجموعة مشتركة من الأدوات، بالإضافة إلى توسيع نطاق التطبيقات باستخدام مزايا Google Cloud.

A فيرتكس الذكاء الاصطناعي يقدم عدة خيارات للتدريب ونشر النماذج:

  • AutoML يسمح لك بتدريب بيانات جدولية أو صورية أو نصية أو فيديو دون الحاجة إلى كتابة تعليمات برمجية أو إعداد تقسيمات البيانات.
  • يمنحك التدريب المخصص السيطرة الكاملة على عملية التدريب، بما في ذلك استخدام الإطار رمز ML المفضل، وترميز التدريب الخاص، واختيار خيارات ضبط المعلمة الفائقة.
  • حديقة نموذجية يتيح اكتشاف نماذج Vertex AI واختبارها وتخصيصها ونشرها، بما في ذلك اختيار النموذج والموارد مفتوحة المصدر (OSS).
  • A الذكاء الاصطناعي التوليدي يوفر إمكانية الوصول إلى نماذج الذكاء الاصطناعي الكبيرة التوليدية من Google بطرق متعددة (النص والرمز والصور والكلام). يمكنك ضبط Google LLMs لتلبية احتياجاتك ونشرها للاستخدام في التطبيقات التي تعمل بالذكاء الاصطناعي.

مصدر: وشك, جوجل للمطورين, دليل توم, Beebom, Google Cloud

انظر أيضا:

تمت مراجعته من قبل جلوكون فيتال في 10/4/24.

اشترك لتلقي أخبارنا:

ترك تعليق

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

المنشورات ذات الصلة
مهمة الفضاء عطارد

تحاول مهمة Mercury إنقاذ المسبار الذي يعاني من مشاكل في الطاقة

تواجه مهمة فضائية مشتركة بين وكالة الفضاء الأوروبية ووكالة استكشاف الفضاء اليابانية تعقيدات عند محاولتها الوصول إلى الكوكب الأقرب إلى الشمس.
الصورة الرمزية ألكسندر ماركيز
اقرأ أكثر
تطلق Blackview هاتف Hero 10، وهو هاتف ذكي قابل للطي مزود بشاشتين وكاميرا بدقة 108 ميجابكسل. يتمتع الجهاز بمواصفات رائعة، مثل شاشة AMOLED، وذاكرة وصول عشوائي (RAM) سعة 12 جيجابايت، وبطارية بسعة 4000 مللي أمبير، وشحن سريع بقدرة 45 وات،

تطلق Blackview هاتف HERO 10، وهو هاتف ذكي قابل للطي مزود بشاشتين وكاميرا بدقة 108 ميجابكسل

يتمتع الجهاز بمواصفات رائعة، مثل شاشة AMOLED، وذاكرة وصول عشوائي (RAM) سعة 12 جيجابايت، وبطارية بسعة 4000 مللي أمبير، وشحن سريع بقدرة 45 وات،
لوكاس جوميز الصورة الرمزية
اقرأ أكثر
انطلاق الصاروخ من قاعدة الكانتارا باتجاه القمر

تعد مشاركة البرازيل في العودة إلى القمر أحد مواضيع منتدى SpaceBR الرابع

ويقام المعرض بالتعاون مع DroneShow Robotics وMundoGEO Connect وExpo eVTO، في الفترة من 21 إلى 23 مايو، مع برنامج موسع لمناقشة سوق الفضاء وفرص العودة إلى القمر والأقمار الصناعية والاستثمارات. تحقق من الجدول الزمني
لوكاس جوميز الصورة الرمزية
اقرأ أكثر