جيميني اومني ثورة الذكاء الاصطناعي في عالم انتاج الفيديو

في خطوة مفاجئة، كشفت جوجل عن عائلة نماذج ذكاء اصطناعي جديدة باسم "جيميني اومني"، تتجاوز قدرات نموذجها الحالي "فيو"، وذلك خلال فعاليات مؤتمرها الأخير للمطورين، حيث يبدأ أول هذه النماذج بنموذج "اومني فلاش".
وتهدف عائلة نماذج "جيميني اومني" إلى تقديم تجربة مختلفة تماما في توليد مقاطع الفيديو مقارنة بـ "فيو" أو "فلو"، فهي قادرة على توليد مقاطع الفيديو مباشرة من الصور ومقاطع الفيديو والنصوص، مما يعني قدرتها على التعامل مع أنواع متعددة من المدخلات.
وتجسد "جيميني اومني" تحولا في كيفية استخدام نماذج الذكاء الاصطناعي لإنشاء مقاطع الفيديو، إذ أنها تحرر المستخدم من كتابة الأوامر النصية المعقدة، وتمنحه القدرة على توليد مقاطع فيديو بناء على أي نوع من المدخلات.
ويستطيع المستخدم من خلال "جيميني اومني" معالجة الصور والنصوص ومقاطع الفيديو لإنتاج مقاطع احترافية تحافظ على المحتوى والشخصيات الأصلية.
ويعني ذلك أنه عند رفع صورة إلى الأداة، يمكن توليد مقطع فيديو للشخص أو الأشكال الموجودة في الصورة مع الحفاظ على جميع التفاصيل.
وتفتح هذه الإمكانية الباب أمام استخدامات متنوعة لم تكن ممكنة في السابق، حيث كانت تتطلب مستوى عاليا من الخبرة في كتابة الأوامر للذكاء الاصطناعي.
وتتعدد الاستخدامات التي يمكن الاستفادة منها من "اومني"، بدءا من تعديل مقاطع الفيديو الموجودة مسبقا، وفقا لتقرير موقع "تيك كرانش" التقني.
وإلى جانب ذلك، يمكن تعديل الصور باستخدام "اومني" على غرار أداة "نانو بانانا برو"، والاستفادة من قدراتها المتطورة.
ولا تتطلب عملية تعديل أو مونتاج الفيديو مهارات خاصة، بل يكفي وصف التعديلات المطلوبة لـ "اومني"، لتقوم تلقائيا بتعديل المقطع وتحويله إلى مقطع جديد جاهز للمشاركة.
كما يوفر النموذج القدرة على توليد صورة رمزية "افاتار" مطابقة للمستخدم، مع استخدام نفس درجة الصوت، ويمكن تحريك هذه الصورة واستخدامها في مقاطع الفيديو، بحسب "تيك كرانش".
ولكن قدرات "اومني فلاش" تقتصر على توليد مقاطع فيديو لمدة 10 ثوان فقط، وترى جوجل أن المستخدمين لا يرغبون في إنشاء مقاطع أطول حاليا.
وتضيف نيكول بريشتوفا، مديرة إدارة المنتجات في "جوجل ديب مايند"، أن هذا التقييد ليس بسبب ضعف النموذج، بل هو قرار يهدف إلى إتاحة النموذج لأكبر عدد ممكن من المستخدمين.
وتحمل جميع المقاطع المولدة بواسطة "جيميني اومني" علامة "سينث اي دي" المميزة لمقاطع الفيديو المولدة بالذكاء الاصطناعي من جوجل، لتسهيل اكتشافها وحماية المستخدمين من سوء استخدام الأداة.
وتعود عائلة نماذج "اومني" بالنفع على العاملين في مجال الفيديو وصناع المحتوى، حيث تقلل الوقت اللازم لتعديل وإنتاج مقاطع الفيديو دون الحاجة إلى تعلم برامج المونتاج المعقدة.
كما أن استخدام "اومني" لا يتطلب حواسيب متطورة، بل يمكن استخدامه من خلال تطبيق الهاتف الخاص بـ "جيميني".
ويشير تقرير موقع "ذا فيرج" إلى أن الفرق الرئيسي بين "اومني" و"فلو" يكمن في أنواع المدخلات التي يمكن لكل أداة التعامل معها.
وتستطيع "فيو" التعامل مع الصور والنصوص لتوليد مقاطع الفيديو، بينما يوسع "اومني" التجربة لتشمل الصور ومقاطع الفيديو والصوت والنصوص، بالإضافة إلى تحرير الفيديو بالمحادثة.
وبينما يبدو هذا هو الفرق الأبرز من ناحية المستخدم، إلا أن الآلية التي تقف خلف كل أداة مختلفة تماما، حيث تصف جوجل "اومني" بأنه أقرب إلى نموذج "عالم" بدلا من مجرد نموذج ذكاء اصطناعي تقليدي.
ويكمن الفرق بين نماذج العالم ونماذج الذكاء الاصطناعي التقليدية في قدرة نماذج العالم على فهم قوانين العالم الطبيعي والفيزيائية والواقعية والالتزام بها، وتوقع نتائجها على الأشياء.
ويعني هذا أن مقطع الفيديو الذي سيقوم "اومني" بتوليده سيكون أقرب إلى الواقع ويلتزم بقوانين الفيزياء مثل الجاذبية وحركة الهواء، مما يزيد من واقعية المقاطع.
كما يعتمد "اومني" على عائلة مختلفة من نماذج الذكاء الاصطناعي التي تقدمها جوجل، حيث يدمج بين نموذج الذكاء الاصطناعي اللغوي "جيميني" والبيانات التي تم تدريبه عليها وبين نماذج توليد مقاطع الفيديو الخاصة بالشركة، وفقا لـ "تيك كرانش".
وتحاول جوجل الحد من استخدام "اومني" في توليد مقاطع التزييف العميق من خلال وضع علامة مميزة للكشف عن المقاطع المولدة بالذكاء الاصطناعي "سينث اي دي"، بالإضافة إلى خطوات للتيقن من هوية المستخدم قبل إتاحة عمل "افاتار" خاص به.
ولكن، العديد من الأدوات التي تملك قيودا مماثلة لم تتمكن من إيقاف انتشار مقاطع التزييف العميق، فهل ستنجح أدوات جوجل في التغلب على هذا التحدي؟







