اخبار التكنولوجيا

آبل تطور أداة ذكاء اصطناعي تحرك الصور بالأوصاف النصية

كشف الباحثون في آبل النقاب عن Keyframer، وهو نموذج أولي لأداة الرسوم المتحركة التي تعمل بالذكاء الاصطناعي والتي تتيح للمستخدمين إضافة حركة إلى الصور الثنائية الأبعاد من خلال وصف كيفية تحريكها.

وتسخر Keyframer قوة النماذج اللغوية الكبيرة من أجل تحريك الصور الثابتة من خلال مطالبات باللغة الطبيعية.

وقالت الشركة في ورقة بحثية إن نماذج اللغات الكبيرة غير مستكشفة في الرسوم المتحركة مع أنها أظهرت إمكانات كبيرة عبر الوسائط الإبداعية الأخرى، مثل الكتابة وتوليد الصور.

وتعرض آبل أداة Keyframer العاملة باستخدام النماذج اللغوية الكبيرة بصفتها مثالًا واحدًا لكيفية استخدام التكنولوجيا.

وتستطيع Keyframer أن تأخذ ملفات بالتنسيق الذي يمكن تغيير حجمه دون تغيير الجودة SVG وإنشاء تعليمات برمجية بلغة البرمجة CSS من أجل تحريك الصورة بناءً على مطالبة نصية، وذلك باستخدام النموذج اللغوي الكبير GPT4 من OpenAI بصفته النموذج الأساسي.

ويحتاج المستخدم إلى تحميل الصورة وكتابة مطالبة نصية ومن ثم الضغط على زر “توليد”.

وتوضح الأمثلة الواردة في ورقة البحث كيف يمكن لصورة كوكب زحل أن تنتقل بين ألوان الخلفية، أو عرض النجوم وهي تظهر وتتلاشى.

ويمكن للمستخدمين إنتاج تصميمات الرسوم المتحركة المتعددة دفعة واحدة، وضبط الخصائص، مثل الألوان ومدة الرسوم المتحركة في نافذة منفصلة.

وليست هناك حاجة إلى خبرة في البرمجة، إذ تحول Keyframer هذه التغييرات تلقائيًا إلى لغة البرمجة CSS، مع أن التعليمات البرمجية نفسها قابلة للتحرير بالكامل.

ويعد هذا النهج القائم على الوصف بسيطًا مقارنةً بالأشكال الأخرى للرسوم المتحركة التي يولدها الذكاء الاصطناعي، التي تتطلب عادةً تطبيقات عديدة مختلفة وبعض الخبرة في البرمجة.

ولا تتاح Keyframer للعامة بعد، وشملت دراسة المستخدم ضمن ورقة بحث آبل مقدار 13 شخصًا فقط يمكنهم استخدام صورتين SVG بسيطتين محددتين سابقًا عند تجربة الأداة.

وحرصت آبل على ذكر الحدود في الورقة، مع تحديد أن Keyframer تركز على الرسوم المتحركة المستندة إلى الويب، مثل تسلسلات التحميل، وتصور البيانات، والانتقالات المتحركة.

وعلى النقيض من ذلك، فإن نوع الرسوم المتحركة التي تراها في الأفلام وألعاب الفيديو معقدة للغاية ولا يمكن في الوقت الحالي على الأقل إنتاجها باستخدام الأوصاف وحدها.

وتعد Keyframer واحدة من ابتكارات الذكاء الاصطناعي العديدة التي أعلنتها آبل في الأشهر الأخيرة.

وقدمت آبل في شهر ديسمبر HUGS، وهي أداة يمكنها إنشاء صور رمزية بشرية جاهزة للرسوم المتحركة من مقاطع الفيديو.

وأصدرت آبل في الأسبوع الماضي MGIE، وهو نموذج جديد للذكاء الاصطناعي يمكنه تحرير الصور باستخدام الأوصاف النصية.



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *