عيب خطير في نماذج توليد الفيديو بالذكاء الاصطناعي
على الرغم من التقدم الكبير الذي أحرزته تقنيات الذكاء الاصطناعي، كشفت دراسة حديثة عن عيب أساسي في نماذج توليد الفيديو بالذكاء الاصطناعي.
وبحسب الدراسة، فإن تلك النماذج تفتقر لفهم القوانين الفيزيائية الأساسية، ما يؤدي إلى نتائج غير واقعية في بعض الحالات.
الاعتماد على الأنماط لا القوانين
تعمل معظم نماذج توليد الفيديو الحالية على تحليل الأنماط المتكررة في البيانات دون فهم فعلي للتفاعلات الفيزيائية، ما يؤدي إلى قصور في إنتاج مشاهد تعكس ديناميكيات الطبيعة بشكل دقيق، مثل حركة الأجسام، انعكاسات الضوء، أو تفاعل العناصر مع بعضها.
نموذج Sora
أعلنت شركة OpenAI، أنها تطور نموذجًا جديدًا لتوليد الفيديو يحمل اسم Sora، يهدف إلى تجاوز هذه العقبة، قائلة إن النموذج يمتلك فهمًا أساسيًا للتفاعلات الفيزيائية والهندسة الثلاثية الأبعاد، ما يجعله أقرب إلى محاكاة العالم الحقيقي.
ولا تقتصر الجهود على OpenAI؛ إذ تعمل شركات مثل "RunwayML" و"DeepMind التابعة لغوغل على تطوير نماذج مشابهة لتحسين دقة توليد الفيديو. لكن حتى الآن، تبقى هذه النماذج إما قيد التطوير أو متاحة بشكل محدود للجهات البحثية والشركات فقط.
عوائق النماذج الحالية
وفقًا للدراسة، أبرز العيوب في نماذج الذكاء الاصطناعي لتوليد الفيديو تشمل:
- انتهاك قوانين الحركة، مثل الأجسام التي تتحرك بطريقة غير طبيعية.
- أخطاء في الظلال والإضاءة، ما يؤدي إلى مشاهد تفتقر للواقعية.
- محدودية التفاعلات المعقدة، حيث تعجز النماذج عن محاكاة التفاعلات الفيزيائية الدقيقة مثل السوائل أو الاصطدامات.
موعد إطلاق Sora
رغم إعلان OpenAI عن نموذج Sora مطلع عام 2024، لم تُحدد الشركة حتى الآن موعدًا رسميًا لإطلاقه. ويُتوقع أن يكون متاحًا بعد عدة اختبارات لضمان جودة الأداء.
ويتوقع الخبراء أن يعزز فهم القوانين الفيزيائية في نماذج الذكاء الاصطناعي قدرات توليد الفيديو، مما يفتح آفاقًا جديدة في مجالات مثل السينما، التعليم، والبحث العلمي. ومع ذلك، يبقى التحدي في تحقيق هذا التطور مع الحفاظ على الكفاءة وسرعة الأداء.
aXA6IDMuMTI4LjMzLjIwOSA= جزيرة ام اند امز US