أعلنت شركة OpenAI رسميا عن نموذج الذكاء الاصطناعي الجديد Sora سورا لتحويل النصوص إلى مقاطع فيديو، وهو النموذج الذي تقول الشركة أنه يمكنه إنشاء فيديو لمشاهد واقعية ومتخيلة من الأوصاف النصية، بما في ذلك مقاطع الفيديو التي تتضمن مشاهد مركبة وأنواع مختلفة من الحركة.
وقال سام ألتمان الرئيس التنفيذي لشركة OpenAI عبر منشور على موقع إكس X أن نموذج الذكاء الاصطناعي سورا Sora متاح الآن لمجموعة مختارة من المستخدمين، بما في ذلك الفريق الذي يقيم المخاطر المحتملة من استخدام النموذج الجديد، بالإضافة لمجموعة من منتجي المحتوى وصانعي الأفلام والمصممين للحصول على تعليقاتهم حول النموذج.
ما هو سورا Sora من شركة OpenAI ؟
ويوفر نموذج الذكاء الاصطناعي الجديد من شركة OpenAI الذي تطلق عليه اسم سورا Sora للمستخدمين أداة لتحويل النص إلى فيديو، بحيث ما على المستخدم سوى وصف أي مشهد نصيا للحصول على فيديو بجودة عالية مدته تصل إلى دقيقة واحدة، وقالت الشركة التي تطور شات جي بي تي أنها تعمل على تعليم الذكاء الاصطناعي كيفية فهم ومحاكاة العالم المادي المتحرك.
وأكدت OpenAI أن نموذج الذكاء الاصطناعي الجديد الخاص بها سورا Sora قادر على إنشاء مقاطع فيديو لمشاهد معقدة بشخصيات متعددة، مع أنواع محددة من الحركة وتفاصيل دقيقة للمشهد والخلفية.
وتقول الشركة أن النموذج ليس قادرا فقط على فهم المطالبات النصية للمستخدم لإنشاء الفيديو، لكنه قادر على فهم كيفية وجود أو ارتباط الأشياء الموصوفة داخل الفيديو في العالم الحقيقي، كما يمكن لـ Sora أيضا إنشاء لقطات متعددة في مقطع فيديو واحد يتم إنشاؤه بدقة مع وجود شخصيات والالتزام بأسلوب مرئي معين.
لكن النموذج الجديد للذكاء الاصطناعي لتحويل النصوص إلى فيديو Sora لا يزال لديه بعض القصور حسبما قالت الشركة المطورة، حيث قد يجد أحيانا صعوبة في محاكاة الحركة الطبيعية لمشهد ما بدقة، كما قد لا يفهم في حالات محددة العلاقة بين السبب والنتيجة، مثل عرض مشهد فيديو لشخص يأكل قضمة من كعكة ما ثم يعرض الكعكة كاملة لاحقا، كما قد يخلط النموذج أحيانا بين التفاصيل المكانية في الفيديو مثل الخلط بين اليسار واليمين واتباع مسار معين للكاميرا.
متى يتوفر نموذج سورا Sora لتحويل النصوص إلى فيديو ؟
وفيما لم تعلن OpenAI بعد عن موعد توفر نموذج الذكاء الاصطناعي الجديد سورا لإنشاء الفيديو من النصوص، قالت أن فريقها للسلامة يختبر الآن النموذج للتأكد من المخاطر المحتملة، كما يختبره الآن مجموعة من المبدعين للحصول على تعليقاتهم.
وقالت الشركة أنها ستتخد العديد من الخطوات لضمان السلامة قبل إتاحة Sora في منتجاتها المختلفة مثل ChatGPT Plus وغيرها، مع العمل على تطوير أدوات للمساعدة في اكتشاف المحتوى المضلل، كما قالت أنها ستستفيد من أساليب السلامة الحالية التي وفرتها لمنتجاتها مثل DALL·E 3 لإنشاء الصور بالذكاء الاصطناعي عبر وصفها نصيا.
أمثلة على مقاطع الفيديو القادر Sora على إنشائها من خلال الوصف النصي:
وعرضت OpenAI العديد من مقاطع الفيديو من إنشاء نموذج تحويل النصوص إلى فيديو سورا Sora، كما عرض سام ألتمان مجموعة من الفيديوهات من المقترحات النصية التي حصل عليها من المستخدمين على X، وهي الأمثلة التي شملت:
فيديو للوصف النصي: “قرد يلعب الشطرنج في الحديقة”