خاص

أداة Sora لتحويل النص إلى فيديو

يوماً بعد يوم، تستمر تقنيات الذكاء الاصطناعي التوليدي بتحقيق تقدم سريع، ينذر بإحداث تحول كبير في مختلف مجالات الحياة، حيث أصبحت الآلات وبفضل هذه التكنولوجيا، قادرة على إنشاء محتوى واقعي، لا يمكن الشك للحظة، أن جميع عناصره من إنتاج برمجية ذكية.

فمنذ أيام أذهل الرئيس التنفيذي لشركة “OpenAI”، سام ألتمان، صناعة الذكاء الاصطناعي مرة جديدة، بالكشف عن نموذج Sora لتحويل النص إلى فيديو، والذي صدم الجمهور بقدراته على إنتاج مقاطع فيديو عالية الدقة عبر شبكة الإنترنت.

تحويل النص إلى فيديو

ونموذج Sora، الذي يأخذ اسمه من الكلمة اليابانية التي تعني “سماء”، يمكنه إنشاء مقاطع فيديو ذات مظهر واقعي، تصل مدتها إلى دقيقة، بناءً على المطالبات النصية، حيث كل ما يجب على الفرد فعله هو تزويد Sora برسالة نصية بسيطة، يشرح من خلالها ما يريده أن يظهر بالفيديو، ليقوم Sora بعدها بإنتاج محتوى الفيديو، الذي طلب منه من خلال تحويل النص المكتوب إلى فيديو.

وحتى الساعة، فإن نموذج الذكاء الاصطناعي الجديد لشركة OpenAI، غير متاح لعموم المستخدمين، بل هو متوفر لعدد محدود من المبدعين والخبراء، المكلفين بتقييم سلامته، قبل طرحه على نطاق واسع لعامة الجمهور.

وOpenAI ليست أحدث شركة تتبنى تكنولوجيا الفيديو التوليدي، فهناك أيضاً شركات أخرى تمتلك نماذج للذكاء الاصطناعي، قادرة على إنتاج مقاطع فيديو من خلال المطالبات النصية، حيث قامت Meta في السابق بالكشف عن نموذج Emu Video، في حين تملك Google نموذج Lumiere لتحويل النص إلى فيديو.

مخاطر تكنولوجيا الفيديو التوليدي

ورغم أن تكنولوجيا الفيديو التوليدي يمكن أن تعمل على تسريع الإنتاج المرئي الإبداعي، إلا أن اعتماد هذه التكنولوجيا على نطاق واسع، قد يؤدي إلى إحداث حالة من الفوضى عبر شبكة الإنترنت، خصوصاً إذا ما تم استخدام نماذج مثل Sora وEmu Video وLumiere من قبل أطراف سيئة، لإنشاء مقاطع فيديو كاذبة ونشرها على أنها حقيقية.

كما أن تكنولوجيا الفيديو التوليدي، يمكن أن تشكل تهديدات جديدة للصناعة الإبداعية، بسبب تأثيرها على سبل عيش الفنانين، فإطلاق نماذج الذكاء الاصطناعي القادرة على إنتاج مقاطع فيديو معقدة وبدقة عالية، يعزز مخاوف استيلاء هذه التكنولوجيا على وظائف البشر.

أداء OpenAI يخيف المراقبين

وما يخيف المراقبين أكثر، هو دخول شركة OpenAI إلى ساحة المنافسة، لناحية البرامج المدعومة بتكنولوجيا الفيديو التوليدي، فرغم أن شركات مثل ميتا وجوجل كانت قد سبقت OpenAI على طرح منتجات ذكية لإنتاج الفيديو، إلا أن الضجة التي أحدثها الإعلان عن Sora كانت كبيرة جداً وذلك لسببين، الأول هو القدرات المتطورة والفائقة التي يتمتع بها النموذج الجديد، أما السبب الثاني فيرجع إلى إدارة شركة OpenAI المستعدة لتحطيم جميع القيود، وأخذ الذكاء الاصطناعي التوليدي إلى مرحلة جديدة، وذلك بعكس شركتيْ جوجل وميتا، اللتين تعتمدان سياسة متحفظة، لعلمهما أن أي خطوة متسرعة في هذا المجال، قد تساهم في تعزيز الفوضى في عالم الإنترنت.

يفهم أكثر من منافسيه

ويقول الكاتب والمحلل في شؤون الذكاء الاصطناعي، ألان القارح، في حديث لموقع “اقتصاد سكاي نيوز عربية”، إن شركة OpenAI أعلنت أنها ومن خلال نموذج Sora، تقوم بتعليم الذكاء الاصطناعي، كيفية فهم ومحاكاة العالم المادي المتحرك، ومنحه القدرة على تحويل النص المكتوب إلى فيديو، لافتاً إلى أن Sora قادر على إنشاء مشاهد معقدة، بشخصيات متعددة وبتفاصيل دقيقة للخلفية، وهو يتمتع بقدرة فهم كبيرة للغة مقارنة بالمنافسين، حيث يمكنه تفسير ما هو مكتوب بدقة، لينشئ شخصيات مقنعة بالأسلوب المرئي.

ويشرح القارح أن نموذج Sora يفهم ما طلبه المستخدم، ويفهم أيضاً كيفية وجود الأشياء في العالم الحقيقي، بناءً على الأبحاث السابقة، وبيانات التدريب التي تمتلكها OpenAI، ونتيجة لذلك، أصبح النموذج قادراً على اتباع التعليمات النصية للمستخدم بأمانة كبيرة، لافتاً إلى أن Sora قادر على اللجوء إلى صورة موجودة على الإنترنت، والتقاط نسخة منها، واستخدامها لإنشاء محتوى متحرك، وسد الفراغات التي قد يحتويها النص المكتوب، لتكون النتيجة هي الحصول على فيديو يهتم بالتفاصيل الصغيرة. 

الأمور الممنوعة على Sora

وبحسب القارح فإن OpenAI تعترف أن نموذج Sora بوضعه الحالي لديه نقاط ضعف، فهو قد لا يفهم على المستخدم ببعض الحالات المحددة، وقد تختلط عليه الأمور بين اليمين واليسار، ولذلك لم تقم الشركة بطرحه بعد لعموم المستخدمين، كما أنه من ناحية الأمان، فإن OpenAI تعمل مع خبراء السلامة، لمنع نموذجها من تركيب فيديوهات، ترتكز على نص يحتوي على معلومات خاطئة، أو طلب بإنشاء محتوى يحض على الكراهية، أو العنف الشديد أو المحتوى الجنسي، أو يعتدي على الملكية الفكرية للآخرين، كاشفاً أن OpenAI تقوم أيضاً بتبني أدوات، تساعد في تعريف مستخدمي الإنترنت، على أن الفيديو الذي يشاهدونه، تم إنشاؤه بواسطة Sora ما يساعدهم على اكتشاف أن المتحوى المنشور ليس بحقيقي.

هل اقتربت الفوضى في عالم الإنترنت؟

ويرى القارح أن الموجة الجديدة من أنظمة الذكاء الاصطناعي التوليدي، تتمتع بالقدرة على إظهار سلوك، لا يمكن تمييزه عن سلوك البشر، ومن هنا يأتي الخوف من أن تحدث هذه البرامج، فوضى في عالم الإنترنت، في حال تم استخدامها من قبل أطراف أو مجموعات، تهدف إلى خلق بلبلة أو إلى ابتزاز شخص ما، مذكراً بما حصل منذ أيام قليلة، مع المغنية الأميركية تايلور سوفيت التي انتشرت لها صور إباحية مزيفة، تبين أنها أُنشئت من خلال تقنية التزييف العميق (Deep fake) وهي أحد أشكال الذكاء الاصطناعي.

وشدد القارح على أن ما حصل مع النجمة الأميركية، دق جرس الإنذار عالمياً ونبه إلى المخاطر، التي بات يمكن أن تنتج عن استخدام الذكاء الاصطناعي التوليدي، في سياق إنتاج محتوى الفيديو المُزيف، لابتزاز الفئات الأضعف في المجتمع، أو نشر شائعات وجعلها تبدو حقيقية، لافتاً إلى أن المشكلة الأكبر في هذا المجال، هو عدم قدرة أي قيود وتشريعات، على ضبط الوضع بشكل تام، فتكنولوجيا الفيديو التوليدي، ستكون متوفرة بين أيدي عامة الناس، خلال فترة قريبة، وبالتالي فإنه لا يمكن التنبؤ بجميع الطرق التي سيستخدم بها هؤلاء الأشخاص هذه التكنولوجيا، وهذا ما يشير إلى أننا مقبلون على مرحلة، قد يشهد فيها المحتوى المنشور على الإنترنت حالة كبيرة من الفوضى.

من جهته يقول المحلل التكنولوجي، جوزيف زغبي، في حديث لموقع “اقتصاد سكاي نيوز عربية”، إن الذكاء الاصطناعي التوليدي، اصبح يتقدم بسرعة كبيرة، وما نراه في العلن، هو جزء صغير من الذي يتم تحقيقه “خلف الكواليس”، ولذلك بات على السلطات التشريعية في مختلف الدول، مواكبة التقدم التكنولوجي الحاصل، من خلال إقرار قوانين تنظم استخدام الذكاء الاصطناعي التوليدي وأدواته المتنوعة، وتكافح سوء استعماله، وتحاسب المرتكبين، لافتاً إلى أنه رغم عدم قدرة قوانين وتشريعات الذكاء الاصطناعي، على ردع المخالفات بشكل تام، إلا أن وجودها يبقى أفضل من عدمه، خصوصاً أنها تشكل حافزاً لإنصاف الضحايا المحتملين، والتعويض عليهم ومحاسبة ألأطراف المسيئة.

“OPEN AI” تكشف عن أداة جديدة تحول النصوص لمقاطع فيديو

المشكلة ليست بظهور Sora

وشدد زغبي على أن البرامج التي تعتمد على تكنولوجيا الفيديو التوليدي، يمكن أن تساعد في التضليل وانتحال الشخصيات، مشيراً إلى أن المشكلة ليست بظهور نموذج Sora الذي ستسعى من خلاله شركة OpenAI إلى مراعاة شروط الاستخدام، بل بمساهمة الشركة في نشر تكنولوجيا الذكاء الاصطناعي التوليدي، بشكل غير مسؤول، ففي الوقت الذي نرى فيه أن جوجل وميتا، تتأنيان في نشر التكنولوجيات الحديثة، لضمان استعداد الجميع للمشهد سريع التغير الذي يلوح في الأفق، تظهر OpenAI بمظهر المتسرع، الذي يريد أن يسبق الجميع، دون الأخذ في الاعتبار، نتيجة أي إنفلات قد يحصل بسبب التكنولوجيا الجديدة.

ويرى زغبي أن الأداة الجديدة Sora والأدوات الأخرى، التي تعمل من خلال تكنولوجيا الفيديو التوليدي، ستحدث تغييرات إيجابية في مجال الإعلام، حيث ستسمح بإنتاج مواد بصرية معقدة بأسلوب سهل وبسيط، وهذا التغيير سيكون بمثابة ثورة كبيرة في صناعة المحتوى، ولكن في المقابل، سيكون له تأثير سلبي على سوق العمل، إذ أن المحتوى المنتج آلياً بهذه السهولة، يقلل الحاجة إلى مهارات كثيرة في عالم إنتاج وإعداد الفيديوهات والنصوص، وبالتالي على الأشخاص المختصين في هذا المجال، ربما تغيير مجال عملهم.

شاركها.
اترك تعليقاً

Exit mobile version