كشفت شركة OpenAI هذا الأسبوع عن نموذج الذكاء الاصطناعي GPT-4o الجديد، والذي يجلب لمستخدمي شات جي بي تي ChatGPT تجربة مبتكرة شبيهة بالتي عرضها فيلم Her، حيث يتيح للمستخدمين الدردشة صوتيا في الوقت الحقيقي للحصول على معلومات أو الاستفسار عن أي شيء، مع إمكانية فهم نبرة الصوت والرد عليها، بالإضافة إلى الرؤية أفضل اعتمادا على كاميرا الهاتف، بحيث يمكن فتح الكاميرا للسؤال عن خطوات حل معادلة رياضية ما أو الحصول على إجابات حول رسم بياني ما وغيرها.
كما يعرض GPT-4o ردودا أسرع، مع القدرة على الوصول إلى الويب لحظيا وتوثيق الإجابات بروابط مباشرة للمصادر، بالإضافة لتكلفة أقل للمطورين من خلال الواجهة البرمجية API التي توفرها الشركة.
ما هو GPT-4o جي بي تي-4o ؟
وGPT-4o هو نموذج ذكاء اصطناعي لغوي جديد من شركة OpenAI الرائدة في تطوير تقنيات AI، وهو النموذج متعدد الوسائط القادر على معالجة النصوص والصوت والصور والفيديو وفهمها، مع القدرة على إنتاج النصوص والصوت والصور والفيديو أيضا، مما يجعل ChatGPT مساعدا ذكيا من الجيل الجديد قادر على الدردشة صوتيا والرؤية للرد على استفسارات المستخدمين.
ويشير حرف o في GPT 4o إلى كلمة أومني omni، وهي كلمة لاتينية تعني الكل أو كل شيئ، وهي من الكلمات البادئة، وذلك في إشارة لقدرة النموذج على أداء مختلف المهام وفهم مختلف أنساق المحتوى.
ويمكن لشات جي بي تي استنادا لنموذج GPT-4o الرد صوتيا على استفسارات المستخدمين صوتيا خلال 320 ميللي ثانية في المتوسط، وهو ما تقول OpenAI أنه مشابه لاستجابة البشر في المحادثات، كما أنه يوفر أداء مشابها لنموذج GPT-4 Turbo في معالجة النصوص بالإنجليزية والمساعدة في أداء مهام البرمجة، مع أداء أفضل كثيرا في معالجة النصوص بلغات أخرى غير الإنجليزية.
ويوفر GPT-4o قدرة أكبر كثيرا في معالجة الأوامر النصية أو الصوتية أسرع مع تكلفة أقل بنسبة 50 في المئة للمطورين من خلال الواجهة البرمجية API التي توفرها الشركة، مع فهم أفضل كثيرا للصوت وقدرة أكبر على الرؤية.
ما هي مميزات وقدرات GPT-4o جي بي تي-4o ؟
وقالت شركة OpenAI أن أداء GPT-4o في مستوى GPT-4 Turbo وفقا للمعايير التقليدية لقياس أداء نماذج الذكاء الاصطناعي اللغوية، وذلك فيما يتعلق بمعالجة النصوص والشفرات البرمجية والاستدلال، بالإضافة للقدرة على معالجة النصوص والصوت والصورة.
وهذه مميزات النموذج الجديد:
– القدرة على إجراء المحادثة الصوتية لحظيا
وفيما يوفر GPT-4 إمكانية الاستفسار صوتيا من خلال شات جي بي تي والحصول على إجابة صوتية، لكنه يعتمد على تحويل الصوت إلى نص ثم تحويل النص إلى الصوت، فإن GPT-4o يتيح لمستخدمي ChatGPT الدردشة صوتيا في الوقت الحقيقي على غرار الدردشة مع شخص آخر، مع الحفاظ على سرعة استجابة أشبه بالمحادثة التقليدية بين شخصين، وهو ما يوفر تجربة شبيهة بالتقنيات المتخيلة في أفلام ومسلسلات الخيال العلمي، مثل فيلم Her، مع القدرة على فهم مشاعر المستخدم من صوته أو التعرف على نبرة الصوت وإنتاج محادثات أيضا تراعي ذلك.
– الرؤية ومشاهدة الفيديو والصور
كما يتيح GPT-4o أيضا لمستخدمي شات جي بي تي إمكانية الاعتماد على كاميرا الهاتف للاستفسار عن أي شيء ما، بحيث يمكن فتح الكاميرا للمساعدة على حل معادلة رياضية خطوة بخطوة من خلال التفاعل المرئي والصوتي، أو حتى للاستفسار عن شيء ما والتعرف عليه أو حتى طلب الحصول على ملخص للمعلومات في رسم بياني ما، وضربت OpenAI مثالا بإمكانية توجيه الكاميرا للعبة رياضية ما مثل مباراة كرة يد على سبيل المثال وطلب التعرف على معلومات حول قواعد اللعبة، وربما مستقبلا للتأكد من صحة هدف ما في مباراة بين ريال مدريد وبرشلونة.
– دعم أكثر من 50 لغة مختلفة
ويدعم جي بي تي 4 أوه أكثر من 50 لغة مختلفة، بما في ذلك اللغة العربية، وهو ما يتيح الاعتماد على شات جي بي تي في الترجمة الفورية لحظيا بين هذه اللغات، وذلك في تهديد مباشر للوظائف المتعلقة بالترجمة.
– عرض الإجابات معززة بالمعلومات من الويب
وهو ما يجعل شات جي بي تي منافسا لمحرك بحث جوجل، حيث يمكنه الآن الوصول للويب مباشرة لتزويد المستخدم بإجابات حديثة تراعي السياق أكثر، مع تعزيز هذه الإجابات بروابط لمصادر ومواقع الويب للتحقق من المعلومات مباشرة.
كيف يمكن الوصول لمميزات GPT-4o ؟
وأكدت OpenAI أنها بدأت في توفير مميزات جي بي تي-4o لمستخدمي شات جي بي تي ChatGPT عالميا، على أن يتوفر خلال الأسابيع المقبلة لجميع المستخدمين، كما أكدت أن مميزات النموذج الجديد ستتوفر لمستخدمي الإصدارا المجاني من شات جي بي تي، لكن مع حدود استخدام أقل 5 مرات مقارنة مع المشتركين في ChatGPT Plus.
وتخطط OpenAI لإطلاق الوضع الصوتي لإجراء دردشات صوتية مباشرة خلال الأسابيع المقبلة، مع توفير الوصول المبكر للميزة للمشتركين في الخدمة المدفوعة عند طرحها على نطاق أوسع.
مميزات مجانية جديدة لمستخدمي شات جي بي تي
وفي خطوة مفاجأة أعلنت OpenAI عن توفير العديد من المميزات التي كانت تتوفر حصريا للمشتركين في خدمتها المدفوعة للمشتركين، بما في ذلك الحصول على ذكاء في مستوى أداء نموذج GPT-4، بالإضافة للحصول على ردود أفضل اعتمادا على إمكانية الوصول للويب، إلى جانب القدرة على تحليل البيانات ورفع الملفات للاستفسار عن المعلومات داخلها، مع إمكانية التقاط صور أو رفع صورة للاستفسار عن شيء ما داخلها.
كما يمكن لمستخدمي الإصدار المجاني من ChatGPT أيضا الآن الوصول إلى متجر GPTs واستكشاف النسخ المخصصة لأداء مهمة محددة مثل تعلم اللغات على سبيل المثال، بالإضافة للاستفادة من ميزة الذاكرة التي توفر الحصول على إجابات أدق اعتمادا على حفظ العديد من المعلومات عن المستخدم أو طريقة عرض الإجابات.