أخبار عاجلة
متعاقدو اللبنانية ملتزمون بالإضراب -
OpenAI تطلق نموذج GPT-Image 1.5 لتوليد الصور بنحو أسرع وأدق -
أطعمة ومشروبات تهدد قلبك وتضر بصحتك.. تجنبها! -

OpenAI تطلق نموذج GPT-Image 1.5 لتوليد الصور بنحو أسرع وأدق

OpenAI تطلق نموذج GPT-Image 1.5 لتوليد الصور بنحو أسرع وأدق
OpenAI تطلق نموذج GPT-Image 1.5 لتوليد الصور بنحو أسرع وأدق

أعلنت شركة OpenAI إطلاق نموذج GPT-Image 1.5 لتوليد الصور، مؤكدةً أنه يقدّم قفزة ملحوظة في دقة فهم الأوامر النصية، والحفاظ على التفاصيل البصرية، وسرعة المعالجة مقارنةً بالإصدار السابق.

وبحسب الشركة، فإن النموذج الجديد الصور بسرعة تصل إلى أربعة أضعاف. وقد أصبح النموذج متاحًا الآن لكافة مستخدمي ChatGPT، إضافةً إلى المطوّرين عبر واجهة البرمجة (API).

وفي سياق متصل، قالت الرئيسة التنفيذية لتطبيقات OpenAI، فيدجي سيمو، إن قدرات توليد الصور الجديدة تشكّل جزءًا من تحوّل أوسع في ChatGPT، من أداة نصية تفاعلية إلى “واجهة توليدية متكاملة” تستدعي المكوّنات المناسبة تلقائيًا وفق ما يرغب المستخدم في إنجازه.

تحرير أدقّ واتساق بصري أفضل

يوفّر GPT-Image 1.5 نهجًا أكثر دقة في تحرير الصور، وفقًا لما زعمته OpenAI؛ إذ يُجري تعديلات محدّدة دون التأثير في بقية العناصر، مع الحفاظ على اتساق الإضاءة والتكوين والوجوه. ويدعم النموذج عمليات الإضافة والحذف والدمج والمزج ونقل العناصر داخل الصورة.

وتشمل حالات الاستخدام تحرير الصور الاحترافية، وتجارب القياس الافتراضي للملابس وتسريحات الشعر، والتحويل بين الأساليب الفنية. وتُظهر النماذج التي عرضتها OpenAI إمكانات مثل دمج أشخاص وحيوان أليف من صور منفصلة في مشهد واحد، أو تحويل صورة عادية إلى ملصق سينمائي بطابع كلاسيكي.

التزام أعلى بالأوامر المعقّدة

أوضحت الشركة أن النموذج الجديد بات يلتزم بالتعليمات التفصيلية بدرجة أعلى؛ ففي اختبار يتطلّب ترتيب 36 عنصرًا مختلفًا داخل شبكة، نجح GPT-Image 1.5 في وضع العناصر بدقة، على عكس الإصدار السابق، مما يسهّل إنشاء صور تتطلب توزيعًا دقيقًا للعناصر.

وتحسّنت قدرة النموذج على عرض النصوص داخل الصور، ويشمل ذلك عرض نصوص أصغر وأكثر كثافة، مثل مقتطفات المقالات والجداول القصيرة والإنفوجرافيك الرقمية. ومع ذلك، أقرت OpenAI باستمرار بعض التحديات، مثل التعامل مع النصوص الطويلة، أو الخطوط غير الشائعة، أو تعدّد الوجوه داخل الصورة الواحدة، أو إنتاج محتوى بلغات متعددة.

وفي اختبارات داخلية لمشاهد فوتوغرافية معقّدة غير مألوفة، أظهر GPT-Image 1.5 أداءً قويًا متقاربًا مع نموذج جوجل Nano Banana Pro، ومتفوّقًا بوضوح على الإصدار السابق، مما يعزّز موقعه ضمن نماذج توليد الصور المتقدّمة في السوق، لكن التجربة الواقعية هي التي ستحدد كفاءة النموذج مقارنةً بمنافسيه.

نسخ الرابط تم نسخ الرابط

اشترك فى النشرة البريدية لتحصل على اهم الاخبار بمجرد نشرها

تابعنا على مواقع التواصل الاجتماعى

السابق جوجل تطلق “Disco”.. متصفح تجريبي يبني تطبيقات فورية بأوامر المستخدم
التالى سيري تُسقِط قائدها.. آبل تعلن رحيل رئيس الذكاء الاصطناعي بعد سنوات من الإخفاق