لقد اختبرت 5 مولدات صور تعمل بالذكاء الاصطناعي وهذا هو المولد الذي أوصي به
ريان هينز / هيئة أندرويد
أصبحت الصور المولدة بواسطة الذكاء الاصطناعي أكثر إثارة للإعجاب من أي وقت مضى، حتى أن بعضها فاز بجوائز التصوير الفوتوغرافي وخدع الخبراء في هذه العملية. أفضل جزء؟ لا تحتاج إلى أن تكون فنانًا محترفًا أو لديك أي مهارات تقنية لإنشائها. ولكن ليس كل شيء مولدات الصور بالذكاء الاصطناعي تم إنشاؤها على قدم المساواة – بعضها يتفوق في الواقعية، بينما البعض الآخر مليء بالأخطاء التي يسهل اكتشافها. هناك شيء واحد مؤكد: عدد قليل جدًا من الأشخاص يمكنهم إنشاء نص بشكل موثوق. للعثور على أفضلها، دفعت كل مولد صور يعمل بالذكاء الاصطناعي بمطالبات صعبة متتالية. وهنا النتائج التي توصلت إليها.
ما هو أفضل مولد صور AI؟
ج. سكوت براون / هيئة أندرويد
يعد العثور على أفضل منشئ صور يعمل بالذكاء الاصطناعي أمرًا صعبًا نظرًا لأن النتائج يمكن أن تختلف بشكل كبير من مطالبة إلى أخرى. ومع ذلك، فإننا نعلم أن تكنولوجيا الذكاء الاصطناعي التوليدي تميل إلى النضال في مجالات معينة أكثر من غيرها، لذا يمكننا تصميم مطالباتنا لتسليط الضوء على نقاط الضعف هذه ومعرفة أين يتألق كل منها – أو يفشل. يمكن لجميع مولدات الصور تقريبًا التعامل مع أنماط فنية أبسط، لذا سأقتصر الاختبار على المشاهد الواقعية هذه المرة.
إذا كنت بحاجة في أي وقت إلى إجراء اختبار قوي لمولد صور يعمل بالذكاء الاصطناعي، فحاول أن تطلب صورًا ذات تفاصيل معقدة مثل اليدين أو الشعر أو النص. ولا يستطيع سوى عدد قليل منهم التعامل مع هذه الأمور بشكل جيد، بينما يؤدي الآخرون في كثير من الأحيان إلى نتائج مشوهة أو غير واقعية. اختبار جيد آخر هو المشاهد المعقدة ذات المواضيع المتعددة أو وجهات النظر غير العادية، والتي تميل إلى التعثر حتى في أفضل النماذج.
مع أخذ ذلك في الاعتبار، قررت اختبار عدد قليل من مولدات الصور المختلفة ذات الذكاء الاصطناعي. على وجه التحديد، اخترت Imagen 3 من Google، وMeta’s Imagine، وDALL-E 3 عبر مصمم مايكروسوفت و ChatGPT، و جروك. وفي طلبي الأول، طلبت صورة لشخص يبكي. قد يبدو هذا الطلب سطحيًا جدًا، لكن تباين النتيجة كان رائعًا.
المطلب الأول: رجل يبكي والدموع تسيل على وجهه
كما يمكنك أن تقول بالفعل، فإن الصور من نماذج الذكاء الاصطناعي المختلفة لا تبدو متشابهة على الإطلاق. على الرغم من أن جزءًا من هذا يرجع إلى أن مطالبتي كانت غامضة إلى حد ما، فقد تم تدريب كل منشئ صور قمت باختباره أيضًا على مجموعة بيانات مختلفة. استخدمت Meta صورًا عامة من Facebook وInstagram، على سبيل المثال، في حين أنه من غير الواضح كيف حصلت معظم الشركات الأخرى على مجموعات بيانات التدريب الخاصة بها.
لطالما كان تكرار التشريح أمرًا صعبًا بالنسبة لمولدات الصور التي تعمل بالذكاء الاصطناعي، وهذه النتائج تثبت هذه الحقيقة فقط. لقد أنتج برنامج Imagen 3 من Google نتيجة مقنعة للغاية، كما تم إنشاء نتائج أخرى مثل Imagen من Meta. لقد قمت بإعادة اختبار هذه المطالبة مع اختلافات طفيفة لتحسين حجم العينة ولكن Imagen 3 فاز في كل مرة.
يستخدم Microsoft Designer DALL-E 3 الخاص بـ OpenAI أسفل الغطاء، مما يعني أنه يجب أن ينتج نتائج مماثلة لنتائج ChatGPT. وقد ثبت أن هذا صحيح في الاختبار الذي أجريته، حيث قدمت كلتا الخدمتين نتائج جيدة.
الفائز: الصورة 3، تليها DALL-E 3
موجه 2: مشهد مليء بالإثارة لراقصين في منتصف الأداء في شارع غارق في المطر…
لقد قمت بزيادة تعقيد وتفاصيل مطالبتي هذه المرة، مع إبقاء الموضوعات البشرية في الإطار. أعطى Imagen 3 نتيجة ممتازة مرة أخرى، ولم يتعثر إلا بأصابع أحد المشاركين. من ناحية أخرى، فقد أفسد برنامج Meta’s Imagine أطراف أحد الراقصين ووجهه بالكامل، وسأعتبر النتيجة غير قابلة للاستخدام.
قدم Microsoft Designer نتائج على شكل رسوم متحركة، والتي بدت مقبولة ولكنها لم تكن ما كنت أبحث عنه. وكانت محاولة ChatGPT أسوأ بكثير، حيث ظهر طرف إضافي من راقصة واحدة. ولحسن الحظ، قام جروك بإرجاع البندول إلى الخلف بنتيجة معقولة إلى جانب تشابك أصابع الراقصين.
موجه 3: قم بإنشاء صورة لطائرة إيرباص A380… وهي تسير على طريق هارب مع وجود أشجار استوائية في الخلفية.
قد أبدو وكأنني رقم قياسي مكسور في هذه المرحلة ولكن Imagen 3 يستمر في القضاء على المنافسة. على الرغم من أن هذه المطالبة تتطلب من الذكاء الاصطناعي إنشاء نص على جسم الطائرة، إلا أن نموذج جوجل تعامل معها بسهولة. تم نسخ اسم شركة الطيران بشكل مثالي، وبصرف النظر عن العلامات الفردية للمدرج، يكاد يكون من المستحيل معرفة أن الصورة تم إنشاؤها بواسطة الذكاء الاصطناعي.
حقق جروك نتيجة مثيرة للإعجاب مماثلة، وإن لم يكن في المحاولة الأولى، وما زال مشوهًا بعض النوافذ على السطح العلوي للطائرة. يستخدم برنامج الدردشة الآلي مولد صور جديدًا نسبيًا يسمى Flux، أنشأه الباحثون الذين طوروا Stable Diffusion. نظرًا لسمعة هذا الأخير في مجال إنشاء الصور، فليس من المستغرب أن يتمكن Grok من تحقيق نتائج ممتازة.
لسوء الحظ، قدمت مولدات الصور الأخرى التي تعمل بتقنية الذكاء الاصطناعي نتائج دون المستوى مقارنة بالنتائج السيئة الكوميدية هنا. Meta’s Imagine بصق نصًا مشوهًا ومستوى خاطئًا. DALL-E 3 عبر ChatGPT كاد أن يثبت النص على جانب الطائرة ولكنه أدى إلى ظهور علامات مشوهة على المدرج. يستخدم Microsoft Designer نفس طراز DALL-E 3 ولكنه يقدم بطريقة ما صورًا غير واقعية ذات مظهر أسوأ.
تجدر الإشارة إلى أن إضافة مصطلحات مثل “صورة واقعية” أو “HD” لم تفعل الكثير لجعل النتائج الناتجة عن الذكاء الاصطناعي تبدو أكثر واقعية أو واقعية. كان التأثير ضئيلًا في أحسن الأحوال، على الرغم من أنه من الممارسات المعتادة تضمين هذه المصطلحات كجزء من التحفيز الجيد.
الفائز: الصورة 3، تليها جروك
موجه 4: الشخصيات الشهيرة
لقد قيل الكثير عن الجانب المظلم لمولدات صور الذكاء الاصطناعي وقدرتها على التأثير على الرأي العام من خلال روايات كاذبة. لمكافحة هذه المشكلة، تحتوي معظم منصات الذكاء الاصطناعي الآن على حواجز حماية تمنعك من طلب صور تحاكي شخصًا معينًا.
ليس من المستغرب إذن أن يتم رفض مطالبتي من قبل جميع منشئي صور الذكاء الاصطناعي – باستثناء Grok. قام Elon Musk بإنشاء Grok باعتباره أقصى قدر من الذكاء الاصطناعي “البحث عن الحقيقة”، وهو مجرد حديث تسويقي لروبوت الدردشة مع حواجز حماية أقل من منافسيه. يمتد هذا النقص في القيود إلى الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي أيضًا، مما يعني أنه يمكنك من الناحية الفنية إنشاء صور لقادة العالم والمشاهير وحتى Musk نفسه في إعدادات مشكوك فيها.
ما هو مولد الصور AI الذي أوصي به؟
تتمتع العديد من أدوات إنشاء صور الذكاء الاصطناعي التي اختبرتها بنقاط قوة فريدة تجعلها أفضل من غيرها، لذا إليك اختياري الأفضل اعتمادًا على أولوياتي.
- جودة: قد لا يكون لدى Imagen 3 من Google اسم العلامة التجارية الأكثر شهرة بين جميع مولدات الصور المدعومة بالذكاء الاصطناعي في هذه القائمة، ولكنها تتميز بتقديم صور واقعية ونتائج يمكن تصديقها إلى حد كبير. الجانب السلبي الوحيد هو أنك تحصل على صورة واحدة فقط في كل مرة، ويمكن أن تستغرق معالجة الذكاء الاصطناعي عدة ثوانٍ في كل مرة ترسل فيها رسالة مطالبة.
- سرعة: ميتا تخيل تبرز إذا كنت بحاجة إلى صورة سريعة لأنك لا تحتاج حتى إلى الضغط على مفتاح Enter لرؤية النتيجة. تقوم الأداة بإنشاء صورة خلال ثانية من الكتابة في رسالة مطالبة، وهو ما يبدو فوريًا تقريبًا مقارنة بالعروض الأخرى في هذه القائمة.
- يكلف: مع توفر العديد من مولدات الصور المدعومة بالذكاء الاصطناعي اليوم، هل يستحق الدفع مقابل الحصول على واحدة منها؟ سيؤدي القيام بذلك إلى فتح بعض الميزات الرائعة، نظرًا لأن تحرير الصور باستخدام الذكاء الاصطناعي يكون عادةً مقفلاً خلف خدمات الاشتراك مثل منتصف الرحلةوAdobe Firefly وDALL-E 3. لإنشاء صور AI بسيطة، أوصي بـ Imagen 3 وMeta Imagine وMicrosoft Designer.
- الرقابة: يقدم Grok واحدًا من أسهل أدوات إنشاء الصور التي تعمل بالذكاء الاصطناعي مع بعض القيود الأقل، لذا فإن الأمر يستحق المحاولة. الجانب السلبي الوحيد هو أنك ستحتاج إلى اشتراك X Premium (المعروف سابقًا باسم Twitter Blue) لاستخدام الخدمة.
ومع ذلك، من الناحية العملية، قد يكون أفضل منشئ صور يعمل بالذكاء الاصطناعي هو الموجود بالفعل على جهازك. على سبيل المثال، تم دمج Meta AI بالفعل داخلها واتساب وفيسبوك ماسنجر. إذا كنت تستخدم أيًا من التطبيقين بالفعل، فمن المفترض أن يخدمك Meta Imagine في تلبية الاحتياجات الأساسية لإنشاء الصور.
وبالمثل، فإن سلسلة بيكسل 9 يأتي مع تطبيق Pixel Studio الجديد من Google والمدعوم من Imagen 3. وبدلاً من ذلك، يمكنك أيضًا طلب صور تم إنشاؤها بواسطة الذكاء الاصطناعي عبر تطبيق Gemini على أي جهاز يعمل بنظام Android. لا يزال الأخير يستخدم الجيل الأخير من Imagen 2 في الوقت الحالي، لكنه سينتقل إلى أحدث طراز من Google قريبًا.