لقد قمت بتجربة Sora من OpenAI، لكني أجد صعوبة في منحنى التعلم الخاص به
ريان هينز / هيئة أندرويد
وبعد أشهر من الانتظار، حدث ما حدث أخيرًا، حيث أطلقت شركة OpenAI مولد الفيديو الخاص بها، Sora. أو، على الأقل، فتحت إمكانية الوصول إلى الأداة، فقط لشبكة الإنترنت بأكملها للقفز على متنها في وقت واحد، مما اضطر OpenAI لضخ الفرامل على إنشاء الحساب. بفضل القليل من الصبر والتصميم، تمكنت من شق طريقي عبر قائمة الانتظار، والآن لدي القدرة على إنشاء أي شيء يمكنني التفكير فيه – ضمن بعض الحدود المحددة جيدًا.
مع هذه القوة والمسؤولية العظيمة، جاء شيء آخر: منحنى تعليمي رائع. على الرغم من أنني أستمتع بـ Sora وأعجب بإمكانياته، إلا أنني أواجه مشكلة في تحديد المطالبات المثالية للحصول على مقاطع الفيديو التي تعجبني. أنا متأكد من أنها مجرد مسألة تدريب، ولكن إليكم كيف مرت أيامي القليلة الأولى مع سورا.
هل استخدمت OpenAI’s Sora لإنشاء مقاطع فيديو حتى الآن؟
0 أصوات
إنشاء الفيديو في متناول يدك؟
ريان هينز / هيئة أندرويد
أولاً، دعونا نتحدث عن كيفية عمل Sora – أو على الأقل كيفية الوصول إلى أداة إنشاء الفيديو القوية. على الرغم من أنه يأتي من OpenAI، وتحتاج إلى أن تكون عضوًا في ChatGPT Plus أو Pro لبدء الإنشاء، إلا أنه لا يمكنك الوصول إلى Sora عبر الطريق الرئيسي. ChatGPT واجهة. بدلاً من ذلك، عليك التوجه مباشرة إلى موقع Sora (sora.com)، حيث تقابل معرضًا للمقاطع المميزة التي تحدد الشريط بشكل لا يصدق عالي.
على الأقل، لقد وضعوا المعيار عاليًا في رأسي. لقد قمت بالتمرير عبر عدد قليل منها، ونظرت إلى مطالباتها، وشاهدتها وهي تعمل بسلاسة، واعتقدت أنه يمكنني فعل الشيء نفسه. بعد كل شيء، سيتم تنفيذ مطالباتي من خلال نفس التعديل الخاص بـ DALL-E 3 الذي تم تعديله من قبلهم، لذا يجب أن تبدو جيدة تمامًا، أليس كذلك؟ الأمر ليس بهذه السهولة. من المؤكد أن كتابة المطالبات أمر سهل للغاية، ولكن معرفة ما يستجيب له Sora بشكل أفضل هو أمر أصعب قليلاً.
يعد إنشاء مقاطع الفيديو أمرًا سهلاً تمامًا مثل كتابة ما تريد رؤيته… أو على الأقل يبدو بهذه الطريقة على الورق.
قبل أن نصل إلى التحديات، ربما ينبغي لي أن أوضح بعض القيود الحالية التي يواجهها سورا. على عكس Pixel Studio من Google أو أي منشئ صور أساسي آخر، لا يمكنك ببساطة الجلوس وتشغيل Sora بما يرضيك – على الأقل ليس كعضو في ChatGPT Plus مقابل 20 دولارًا شهريًا.
بدلاً من ذلك، يتم منحك بنكًا بقيمة 1000 نقطة، والتي يمكنك إنفاقها على إنشاء الفيديو كما تراه مناسبًا. كل شيء تقوم بتغييره خلال الموجه الخاص بك، بدءًا من نسبة العرض إلى الارتفاع إلى المدة إلى الدقة، سيكلف عددًا معينًا من تلك الاعتمادات حتى نفاد الشهر. تتراوح تكلفة مقاطع الفيديو الجديدة تمامًا من 20 نقطة إلى 2000 نقطة، ويمكنك الاطلاع على جدول التكاليف المفيد هنا – شيء أتمنى لو وجدته قبل أن أنفق 260 نقطة في حوالي 20 دقيقة. أنت مقيد أيضًا بإنشاء فيديو واحد في كل مرة وبدقة قصوى تبلغ 720 بكسل كعضو Plus.
إذا كنت ترغب في الحصول على عضوية ChatGPT Pro، فستكون الحدود أقل بكثير ولكن السعر أعلى بكثير عند 200 دولار شهريًا. بدلاً من 1000 نقطة، تحصل على 10000 نقطة لمقاطع الفيديو ذات الأولوية، وبعد ذلك تحصل على أجيال فيديو غير محدودة؛ إنها تستغرق وقتًا أطول قليلاً – يطلق عليها OpenAI اسم “مقاطع الفيديو المريحة”. يمكن للأعضاء المحترفين أيضًا إنشاء خمسة مقاطع فيديو في المرة الواحدة، ورفعها إلى 1080 بكسل، والسماح لها بالتشغيل لمدة تصل إلى 20 ثانية.
لسوء الحظ، بغض النظر عن مستوى ChatGPT الذي تدفع مقابله، لا يحتوي أي من مقاطع فيديو Sora على صوت، لذلك سيتعين عليك تنزيل مقاطعك ومزامنة الموسيقى أو المؤثرات الصوتية بعد الانتهاء من العناصر المرئية. اقترحت شركة OpenAI أن دعم الصوت سيصل إلى Sora في نهاية المطاف، لكن الأمر لم يصل بعد.
ما مدى صعوبة الأمر؟
مع هذه المقدمة الأساسية، فإن بقية استخدام Sora لإنشاء مقاطع الفيديو يجب أن يكون سهلاً، أليس كذلك؟ حسنا، نعم ولا. على الرغم من كتابة المطالبة الخاصة بك، واختيار الإعدادات الخاصة بك من القائمة الموجودة في الأسفل، وانتظار إنشاء الفيديو الخاص بك يكون بهذه السهولة، من الصعب جدًا التوصل إلى شيء يستحق موجز Sora المميز المتغير باستمرار.
في محاولة لمشاركة ذاكرة التخزين المؤقتة المحدودة من الرموز لهذا الشهر، بمجرد أن تمكنت من الوصول إلى Sora، تواصلت مع زميلي ميتجا. لقد كنا نناقش أنا وهو مدى السرعة التي قد نتمكن بها من الوصول إلى المنصة، لذلك اعتقدت أنه قد يكون لديه بعض الأفكار الجيدة لأجيال عديدة منذ البداية. كما اتضح فيما بعد، كان أول ما فكر فيه هو شيء لم أتخيله أبدًا: عشرة حمير وحشية ترتدي بدلات ترقص على أغنية مايكل جاكسون أمام دار الأوبرا في سيدني أثناء تناول رافيولي البيستو. قد يبدو الأمر وكأنه فيديو غريب، ولكن إذا كان Sora قادرًا على التعامل مع هذا القدر من التفاصيل، فمن المؤكد أنه أمر حقيقي.
سوف يجرب سورا أي شيء تطلبه تقريبًا، ولكن عليك أن تصفه بشكل صحيح.
بمجرد أن انتهيت من الضحك على الفكرة، مررت بها على سورا وانتظرت النتيجة. من الناحية الفنية، المنتج النهائي حصل على معظم الأمور في نصابها الصحيح. وضعت مجموعة من الحمير الوحشية ترتدي البدلات أمام دار الأوبرا في سيدني، وكانوا جميعًا يحملون لوحات خضراء في أيديهم. ومع ذلك، تراوح العدد بين ثمانية وحوالي 12 حمار وحشي، ولم يكن هناك ما يشير إلى أنها أغنية لمايكل جاكسون، وكان رافيولي البيستو بالتأكيد مجرد طبق أخضر – قريب، ولكن ليس صحيحًا تمامًا. والأمر الأكثر إثارة للقلق هو أنني رفعت تكلفة الفيديو إلى 100 رمز لأنني كنت آمل أن يُظهر مقطع مدته عشر ثوانٍ المزيد من الرقص. لم يحدث ذلك.
ومع ذلك، فقد تعلمت منذ ذلك الحين أن أداة Storyboard الخاصة بـ Sora ضرورية لأي شيء يتضمن حركة معقدة. فهو يسمح لك بسحب وإفلات المقاطع على طول الخط الزمني الذي تبلغ مدته خمس أو عشر ثوانٍ، مما يساعد Sora على تقسيم الحدث والتدفق من اتجاه إلى آخر. لذا، في محاولة لاستخلاص المزيد من الإثارة من أصدقائي الحمير الوحشية، قفزت إلى القصة المصورة وقسمت الرقص ورافيولي البيستو إلى حركتين منفصلتين متباعدتين على مقطع مدته خمس ثوانٍ، ثم استخدمت ChatGPT للثقب أعلى الوصف الخاص بي – ميزة أخرى مدمجة في لوحة العمل.
مرة أخرى… لقد نجح الأمر نوعًا ما، لكنه لم ينجح نوعًا ما. نعم، حصلت على الحمير الوحشية، وكانوا أمام دار الأوبرا في سيدني، لكنهم توقفوا عن الرقص، وعندما طلب منهم أن يأكلوا بعضًا من الرافيولي، نمت لهم فجأة أيدي بشرية لإمساك شوكاتهم. آسف، الخلاصة المميزة، ولكن أعتقد أنني بعيد المنال.
لقد جربت أيضًا المزيد من المحفزات الطبيعية، مثل انزلاق طيور البطريق المعكرونة أسفل الجبال الجليدية في البحر، والمزيد من المحفزات الخيالية، مثل قطعة من الخبز المحمص ذات وجه يشبه بيكسار تقفز من محمصة الخبز، وكانت القصة هي نفسها في الغالب. يتعامل Sora مع بعض الأجزاء من كل مطالبة بشكل جيد للغاية، ولكن عليك أن تصف مشهدك بالقدر المناسب من التفاصيل. كثيرًا، ويبدأ سورا في دمج عناصر مختلفة. القليل جدًا، وستحصل على منتج نهائي ممل نسبيًا.
ومع ذلك، بطريقة ما، هناك ما هو أكثر في سورا مما لمسته، خاصة عندما يتعلق الأمر بذلك التحرير. يحزم منشئ الفيديو أيضًا القدرة على إعادة قص المقاطع وإعادة مزجها ومزجها لتوسيع فكرة ما أو ضم مقطع فيديو إلى آخر أو قص العناصر التي لا تعمل بشكل جيد. ولكن مرة أخرى، ما زلت أرغب في تسجيل مقطع فيديو يبدو جيدًا في المرة الأولى.
وبغض النظر عن التحديات، فأنا متحمس للمستقبل
ريان هينز / هيئة أندرويد
بشكل عام، من العدل أن أعتبر الأيام القليلة الأولى التي استخدمت فيها Sora حقيبة مختلطة. هل كان مولد الفيديو مثاليًا؟ لا، لكن لا يمكنني إلقاء اللوم بالكامل على OpenAI في ذلك. هذه هي تجربتي الأولى في إنشاء مقاطع فيديو تعتمد فقط على النص، لذلك لست مندهشًا لأنني وجدت صعوبة في تحديد المستوى الصحيح من التفاصيل. لقد أعطيت سورا الكثير من المعلومات حتى الآن، وأعطيتها القليل جدًا، مما يعني أن تحديد الموجه الصحيح يجب أن يكون قاب قوسين أو أدنى.
والأهم من ذلك، أنني تأثرت بشدة بما وعد سورا بفعله. مقاطع الفيديو التي يمكنني إنشاؤها باستخدام ChatGPT Plus عضو يستغرق الأمر مجرد لحظات للاستحضار، وأتخيل أنها ستصبح أسرع مع استمرار النموذج في تدريبه. لست متأكدًا تمامًا من أنني سأستخدم أيًا من المقاطع السريعة التي أعدها سورا حتى الآن – لا يزال الكثير منها يعاني من آثار غريبة مثل ظهور الأذرع البشرية على الحمير الوحشية – لكن المقاطع التي وصلت إلى سورا تمنحني المجموعة المميزة الأمل في أن الأمر يتعلق فقط بتعلم كيفية السؤال عن العناصر الصحيحة.
لقد أعجبت بسورا، ولكن لدي الكثير لأتعلمه.
إلى جانب ذلك، لن أتفاجأ إذا كانت الطريقة التي يتعامل بها OpenAI مع المطالبات والإبداعات مفتوحة أيضًا. في الوقت الحالي، عندما تقوم بحرق 1000 رصيد خاص بك كعضو في ChatGPT Plus، فهذا كل شيء – لا توجد طريقة لشراء المزيد حتى تنتهي فترة الفوترة الخاصة بك. وبالمثل، لا توجد طريقة لتجديد الأرصدة غير المستخدمة من شهر إلى آخر، لذلك عليك إيجاد التوازن الصحيح بين الإنفاق والادخار لتتمكن من الاستمرار خلال الشهر.
إذا كان الأمر متروكًا لي، فسأرغب بالتأكيد في استعادة بعض الاعتمادات السخيفة التي أنفقتها، لكن هذا ليس خيارًا. بدلاً من ذلك، سأسميها تكلفة التعلم، وسأضطر إلى قضاء المزيد من الوقت لضبط مطالباتي قبل إرسالها إلى سورا. ربما في يوم من الأيام، سأخرج بشيء يستحق أن أعرضه.