أربعة أشياء يجب معرفتها عن GPT-4

نشرت: 2023-03-18

في يوم الثلاثاء الموافق 14 مارس ، أصدرت شركة OpenAI أحدث نموذج للتعلم الآلي ، GPT-4. على الرغم من أنه لم يهز العالم على الفور بالطريقة نفسها التي فعلها ChatGPT ، إلا أن ذلك يرجع في الغالب إلى عدم وجود واجهة جديدة لامعة تتماشى معها. ثق بنا - لا يزال الأمر مثيرًا بشكل لا يصدق. فيما يلي أربعة أشياء يجب أن تعرفها عن GPT-4 الآن.

جدول المحتويات

الشيء رقم 1: تعدد الوسائط ليس هنا بعد

قبل الإطلاق ، كان الكثير من الضجيج حول GPT-4 يدور حول كونه متعدد الوسائط ، أو قادرًا على قبول كل من النص والصور كمدخلات. حاليًا ، تختبر OpenAI تلك الوسائط المتعددة فقط مع شريك واحد ، Be My Eyes. بالنسبة لأي شخص آخر ، لا يزال GPT-4 يقبل إدخال النص فقط.

الشيء رقم 2: يمكن لـ GPT-4 قبول مدخلات أكبر بكثير

في حالة عدم وجود وسائط متعددة ، فإن إحدى الطرق الأكثر وضوحًا التي يختلف بها GPT-4 عن GPT-3.5 هي أنه يمكنه قبول مدخلات أكبر بكثير (وإنتاج مخرجات أكبر ، ولكن هذا لن يكون مفيدًا بنفس الطريقة).

الحد الأقصى لعدد الرموز التي يمكنك استخدامها في وقت واحد مع GPT-3.5 هو 4096. مع النموذج الأساسي لـ GPT-4 ، يتضاعف هذا الحد الأقصى إلى 8192 رمزًا - وهناك أيضًا نموذج GPT-4 ثانٍ يمكنه التعامل مع ما يصل إلى 32768 رمزًا مميزًا.

لا اريد؟

بالنسبة للمبتدئين ، فهذا يعني أنه يمكنني إعطاء التقرير الفني الكامل لـ GPT-4 OpenAI (باستثناء الملاحق) على GPT-4 لقراءته. (هذا أكثر من 5000 كلمة من المحتوى.) طلبت منه تلخيص التقرير واستدعاء أي معلومات مهمة كانت مفقودة.

هنا كان رد GPT-4:

موجه: لخص النقاط الرئيسية لورقة البحث هذه. ما هي المعلومات الهامة المفقودة؟ (متبوعًا بالنص الكامل للتقرير الفني GPT-4 الخاص بـ OpenAI)

يلخص هذا التقرير الفني تطوير OpenAI's GPT-4 ، وهو نموذج متعدد الوسائط واسع النطاق يقبل مدخلات الصور والنص لإنشاء مخرجات نصية. يوضح GPT-4 الأداء على مستوى الإنسان في مختلف المعايير المهنية والأكاديمية ، مثل تسجيل أعلى 10٪ في امتحان شريط محاكاة. إنه نموذج قائم على المحولات ، مع تحسين أدائه باستخدام عملية محاذاة ما بعد التدريب.

تشمل القدرات الأساسية لـ GPT-4 ما يلي:

1. معالجة مدخلات الصور والنص ، مع التطبيقات المحتملة في أنظمة الحوار ، وتلخيص النص ، والترجمة الآلية.

2. الحصول على درجات جيدة في الامتحانات المصممة للبشر ، مع أداء في امتحان المحاكاة في أعلى 10٪ من المتقدمين للاختبار.

3. التفوق في الأداء على نماذج اللغة السابقة وأحدث الأنظمة على معايير البرمجة اللغوية العصبية التقليدية ، والأداء القوي في النسخ المترجمة من MMLU في 24 لغة من 26 لغة.

يسلط التقرير الضوء أيضًا على تطوير البنية التحتية للتعلم العميق وطرق التحسين التي تتصرف بشكل متوقع عبر مجموعة من المقاييس. مكّن ذلك الباحثين من عمل تنبؤات دقيقة حول أداء GPT-4 استنادًا إلى نماذج أصغر مدربة على 1/1000 من الحوسبة.

H ومع ذلك ، تعرض GPT-4 العديد من القيود ، مثل عدم موثوقيتها بشكل كامل ، ووجود نافذة سياق محدودة ، وعدم التعلم من التجربة. تشكل قدراتها وقيودها تحديات جديدة للسلامة ، مع التحيز والمعلومات المضللة والاعتماد المفرط والخصوصية والأمن السيبراني من بين المخاطر المحددة.

امتنع التقرير عن مناقشة الهندسة المعمارية ، أو الأجهزة ، أو حساب التدريب ، أو إنشاء مجموعة البيانات ، أو طرق التدريب الخاصة بـ GPT-4 بالتفصيل بسبب المخاوف التنافسية والآثار المتعلقة بالسلامة.

بشكل عام ، يمثل تطوير GPT-4 تقدمًا كبيرًا في مجال الذكاء الاصطناعي ويظهر إمكانات كبيرة للتطبيقات التحويلية في معالجة اللغة الطبيعية ، مع التأكيد أيضًا على الحاجة إلى التحسين المستمر والاهتمام بتحديات السلامة.

لا تكشف الورقة البحثية عن تفاصيل محددة حول أجهزة GPT-4 أو الهندسة المعمارية أو إنشاء مجموعة البيانات أو أساليب التدريب. سيكون الحصول على مزيد من المعلومات حول هذه الجوانب التقنية مفيدًا للباحثين الذين يتطلعون إلى تكرار عمل GPT-4 أو البناء عليه.

باستخدام طرز GPT-3.5 والإصدارات الأقدم ، لا يمكنك إعطائها مثل هذه المدخلات الطويلة مثل تقرير تقني كامل. هذا تقدم رائع حقًا ، حيث يمكنك الآن تزويد النموذج بالكثير من المعلومات كسياق.

هذه الإمكانية مفيدة بشكل خاص لأن النموذج غير متصل بالإنترنت. الطريقة الوحيدة للحصول على معلومات جديدة هي إذا قمت بتوفيرها - ويمكنك الآن توفير المزيد منها.

على النقيض من ذلك ، إذا سألت عن ماهية GPT-4 دون تقديم التقرير الفني ، فإليك ما أحصل عليه:

موجه: ما هو GPT-4؟

GPT-4 هو الوريث الافتراضي لـ OpenAI's GPT-3 ، نموذج اللغة الحديث الذي حقق نتائج ملحوظة في مجموعة متنوعة من مهام معالجة اللغة الطبيعية. من المتوقع أن يؤدي GPT-4 ، على الرغم من عدم توفره حاليًا ، إلى زيادة تحسين قدرات GPT-3 ، مما قد يتيح إنشاء المزيد من النصوص الشبيهة بالبشر وفهمها.

كنموذج لغوي ، سيكون هدف GPT-4 هو إنشاء نص يشبه الإنسان بناءً على سياق المدخلات المقدمة. لفهم كيفية عملها ، دعنا نتعمق في بعض سيناريوهات الحياة الواقعية حيث يمكن استخدام قوة GPT-4.

لنفترض أنك كاتب ...

…وما إلى ذلك وهلم جرا.

بقدر ما يعرف GPT-4 ، لا يزال GPT-4 خليفة افتراضيًا لـ GPT-3. وهذا أمر منطقي ، لأنه من الواضح أنه لا يمكن تدريبه على نص من عالم يوجد فيه GPT-4 بالفعل. في كل المحتوى الذي شاهده النموذج ، لا يزال GPT-4 تطورًا مستقبليًا.

ما يعنيه هذا ، مع ذلك ، هو أنه يمكننا الآن الحصول على نتائج أفضل بكثير من GPT-4 بشأن أشياء مثل الأحداث الجديدة أو الموضوعات المتعمقة للغاية ، من خلال توفير المزيد من المعلومات في الموجه.

بالإضافة إلى ما يمكّنه هذا التحسين ، من المثير للاهتمام أيضًا التفكير من وجهة نظر معمارية. من أجل قبول المزيد من الرموز المميزة ، يكون النموذج قادرًا على استدعاء المعلومات وتوليفها عبر نافذة أكبر بكثير. هل تم ذلك ببساطة عن طريق بناء نموذج أكبر مع المزيد من الطبقات والمعلمات ، أم تم إجراء تغييرات أساسية على كيفية معالجة المعلومات وتخزينها؟

للأسف ، عدم وجود أي إجابة على هذا السؤال يقودنا إلى النقطة الثالثة.

الشيء رقم 3: OpenAI ليس هكذا… مفتوح… بعد الآن

شيء واحد رائع في GPT-4 لا علاقة له على الإطلاق بقدراته. من ورقة بحث OpenAI حول هذا الموضوع:

يركز هذا التقرير على إمكانيات وقيود وخصائص أمان GPT-4. GPT-4 هو نموذج من طراز Transformer تم تدريبه مسبقًا للتنبؤ بالرمز المميز التالي في مستند ، باستخدام كل من البيانات المتاحة للجمهور (مثل بيانات الإنترنت) والبيانات المرخصة من موفري الطرف الثالث. تم ضبط النموذج بعد ذلك باستخدام التعلم المعزز من ردود الفعل البشرية (RLHF). نظرًا لكل من المشهد التنافسي والآثار المتعلقة بالسلامة للنماذج واسعة النطاق مثل GPT-4 ، لا يحتوي هذا التقرير على مزيد من التفاصيل حول البنية (بما في ذلك حجم النموذج) أو الأجهزة أو حساب التدريب أو إنشاء مجموعة البيانات أو طريقة التدريب أو ما شابه ذلك.

(توكيد لي)

لا مزيد من التفاصيل حول حجم النموذج ومجموعة البيانات والتدريب ... أي شيء؟

هذا غير مفتوح إلى حد كبير. إنه أيضًا خروج كبير عن البحث العام لـ OpenAI حول GPTs السابقة.

من الجدير بالذكر أيضًا كيف أن هذين السببين للسرية هما: المشهد التنافسي ، والآثار الأمنية للنماذج واسعة النطاق. تتطلب "تداعيات السلامة" الحذر والحصافة ، لكن "المشهد التنافسي" يتطلب قوة كاملة في المستقبل للتغلب على أي شخص آخر.

في ملاحظة غير ذات صلة تمامًا ، تم إصدار اثنين من التطورات الرئيسية الأخرى في مجال الذكاء الاصطناعي في نفس اليوم مثل GPT-4: نموذج Anthropic's Claude و PaLM API من Google.

الشيء الرابع: أصبح الذكاء الاصطناعي طالبًا متميزًا (لكنه لا يزال يكذب)

يُظهر أحد الرسوم البيانية الأكثر انتشارًا من الإطلاق أداء GPT-4 في الاختبارات المختلفة. يبدو الأمر كما لو أن OpenAI لا يزال تحت الوهم ، الذي يتقاسمه طلاب المدارس الثانوية المتفوقون في كل مكان ، أن درجات الاختبار المعيارية ترتبط بطريقة ما بنجاح العالم الحقيقي.

مضحك جداً.

ومع ذلك ، فإن ما تجدر الإشارة إليه هو أن GPT-4 لم يتم تدريبه على وجه التحديد لإجراء أي من هذه الاختبارات. هذه ليست حالة نموذج الذكاء الاصطناعي الذي يتم تدريبه خصيصًا للعب Go وفي النهاية يتغلب على أفضل لاعب بشري ؛ بدلاً من ذلك ، فإن قدرتها على تفوق هذه الاختبارات تمثل ذكاءً "ناشئًا".

لم يتم تدريب الطرز السابقة مثل GPT-3 أيضًا على إجراء اختبارات معينة ، ولكن كما ترى ، فقد تحسن أداء GPT-4 بشكل ملحوظ مقارنة بـ GPT-3:

من التقرير الفني GPT-4 الخاص بـ OpenAI

إذا كنت لا تهتم بقدرة الذكاء الاصطناعي على إجراء اختبارات معيارية وتريد فقط معرفة مدى نجاحه في القيام بما تريده ، فلا يزال هذا خبرًا جيدًا. من التقرير:

يتحسن GPT-4 بشكل كبير مقارنة بالنماذج السابقة في القدرة على متابعة نية المستخدم. في مجموعة بيانات مكونة من 5214 مطالبة تم إرسالها إلى ChatGPT و OpenAI API ، تم تفضيل الردود التي تم إنشاؤها بواسطة GPT-4 على الردود التي تم إنشاؤها بواسطة GPT-3.5 في 70.2٪ من المطالبات.

لذلك ، من المرجح أن يمنحك GPT-4 ما تبحث عنه أكثر من GPT-3.5. ذلك رائع. من المهم أن تضع في اعتبارك أنه على الرغم من الأداء المحسن ، لا يزال النموذج الجديد به نفس القيود التي نعرفها ونحبها من أصدقائنا الحاليين في مجال الذكاء الاصطناعي.

اقتباس آخر من التقرير:

على الرغم من إمكانياتها ، فإن GPT-4 لها قيود مماثلة لنماذج GPT السابقة: فهي غير موثوقة تمامًا (على سبيل المثال يمكن أن تعاني من "الهلوسة") ، ولديها نافذة سياق محدودة ، ولا تتعلم من التجربة. يجب توخي الحذر عند استخدام مخرجات GPT-4 ، لا سيما في السياقات التي تكون فيها الموثوقية مهمة.

في الواقع ، يمكن أن تصبح الهلوسة مشكلة أكبر مما كانت عليه ، وذلك ببساطة لأنه كلما تحسن الذكاء الاصطناعي ، كان من الأسهل تصديق ما يقوله. مع GPT-3 و GPT-3.5 ، يدرك الناس جيدًا أن النموذج سيصنع الأشياء تمامًا لأنه يحدث كثيرًا. نظرًا لأن النماذج الأحدث والأفضل تفعل ذلك بشكل أقل تكرارًا ، فهناك خطر أكبر أنه عندما يحدثون الهلوسة ، قد نفشل في ملاحظتها أو التحقق من الحقائق.

لذا ابقوا يقظين ، أيها الأصدقاء. ولكن أيضًا ، هذه أوقات مثيرة للغاية.


الشيء رقم 5: إذا كنت ترغب في استخدام GPT-4 ، فيمكنك القيام بذلك إما من خلال ChatGPT Plus أو عبر API. توجد قائمة انتظار لواجهة برمجة التطبيقات ، لكن الأمر استغرق مني يومين فقط للوصول إليها. تتمثل إحدى وسائل الشرح المتعلقة بواجهة برمجة التطبيقات في أن GPT-4 يمكن الوصول إليه من خلال وظيفة ChatCompletion (مثل gpt-3.5-turbo) ، وليس وظيفة الإكمال التي ربما استخدمتها مع text-davinci-003 أو النماذج السابقة الأخرى. المزيد عن الاختلافات بين هذين في وقت لاحق.