شـات جي بي تي..

حوار مع لور سوليي Laure Soulier

ترجمة: يحيى بوافي

أجرى الحوار: أوليفيي أوسكار

 

الذكاء الاصطناعي لـ"أُوبن إيه آي" يشتغل مثل "منطقة صغيرة من الدماغ"1.

 

سَحَر برنامجُ معالجة اللغة الطبيعية الذي تم تصميمُه من طرف "أوبن إيه آي"، (OpenAI) كل مستخدمي شبكة الانترنِت عبر العالم، لكن ما هي رؤية الخبراء إلى هذا التقدم الجديد الذي حققه الذكاء الاصطناعي؟ هل يفتح شات جي بي تي ChatGPT الطريق سالكة نحو ذكاء اصطناعي "قوي"، بمعنى ذكاء اصطناعياً يكون قادراً على منافسة الذكاء الإنساني؟
 

تجيب لور سولييه (Laure Soulier) عن أسئلة مجلة "علوم ومستقبل"، وهي الأستاذة المحاضرة في الإعلاميات بفريق البحث الذي يحمل اسم "تعلم آلي للوصول إلى المعلومات" "Machine learning for information access (MLIA) بمعهد الأنظمة الذكية وعلم الربوتية (ISIR) (بجامعة السوربون) التابع للمركز الوطني للبحث العلمي (CNRS).


 

● تكتسي أداة مثل شات جي بي تي بالنسبة للجمهور العام خاصية سحرية تقريباً، بوصفك خبيرة، هل تتقاسمين هذا الشعور؟

إذا كان العالم قد اكتشف اليوم شات جي بي تي؛ فإن الجماعة العلمية كانت تعمل على هذه النماذج منذ سنوات، وينتمي برنامج شات جي بي تي إلى أسرة "النماذج اللغوية (الكبيرة)" التي يتمثل هدفها في تعلم تمثيلات الكلمات، والجمل أو الوثائق.

وهذه المقاربة كان ظهورها سنة 2003، وفيما بعد ستعرف انتشاراً سنة 2013 مع نماذج (من نوع (وورد 2فاك2 Word2vec أوفاست تكست3 Fast TExt )، التي يتمثل هدفُها في استشعار دلالة الكلمات عبر تعلُّم توقع احتمالية الكلمات بدلالة الكلمات المستخدمة في الجملة، وبالاستناد إلى قاعدة عدد مهم من الأمثلة (وذاك هو مبدأ التّعلم الآلي الذي يتعلّم الإحداثيات الخاصة بنموذج من النماذج على أساس الأمثلة، والتعلم العميق هو ميدان فرعي من التعلم الآلي يستخدم ويوظف أسرة من النماذج المُستخدِمة لـ"شبكات العصبونات").

وقد تطورت هندسة هذه النماذج المستندة إلى شبكات من العصبونات، عبر الإدراج المتزايد لبارامترات إضافية، لتمنح ميلاد نماذج لغوية بما فيها BERT, T5,، أو GPT-3، التي بُني على أساسها شات جي بي تي ChatGPT، فهذه النماذج اللغوية الكبيرة قادرة على أن تستشعر دلالة الكلمات، وهي قادرة أيضاً على معالجة مهام كما هو الحال بالنسبة للترجمة أو للتلخيص الآلي. وبالنسبة لنا، نحن الباحثين العلميين، ربما تكون اللحظة "السحرية" راجعة إلى هذه الفترة، التي تبقى على ارتباط بالأداء الهام للنماذج في العديد من المهام الخاصة بالمعالجة الآلية للنص.

● ما المشترك بين "النماذج اللغوية الكبيرة"؟

يتمثل المشترك بينها في قيامها على نموذج يسمى بالمحوّل (حول باللغة الإنجليزية). وهو النموذج الذي تم اقتراحه سنة 2017 من قبل أشيش فاسواني Ashish Vaswani وزملاؤه، وبالتالي فالقطيعة التكنولوجية يؤرَّخُ لها، بنظري، ابتداء من هذا التاريخ، وجميع النماذج الأخرى (تي 5(T5)، جي بي تي(GPT)، بيرت (BERT)) مشتقة من المُحَوِّل Transformer بالإضافة إلى العديد من التنويعات المقترحة في الأوراق العلمية، بما فيها شات جي بي تيChatGP

● كيف نحدّد هذا النموذج المحوّل؟

يتم ذلك استناداً إلى شبكات العصبونات "المتكررة" التي أتاحت تشفير مقطع من الكلمات، ويستند النموذج المحوّل إلى آلية أو مكيانزم يسمى "انتباه خاص". والفكرة هي على الدوام تعلُّمُ تمثيل الكلمات في جملة لكن عبر تنسيق كل كلمة من كلمات الجملة وإكسابها خواص السياق مع كلمات أخرى. لهذا فالنموذج يحسِبُ درجة الأهمية بين كل زوج من الكلمات مما يمكِّنُ من ترجيح تمثيل كلمة من خلال تمثيل كلمات في الجملة، وفضلاً عن هذا طوَّر مبتكرو المحوّل بصورة مهمة وزادوا حجم البُنى أو المعماريات، لأجل الحصول على المزيد من المعلومات وجعل تحليل الجملة أكثر تدقيقاً، ومن خلال ذلك عملوا على تجميع كتل لـ"الانتباه الخاص" الواحدة فوق الأخرى لأجل بناء فرع للشبكة، وضاعفوا هذه البطاريات من الكتل بغية الحصول على شبكة كبيرة متعددة الفروع.

وجاءت المفاجأة من التحليل البعدي للجهاز

فعلاً، هناك متخصّصون في الذكاء الاصطناعي أرادوا معرفة ما يوجد داخل هذه الفروع الخوارزمية، حتّى يحدّدوا ما يستشعرُه ويلتقطه كل واحد منها، وقد أطلق على ميدان البحث هذا اسم البيرتولوجيا4 BERTologie (مشتق من اسم بيرت BERT). فاكتشفوا بذلك وجود فروع مخصّصة للتركيب، وأخرى خاصة بالدلالة، إلخ. بمعنى أن كل فرع قد تخصص ذاتياً في تحليل العلامات المختلفة للغة، دون أن يكون تمّ تصمِيمُ هذه الفروع منذ البداية بشكل نوعي في إطار هذا الهدف.

● لكن ما حدود شات جي بي تي؟

إن شات جي بي تي (ChatGPT) قد تم تدريبه عل قاعدة العديد من الأمثلة، لتعلُّم التنبُّؤ باحتمالية الكلمة المقبلة في الجملة، فهو يلتقط ويستشعر إذن صور الانتظام في المعجم وعلامات الترقيم والأسلوب. وبذات الكيفية التي يستند فيها (شات جي بي تي) إلى مبدأ الاحتمالات؛ فإنه لا يتحقق في أي لحظة من صحة المعلومات. كما أنه لا يضمن في أي لحظة أيضاً احترام حقوق المؤلف؛ لأنه ليس بمأمن عن إعادة استنساخ جمل أو مقاطع كاملة يكون سبق أن رآها أثناء تعلُّمه.

وفي الأخير، بالنظر لاعتماده على قراءة العديد من الأمثلة، يمكن أن تكون هناك أوجه انحياز في البيانات التي ستؤثر في توليد النموذج، فإذا كانت هذه البيانات تتضمن أشياء غير مناسبة من زاوية أخلاقية (على سبيل المثال أقوال عنصرية أو تمييز على أساس الجنس)؛ فإن برنامج شات جي بي تي ChatGPT يكون له احتمال قوي لإعادة إنتاج أوجه الانحياز هذه لحظة الإنشاء والتوليد.

● إن الآفاق هي بالفعل مذهلة جداً، لأن اليوم الذي سيتم وصل فيه برنامج مثل هذا بالويب، سيصيرُ له منفذ إلى شكل من المعرفة الكونية، أليس كذلك؟

لسنا بالبعيدين عن ذلك، لأن "أوبن أي أي" (OpenAI) تشتغل على نموذج يسمى بـ"ويب جي بي تي WEBGPT، المتصل مباشرة بالويب، بل إن الاتجاه يسير حتى إلى ما وراء ذلك؛ فإذا كان شات جي بي تي نموذجاً يستندُ إلى توليد النصوص وإنشائها؛ فإن نماذج أخرى، كما هو الحال بالنسبة لـ"دال إي (Dall-E)5، هي نماذج هامة جداً لتوليد الصور انطلاقاً من النص.

وبذات الشكل، تم استعمال النموذج المحوّل من أجل تعلم تمثيل الصور أو الأصوات، وهناك اتجاه ظهر يحاول تجميع كل الأنماط -الصورة والنص والكلام والصوت- لأجل تجميع مختلف العلامات وبناء معرفة بالعالم تكون أكثر كلية بالعالم، ويُطلِقُ المتخصصون على هذه المقاربة اسم "نماذج التأسيس"6 (modèles fondation" ("foundation models" en anglais).

● لقد ذكرت شكلاً للذكاء الاصطناعي سيكون في أداء جيد مع النص، والصورة والصوت، وإذن لسنا بالبعيدين عن شكل لانبثاق الوعي؟

في كل الأحوال يعود ذلك إلى أن نطرح على أنفسنا السؤال التالي: هل يتجه شات جي بي تي ChatGPT نحو ذكاء اصطناعي قوي؟ إنَّ أداةً قادرة على توليد قصيدة ونماذج للرسائل وقادرة على كتابة التعليمات البرمجية، قد تبدو أقرب إلى الإنسان، لكن مع ذلك لا زالت هناك قيود وعوائق؛ إذ ما دام شات جي بي تي لا يعمل إلاّ على نقل احتمالات الكلمات في توليده وإنشائه للجمل؛ فإن ما يعنيه ذلك هو أن هذه الأداة تستخدم إلى حد ما مفردات أساسية، ما دامت هذه الكلمات هي الأكثر احتمالية.

ثم إن شات جي بي تي لا يعرف بناء استدلال حول كل مهامه، على غرار ما يفعل الفرد الإنساني. وهو ما يذكرني بتأمل لجيفري هينتون Geoffrey Hinton، بوصفه أحد الآباء المؤسِّسين للذكاء الاصطناعي، حيث قال متحدثاً عن هذه النماذج اللغوية، وكان ذلك قبل خروج برنامج شات جي بي تي ChatGPT، وهو القول الذي أظن أنه لا زال محتفظاً بكامل صلاحيته حتى مع ظهور هذا البرنامج، ومفادُه أن هذا النموذج يميل إلى محاكاة "جزء صغير من الدماغ"، وهو ما يمكننا أن نرى فيه كيفية للاقتراب والدنو من الذكاء الاصطناعي القوي، دون أن يتم بلوغه، وبنظري، نحن لا زلنا بدرجة أكبر وسط الكثير من أنظمة الذكاء الاصطناعي الضعيفة، التي يجاور بعضها بعضاً، لكنها مصنوعة وفقاً لنموذج واحد.

 


 
هوامش
1. Laure Soulier «ChatGPT: l’intelligence artificielle d’OpenAI fonctionne comme une “petite partie du cerveau
https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/chatgpt-l-intelligence-artificielle-d-openai-fonctionne-comme-une-petite-partie-du-cerveau_16889
2. نموذج لغوي يقوم على خواريزمية للمعالجة الأتوماتية أو الآلية للغة الطبيعة من أجل تحديد الإطارات الخاصة بالكلمات، والتي يمكن استخدامها في مهام ترتبط باللغة الطبيعة من قبيل تصنيف النصوص والتعرف على التشابه التركيبي.
3. نموذج لمعالجة اللغة الطبيعية تم تطويره من طرف شركة فايسبوك سابقاً (ميتا حالياً)، يتيح تعلم تمثيلات الكلمات انطلاقاً من مقاطع متتالية، بدلا من الحروف، وهو ما يتيح لهذا النموذج أن يأخذ في الاعتبار المعلومات الخاصة بسباق الكلمات، حتى بالنسبة لتلك الكلمات النادرة أو غير المعروفة.
4. البيرتولوجيا (La Bertologie) ميدان بحث يدرس استعمال نموذج بيرت في المعالجة الآلية للغات، وبيرت هو نموذج للمعالجة الآلية للغات تم تطويره من قبل غوغل، كانت له نتائج ثورية في العديد من مهام البرمجة اللغوية العصبية، مثل فهم النصوص وتوليدها وتصنيفها، وعليه تكون البيرتولوجيا مبحثاً يهتم بالتطبيقات الممكنة لبيرت BERTكنموذج للمعالجة الآلية للغات.
5. نموذج لمعالجة اللغة تم تطويره من قبل أوين إي أيه OpenAI، قادر على توليد الصور انطلاقاً من أوصاف مكتوبة باللغة الطبيعية.
6. النماذج الأساسية هي نماذج التعلم الآلي التي تكون بمثابة قاعدة لأجل بناء نماذج تفوقها تعقيداً، وما يميز النماذج الأساسية هي خاصية العمومية وإمكانية استخدمها في المهام المختلفة لمعالجة المعلومات، على سبيل المثال نموذج أساسي لمعالجة الصور، يمكن أن يتم استعماله للتعرف على الصور وتقطيعها وتوليدها... إلخ.

التعليقات

اضافة التعليق تتم مراجعة التعليقات قبل نشرها والسماح بظهورها