مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

50 خبر
  • العملية العسكرية الروسية في أوكرانيا
  • فيديوهات
  • نبض الملاعب
  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • نبض الملاعب

    نبض الملاعب

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • فتاة توثق قصف نظام كييف على مدرسة لوغانسك وترسل فيديوهات لأقاربها قبل وفاتها

    فتاة توثق قصف نظام كييف على مدرسة لوغانسك وترسل فيديوهات لأقاربها قبل وفاتها

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

"سي إن إن" عن مصدر سعودي: المملكة لن تطبع مع إسرائيل إلا بعد وجود مسار واضح نحو إقامة دولة فلسطينية

إيران توجه تحذيرا لواشنطن بعد الضربة الأخيرة: ردنا سيتجاوز الإقليم

الأمن الفيدرالي الروسي: اغتيال القيادة الإيرانية جرى باستخدام برمجيات خبيثة في أنظمة المراقبة

مصدر عسكري لتسنيم: التحقيقات الفنية تؤكد وقوف إسرائيل وراء هجمات بمسيرات استهدفت الإمارات

قراءة إسرائيلية لطلب ترامب تطبيع السعودية ودول أخرى مع إسرائيل.. لماذا ذكر مصر والأردن وتركيا؟

خامنئي يوجه رسالة إلى الحكومات الإسلامية

الخارجية الروسية: سيتم ضرب مراكز القيادة وصنع القرار في كييف

كاتب إسرائيلي: الفشل الأمريكي في إيران يتحول إلى كارثة في إسرائيل التي تواجه أخطر وضع في تاريخها

الخارجية الروسية: لافروف تحدث مع روبيو وأبلغه ببدء القوات الروسية شن ضربات منظمة على منشآت في كييف

"بلومبرغ": سفن الإمارات تلجأ إلى "العبور المظلم" لمضيق هرمز (فيديو)

ترامب: اليورانيوم الإيراني عالي التخصيب سيسلم فورا للولايات المتحدة أو يدمر في مكانه

برنياع: كلما كان الزئير أكبر كانت الهزيمة أعمق.. الحرب مع إيران انكشاف إستراتيجي لإسرائيل وأمريكا

لبنان لحظة بلحظة.. تصعيد عسكري مستمر و"حزب الله" يهدد بإسقاط الحكومة

لافروف: لم يبد الغرب قلقا يذكر على سلامة أراضي الدنمارك

لبنان لحظة بلحظة.. إسرائيل تقيد أعداد التجمعات و"حزب الله" يحيي ذكرى تحرير الجنوب

جهود نتنياهو لإعادة تشكيل الشرق الأوسط تأتي بنتائج عكسية

مطاردة بالطائرات المسيرة تطيح بتاجر مخدرات في بغداد (فيديو+صور)