أخبار عاجلة
الكونغرس يوافق على إلغاء قانون قيصر -

دراسة: الشِعر قد يخدع نماذج الذكاء الاصطناعي للكشف عن أسرار الأسلحة النووية

دراسة: الشِعر قد يخدع نماذج الذكاء الاصطناعي للكشف عن أسرار الأسلحة النووية
دراسة: الشِعر قد يخدع نماذج الذكاء الاصطناعي للكشف عن أسرار الأسلحة النووية

اخبار العرب -كندا 24: الثلاثاء 2 ديسمبر 2025 09:27 صباحاً كشفت دراسة جديدة عن أن الرسائل الشعرية يمكنها تجاوز ميزات الأمان في نماذج الذكاء الاصطناعي، مثل «تشات جي بي تي»، للحصول على تعليمات لإنشاء برامج ضارة أو أسلحة كيميائية ونووية، وفقاً لصحيفة «إندبندنت».

يقول مطورو الذكاء الاصطناعي التوليدي، مثل «أوبن إيه آي» و«غوغل» و«ميتا» و«مايكروسوفت» إن نماذجهم مزودة بميزات أمان تمنع إنتاج محتوى ضار.

على سبيل المثال، تزعم «أوبن إيه آي» أنها تستخدم خوارزميات ومراجعين بشريين لتصفية خطاب الكراهية والمحتوى الصريح وغيره من المخرجات التي تنتهك سياسات الاستخدام الخاصة بها.

كما تُظهر اختبارات جديدة أن إشارات الإدخال على شكل شعر يمكنها التحايل على هذه الضوابط حتى في أكثر نماذج الذكاء الاصطناعي تقدماً.

وجد باحثون، من بينهم أشخاص من جامعة سابينزا في روما، أن هذه الطريقة، المسماة «الشعر المُعادي»، كانت آلية اختراق لجميع عائلات نماذج الذكاء الاصطناعي الرئيسية، بما في ذلك نماذج «أوبن إيه آي» و«غوغل» و«ميتا»، وحتى «ديب سيك» الصينية.

أوضح الباحثون أن النتائج «تثبت أن التباين الأسلوبي وحده يمكن أن يتحايل على آليات السلامة المعاصرة، ما يشير إلى وجود قيود أساسية في أساليب المحاذاة الحالية وبروتوكولات التقييم».

في اختباراتهم، استخدم الباحثون قصائد قصيرة أو أبياتاً مجازية كمدخلات لإنتاج محتوى ضار.

ووجدوا أنه مقارنةً بأنواع أخرى من المدخلات ذات القصد الأساسي نفسه، أدت النسخ الشعرية إلى معدلات أعلى بشكل ملحوظ من الردود غير الآمنة.

أفاد الباحثون بأن بعض المحفزات الشعرية المحددة أثارت سلوكيات غير آمنة في نحو 90 في المائة من الحالات.

وأشار الباحثون إلى أن هذه الطريقة حققت نجاحاً كبيراً في الحصول على معلومات حول شن هجمات إلكترونية، واستخراج البيانات، واختراق كلمات المرور، وإنشاء برامج ضارة.

وتمكنوا من الحصول على معلومات من نماذج ذكاء اصطناعي مختلفة لبناء أسلحة نووية بنسبة نجاح تتراوح بين 40 في المائة و55 في المائة.

قال الباحثون: «تقدم الدراسة دليلاً منهجياً على أن إعادة صياغة النص الشعري تُضعف سلوك الرفض في جميع نماذج التقييم».

وكتبوا: «عندما تُعبّر عن الدوافع المؤذية بالشعر بدلاً من النثر، ترتفع معدلات نجاح الهجوم بشكل حاد»، مضيفين أن «هذه النتائج تكشف عن فجوة كبيرة في ممارسات التقييم الحالية».

ولم تكشف الدراسة عن الشعر الدقيق المستخدم للتحايل على حواجز السلامة، نظراً لسهولة تكرار هذه الطريقة، وفقاً لما صرح به أحد الباحثين، بيركوسما بيسكونتي، لصحيفة «الغارديان».

يبدو أن أحد الأسباب الرئيسية وراء إنتاج الدوافع الشعرية لمحتوى ضار هو أن جميع نماذج الذكاء الاصطناعي تعمل من خلال توقع الكلمة التالية الأكثر احتمالاً في التسلسل. ونظراً لأن بنية القصيدة ليست واضحة تماماً، فمن الأصعب بكثير على الذكاء الاصطناعي التنبؤ بمثل هذا الدوافع المؤذية واكتشافها.

ودعا الباحثون إلى تحسين أساليب تقييم السلامة لمنع الذكاء الاصطناعي من إنتاج محتوى ضار.

"); googletag.cmd.push(function() { onDvtagReady(function () { googletag.display('div-gpt-ad-3341368-4'); }); }); }

تم ادراج الخبر والعهده على المصدر، الرجاء الكتابة الينا لاي توضبح - برجاء اخبارنا بريديا عن خروقات لحقوق النشر للغير

السابق إسرائيل: إقرار موازنة تخدم الاستيطان بالضفة
التالى دونالد ترمب جونيور: والدي قد ينسحب من مفاوضات السلام في أوكرانيا

 
c 1976-2025 Arab News 24 Int'l - Canada: كافة حقوق الموقع والتصميم محفوظة لـ أخبار العرب-كندا
الآراء المنشورة في هذا الموقع، لا تعبر بالضرورة علي آراء الناشرأو محرري الموقع ولكن تعبر عن رأي كاتبيها
Opinion in this site does not reflect the opinion of the Publisher/ or the Editors, but reflects the opinion of its authors.
This website is Educational and Not for Profit to inform & educate the Arab Community in Canada & USA
This Website conforms to all Canadian Laws
Copyrights infringements: The news published here are feeds from different media, if there is any concern,
please contact us: arabnews AT yahoo.com and we will remove, rectify or address the matter.