تصاعدت وتيرة استهداف أنظمة
الذكاء الاصطناعي من قبل مجموعات
القرصنة الإلكترونية، مع انتقال الهجمات من محاولات
اختراق تقليدية إلى أساليب تعتمد على التلاعب بطريقة استجابة النماذج أو استغلال سلوكها التفاعلي، إضافة إلى إدخال إشارات صوتية خفية لا يدركها المستخدم.
وكشف تقرير نشره موقع "The Verge" أن الجيل الأول من الهجمات على روبوتات الدردشة المعتمدة على النماذج اللغوية الكبرى اتسم ببساطة نسبية، إذ لم يكن يتطلب مهارات تقنية متقدمة أو وصولاً مباشراً للأنظمة، بل كان يعتمد أحياناً على أوامر مباشرة تدفع النموذج إلى تجاوز تعليماته الأصلية.
وأظهر مستخدمون على منصات مثل "إكس" قدرة على دفع بعض روبوتات الدردشة إلى الاستجابة لأوامر من نوع "تجاهل جميع التعليمات السابقة"، ما أدى إلى تغيّر سلوكها بشكل غير متوقع وإنتاج محتوى غير منضبط، قبل أن تنتقل هذه الأساليب لاحقا إلى منصات أكثر تقدما مثل "شات جي بي تي" عبر هجمات من نوع "DAN" (Do Anything Now)، والتي تعتمد على إدخال النظام في سيناريو افتراضي يطلب منه التصرف دون قيود.
اظهار أخبار متعلقة
,انتقل المهاجمون لاحقا، بحسب التقرير، من استهداف التعليمات المباشرة إلى استغلال السمات السلوكية للنماذج الحديثة، في ظل سعي الشركات لجعل روبوتات الدردشة أكثر تعاطفاً وطبيعية في التفاعل، ما فتح مساحة لهجمات تعتمد على التلاعب النفسي عبر محادثات طويلة تدفع النموذج تدريجياً إلى تجاوز بعض القيود أو الكشف عن معلومات غير مسموح بها.
,برز في السياق ذاته تهديد جديد يتمثل في "الصوت العدائي" (Adversarial Audio)، وهو أسلوب يقوم على تضمين أوامر مخفية داخل ملفات صوتية أو مقاطع فيديو تبدو طبيعية، لكنها تُفهم من قبل أنظمة الذكاء الاصطناعي الصوتية دون أن يلاحظها المستخدم.
,عرض باحثون من الصين وسنغافورة، خلال مؤتمر "IEEE Symposium on Security and Privacy" نتائج دراسة أظهرت إمكانية دمج إشارات صوتية خفية داخل أغان وأفلام ومقاطع صوتية، يمكنها خداع المساعدات الذكية لتنفيذ أوامر غير مقصودة، مشيرين إلى أن تدريب هذه الإشارات لا يستغرق سوى نحو 30 دقيقة.
ونقل الموقع عن الباحث الرئيسي منغ تشين، طالب الدكتوراه في جامعة تشجيانج، قوله إن هذه التقنية لا تعتمد على سياق محدد، ما يزيد من مرونتها وخطورتها، ويجعل اكتشافها أكثر صعوبة بالنسبة لأنظمة الحماية الحالية.
اظهار أخبار متعلقة
ومن جانبها، علقت شركة مايكروسوفت على هذه الأبحاث بالقول إنها تسهم في فهم التهديدات الناشئة وتعزيز قدرات الحماية، مشيرة إلى أن نماذج الذكاء الاصطناعي تُدمج داخل تطبيقات متعددة تتطلب طبقات أمان إضافية.
وأظهرت هذه التطورات أن الذكاء الاصطناعي بات هدفاً متقدماً للهجمات الإلكترونية، مع انتقال التحدي من الثغرات البرمجية التقليدية إلى استهداف طريقة التفاعل والسلوك، في سباق مرشح للتصاعد مع تطور هذه الأنظمة وتوسع استخدامها.