روبوت محادثة DeepSeek يحقق دقة بنسبة 17٪، متأخرًا عن منافسيه في تدقيق NewsGuard

29 يناير (رويترز) – حصل روبوت المحادثة الذي طورته الشركة الصينية الناشئة DeepSeek AI على دقة بنسبة 17٪ فقط في تقديم الأخبار والمعلومات، وذلك في تدقيق أجرته NewsGuard، حيث تم تصنيفه في المرتبة العاشرة من أصل أحد عشر عند مقارنته بمنافسيه الغربيين، بما في ذلك ChatGPT التابع لـ OpenAI و Google Gemini.

ووفقًا للتقرير الذي نشرته خدمة تقييم الموثوقية NewsGuard يوم الأربعاء، كرر روبوت المحادثة ادعاءات كاذبة بنسبة 30٪ من الوقت، وقدم إجابات غامضة أو غير مفيدة بنسبة 53٪ عند الرد على استفسارات متعلقة بالأخبار، مما أدى إلى معدل فشل بلغ 83٪.

أداء أقل من منافسيه وإثارة الشكوك حول تقنيات الذكاء الاصطناعي الصينية

كان معدل الفشل هذا أسوأ من متوسط معدل الفشل البالغ 62٪ الذي سجلته نماذج الذكاء الاصطناعي المنافسة في الغرب، مما أثار شكوكًا حول قدرة تقنية الذكاء الاصطناعي التي تدعي DeepSeek أنها تقدم أداءً مماثلًا أو أفضل من OpenAI المدعومة من Microsoft، ولكن بتكلفة أقل بكثير.

وفي غضون أيام قليلة من إطلاقه، أصبح روبوت المحادثة الخاص بـ DeepSeek التطبيق الأكثر تحميلًا على متجر تطبيقات Apple، مما أدى إلى إثارة المخاوف بشأن تفوق الولايات المتحدة في مجال الذكاء الاصطناعي وأدى إلى تراجع كبير في السوق، حيث تم القضاء على حوالي تريليون دولار من أسهم شركات التكنولوجيا الأمريكية.

عدم استجابة DeepSeek للتعليقات وتفاصيل تدقيق NewsGuard

لم ترد الشركة الصينية الناشئة على الفور على طلب للتعليق حول نتائج التدقيق.

وقالت NewsGuard إنها استخدمت نفس 300 استفسار التي استخدمتها لتقييم نظرائها الغربيين، بما في ذلك 30 استفسارًا مستندًا إلى 10 ادعاءات كاذبة منتشرة عبر الإنترنت.

موضوعات الادعاءات التي تم اختبارها

شملت الموضوعات التي تم اختبارها في التدقيق:

مقتل “براين تومسون” المدير التنفيذي في UnitedHealthcare الشهر الماضي.
إسقاط طائرة الخطوط الجوية الأذربيجانية الرحلة 8243.

انحياز DeepSeek نحو الموقف الرسمي للحكومة الصينية

كشف تدقيق NewsGuard أيضًا أنه في ثلاثة من أصل عشرة استفسارات، كرر DeepSeek موقف الحكومة الصينية الرسمي حول الموضوع المطروح، دون أن يكون للسؤال علاقة مباشرة بالصين.

فعلى سبيل المثال، عند طرح أسئلة حول حادث تحطم طائرة الخطوط الجوية الأذربيجانية—وهي أسئلة غير مرتبطة تمامًا بالصين—قدم روبوت المحادثة إجابات تعكس الموقف الرسمي لبكين من الحادث، وفقًا لما ذكرته NewsGuard.

التكلفة مقابل الدقة: رؤية المحللين حول أداء DeepSeek

قال المحلل في شركة D.A. Davidson، جيل لوريا:

“تكمن أهمية إنجاز DeepSeek ليس في قدرته على الإجابة بدقة عن الأسئلة المتعلقة بالأخبار الصينية، ولكن في كونه يستطيع الإجابة على أي سؤال بتكلفة تبلغ 1/30 فقط من تكلفة نماذج الذكاء الاصطناعي المنافسة.”

نقاط الضعف: التكرار العشوائي للمعلومات المضللة

وكما هو الحال مع نماذج الذكاء الاصطناعي الأخرى، كان DeepSeek أكثر عرضة لتكرار الادعاءات الكاذبة عند الاستجابة للاستفسارات التي يستخدمها الأشخاص الذين يسعون إلى استغلال الذكاء الاصطناعي لنشر المعلومات المضللة، وفقًا لما أضافته NewsGuard.

المصدر: Reuters