ساعدنیوز: أعلنت شرکه الذکاء الاصطناعی الصینیه DeepSeek أن تدریب نموذجها R1 المتخصص فی التفکیر المنطقی کلف 294,000 دولار فقط، وهو جزء ضئیل مقارنه بالأرقام التی تشیر إلیها الشرکات الأمریکیه المنافسه، مما یعکس طموح بکین لمنافسه الهیمنه الأمریکیه فی مجال الذکاء الاصطناعی.
فی کشف غیر مسبوق نشرته مجله Nature یوم الأربعاء، کشفت شرکه الذکاء الاصطناعی DeepSeek، ومقرها هانغتشو، لأول مره عن التکالیف والتفاصیل الفنیه وراء نموذجها اللغوی الکبیر R1. وذکرت المقاله، التی شارک فی تألیفها المؤسس لیانغ وینفنج، أن النموذج تم تدریبه باستخدام 512 شریحه Nvidia H800 على مدار 80 ساعه، ما یتیح رؤیه نادره للموارد المالیه والحوسبیه المطلوبه لتطویر تقنیات الذکاء الاصطناعی المتقدمه فی الصین.
فی وقت سابق من هذا العام، أثار إطلاق DeepSeek لأنظمه ذکاء اصطناعی منخفضه التکلفه موجات فی الأسواق التکنولوجیه العالمیه، مخیفه المستثمرین بشأن المنافسه مع عمالقه مثل Nvidia. وأوضح المقال أن النسخ السابقه من الورقه البحثیه لم تتضمن هذه التفاصیل الحرجه للتکالیف.
عادهً ما یتطلب تدریب النماذج اللغویه الکبیره أسابیع من الحوسبه على معالجات قویه، بتکالیف تصل لعشرات أو مئات الملایین من الدولارات. وأشار سام ألتمان، الرئیس التنفیذی لشرکه OpenAI فی 2023، إلى أن تدریب النماذج الأساسیه تجاوز 100 ملیون دولار، رغم عدم نشر التفاصیل.
کما خضعت DeepSeek لتدقیق من السلطات الأمریکیه بشأن استخدام الشرائح. وأکدت الشرکه، لأول مره، امتلاکها شرائح A100 المستخدمه فی المراحل الأولى للتطویر، بالإضافه إلى شرائح H800 المستخدمه قانونیًا. ویشیر التقریر إلى أن الوصول إلى معالجات متقدمه مکن DeepSeek من جذب أفضل الباحثین فی الذکاء الاصطناعی فی الصین.
وردت الشرکه على مزاعم نسخ نماذج OpenAI، مؤکده أن استخدام التقنیه کان بهدف خفض التکالیف وتحسین الأداء وجعل الذکاء الاصطناعی أکثر وصولًا. وأقرت DeepSeek باستخدام Meta Llama مفتوح المصدر وبعض المحتوى الناتج عن OpenAI فی تدریب النسخه V3، مشدده على أنه لم یکن نسخًا متعمدًا.
یمثل هذا الکشف الأول من نوعه شفافیه حاسمه حول تکالیف وأسالیب تدریب الذکاء الاصطناعی، ویبرز النفوذ المتزاید للصین فی الابتکار العالمی، ویثیر نقاشات حول الأخلاقیات والمنافسه والوصول التکنولوجی.