در یک هفته پر مشغله برای هوش مصنوعی مولد (GenAI)، صنعت فناوری در حال ارزیابی تأثیر تازه وارد جدید در صحنه مدل های زبانی بزرگ (LLM) است. شرکت چینی DeepSeek روز دوشنبه بازارهای سهام را شوکه کرد و باعث کاهش 600 میلیارد دلاری ارزش شرکت Nvidia، که پیش تر به عنوان "فرزند طلایی" هوش مصنوعی شناخته می شد، شد.
با فروکش کردن هیاهو و بهبود بازارها، صنعت فناوری در حال بررسی پیامدهای این اتفاق است و این سؤال را مطرح می کند که آیا انقلاب هوش مصنوعی چین واقعاً چیزی است که به نظر می رسد یا خیر.
میزان علاقه به این موضوع را می توان از پرسشهای یک تحلیلگر سرمایه گذاری از بیل مک درموت، مدیرعامل ServiceNow، دریافت. این تحلیلگر به جای پرسیدن درباره عملکرد شرکت، نظر او را درباره DeepSeek جویا شد، چرا که ServiceNow در حال ادغام مدل های زبانی بزرگ (LLM) در راهکارهای کاری خود است.
او گفت: "این مدل ها با سرعتی چشمگیر و شاید سریع تر از آنچه کسی تصور می کرد، به یک کالای عمومی تبدیل می شوند." مک درموت این اظهارات را در جلسه ای با تحلیلگران پس از ارائه گزارش مالی سه ماهه چهارم شرکت مطرح کرد.
"این موضوع برای فروشندگان پلتفرم و اپلیکیشن هایی مثل ما بسیار هیجان انگیز است، زیرا تفاوت رقابتی در سطح ما، از طریق اپلیکیشن ها، فرآیند های کسب و کار و در نهایت دستیابی به نتایج تجاری اتفاق می افتد."
بیل مک درموت، مدیرعامل ServiceNow، نه تنها به مزایای این موضوع برای مشتریان فکر می کرد، بلکه چشم به پتانسیل صرفه جویی در هزینه های مربوط به "حاشیه سود ناخالص" از مدل های زبانی بزرگ (LLM) ارزان تر برای شرکت خودش نیز داشت. او این نکته را در جمع حضار مطرح کرد.
با این حال، مدیرعامل ServiceNow نسبت به این موضوع نیز احتیاط داشت. او گفت: "در مورد DeepSeek، فقط باید بگویم ما به شدت معتقدیم که باید دو بار، اگر نه سه بار اندازه گیری کنیم و سپس یک بار برش دهیم. ما قویاً بر این باوریم که باید بفهمیم واقعاً چه اتفاقی در حال روی دادن است و کاملاً به هوش مصنوعی مسئولانه متعهد هستیم." او اضافه کرد که تیم های ServiceNow در حال بررسی پیامدهای ورود DeepSeek هستند.

دلیل اشتیاق مک درموت به DeepSeek به ادعاهای این شرکت برمی گردد که توانسته مدل های V3 و جدیدترین مدل R1 خود را به صورت کارآمد و با هزینه ای نسبی بسازد. در حالی که رقبای غربی ده ها میلیارد دلار برای آموزش مدل های زبانی بزرگ خود هزینه کرده اند، گفته می شود DeepSeek توانسته عملکردی قابل مقایسه با مدل V3 – که R1 بر اساس آن ساخته شده است – را تنها با هزینه ای کمتر از 6 میلیون دلار در فضای ابری آموزش دهد.
اما این برآورد هزینه بر اساس محاسبات DeepSeek بوده که تعداد ساعت های استفاده از پردازنده گرافیکی Nvidia H800 برای آموزش مدل V3 را در نرخ اجاره معمولی 2 دلار در ساعت ضرب کرده است (به صفحه 5 مقاله آنها مراجعه کنید). در واقعیت، DeepSeek مدل های خود را با استفاده از هزاران پردازنده گرافیکی متعلق به خودش ساخته و میلیون ها دلار برای این کار هزینه کرده است. یک تحلیل مستقل نشان می دهد که DeepSeek حدود 1.6 میلیارد دلار برای سخت افزار هوش مصنوعی خرج کرده است. علاوه بر این، تمام هزینه های تحقیق و توسعه نیز باید در نظر گرفته شود.
در مورد قیمت API ابری، مدل استدلالی DeepSeek R1 به نظر می رسد ارزان تر از مدل o1 شرکت OpenAI باشد. با این حال، برخی ادعاهای آزمایشگاه DeepSeek را زیر سؤال می برند.
اولاً، این ایده مطرح است که DeepSeek می تواند جایگزینی مناسب و متن باز برای دیگر مدل های زبانی بزرگ (LLM) ارائه شده توسط فروشندگان باشد. در حالی که برخی فروشندگان آمریکایی ادعا می کنند محصولاتشان متن باز هستند، تحقیقات دانشگاهی نشان داده است که آن ها در واقع چندان هم متن باز نیستند.
به همین ترتیب، ادعاهای DeepSeek درباره متن باز بودن نیز نیاز به بررسی دقیق دارد. شرکت Version1، که در زمینه ادغام سیستم ها و خدمات فناوری اطلاعات فعالیت می کند، اشاره کرده است که اگرچه DeepSeek وزن های مدل خود را منتشر کرده است، اما داده های آموزشی و کد آموزشی آن را فاش نکرده است، بنابراین امکان تولید مجدد این مدل وجود ندارد.

در یک گروه بحث در Reddit که به OpenAI اختصاص دارد، یکی از کاربران شواهدی ارائه داد که نشان میدهد DeepSeek R1 ممکن است مدل های خود را بر اساس پاسخ های معیار (Benchmark Answers) آموزش داده باشد. این موضوع احتمالاً به این معناست که DeepSeek سعی کرده بازار را دستکاری کند، بدون این که یک مدل همهمنظوره واقعی تولید کند.
برخی کاربران ادعا کرده اند که برخی پاسخ های ارائه شده توسط مدل DeepSeek شباهتی بین 50 تا 90 درصد با پاسخ های معیار دارند. دیگران در همان گروه تردید دارند که آیا با این روش می توان مدل زبانی بزرگ همه منظوره ای ایجاد کرد یا خیر.
فارغ از این که عملکرد و ادعاهای متن باز بودن DeepSeek چقدر معتبر است، این شرکت همچنین به دلیل مشکلات امنیتی با انتقاداتی مواجه شده است. ظاهراً یک پایگاه داده پشتیبان این شرکت به طور عمومی باز بوده است و در نتیجه، این شرکت مجبور شده ثبت نام های جدید برای رابط وب مدل های خود را به دلیل یک حمله سایبری مداوم محدود کند.
این شرکت در یادداشتی در صفحه وضعیت خود اعلام کرد: "به دلیل حملات مخرب گسترده به خدمات DeepSeek، ما به طور موقت ثبت نام ها را محدود کرده ایم تا از ادامه ارائه خدمات اطمینان حاصل کنیم."
صرف نظر از تأثیر این مسائل بر ارزش سهام، به نظر می رسد کاربران فناوری همچنان سوالات بیشتری خواهند داشت، چرا که چین به تلاش خود برای ورود به بازارهای نرم افزاری غربی ادامه می دهد.
صفر و یک: همراه همیشگی شما در دنیای دیجیتال
صفر و یک اینجاست تا تجربهای متفاوت از اینترنت رو براتون رقم بزنه!
خدمات ویژه ما:
- اینترنت +ADSL2 با سرعت فوقالعاده
- VDSL برای کاربران حرفهای
- TD-LTE برای مناطق بدون دسترسی به فیبر
- سرورهای ابری قدرتمند
- سرور مجازی (VPS)
- سرور اختصاصی
- پهنای باند اختصاصی
منابع:
DeepSeek stirs intrigue and doubt across the tech world - theregister