DeepSeek کنجکاوی و تردید را در دنیای فناوری برانگیخته است.

۴ اسفند ۱۴۰۳ مطالعه ۴ دقیقه

در یک هفته پر مشغله برای هوش مصنوعی مولد (GenAI)، صنعت فناوری در حال ارزیابی تأثیر تازه‌ وارد جدید در صحنه مدل‌ های زبانی بزرگ (LLM) است. شرکت چینی DeepSeek روز دوشنبه بازارهای سهام را شوکه کرد و باعث کاهش 600 میلیارد دلاری ارزش شرکت Nvidia، که پیش‌ تر به عنوان "فرزند طلایی" هوش مصنوعی شناخته می‌ شد، شد.

با فروکش کردن هیاهو و بهبود بازارها، صنعت فناوری در حال بررسی پیامدهای این اتفاق است و این سؤال را مطرح می‌ کند که آیا انقلاب هوش مصنوعی چین واقعاً چیزی است که به نظر می‌ رسد یا خیر.

میزان علاقه به این موضوع را می‌ توان از پرسش‌های یک تحلیلگر سرمایه‌ گذاری از بیل مک‌ درموت، مدیرعامل ServiceNow، دریافت. این تحلیلگر به جای پرسیدن درباره عملکرد شرکت، نظر او را درباره DeepSeek جویا شد، چرا که ServiceNow در حال ادغام مدل‌ های زبانی بزرگ (LLM) در راهکارهای کاری خود است.

او گفت: "این مدل‌ ها با سرعتی چشمگیر و شاید سریع‌ تر از آنچه کسی تصور می‌ کرد، به یک کالای عمومی تبدیل می‌ شوند." مک‌ درموت این اظهارات را در جلسه‌ ای با تحلیلگران پس از ارائه گزارش مالی سه‌ ماهه چهارم شرکت مطرح کرد.

"این موضوع برای فروشندگان پلتفرم و اپلیکیشن‌ هایی مثل ما بسیار هیجان‌ انگیز است، زیرا تفاوت رقابتی در سطح ما، از طریق اپلیکیشن‌ ها، فرآیند های کسب‌ و کار و در نهایت دستیابی به نتایج تجاری اتفاق می‌ افتد."

بیل مک‌ درموت، مدیرعامل ServiceNow، نه تنها به مزایای این موضوع برای مشتریان فکر می‌ کرد، بلکه چشم به پتانسیل صرفه‌ جویی در هزینه‌ های مربوط به "حاشیه سود ناخالص" از مدل‌ های زبانی بزرگ (LLM) ارزان‌ تر برای شرکت خودش نیز داشت. او این نکته را در جمع حضار مطرح کرد.

با این حال، مدیرعامل ServiceNow نسبت به این موضوع نیز احتیاط داشت. او گفت: "در مورد DeepSeek، فقط باید بگویم ما به شدت معتقدیم که باید دو بار، اگر نه سه بار اندازه‌ گیری کنیم و سپس یک بار برش دهیم. ما قویاً بر این باوریم که باید بفهمیم واقعاً چه اتفاقی در حال روی دادن است و کاملاً به هوش مصنوعی مسئولانه متعهد هستیم." او اضافه کرد که تیم‌ های ServiceNow در حال بررسی پیامدهای ورود DeepSeek هستند.

DeepSeek

دلیل اشتیاق مک‌ درموت به DeepSeek به ادعاهای این شرکت برمی‌ گردد که توانسته مدل‌ های V3 و جدیدترین مدل R1 خود را به‌ صورت کارآمد و با هزینه‌ ای نسبی بسازد. در حالی که رقبای غربی ده‌ ها میلیارد دلار برای آموزش مدل‌ های زبانی بزرگ خود هزینه کرده‌ اند، گفته می‌ شود DeepSeek توانسته عملکردی قابل مقایسه با مدل V3 – که R1 بر اساس آن ساخته شده است – را تنها با هزینه‌ ای کمتر از 6 میلیون دلار در فضای ابری آموزش دهد.

اما این برآورد هزینه بر اساس محاسبات DeepSeek بوده که تعداد ساعت‌ های استفاده از پردازنده گرافیکی Nvidia H800 برای آموزش مدل V3 را در نرخ اجاره معمولی 2 دلار در ساعت ضرب کرده است (به صفحه 5 مقاله آن‌ها مراجعه کنید). در واقعیت، DeepSeek مدل‌ های خود را با استفاده از هزاران پردازنده گرافیکی متعلق به خودش ساخته و میلیون‌ ها دلار برای این کار هزینه کرده است. یک تحلیل مستقل نشان می‌ دهد که DeepSeek حدود 1.6 میلیارد دلار برای سخت‌ افزار هوش مصنوعی خرج کرده است. علاوه بر این، تمام هزینه‌ های تحقیق و توسعه نیز باید در نظر گرفته شود.

در مورد قیمت API ابری، مدل استدلالی DeepSeek R1 به نظر می‌ رسد ارزان‌ تر از مدل o1 شرکت OpenAI باشد. با این حال، برخی ادعاهای آزمایشگاه DeepSeek را زیر سؤال می‌ برند.

اولاً، این ایده مطرح است که DeepSeek می‌ تواند جایگزینی مناسب و متن‌ باز برای دیگر مدل‌ های زبانی بزرگ (LLM) ارائه‌ شده توسط فروشندگان باشد. در حالی که برخی فروشندگان آمریکایی ادعا می‌ کنند محصولاتشان متن‌ باز هستند، تحقیقات دانشگاهی نشان داده است که آن‌ ها در واقع چندان هم متن‌ باز نیستند.

به همین ترتیب، ادعاهای DeepSeek درباره متن‌ باز بودن نیز نیاز به بررسی دقیق دارد. شرکت Version1، که در زمینه ادغام سیستم‌ ها و خدمات فناوری اطلاعات فعالیت می‌ کند، اشاره کرده است که اگرچه DeepSeek وزن‌ های مدل خود را منتشر کرده است، اما داده‌ های آموزشی و کد آموزشی آن را فاش نکرده است، بنابراین امکان تولید مجدد این مدل وجود ندارد.

DeepSeek R1

در یک گروه بحث در Reddit که به OpenAI اختصاص دارد، یکی از کاربران شواهدی ارائه داد که نشان می‌دهد DeepSeek R1 ممکن است مدل‌ های خود را بر اساس پاسخ‌ های معیار (Benchmark Answers) آموزش داده باشد. این موضوع احتمالاً به این معناست که DeepSeek سعی کرده بازار را دستکاری کند، بدون این که یک مدل همه‌منظوره واقعی تولید کند.

برخی کاربران ادعا کرده‌ اند که برخی پاسخ‌ های ارائه‌ شده توسط مدل DeepSeek شباهتی بین 50 تا 90 درصد با پاسخ‌ های معیار دارند. دیگران در همان گروه تردید دارند که آیا با این روش می‌ توان مدل زبانی بزرگ همه‌ منظوره‌ ای ایجاد کرد یا خیر.

فارغ از این که عملکرد و ادعاهای متن‌ باز بودن DeepSeek چقدر معتبر است، این شرکت همچنین به دلیل مشکلات امنیتی با انتقاداتی مواجه شده است. ظاهراً یک پایگاه داده پشتیبان این شرکت به‌ طور عمومی باز بوده است و در نتیجه، این شرکت مجبور شده ثبت‌ نام‌ های جدید برای رابط وب مدل‌ های خود را به دلیل یک حمله سایبری مداوم محدود کند.

این شرکت در یادداشتی در صفحه وضعیت خود اعلام کرد: "به دلیل حملات مخرب گسترده به خدمات DeepSeek، ما به طور موقت ثبت‌ نام‌ ها را محدود کرده‌ ایم تا از ادامه ارائه خدمات اطمینان حاصل کنیم."

صرف‌ نظر از تأثیر این مسائل بر ارزش سهام، به نظر می‌ رسد کاربران فناوری همچنان سوالات بیشتری خواهند داشت، چرا که چین به تلاش خود برای ورود به بازارهای نرم‌ افزاری غربی ادامه می‌ دهد.

صفر و یک: همراه همیشگی شما در دنیای دیجیتال 

صفر و یک اینجاست تا تجربه‌ای متفاوت از اینترنت رو براتون رقم بزنه! 

خدمات ویژه ما:

منابع:

DeepSeek stirs intrigue and doubt across the tech world - theregister


داغ‌ترین مطالب روز

بهترین DNSهای گیمینگ 🎮

بهترین DNSهای گیمینگ 🎮

DNS یکی از مهم ترین مواردی است که سبب می شود تا تجربه شما از بازی کردن بهبود یافته و اتصال شما به سرورها پایداری و ثبات پیدا کند. اما پیدا کردن دی ان اس خوب برای بازی ها آنلاین به خصوص بازی هایی نظیر Valorant، Call of Duty و … همواره چالش محسوب شده […]

۱۶ خرداد ۱۴۰۱ ۹

رفع مشکل وصل نشدن اینترنت در ویندوز 7🌐

رفع مشکل وصل نشدن اینترنت در ویندوز 7🌐

اینترنت یکی از مهم ترین عناصر زندگی در عصر امروز است. اما اگر نتوانیم با ویندوز به اینترنت وصل شویم چه؟ مشکل وصل نشدن اینترنت در ویندوز 7 چیست؟ در این مقاله به آموزش رفع مشکل وصل نشدن اینترنت در ویندوز 7 می پردازیم تا با بررسی راه حل های آن بتوانید به صورت اصولی […]

۲۸ اردیبهشت ۱۴۰۱ ۸

دلایل وصل نشدن اینترنت لپ تاپ 💻🌐

دلایل وصل نشدن اینترنت لپ تاپ 💻🌐

وقتی لپ تاپ شما به WiFi متصل نمی شود، روش هایی را که می توانید برای دسترسی به اینترنت استفاده کنید محدود می کند. اگرچه این یک راه بسیار راحت برای آنلاین شدن است، اما چندین مورد وجود دارد که هنگام استفاده از WiFi ممکن است اشتباه کند.این مشکلات باعث می شود که اتصال شما […]

۱۸ تیر ۱۴۰۱ ۶

سرور ابری

سرور ابری

سرور ابری و یا سرویس ابری از اصطلاحاتی هستند که امروزه به آن زیاد بر می خوریم. اما شاید تا کنون درک درستی در خصوص خدمات مبتنی بر ابر و سرور ابری (سرور رایانش ابری) نداشته باشیم. انتخاب خدمات مرکز داده مناسب ، می تواند تاثیر به سزایی در هزینه های یک کسب و کار […]

۲ تیر ۱۳۹۹ ۵

آموزش دانلود از اینترنت📥

آموزش دانلود از اینترنت📥

دانلود کردن بخش جدایی ناپذیر این روزهای زندگی شده است. هر روز حجم عظیمی از اطلاعات دانلود و آپلود شده و به زندگی مجازی جان می بخشد. اما نحوه دانلود اصولی و حرفه ای از اینترنت به چه صورت است؟ چطور دانلود کنیم که از سالم بودن فایل اطمینان بالایی داشته باشیم؟ در این مقاله […]

۱۱ بهمن ۱۴۰۰ ۴

دیدگاه‌ها

comment symbol

برای این مقاله ۰ دیدگاه نوشته شده است. دیدگاه شما چیست؟

شما نیز، دیدگاه خود را از طریق دکمه زیر به اشتراک بگذارید.

نوشتن دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *