شرکت‌ های هوش مصنوعی با پیروی از DeepSeek، مدل‌ های ارزان‌ تری با استفاده از روش «استخراج» ایجاد می‌ کنند.

۲۲ اسفند ۱۴۰۳ مطالعه ۴ دقیقه

شرکت‌ های برجسته هوش مصنوعی از جمله OpenAI، مایکروسافت و متا در رقابت جهانی برای توسعه مدل‌ های هوش مصنوعی ارزان‌ تر، به روشی به نام «استخراج» (Distillation) روی آورده‌ اند؛ روشی که به کاربران و کسب‌ و کارها امکان استفاده مقرون‌ به‌ صرفه از این فناوری را می‌ دهد.

این تکنیک پس از آنکه شرکت DeepSeek در چین از آن برای ساخت مدل‌ های قدرتمند و کارآمد هوش مصنوعی بر اساس سیستم‌ های متن‌ باز منتشر شده توسط رقبایی مانند Meta و Alibaba استفاده کرد، توجهات گسترده‌ ای را به خود جلب کرد. این دستاورد باعث تزلزل در اعتماد به برتری هوش مصنوعی در سیلیکون ولی شد و در نتیجه، سرمایه‌ گذاران وال‌ استریت میلیاردها دلار از ارزش سهام شرکت‌ های بزرگ فناوری ایالات متحده کم کردند.

در روش استخراج، شرکت‌ ها ابتدا یک مدل زبان بزرگ که به عنوان «مدل معلم» شناخته می‌ شود، ایجاد می‌ کنند. این مدل وظیفه پیش‌ بینی کلمه بعدی در یک جمله را انجام می‌ دهد. سپس مدل معلم داده‌ هایی تولید می‌ کند که برای آموزش یک مدل کوچکتر به نام «مدل دانش‌آموز» استفاده می‌ شود. این فرآیند کمک می‌ کند تا دانش و پیش‌ بینی‌ های مدل بزرگ به سرعت به مدل کوچک‌ تر منتقل شود.

اگرچه روش استخراج سال‌ هاست که مورد استفاده قرار می‌ گیرد، اما پیشرفت‌ های اخیر موجب شده است که کارشناسان صنعت باور داشته باشند این فرآیند به طور فزاینده‌ ای به استارتاپ‌ ها کمک می‌ کند تا با هزینه کمتر، برنامه‌ های جدید مبتنی بر این فناوری بسازند.

اولیویه گودمنت، مدیر محصول پلتفرم OpenAI، در این‌باره گفت: «استخراج واقعاً جادویی است. این فرآیند اساساً شامل گرفتن یک مدل بزرگ و هوشمند پیشرفته و استفاده از آن برای آموزش یک مدل کوچک‌ تر است... مدلی که در وظایف خاص بسیار توانمند است و اجرای آن فوق‌ العاده ارزان و سریع است.»

مدل‌ های زبان بزرگ مانند GPT-4 از OpenAI و Gemini از گوگل و Llama از متا برای توسعه و نگهداری به حجم عظیمی از داده‌ ها و توان پردازشی نیاز دارند. اگرچه این شرکت‌ ها ارقام دقیق هزینه‌ های آموزش مدل‌ های بزرگ خود را افشا نکرده‌اند، اما احتمالاً این هزینه‌ها به صدها میلیون دلار می‌رسد.

هوش مصنوعی

با استفاده از روش استخراج، توسعه‌ دهندگان و کسب‌ و کارها می‌ توانند به قابلیت‌ های مدل‌ های هوش مصنوعی با هزینه‌ ای بسیار کمتر دسترسی پیدا کنند، که این امر به توسعه‌ دهندگان اپلیکیشن اجازه می‌ دهد تا مدل‌ های هوش مصنوعی را به سرعت بر روی دستگاه‌ هایی مانند لپ‌ تاپ و گوشی‌ های هوشمند اجرا کنند.

توسعه‌ دهندگان می‌ توانند از پلتفرم OpenAI برای استخراج استفاده کنند و از مدل‌ های زبان بزرگ که پایه‌ گذار محصولاتی مانند ChatGPT هستند، بهره‌ برداری کنند. بزرگ‌ ترین حامی OpenAI، یعنی مایکروسافت، از GPT-4 برای استخراج خانواده مدل‌ های کوچک‌ تر خود به نام Phi استفاده کرده است که این اقدام بخشی از یک همکاری تجاری پس از سرمایه‌ گذاری نزدیک به 14 میلیارد دلار در این شرکت بوده است.

با این حال، استارتاپ مستقر در سان فرانسیسکو اعلام کرده است که معتقد است DeepSeek از مدل‌ های OpenAI برای آموزش رقیب خود استفاده کرده است، حرکتی که بر اساس شرایط خدمات OpenAI غیرقانونی خواهد بود. DeepSeek هنوز به این ادعاها واکنشی نشان نداده است.

در حالی که استخراج می‌ تواند برای ایجاد مدل‌ های با عملکرد بالا استفاده شود، کارشناسان معتقدند که این مدل‌ ها محدودیت‌ هایی دارند. احمد عوض‌ الله از مایکروسافت ریسرچ گفت: «استخراج یک معامله جالب است؛ اگر مدل‌ ها را کوچکتر کنید، به ناچار قابلیت‌ های آن‌ ها کاهش می‌یابد.» او افزود که یک مدل استخراج‌ شده می‌ تواند برای خلاصه‌ سازی ایمیل‌ ها بسیار خوب طراحی شود، اما در واقع در هیچ کار دیگری خوب نخواهد بود.

دیوید کاکس، معاون مدل‌ های هوش مصنوعی در IBM Research، گفت که بیشتر کسب‌ و کارها نیازی به مدل‌ های بزرگ برای اجرای محصولات خود ندارند و مدل‌های استخراج‌شده به اندازه کافی برای مقاصدی مانند چت‌بات‌های خدمات مشتری یا اجرا بر روی دستگاه‌ های کوچکی مانند گوشی‌ ها قدرتمند هستند. او افزود: «هر زمان که بتوانید هزینه را کاهش دهید و عملکرد مورد نظر را به دست آورید، دلیل چندانی برای عدم انجام آن وجود ندارد.»

OpenAI

این موضوع چالشی برای بسیاری از مدل‌ های کسب‌ و کار شرکت‌ های پیشرو هوش مصنوعی ایجاد می‌ کند. حتی اگر توسعه‌ دهندگان از مدل‌ های استخراج‌ شده شرکت‌ هایی مانند OpenAI استفاده کنند، هزینه‌ های کمتری برای اجرا دارند، هزینه کمتری برای ایجاد نیاز دارند و در نتیجه درآمد کمتری تولید می‌ کنند. سازندگان مدل‌ هایی مانند OpenAI معمولاً هزینه کمتری برای استفاده از مدل‌ های استخراج‌ شده دریافت می‌ کنند، زیرا این مدل‌ ها بار محاسباتی کمتری نیاز دارند.

با این حال، اولیویه گودمنت از OpenAI معتقد است که مدل‌ های زبان بزرگ هنوز برای وظایف با هوش بالا و ریسک‌ های بالا ضروری خواهند بود، جایی که کسب‌ و کارها حاضرند برای دقت و قابلیت اطمینان بالا هزینه بیشتری پرداخت کنند. او افزود که مدل‌ های بزرگ همچنین برای کشف قابلیت‌ های جدید که می‌ توانند به مدل‌ های کوچکتر منتقل شوند، مورد نیاز خواهند بود.

OpenAI همچنین به دنبال جلوگیری از استخراج مدل‌ های بزرگ خود برای آموزش رقبای خود است. این شرکت تیم‌ هایی دارد که استفاده از مدل‌ ها را نظارت می‌ کنند و می‌ توانند دسترسی کاربران مشکوک به تولید حجم زیادی از داده‌ ها برای صادرات و آموزش رقبای خود را قطع کنند، همان‌ طور که به نظر می‌ رسد با حساب‌ هایی که به DeepSeek مرتبط بوده‌ اند، انجام داده است. با این حال، بسیاری از این اقدامات به‌ صورت عقب‌ نگر انجام می‌ شود.

داو کیلا، مدیر اجرایی Contextual AI، یک استارتاپ که ابزارهای بازیابی اطلاعات برای شرکت‌ ها می‌ سازد، گفت: «OpenAI برای مدت طولانی در تلاش بوده است تا از استخراج جلوگیری کند، اما کاملاً جلوگیری از آن بسیار دشوار است.»

استخراج همچنین یک پیروزی برای حامیان مدل‌ های متن‌ باز است، جایی که فناوری به‌ صورت رایگان برای توسعه‌ دهندگان در دسترس قرار می‌ گیرد. DeepSeek نیز مدل‌ های اخیر خود را برای توسعه‌ دهندگان به‌ صورت متن‌ باز ارائه کرده است.

یان لِکون، دانشمند ارشد هوش مصنوعی متا، گفت: «ما قصد داریم از [استخراج] استفاده کنیم و آن را به‌ سرعت در محصولات خود قرار دهیم. این تمام ایده متن‌ باز است. شما از پیشرفت همه و دیگران بهره‌ مند می‌ شوید به شرطی که این فرآیندها باز باشند.»

DeepSeek

استخراج همچنین به این معناست که سازندگان مدل می‌ توانند میلیاردها دلار برای پیشرفت قابلیت‌ های سیستم‌ های هوش مصنوعی هزینه کنند، اما همچنان با رقبایی مواجه می‌ شوند که اغلب به سرعت به سطح آنها می‌ رسند، همان‌ طور که انتشارهای اخیر DeepSeek نشان می‌ دهد. این موضوع سوالاتی را درباره مزیت پیشگام بودن در ساخت مدل‌ های زبان بزرگ مطرح می‌ کند، زمانی که قابلیت‌ های آنها می‌ تواند در عرض چند ماه تکرار شود.

دیوید کاکس، معاون مدل‌ های هوش مصنوعی در IBM Research، گفت: «در دنیایی که همه چیز به سرعت در حال حرکت است... شما می‌ توانید واقعاً پول زیادی خرج کنید و کار را به روش سخت انجام دهید، و سپس بقیه میدان درست در پشت سر شما هستند. بنابراین، این یک چشم‌ انداز تجاری جالب و دشوار است.»

به اینترنت پرسرعت صفر و یک بپیوندید!

آیا به دنبال یک اینترنت خانگی سریع و پایدار هستید؟ شرکت صفر و یک با ارائه خدمات متنوعی مانند ADSL2+، TD-LTE، VDSL، وایرلس اشتراکی و اینترنت اختصاصی برای برج‌ها و مجتمع‌ها، بهترین گزینه را برای شما فراهم کرده است!

تجربه‌ای بی‌نظیر از سرعت و کیفیت اینترنت را با ما داشته باشید. خدمات ما به شما این امکان را می‌دهد که به راحتی به آنلاین بودن در کار و سرگرمی‌ های روزمره‌ تان ادامه دهید. با پشتیبانی 24 ساعته و تیمی مجرب، ما در کنار شما خواهیم بود تا هرگونه مشکل را به سرعت حل کنیم.

همین امروز با ما تماس بگیرید یا به وب‌سایت ما مراجعه کنید و از مشاوره بهره‌ مند شوید. با صفر و یک، دنیای جدیدی از اینترنت پرسرعت را تجربه کنید!


داغ‌ترین مطالب روز

بهترین DNSهای گیمینگ 🎮

بهترین DNSهای گیمینگ 🎮

DNS یکی از مهم ترین مواردی است که سبب می شود تا تجربه شما از بازی کردن بهبود یافته و اتصال شما به سرورها پایداری و ثبات پیدا کند. اما پیدا کردن دی ان اس خوب برای بازی ها آنلاین به خصوص بازی هایی نظیر Valorant، Call of Duty و … همواره چالش محسوب شده […]

۱۶ خرداد ۱۴۰۱ ۹

رفع مشکل وصل نشدن اینترنت در ویندوز 7🌐

رفع مشکل وصل نشدن اینترنت در ویندوز 7🌐

اینترنت یکی از مهم ترین عناصر زندگی در عصر امروز است. اما اگر نتوانیم با ویندوز به اینترنت وصل شویم چه؟ مشکل وصل نشدن اینترنت در ویندوز 7 چیست؟ در این مقاله به آموزش رفع مشکل وصل نشدن اینترنت در ویندوز 7 می پردازیم تا با بررسی راه حل های آن بتوانید به صورت اصولی […]

۲۸ اردیبهشت ۱۴۰۱ ۸

سرور ابری

سرور ابری

سرور ابری و یا سرویس ابری از اصطلاحاتی هستند که امروزه به آن زیاد بر می خوریم. اما شاید تا کنون درک درستی در خصوص خدمات مبتنی بر ابر و سرور ابری (سرور رایانش ابری) نداشته باشیم. انتخاب خدمات مرکز داده مناسب ، می تواند تاثیر به سزایی در هزینه های یک کسب و کار […]

۲ تیر ۱۳۹۹ ۵

آموزش دانلود از اینترنت📥

آموزش دانلود از اینترنت📥

دانلود کردن بخش جدایی ناپذیر این روزهای زندگی شده است. هر روز حجم عظیمی از اطلاعات دانلود و آپلود شده و به زندگی مجازی جان می بخشد. اما نحوه دانلود اصولی و حرفه ای از اینترنت به چه صورت است؟ چطور دانلود کنیم که از سالم بودن فایل اطمینان بالایی داشته باشیم؟ در این مقاله […]

۱۱ بهمن ۱۴۰۰ ۴

فیلتر کردن یعنی چه؟🤚

فیلتر کردن یعنی چه؟🤚

فیلتر کردن یکی از پرکاربردترین عبارت های این روزهاست که در گوشه و کنار فضای مجازی از آن زیاد می شنویم. اما فیلتر کردن یعنی چه ؟ فیلتر کردن به معنای بستن سایت به روی کاربران تعیین شده است. به صورتی که این کاربران نتوانند به راحتی به برنامه ها و سایت های مورد نظر […]

۱۱ خرداد ۱۴۰۱ ۴

دیدگاه‌ها

comment symbol

برای این مقاله ۰ دیدگاه نوشته شده است. دیدگاه شما چیست؟

شما نیز، دیدگاه خود را از طریق دکمه زیر به اشتراک بگذارید.

نوشتن دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *