لیست مطالب
شرکت های برجسته هوش مصنوعی از جمله OpenAI، مایکروسافت و متا در رقابت جهانی برای توسعه مدل های هوش مصنوعی ارزان تر، به روشی به نام «استخراج» (Distillation) روی آورده اند؛ روشی که به کاربران و کسب و کارها امکان استفاده مقرون به صرفه از این فناوری را می دهد.
این تکنیک پس از آنکه شرکت DeepSeek در چین از آن برای ساخت مدل های قدرتمند و کارآمد هوش مصنوعی بر اساس سیستم های متن باز منتشر شده توسط رقبایی مانند Meta و Alibaba استفاده کرد، توجهات گسترده ای را به خود جلب کرد. این دستاورد باعث تزلزل در اعتماد به برتری هوش مصنوعی در سیلیکون ولی شد و در نتیجه، سرمایه گذاران وال استریت میلیاردها دلار از ارزش سهام شرکت های بزرگ فناوری ایالات متحده کم کردند.
در روش استخراج، شرکت ها ابتدا یک مدل زبان بزرگ که به عنوان «مدل معلم» شناخته می شود، ایجاد می کنند. این مدل وظیفه پیش بینی کلمه بعدی در یک جمله را انجام می دهد. سپس مدل معلم داده هایی تولید می کند که برای آموزش یک مدل کوچکتر به نام «مدل دانشآموز» استفاده می شود. این فرآیند کمک می کند تا دانش و پیش بینی های مدل بزرگ به سرعت به مدل کوچک تر منتقل شود.
اگرچه روش استخراج سال هاست که مورد استفاده قرار می گیرد، اما پیشرفت های اخیر موجب شده است که کارشناسان صنعت باور داشته باشند این فرآیند به طور فزاینده ای به استارتاپ ها کمک می کند تا با هزینه کمتر، برنامه های جدید مبتنی بر این فناوری بسازند.
اولیویه گودمنت، مدیر محصول پلتفرم OpenAI، در اینباره گفت: «استخراج واقعاً جادویی است. این فرآیند اساساً شامل گرفتن یک مدل بزرگ و هوشمند پیشرفته و استفاده از آن برای آموزش یک مدل کوچک تر است... مدلی که در وظایف خاص بسیار توانمند است و اجرای آن فوق العاده ارزان و سریع است.»
مدل های زبان بزرگ مانند GPT-4 از OpenAI و Gemini از گوگل و Llama از متا برای توسعه و نگهداری به حجم عظیمی از داده ها و توان پردازشی نیاز دارند. اگرچه این شرکت ها ارقام دقیق هزینه های آموزش مدل های بزرگ خود را افشا نکردهاند، اما احتمالاً این هزینهها به صدها میلیون دلار میرسد.

با استفاده از روش استخراج، توسعه دهندگان و کسب و کارها می توانند به قابلیت های مدل های هوش مصنوعی با هزینه ای بسیار کمتر دسترسی پیدا کنند، که این امر به توسعه دهندگان اپلیکیشن اجازه می دهد تا مدل های هوش مصنوعی را به سرعت بر روی دستگاه هایی مانند لپ تاپ و گوشی های هوشمند اجرا کنند.
توسعه دهندگان می توانند از پلتفرم OpenAI برای استخراج استفاده کنند و از مدل های زبان بزرگ که پایه گذار محصولاتی مانند ChatGPT هستند، بهره برداری کنند. بزرگ ترین حامی OpenAI، یعنی مایکروسافت، از GPT-4 برای استخراج خانواده مدل های کوچک تر خود به نام Phi استفاده کرده است که این اقدام بخشی از یک همکاری تجاری پس از سرمایه گذاری نزدیک به 14 میلیارد دلار در این شرکت بوده است.
با این حال، استارتاپ مستقر در سان فرانسیسکو اعلام کرده است که معتقد است DeepSeek از مدل های OpenAI برای آموزش رقیب خود استفاده کرده است، حرکتی که بر اساس شرایط خدمات OpenAI غیرقانونی خواهد بود. DeepSeek هنوز به این ادعاها واکنشی نشان نداده است.
در حالی که استخراج می تواند برای ایجاد مدل های با عملکرد بالا استفاده شود، کارشناسان معتقدند که این مدل ها محدودیت هایی دارند. احمد عوض الله از مایکروسافت ریسرچ گفت: «استخراج یک معامله جالب است؛ اگر مدل ها را کوچکتر کنید، به ناچار قابلیت های آن ها کاهش مییابد.» او افزود که یک مدل استخراج شده می تواند برای خلاصه سازی ایمیل ها بسیار خوب طراحی شود، اما در واقع در هیچ کار دیگری خوب نخواهد بود.
دیوید کاکس، معاون مدل های هوش مصنوعی در IBM Research، گفت که بیشتر کسب و کارها نیازی به مدل های بزرگ برای اجرای محصولات خود ندارند و مدلهای استخراجشده به اندازه کافی برای مقاصدی مانند چتباتهای خدمات مشتری یا اجرا بر روی دستگاه های کوچکی مانند گوشی ها قدرتمند هستند. او افزود: «هر زمان که بتوانید هزینه را کاهش دهید و عملکرد مورد نظر را به دست آورید، دلیل چندانی برای عدم انجام آن وجود ندارد.»

این موضوع چالشی برای بسیاری از مدل های کسب و کار شرکت های پیشرو هوش مصنوعی ایجاد می کند. حتی اگر توسعه دهندگان از مدل های استخراج شده شرکت هایی مانند OpenAI استفاده کنند، هزینه های کمتری برای اجرا دارند، هزینه کمتری برای ایجاد نیاز دارند و در نتیجه درآمد کمتری تولید می کنند. سازندگان مدل هایی مانند OpenAI معمولاً هزینه کمتری برای استفاده از مدل های استخراج شده دریافت می کنند، زیرا این مدل ها بار محاسباتی کمتری نیاز دارند.
با این حال، اولیویه گودمنت از OpenAI معتقد است که مدل های زبان بزرگ هنوز برای وظایف با هوش بالا و ریسک های بالا ضروری خواهند بود، جایی که کسب و کارها حاضرند برای دقت و قابلیت اطمینان بالا هزینه بیشتری پرداخت کنند. او افزود که مدل های بزرگ همچنین برای کشف قابلیت های جدید که می توانند به مدل های کوچکتر منتقل شوند، مورد نیاز خواهند بود.
OpenAI همچنین به دنبال جلوگیری از استخراج مدل های بزرگ خود برای آموزش رقبای خود است. این شرکت تیم هایی دارد که استفاده از مدل ها را نظارت می کنند و می توانند دسترسی کاربران مشکوک به تولید حجم زیادی از داده ها برای صادرات و آموزش رقبای خود را قطع کنند، همان طور که به نظر می رسد با حساب هایی که به DeepSeek مرتبط بوده اند، انجام داده است. با این حال، بسیاری از این اقدامات به صورت عقب نگر انجام می شود.
داو کیلا، مدیر اجرایی Contextual AI، یک استارتاپ که ابزارهای بازیابی اطلاعات برای شرکت ها می سازد، گفت: «OpenAI برای مدت طولانی در تلاش بوده است تا از استخراج جلوگیری کند، اما کاملاً جلوگیری از آن بسیار دشوار است.»
استخراج همچنین یک پیروزی برای حامیان مدل های متن باز است، جایی که فناوری به صورت رایگان برای توسعه دهندگان در دسترس قرار می گیرد. DeepSeek نیز مدل های اخیر خود را برای توسعه دهندگان به صورت متن باز ارائه کرده است.
یان لِکون، دانشمند ارشد هوش مصنوعی متا، گفت: «ما قصد داریم از [استخراج] استفاده کنیم و آن را به سرعت در محصولات خود قرار دهیم. این تمام ایده متن باز است. شما از پیشرفت همه و دیگران بهره مند می شوید به شرطی که این فرآیندها باز باشند.»

استخراج همچنین به این معناست که سازندگان مدل می توانند میلیاردها دلار برای پیشرفت قابلیت های سیستم های هوش مصنوعی هزینه کنند، اما همچنان با رقبایی مواجه می شوند که اغلب به سرعت به سطح آنها می رسند، همان طور که انتشارهای اخیر DeepSeek نشان می دهد. این موضوع سوالاتی را درباره مزیت پیشگام بودن در ساخت مدل های زبان بزرگ مطرح می کند، زمانی که قابلیت های آنها می تواند در عرض چند ماه تکرار شود.
دیوید کاکس، معاون مدل های هوش مصنوعی در IBM Research، گفت: «در دنیایی که همه چیز به سرعت در حال حرکت است... شما می توانید واقعاً پول زیادی خرج کنید و کار را به روش سخت انجام دهید، و سپس بقیه میدان درست در پشت سر شما هستند. بنابراین، این یک چشم انداز تجاری جالب و دشوار است.»
به اینترنت پرسرعت صفر و یک بپیوندید!
آیا به دنبال یک اینترنت خانگی سریع و پایدار هستید؟ شرکت صفر و یک با ارائه خدمات متنوعی مانند ADSL2+، TD-LTE، VDSL، وایرلس اشتراکی و اینترنت اختصاصی برای برجها و مجتمعها، بهترین گزینه را برای شما فراهم کرده است!
تجربهای بینظیر از سرعت و کیفیت اینترنت را با ما داشته باشید. خدمات ما به شما این امکان را میدهد که به راحتی به آنلاین بودن در کار و سرگرمی های روزمره تان ادامه دهید. با پشتیبانی 24 ساعته و تیمی مجرب، ما در کنار شما خواهیم بود تا هرگونه مشکل را به سرعت حل کنیم.
همین امروز با ما تماس بگیرید یا به وبسایت ما مراجعه کنید و از مشاوره بهره مند شوید. با صفر و یک، دنیای جدیدی از اینترنت پرسرعت را تجربه کنید!