لیست مطالب
در کنفرانس توسعه دهندگان گوگل I/O 2025 که در تاریخ ۲۰ می ۲۰۲۵ برگزار شد، گوگل از به روزرسانیهای خیره کننده ای برای مدل های هوش مصنوعی Gemini 2.5 خود رونمایی کرد که نوید بخش تحولی در دنیای فناوری است. این مدلها، به ویژه Gemini 2.5 Pro و Gemini 2.5 Flash، با قابلیتهای پیشرفته در زمینههای برنامه نویسی، آموزش، استدلال پیچیده و حتی ساخت اپلیکیشن های وب تعاملی، مرزهای هوش مصنوعی را جا به جا کردهاند. در این خبر، به بررسی مهم ترین ویژگیهای اعلام شده در این رویداد می پردازیم که نشان دهنده تعهد گوگل به پیشبرد فناوری هوش مصنوعی مسئولانه و خلاقانه است.
Gemini 2.5 Pro: پیشتاز در آموزش و استدلال
مدل Gemini 2.5 Pro ، عملکردی بی نظیر در درک متون طولانی و ویدئوها ارائه میدهد. این مدل با ادغام LearnLM، مجموعه ای از مدلهای طراحی شده با همکاری کارشناسان آموزشی، به عنوان برترین مدل برای یادگیری شناخته شده است. در ارزیابیهای انجام شده توسط کارشناسان، Gemini 2.5 Pro در مقایسه با سایر مدلهای پیشرو، در تمامی پنج اصل علم یادگیری که برای ساخت سیستمهای هوش مصنوعی آموزشی استفاده میشود، عملکرد بهتری داشته است. این قابلیت، آن را به ابزاری ایده آل برای پلتفرمهای آموزشی و برنامههای یادگیری تبدیل کرده است.
علاوه بر این، گوگل حالت آزمایشی Deep Think را معرفی کرد که با استفاده از تکنیکهای جدید تحقیقاتی، توانایی مدل را در بررسی چندین فرضیه قبل از پاسخ گویی تقویت میکند. این حالت در آزمون USAMO 2025، یکی از سخت ترین معیارهای ریاضی، امتیازی چشمگیر کسب کرده و نشان دهنده پیشرفت قابل توجه در استدلال پیشرفته است.
Gemini 2.5 Flash: سرعت و کارایی برای همه
مدل Gemini 2.5 Flash، که اکنون در اپلیکیشن Gemini برای همه کاربران در دسترس است، با تمرکز بر پاسخ گویی سریع و کارایی بالا طراحی شده است. این مدل از ماه ژوئن ۲۰۲۵ در Google AI Studio برای توسعه دهندگان و در Vertex AI برای شرکتها عرضه خواهد شد. به روزرسانیهای اخیر این مدل، آن را به گزینهای ایدهآل برای توسعه دهندگان تبدیل کرده که به دنبال ساخت اپلیکیشنهای وب تعاملی و غنی هستند.
Gemini 2.5 Flash در جدول رتبه بندی برنامه نویسی WebDev Arena با امتیاز ELO 1415 پیشتاز است و در تمام معیارهای LMArena، که ترجیحات انسانی را ارزیابی می کند، رتبه اول را کسب کرده است. این مدل با قابلیت بودجه تفکر (thinking budgets) به توسعه دهندگان امکان میدهد تا تعادل بین هزینه، کیفیت و تأخیر را کنترل کنند.
قابلیتهای جدید: شفافیت و تعامل پیشرفته

یکی از نوآوریهای کلیدی معرفی شده در I/O 2025، ویژگی Thought Summaries در API Gemini و Vertex AI است. این قابلیت، فرآیند تفکر مدل را بهصورت ساختاریافته با سرفصلها و جزئیات کلیدی ارائه میدهد، که درک و رفع اشکال تعاملات با مدل را برای توسعه دهندگان و کاربران آسانتر میکند. این شفافیت به ویژه برای برنامههای پیچیدهای که نیاز به دقت بالا دارند، ارزشمند است.
علاوه بر این، Live API گوگل اکنون نسخه پیش نمایش ورودی صوتی-تصویری و خروجی صوتی بومی را ارائه میدهد که امکان ایجاد مکالمات طبیعیتر را فراهم میکند. کاربران میتوانند تن صدا، لهجه و سبک گفتار مدل را تنظیم کنند، مثلاً از آن بخواهند داستان را با صدایی دراماتیک روایت کند. قابلیتهایی مانند گفتوگوی عاطفی (Affective Dialogue)، که احساسات کاربر را تشخیص میدهد، و پاسخ گویی هوشمند در برابر نویزهای پسزمینه، تجربه کاربری را به سطح جدیدی ارتقا دادهاند.
کاربردهای خلاقانه و مسئولانه
گوگل در I/O 2025 نشان داد که چگونه Gemini 2.5 میتواند در زمینههای خلاقانه مانند توسعه بازیهای ویدیویی و ساخت اپلیکیشن های وب بدرخشد. این مدل قادر است با دریافت یک خط دستور، کد اجرایی برای یک بازی ویدیویی تولید کند و در معیار SWE-Bench Verified، استاندارد صنعت برای ارزیابی کدگذاری، امتیاز ۶۳.۸٪ را کسب کرده است.
گوگل همچنین بر تعهد خود به توسعه هوش مصنوعی مسئولانه تأکید کرد. به روزرسانیهای امنیتی Gemini 2.5 آن را به یکی از امن ترین مدلهای این شرکت تبدیل کرده است. جزئیات بیشتر در این زمینه در وبلاگ Google DeepMind و کارت مدل بهروزشده Gemini 2.5 Pro در دسترس است.
دسترسی و آینده
Gemini 2.5 Pro Experimental هم اکنون برای توسعه دهندگان در Google AI Studio و برای کاربران Gemini Advanced از طریق منوی انتخاب مدل در دسترس است. این مدل در هفتههای آینده در Vertex AI نیز عرضه خواهد شد. Gemini 2.5 Flash نیز به زودی برای عموم کاربران و شرکتها در دسترس قرار میگیرد.
گوگل با دریافت بازخورد کاربران و توسعه دهندگان، به بهبود سریع این مدلها ادامه میدهد تا آنها را به ابزاری مفیدتر و قدرتمندتر تبدیل کند. این پیشرفتها نهتنها تجربه کاربری را بهبود میبخشند، بلکه راه را برای کاربردهای نوآورانه در آموزش، برنامه نویسی و خلاقیت هموار میکنند.

نتیجه گیری
رونمایی از Gemini 2.5 در Google I/O 2025 نقطه عطفی در مسیر پیشرفت هوش مصنوعی است. با قابلیتهایی مانند استدلال پیشرفته، پشتیبانی چندرسانهای و شفافیت در فرآیند تفکر، این مدلها آمادهاند تا نحوه تعامل ما با فناوری را بازتعریف کنند. از آموزش گرفته تا توسعه نرمافزار و خلق محتوای خلاقانه، Gemini 2.5 نشان دهنده تعهد گوگل به ساخت هوش مصنوعی است که نه تنها قدرتمند، بلکه مفید، امن و دسترسپذیر برای همه است. آینده هوش مصنوعی با Gemini 2.5 روشنتر از همیشه به نظر می رسد.
منبع :
[1] Gemini 2.5: Our most intelligent models are getting even better - google