در کنفرانس گوگل I/O 2025، گوگل در مورد چگونگی پیشرفت ها در هوش مصنوعی و به کارگیری آن در محصولات صحبت کرد. به روزرسانی های عمده ای برای اپلیکیشن Gemini، ابزارهای هوش مصنوعی مولد و هر چیزی که در این بین قرار دارد، در راه است - از جمله پیشرفت های واقعاً باورنکردنی که در مدل های هوش مصنوعی خود (و روشهای جدید دسترسی به آنها) به دست می آورد.
این مقاله ادامه ای بر مقاله قبلی است که 50 مورد اول از 100 اعلامیه کنفرانس I/O را پوشش داد و حالا به بررسی 50 اعلامیه بعدی میپردازد.
- برای آسان تر کردن شناسایی محتوای تولید شده توسط هوش مصنوعی برای افراد و سازمان ها، ما SynthID Detector را معرفی کردیم، یک پورتال تأیید که به شناسایی سریع و کارآمد محتوایی که با SynthID علامت گذاری شده کمک می کند.
- از زمان راه اندازی، SynthID بیش از 10 میلیارد قطعه محتوا را علامت گذاری کرده است.
- ما شروع به عرضه پورتال SynthID Detector برای گروهی از آزمایش کنندگان اولیه کرده ایم. روزنامه نگاران، متخصصان رسانه ای و محققان می توانند برای دسترسی به SynthID Detector در لیست انتظار ثبت نام کنند.
- ما در حال کار برای گسترش بهترین مدل چندوجهی خود، جمینی 2.5 Pro، به یک "مدل جهانی" هستیم که بتواند با درک و شبیه سازی جنبه های مختلف جهان، برنامه ریزی کند و تجربیات جدیدی را تصور کند، مشابه عملکرد مغز.
- به روزرسانی های پروژه آسترا، نمونه اولیه تحقیقاتی ما که قابلیت های یک دستیار هوش مصنوعی جهانی را کاوش می کند، شامل خروجی صوتی طبیعی تر با صدا، بهبود حافظه و کنترل کامپیوتر است. به مرور این قابلیت های جدید به جمینی Live، API زنده برای توسعه دهندگان و فرم های جدیدی مانند عینک های Android XR آورده خواهد شد.
- به عنوان بخشی از تحقیقات پروژه آسترا، ما با سرویس تفسیر بصری Aira همکاری کردیم تا نمونه اولیه ای بسازیم که به افراد نابینا و کم بینا در انجام کارهای روزمره کمک کند و مهارت ها و ابزارهایی که آنها قبلاً استفاده می کنند را تکمیل کند.

- با پروژه آسترا، ما در حال آزمایش یک معلم گفت و گویی هستیم که می تواند در تکالیف به شما کمک کند. این معلم نه تنها می تواند همراه با کار شما پیش برود، بلکه می تواند مسائل را مرحله به مرحله توضیح دهد، اشتباهات را شناسایی کند و حتی نمودارهایی برای توضیح مفاهیم در صورت گیر کردن شما ایجاد کند.
- این تجربه تحقیقاتی اواخر امسال به محصولات گوگل می آید و آزمایش کنندگان مورد اعتماد اندروید می توانند برای پیش نمایش در لیست انتظار ثبت نام کنند.
- ما نگاهی به اولین دستگاه Android XR که اواخر امسال عرضه می شود انداختیم: پروژه موهان سامسونگ. این هدست تجربه های فراگیری را روی یک صفحه بی نهایت ارائه خواهد داد.
- همچنین پیش نمایشی از نحوه عملکرد جمینی روی عینک های Android XR در سناریوهای واقعی، از جمله پیام رسانی به دوستان، تعیین قرار ملاقات، درخواست مسیرهای گام به گام، گرفتن عکس و موارد دیگر را به اشتراک گذاشتیم.
- حتی ترجمه زبان زنده بین دو نفر را نمایش دادیم که پتانسیل این عینک ها برای شکستن موانع زبانی را نشان می دهد.
- عینک های نمونه اولیه Android XR اکنون در دست آزمایش کنندگان مورد اعتماد است که به ما کمک می کنند تا مطمئن شویم محصولی واقعاً کمک کننده می سازیم و این کار را به گونه ای انجام می دهیم که حریم خصوصی شما و اطرافیانتان را رعایت کند.
- علاوه بر این، ما با برندهای نوآورانه عینک سازی مانند Gentle Monster و Warby Parker همکاری می کنیم تا عینک هایی با Android XR بسازیم که بخواهید تمام روز آن ها را بپوشید.
- ما همکاری خود با سامسونگ را برای گسترش Android XR به عینک ها، فراتر از هدست ها، پیش می بریم. با هم، یک پلتفرم نرم افزاری و سخت افزاری مرجع ایجاد می کنیم که اکوسیستم را قادر به ساخت عینک های عالی می کند. توسعه دهندگان می توانند اواخر امسال برای این پلتفرم شروع به ساخت کنند.
- چند سال پیش، پروژه استارلاین را معرفی کردیم، پروژه ای تحقیقاتی که گفت و گوهای از راه دور را با فناوری ویدیوی سه بعدی ممکن می کرد تا حس حضور دو نفر در یک اتاق را ایجاد کند. حالا، این پروژه به پلتفرم جدیدی به نام Google Beam تبدیل شده است.
- ما با Zoom و HP همکاری می کنیم تا اولین دستگاه های Google Beam را اواخر امسال برای مشتریان منتخب به بازار بیاوریم. همچنین با رهبران صنعت مانند Zoom، Diversified و AVI-SPL همکاری می کنیم تا Google Beam را به کسب و کارها و سازمان های سراسر جهان بیاوریم.

- حتی اولین محصولات Google Beam از HP را در نمایشگاه InfoComm طی چند هفته آینده خواهید دید.
- ما ترجمه گفتار را معرفی کردیم که اکنون در Google Meet در دسترس است. این ویژگی ترجمه نه تنها به صورت تقریباً بلادرنگ انجام می شود، به لطف هوش مصنوعی گوگل، بلکه می تواند کیفیت، لحن و بیان صدای فرد را حفظ کند. گفت و گوی روان به افراد امکان می دهد یکدیگر را درک کنند و بدون مانع زبانی احساس ارتباط کنند.
- بیش از 7 میلیون توسعه دهنده با جمینی در حال ساخت هستند، پنج برابر بیشتر از سال گذشته در همین زمان.
- استفاده از جمینی در Vertex AI نسبت به سال گذشته 40 برابر افزایش یافته است.
- ما پیش نمایش های جدیدی برای تبدیل متن به گفتار در 2.5 Pro و 2.5 Flash منتشر می کنیم. این ها از پشتیبانی اولین بار برای چند گوینده برخوردارند و امکان تبدیل متن به گفتار با دو صدا از طریق خروجی صوتی بومی را فراهم می کنند. مانند گفت و گوی صوتی بومی، تبدیل متن به گفتار بیانگر است و می تواند تفاوت های ظریف مانند نجوا را ضبط کند. این در بیش از 24 زبان کار می کند و به صورت یکپارچه بین آن ها جا به جا می شود.
- API زنده نسخه پیش نمایشی از ورودی صوتی - تصویری و گفت و گوی خروجی صوتی بومی را معرفی می کند، بنابراین می توانید مستقیماً تجربه های گفت و گویی بسازید.
- همین حالا امتحان کنید! Jules یک عامل موازی و ناهمگام برای مخازن GitHub شما است که به بهبود و درک کد شما کمک می کند. اکنون در نسخه بتا برای همه توسعه دهندگان باز است. با Jules می توانید چندین مورد از backlog و وظایف کدنویسی را به طور هم زمان واگذار کنید و حتی یک مرور صوتی از تمام به روزرسانی های اخیر کد خود دریافت کنید.
- Gemma 3n جدیدترین مدل چندوجهی باز و کارآمد ماست که برای اجرا روی گوشی ها، لپ تاپ ها و تبلت ها طراحی شده است. این مدل صدا، متن، تصویر و ویدئو را مدیریت می کند. عرضه اولیه در Google AI Studio و Google Cloud در جریان است و برنامه هایی برای گسترش به ابزارهای منبع باز در هفته های آینده وجود دارد.
- همین حالا امتحان کنید! Google AI Studio حالا دارای رابط کاربری تمیزتر، مستندات یکپارچه، داشبوردهای استفاده، اپلیکیشن های جدید و یک تب جدید Generate Media برای کاوش و آزمایش با مدل های مولد پیشرفته ما، از جمله Imagen، Veo و تولید تصویر بومی است.

- Colab به زودی یک تجربه کاملاً عامل محور خواهد بود. کافی است به Colab بگویید چه چیزی می خواهید به دست آورید و ببینید که چگونه در نوت بوک شما اقدام می کند، خطاها را برطرف می کند و کد را تغییر می دهد تا به شما کمک کند مشکلات سخت را سریع تر حل کنید.
- SignGemma یک مدل باز آینده است که زبان اشاره را به متن گفتاری ترجمه می کند (بهترین عملکرد در زبان اشاره آمریکایی به انگلیسی)، و توسعه دهندگان را قادر می سازد تا اپلیکیشن ها و ادغام های جدیدی برای کاربران ناشنوا و کم شنوا ایجاد کنند.
- MedGemma پیشرفته ترین مدل باز ما برای درک متن و تصویر پزشکی چندوجهی است که برای توسعه دهندگان طراحی شده تا برنامههای سلامت خود را، مانند تحلیل تصاویر پزشکی، تطبیق دهند و بسازند. MedGemma اکنون به عنوان بخشی از Health AI Developer Foundations در دسترس است.
- Stitch یک ابزار جدید مجهز به هوش مصنوعی است که طرح های رابط کاربری با کیفیت بالا و کد فرانت اند مربوطه را برای دسکتاپ و موبایل با استفاده از توضیحات زبان طبیعی یا درخواست های تصویری تولید میکند.
- همین حالا امتحان کنید! ما Journeys را در Android Studio معرفی کردیم که به توسعه دهندگان امکان می دهد سفرهای کاربری حیاتی را با استفاده از جمینی با توصیف مراحل آزمایش به زبان طبیعی آزمایش کنند.
- عامل ارتقاء نسخه در Android Studio به زودی برای به روزرسانی خودکار وابستگی ها به آخرین نسخه سازگار، تجزیه یادداشت های انتشار، ساخت پروژه و رفع هرگونه خطا عرضه خواهد شد.
- ما به روزرسانی های جدیدی در API Google Pay معرفی کردیم که برای کمک به توسعه دهندگان در ایجاد تجربه های پرداخت روان تر، ایمن تر و موفق تر طراحی شده اند، از جمله Google Pay در WebViews اندروید.
- Flutter 3.32 دارای ویژگی های جدیدی است که برای تسریع توسعه و بهبود اپلیکیشن ها طراحی شده اند.
- ما به روزرسانی هایی برای کیت توسعه عامل (ADK)، موتور عامل Vertex AI و پروتکل (Agent2Agent (A2A که تعامل بین چندین عامل را ممکن می سازد، به اشتراک گذاشتیم.
- همین حالا امتحان کنید! پیش نمایش توسعه دهنده برای Wear OS 6، Material 3 Expressive، ابزارهای توسعه دهنده به روز شده برای Watch Faces، کنترل های رسانه ای غنی تر و Credential Manager برای احراز هویت را معرفی می کند.
- همین حالا امتحان کنید! ما اعلام کردیم که Gemini Code Assist برای افراد و Gemini Code Assist برای GitHub به صورت عمومی در دسترس هستند و توسعه دهندگان می توانند در کمتر از یک دقیقه شروع کنند. جمینی 2.5 حالا نسخه های رایگان و پولی Gemini Code Assist را تقویت می کند، عملکرد کدنویسی پیشرفته ای ارائه می دهد و به توسعه دهندگان کمک می کند تا در وظایفی مانند ایجاد اپلیکیشن های وب بصری جذاب، تبدیل و ویرایش کد برتری پیدا کنند.

- در اینجا یک نمونه از به روزرسانی اخیر است که می توانید در Gemini Code Assist کاوش کنید: به سرعت از جایی که متوقف شده اید ادامه دهید و با تاریخچه چت و موضوعات به جهت های جدید بپردازید.
- Firebase ویژگی ها و ابزارهای جدیدی را اعلام کرد تا به توسعه دهندگان کمک کند اپلیکیشن های مجهز به هوش مصنوعی را راحت تر بسازند، از جمله به روزرسانی هایی برای Firebase Studio که اخیراً راه اندازی شده و Firebase AI Logic که به توسعه دهندگان امکان می دهد هوش مصنوعی را سریع تر در اپلیکیشن های خود ادغام کنند.
- ما همچنین یک انجمن توسعه دهندگان جدید Google Cloud و NVIDIA را معرفی کردیم، یک فروم اختصاصی برای ارتباط با کارشناسان هر دو شرکت.
- ما Google AI Edge Portal را در پیش نمایش خصوصی معرفی کردیم، یک راه حل جدید از Google Cloud برای آزمایش و بنچمارک یادگیری ماشین روی دستگاه در مقیاس بزرگ.
- جیمیل پاسخ های هوشمند شخصی سازی شده جدیدی دریافت می کند که زمینه و لحن شما را در بر می گیرد. آن ها از ایمیل ها و فایل های گذشته شما در Drive استفاده می کنند تا پاسخی را پیش نویس کنند و در عین حال لحن معمول شما را تطبیق می دهند تا پاسخ ها شبیه شما به نظر برسند. این را اواخر امسال امتحان کنید.
- همین حالا امتحان کنید! Google Vids اکنون برای کاربران Google AI Pro و Ultra در دسترس است.
- همین حالا امتحان کنید! از امروز، ما اپلیکیشن NotebookLM را در Play Store و App Store در دسترس قرار می دهیم تا به کاربران کمک کند Audio Overviews را در حال حرکت دریافت کنند.
- همچنین برای NotebookLM، ما انعطاف پذیری بیشتری به Audio Overviews می آوریم و به شما امکان می دهیم طول ایده آل برای خلاصه های خود را انتخاب کنید، چه یک مرور سریع بخواهید و چه کاوش عمیق تر.
- مرورهای ویدیویی به زودی به NotebookLM می آیند و به شما کمک می کنند تا اطلاعات متراکم مانند PDFها، اسناد، تصاویر، نمودارها و نقل قول های کلیدی را به مرورهای روایت شده قابل هضم تر تبدیل کنید.
- ما حتی یکی از نوت بوک های NotebookLM خود را با شما به اشتراک گذاشتیم — که شامل چند پیش نمایش از مرورهای ویدیویی بود!

- آزمایش جدید Labs ما به نام Sparkify به شما کمک می کند سؤالات خود را به یک ویدیوی انیمیشنی کوتاه تبدیل کنید که با استفاده از آخرین مدل های جمینی و Veo ممکن شده است. این قابلیت ها اواخر امسال به محصولات گوگل می آیند، اما در حال حاضر می توانید برای فرصت امتحان آن در لیست انتظار ثبت نام کنید.
- ما همچنین بر اساس بازخورد شما بهبودهایی به Learn About، یک آزمایش در Labs که در آن هوش مصنوعی گفت و گویی با کنجکاوی شما ملاقات می کند، می آوریم.
- همان طور که سوندار در سخنرانی افتتاحیه خود به اشتراک گذاشت، مردم بیش از پیش هوش مصنوعی را پذیرفته اند. به عنوان یک نمونه: سال گذشته در این زمان، ما ماهانه 9.7 تریلیون توکن را در محصولات و API های خود پردازش می کردیم. حالا، بیش از 480 تریلیون — 50 برابر بیشتر.
- با توجه به این، جای تعجب نیست که کلمه "AI" در طول سخنرانی کلیدی 92 بار گفته شد. اما تعداد "AI"هایی که شنیدیم در واقع در جایگاه دوم قرار گرفت — بعد از جمینی!
جمع بندی
این بخش از مقاله 50 اعلامیه بعدی از کنفرانس I/O را پوشش داد، با تمرکز بر پیشرفت های هوش مصنوعی در زمینه هایی مانند شناسایی محتوای تولید شده توسط هوش مصنوعی، فناوری های واقعیت گسترده (XR)، ابزارهای توسعه دهنده، و تجربه های گفت و گویی و چندوجهی. از SynthID Detector و Google Beam تا ابزارهای جدید مانند Jules و Stitch، گوگل در حال گسترش مرزهای فناوری برای بهبود تجربه های کاربری و توسعه دهندگان است. برای مطالعه 50 اعلامیه قبلی، لطفاً به مقاله پارت اول مراجعه کنید.
خدمات ابری و سرورهای پرسرعت صفر و یک
آیا به دنبال راه حلهای مطمئن و سریع برای میزبانی وب سایت یا برنامه های خود هستید؟ با خدمات سرور ابری، سرور مجازی، سرور اختصاصی، پهنای باند اختصاصی و کولوکیشن شرکت صفر و یک، شما میتوانید به راحتی نیازهای خود را برآورده کنید!
ما با ارائه سرورهای قدرتمند و امن، به شما این امکان را میدهیم که بدون نگرانی از مشکلات فنی، بر روی کسب و کار خود تمرکز کنید. با خدمات ما، میتوانید از سرعت بالا و پشتیبانی 24 ساعته بهره مند شوید!
برای خرید تماس بگیرید و اطلاعات لازم را کسب کنید.