لیست مطالب
در کنفرانس سالانه توسعه دهندگان گوگل (I/O 2025)، جمینای (Gemini) بدون شک ستاره اصلی رویداد بود. گوگل با معرفی مجموعه ای از به روزرسانی های گسترده و قابلیت های پیشگامانه، چشم انداز خود را برای تبدیل جمینای به شخصی ترین، قدرتمندترین و پیش فعال ترین دستیار هوش مصنوعی جهان به نمایش گذاشت. این آپدیت ها شامل قابلیت های تعاملی زنده، مدل های تولید تصویر و ویدیوی پیشرفته، ابزارهای پژوهشی عمیق تر و پلن های اشتراکی جدیدی است که تجربه کاربری را در تمام سطوح بازتعریف می کند.
تعامل زنده و چندرسانه ای: چشم و گوش جدید جمینای
یکی از بزرگ ترین و هیجان انگیزترین رونمایی ها، عرضه عمومی و رایگان قابلیت Gemini Live برای تمام کاربران اندروید و iOS بود. این ویژگی به کاربران اجازه می دهد تا با استفاده از دوربین گوشی خود، هر چیزی را به جمینای نشان دهند و به صورت صوتی و زنده با آن گفتگو کنند. این قابلیت، مرزهای تعامل متنی را از بین برده و به کاربران امکان می دهد تا برای حل مشکلات فنی (مانند تعمیر یک وسیله)، دریافت مشاوره خرید یا هر وظیفه بصری دیگری، کمک آنی و تصویری دریافت کنند. طبق آمار گوگل، مکالمات در حالت Live به طور متوسط پنج برابر طولانی تر از مکالمات متنی است که نشان دهنده جذابیت و کارایی بالای آن است. در هفته های آینده، این قابلیت با اپلیکیشن های کلیدی گوگل مانند Calendar، Maps، Tasks و Keep یکپارچه تر خواهد شد تا به یک دستیار واقعی در برنامه ریزیهای روزمره تبدیل شود.
در کنار تعامل زنده، گوگل از دو مدل تولید محتوای چندرسانه ای جدید و قدرتمند خود رونمایی کرد. مدل Imagen 4 که اکنون در اپلیکیشن جمینای تعبیه شده، به دلیل کیفیت خیره کننده تصاویر، جزئیات واقع گرایانه و توانایی بسیار بهتر در رندر کردن متن و تایپوگرافی در داخل تصاویر شناخته می شود. این مدل برای طراحی های حرفه ای، گرافیک های شبکه های اجتماعی و دعوت نامه ها ابزاری ایده آل است.
شگفت انگیز تر از آن، مدل Veo 3 بود؛ یک مدل تولید ویدیوی پیشرفته که برای اولین بار در جهان از قابلیت تولید بومی صدا پشتیبانی می کند. کاربران می توانند با یک دستور متنی ساده، نه تنها یک صحنه ویدیویی، بلکه افکت های صوتی، صداهای پس زمینه محیطی و حتی دیالوگ بین شخصیت ها را نیز تولید کنند. این قابلیت تجربه ای کاملاً فراگیر و سینمایی ایجاد می کند و در حال حاضر برای مشترکین پلن Google AI Ultra در دسترس است.

ابزارهای پژوهشی و خلاقیت بی حد و مرز
گوگل با به روزرسانی ابزارهای Deep Research و Canvas، قدرت تحلیل و خلاقیت را به سطح جدیدی رسانده است. قابلیت Deep Research اکنون به کاربران اجازه می دهد تا منابع خصوصی خود مانند فایل های PDF و تصاویر را آپلود کرده و آن ها را با داده های عمومی وب ترکیب کنند. این ویژگی به یک پژوهشگر بازار امکان می دهد تا گزارش های فروش داخلی خود را با روندهای بازار جهانی مقایسه کند یا به یک محقق دانشگاهی کمک می کند تا مقالات کمیاب را به مرور ادبیات خود اضافه نماید. به زودی، امکان اتصال به گوگل درایو و جیمیل نیز برای دسترسی آسان تر به اطلاعات شخصی فراهم خواهد شد.
ابزار Canvas که به عنوان یک فضای خلاقیت در جمینای توصیف می شود، با قدرت مدل های جدید Gemini 2.5، هوشمندتر و کارآمدتر شده است. کاربران می توانند اینفوگرافیک های تعاملی، آزمون های آموزشی و حتی پادکست های صوتی (Audio Overviews) به ۴۵ زبان زنده دنیا تولید کنند. اما نقطه اوج قدرت این ابزار، توانایی آن در تبدیل ایده های پیچیده به کد های برنامه نویسی کاربردی با سرعت و دقت بالاست؛ مفهومی که از آن با عنوان "Vibe coding" یاد می شود و موانع ورود به دنیای نرم افزار را به شدت کاهش می دهد.

یکپارچه سازی، دسترس پذیری و پلنهای جدید
گوگل با ادغام جمینای در مرورگر کروم (برای مشترکین Pro و Ultra در آمریکا)، گام مهمی در جهت حضور همیشگی این دستیار برداشته است. این قابلیت به کاربران اجازه می دهد تا در حین وب گردی، به سرعت اطلاعات پیچیده را خلاصه یا سوالات خود را مطرح کنند. همچنین، با معرفی آزمون های تعاملی برای دانشجویان و ارائه یک سال اشتراک رایگان پلن Google AI Pro به دانشجویان کالج در آمریکا، برزیل، ژاپن، اندونزی و بریتانیا، گوگل سرمایه گذاری ویژه ای روی بخش آموزش کرده است.
در نهایت، گوگل ساختار اشتراک های خود را با معرفی دو پلن جدید بازنگری کرد:
- (Google AI Pro ($19.99/month: این پلن جایگزین Gemini Advanced شده و مجموعه ای از ابزارهای هوش مصنوعی پیشرفته با محدودیت های استفاده بالاتر را ارائه می دهد.
- (Google AI Ultra ($249.99/month: این پلن پریمیوم برای پیشگامان و کاربران حرفه ای طراحی شده و بالاترین محدودیت استفاده، قوی ترین مدل ها (مانند Veo 3) و دسترسی زودهنگام به قابلیت های آزمایشی را فراهم می کند. مهم ترین ویژگی انحصاری این پلن، دسترسی به Agent Mode است؛ یک قابلیت آزمایشی که در آن کاربر فقط هدف نهایی را اعلام می کند و جمینای به طور هوشمند تمام مراحل پیچیده، از جمله وب گردی زنده و تحقیق عمیق را برای رسیدن به آن هدف، مدیریت و اجرا می کند.
این به روزرسانی ها در مجموع نشان می دهند که جمینای از یک چت بات ساده فراتر رفته و در حال تبدیل شدن به یک پلتفرم هوشمند یکپارچه است که در تمام جنبه های زندگی دیجیتال کاربران حضور خواهد داشت.
منبع:
Gemini gets more personal, proactive and powerful - google blog