لیست مطالب
مدل تصویرسازی و ویرایش پیشرفته Gemini 2.5 Flash Image که پیش تر توجه بسیاری را جلب کرده بود، اکنون به صورت عمومی در دسترس قرار گرفته و آماده استفاده در محیط های تولیدی است. این مدل با ویژگی های جدیدی همچون پشتیبانی از نسبت های ابعادی متنوع و امکان تولید خروجی صرفاً تصویری، ابزار قدرتمندی برای توسعه دهندگان و خلاقان در حوزه های مختلف به شمار می رود.
ویژگی های جدید Gemini 2.5 Flash Image
یکی از مهم ترین به روزرسانی های این نسخه، اضافه شدن ۱۰ نسبت ابعادی مختلف است که امکان ایجاد محتوا در فرمت های گوناگون را فراهم می کند. این نسبت ها شامل موارد زیر هستند:
منظره ای (Landscape): 21:9، 16:9، 4:3، 3:2
مربع (Square): 1:1
پرتره ای (Portrait): 9:16، 3:4، 2:3
انعطاف پذیر (Flexible): 5:4، 4:5
این تنوع در نسبتهای ابعادی، امکان تولید محتوا برای انواع پلتفرمها و رسانهها را با کیفیت بالا فراهم میآورد.
کاربردهای عملی و تجربیات کاربران
تیم Cartwheel با استفاده از ابزار 3D Pose Mode و مدل Gemini 2.5 Flash Image، سیستم جدیدی برای ایجاد تصاویر با کنترل دقیق شخصیتها و حفظ ثبات در زوایای مختلف دوربین توسعه داده است. این سیستم به هنرمندان اجازه می دهد تا بدون از دست دادن دقت در جزئیات، تصاویر با کیفیت بالا تولید کنند.
همچنین، تیم Volley با استفاده از این مدل، قابلیت ویرایش و تولید تصاویر در حین بازی را فراهم کردهاند که شامل پرترههای شخصیتها، صحنههای پویا و ویرایشهای سریع از طریق چت یا صدا میشود. این ویژگیها تجربه کاربری را در بازیهای تعاملی بهطور چشمگیری بهبود میبخشد.
در رویدادهای اخیر مانند هکاتونهای Kaggle و Cerebral Valley، صدها پروژه با استفاده از مدل Gemini 2.5 Flash Image در زمینههای مختلفی چون آموزش STEM، تبلیغات و واقعیت افزوده به نمایش درآمدند که نشاندهنده پتانسیل بالای این مدل در کاربردهای متنوع است.

دسترسی و قیمت گذاری
مدل Gemini 2.5 Flash Image از طریق API Gemini و Google AI Studio در دسترس توسعه دهندگان قرار دارد. همچنین، برای استفاده در محیطهای سازمانی، این مدل از طریق Vertex AI قابل دسترسی است. هزینه استفاده از این مدل به ازای هر تصویر 0.039 دلار و به ازای هر میلیون توکن خروجی 30 دلار تعیین شده است.
برای شروع کار با این مدل، توسعهدهندگان میتوانند از حالت "build mode" در Google AI Studio استفاده کنند که امکان ایجاد و آزمایش اپلیکیشنهای مبتنی بر هوش مصنوعی را با استفاده از یک دستور ساده فراهم میآورد. همچنین، کدهای تولید شده را میتوان مستقیماً در GitHub ذخیره یا بهصورت رایگان در AI Studio مستقر کرد.
نتیجه گیری
مدل Gemini 2.5 Flash Image با ویژگیهای جدید خود، ابزار قدرتمندی برای تولید و ویرایش تصاویر با کیفیت بالا در نسبتهای ابعادی متنوع فراهم میآورد. این مدل با قابلیتهای پیشرفته خود، پتانسیل بالایی برای استفاده در پروژههای خلاقانه و صنعتی دارد و میتواند به توسعهدهندگان در ایجاد تجربههای بصری نوآورانه کمک کند.
آیا کسب و کار شما برای بهره مندی از جدیدترین فناوری های هوش مصنوعی و اینترنت، به زیرساختی پایدار و پر سرعت نیاز دارد؟ در صفر و یک، ما با ارائه خدمات سرور اختصاصی ایران، سرور مجازی و اینترنت با پهنای باند اختصاصی و نامحدود، پایداری ۹۹٪ را برای فعالیت آنلاین شما تضمین می کنیم. با ما تماس بگیرید تا با مشاوره تخصصی، بهترین راهکار ارتباطی و میزبانی را متناسب با نیاز های سازمان شما ارائه دهیم. با صفر و یک، کیفیت خدمات ارتباطی خود را به سطحی بالاتر ببرید.
منبع :
[1] gemini-2-5-flash-image-now-ready-for-production-with-new-aspect-ratios-developers.googleblog