توضیحات
در دنیای ابزارهای تولید تصویر که بر پایه نوشتن متنهای طولانی (Prompt Engineering) میچرخند، گوگل با معرفی ابزاری از دل بخش Google Labs خود، قواعد بازی را تغییر داد. این ابزار که پیش از این با نام Whisk شناخته میشد (و اکنون هسته اصلی تولید تصویر در Google Flow است)، یک رویکرد کاملاً مبتنی بر تصویر (Image-to-Image) را به کاربران ارائه میدهد. چرا Whisk / Flow با سایر ابزارها متفاوت است؟ در اکثر تولیدکنندههای تصویر مثل Midjourney یا DALL-E، شما مجبورید تمام جزئیات بصری را به کلمه تبدیل کنید؛ کاری که گاهی سخت و محدودکننده است. اما در این پلتفرم، نیازی به کلمات نیست. این ابزار به شما اجازه میدهد تا با آپلود کردن چند عکس مختلف، آنها را با هم «مخلوط» (Whisk) کنید و یک ترکیب مفهومی و کاملاً جدید بسازید. این سیستم از دو موتور قدرتمند گوگل قدرت میگیرد: ابتدا مدلهای زبانی سری Gemini وارد عمل شده و ماهیت مفهومی و منطقی هر عکس (مثلاً “این یک گربه است”، “این یک فضای سایبرپانک است” یا “این یک نقاشی آبرنگ است”) را درک میکنند. سپس این اطلاعاتِ استخراجشده به موتور تولید تصویر Imagen 3 منتقل میشود تا یک خروجی یکپارچه، باکیفیت و منطقی خلق کند. این ابزار کپیپیست (Collage) نمیکند؛ بلکه مفاهیم را در هم میآمیزد تا خروجی نهایی، هم دارای سوژه مورد نظر شما باشد، هم در فضای درست قرار بگیرد و هم دقیقاً همان استایل هنری (مثلاً سهبعدی یا مینیمال) را بازتاب دهد.

کاربرد های اصلی
- توسعه کانسپت سریع (Rapid Ideation): هنرمندان، طراحان محصول و کارگردانان هنری میتوانند با ترکیب تصاویر مرجع (Reference Images)، ایدههای بصری را در چند ثانیه مدلسازی کنند و نیازی به مهندسی پرامپت نداشته باشند.
- انتقال استایل (Style Transfer): حفظ ساختار یک عکس و اعمال یک استایل کاملاً متفاوت (مثلاً تبدیل عکس واقعی یک خانه به یک مدل سهبعدی گلسمورفیسم).
- خلق فضاهای ناممکن: ترکیب سوژههای روزمره با محیطهای سورئال برای تولید محتوای شبکههای اجتماعی یا کانسپتهای تبلیغاتی.
دیدگاه و نظرات
نظر خود را برای ما بنویسید
برای ثبت نظر ثبتنام کنید یا وارد حساب کاربری خود شوید.
ورود / ثبتنام