جستجو
illustrationsهنوز چیزی جستجو نکردی !

نانو بنانا پرو معرفی شد؛ با قابلیت نوشتن متن فارسی روی عکس!

اخبار هوش مصنوعی
تحریریه ایایا
تاریخ به روزرسانی: ۱۴۰۴/۹/۲
نانو بنانا پرو معرفی شد؛ با قابلیت نوشتن متن فارسی روی عکس!

گوگل بالاخره برگ برنده خودش، مدل هوش مصنوعی Nano Banana Pro را معرفی کرد. این مدل فقط یک آپدیت برای افزایش کیفیت ساخت تصاویر نیست؛ بلکه دو باگ اصلی تمام مدل‌های هوش مصنوعی ساخت عکس فعلی یعنی نوشتن متن (مخصوصا فارسی) و رعایت منطق پیچیده در عکس‌ها را هدف گرفته است. برخلاف مدل‌های مرسوم ساخت عکس که صرفاً پیکسل‌ها را حدس می‌زدند، این مدل اول درباره درخواست شما فکر می‌کند، اطلاعات لازم را چک می‌کند و بعد خروجی می‌دهد.

تایپوگرافی و متن: رفع باگ نوشتن متن‌های فارسی کج‌وکوله

بزرگترین مزیت هوش مصنوعی نانو بنانا پرو، حل مشکل نوشتن متن روی عکس است. دیگر لازم نیست نگران حروف عجیب‌وغریب، درهم‌ریخته یا ناخوانا باشید. این مدل متن را با وضوح کامل رندر می‌کند، فرقی هم نمی‌کند تیتر درشت باشد یا نوشته‌های ریز روی برچسب یک محصول. البته تا به امروز هوش مصنوعی Ideogram به خوبی متن‌ها را روی عکس می‌نوشت. اما مهم‌ترین تفاوت Nano Banana Pro نوشتن متن با زبان فارسی روی عکس است.

پشتیبانی واقعی از فارسی: برخلاف اکثر مدل‌های هوش مصنوعی ساخت عکس، این مدل به خوبی می‌تواند فونت‌های رسمی و استاندارد یا حتی دستخط روان (مثلاً نوشتن با خودکار سیاه روی پوست موز) فارسی را بدون به‌هم‌ریختگی روی عکس بنویسد. تنها چند ساعت پس از انتشار Nano Banana Pro در شبکه‌های اجتماعی، کاربران ایرانی حجم زیادی از تصاویر با عکس‌هایی که متن فارسی روی آن‌ها هست را ساختند و به اشتراک گذاشتند.

این قابلیت عملاً کار کارشناس‌های تولید محتوا و گرافیست‌ها را راحت می‌کند. حالا می‌توانید مستقیماً خروجی‌هایی مثل اینفوگرافیک‌های فارسی، بنر و پوسترهای تبلیغاتی یا استوری‌بورد بگیرید که متن‌هایشان نیاز به ویرایش در فتوشاپ ندارد.

قابلیت استدلال بصری: ساخت چارت‌های دقیق با دیتای واقعی

تا قبل از این، اگر از هوش مصنوعی نمودار می‌خواستید، خطوط و اعداد فانتزی و بی‌معنی تحویل می‌گرفتید. نانو بنانا پرو این بازی را تغییر داده است.

  • اتصال به اینترنت: این مدل می‌تواند به اینترنت وصل شود، دیتای واقعی مثل گزارش‌های مالی شرکت‌ها یا آمار جهانی را بگیرد و آن را به نمودار یا اینفوگرافیک دقیق با مقیاس درست تبدیل کند.
  • خلاصه کردن تصویری اطلاعات: یک قابلیت کاربردی برای دانشجویان و تحلیل‌گران؛ می‌توانید یک فایل طولانی مثل مقاله ۹۰ صفحه‌ای را به آن بدهید تا کل محتوا را روی یک تخته وایت‌بورد خلاصه و ترسیم کند.
  • نقشه‌های فنی: تولید نقشه‌های انفجاری برای قطعات صنعتی و دیاگرام‌های آموزشی با دقت مهندسی بالا، حالا ممکن شده است.

ویرایش عکس بدون به‌هم‌ریختن کل تصویر با نانو بنانا

مشکل همیشگی کاربران، شانسی بودن خروجی مدل‌های هوش مصنوعی عکس ساز بود. این مدل کنترل را به شما برمی‌گرداند و اجازه می‌دهد اجزای تصویر را بدون خراب شدن کلیت آن تغییر دهید.

  • ثبات شخصیت‌ها: حفظ چهره و لباس کاراکتر در شات‌های مختلف حالا بسیار دقیق‌تر شده است. می‌توانید یک کاراکتر ثابت بسازید و او را در موقعیت‌های مختلف مثل موج‌سواری یا جلسه کاری قرار دهید بدون اینکه قیافه‌اش عوض شود.
  • تغییر متن در صحنه: می‌توانید متن روی یک بیلبورد در پس‌زمینه را عوض کنید یا منوی یک رستوران را داخل همان عکس به زبان دیگری ترجمه کنید.
  • اصلاح اطلاعات اشتباه: اگر در تصویر یک نمودار عددی اشتباه است، مدل می‌تواند عدد را تغییر دهد و ارتفاع نمودار را هم متناسب با عدد جدید اصلاح کند.
  • ساخت جمعیتی از آدم‌ها بدون بهم ریختگی چهره: در ساخت عکس‌های گروهی، مدل تا ۵ نفر را عالی و منسجم نگه می‌دارد و چهره‌ها دفرمه نمی‌شوند.

در چه پلتفرم‌هایی به Nano Banana Pro دسترسی دارید؟

با توجه به اینکه Nano Banana Pro بر پایه هوش مصنوعی Gemini 3 ساخته شده است، تقریبا در اغلب پلتفرم‌های گوگل حتی در Google Slide و NoteBookLM هم به این مدل دسترسی دارید. در وب‌سایت جمنای می‌توانید به راحتی از این مدل استفاده کنید.

نکته جالب، همکاری با ادوبی است. مدل هوش مصنوعی نانو بنانا پرو به فتوشاپ هم اضافه شده و گرافیست‌ها می‌توانند داخل محیط فتوشاپ از آن استفاده کنند. البته این کار برایتان کردیت (اعتبار) هزینه می‌کند و فعلاً خروجی فتوشاپ روی رزولوشن پایین‌تر قفل شده است. توسعه‌دهنده‌ها هم می‌توانند از طریق Google AI Studio به API مدل دسترسی داشته باشند.

نقطه ضعف‌ها: چه عکس‌هایی را نباید از نانو بنانا پرو بخواهید؟

با تمام این پیشرفت‌ها، نانو بنانا پرو هنوز کامل نیست و چند جا کم می‌آورد:

  • ساعت‌های آنالوگ: هنوز نمی‌تواند عقربه‌های ساعت را دقیق تنظیم کند. اگر بگویید ساعت ۱۱:۱۵ را نشان بده، احتمالاً نتیجه چیز دیگری خواهد بود.
  • متون خیلی ریز: در حالی که تیترها عالی هستند، نوشته‌های بسیار ریز روی قوطی نوشابه یا برچسب دارو هنوز ممکن است کج و کوله نمایش داده شود.
  • دیتای جغرافیایی: با اینکه به وب وصل است، نباید برای جهت‌گیری دقیق ساختمان‌ها یا نقشه‌های GPS صددرصد به آن اعتماد کنید.

بررسی بنچمارک‌های ارائه شده از Nano Banana Pro

برای اینکه مطمئن شویم نتایج به دست آمده از Nano Banana Pro صرفا یک هیاهوی تبلیغاتی نیست، نتایج تست‌های فنی و بنچمارک‌های مستقل این مدل را در برابر رقبایی مثل Midjourney v6 و DALL-E 3 زیر ذره‌بین بردیم. اعداد شوکه‌کننده هستند.