گوگل از مدل‌های هوش مصنوعی Imagen 3 و Veo برای تولید تصاویر و ویدیو رونمایی کرد

بوسیله تیم چیکاو در آذر 14, 1403

گوگل از مدل‌های هوش مصنوعی Imagen 3 و Veo برای تولید تصاویر و ویدیو رونمایی کرد - چیکاو

پلتفرم Vertex AI گوگل میزبان دو مدل جدید هوش مصنوعی به نام‌های Imagen 3 و Veo است. این مدل‌ها می‌توانند به‌صورت مستقل عمل کنند یا به‌طور همزمان با یکدیگر استفاده شوند. Imagen 3 قابلیت تولید تصویر بر اساس یک متن ورودی را دارد، در حالی که Veo می‌تواند یک تصویر ثابت را دریافت کرده و بر اساس ورودی متنی، آن را متحرک‌سازی کند.

قابلیت‌های Imagen 3

Imagen 3 نسبت به نسخه‌های قبلی خود پیشرفت‌های چشمگیری در جزئیات، نورپردازی و کاهش نویز دارد. این مدل از هفته آینده برای تمامی کاربران Vertex AI در دسترس خواهد بود. ویژگی‌های بیشتری برای کاربرانی که در لیست تأیید قرار دارند ارائه می‌شود، از جمله:

Inpainting: افزودن عناصر جدید به تصویر موجود.
Outpainting: گسترش تصویر فراتر از مرزهای اصلی.
Product Background: تغییر خودکار پس‌زمینه تصویر.

همچنین کسب‌وکارها می‌توانند تصاویر مرجع را همراه با متن ورودی ارائه دهند. با قابلیت Imagen 3 Customization، کاربران می‌توانند برند، سبک، لوگو، یا ویژگی‌های محصول خود را در تصاویر تولید شده وارد کنند.

امکانات Veo

Veo که اکنون در نسخه پیش‌نمایش خصوصی ارائه شده است، به کاربران اجازه می‌دهد یک تصویر ثابت را دریافت کرده و با ارائه دستورالعمل‌های صحنه، آن را متحرک کنند.

ویژگی‌های امنیتی

خروجی‌های هر دو مدل Imagen و Veo به کمک فناوری SynthID از DeepMind به‌صورت نامرئی واترمارک می‌شوند تا از سوءاستفاده به‌عنوان محتوای واقعی جلوگیری شود. فیلترهای ایمنی نیز مانع تولید محتوای آسیب‌زا توسط این هوش مصنوعی می‌شوند. علاوه بر این، گوگل تأکید کرده است که داده‌های کاربران برای آموزش این مدل‌ها استفاده نشده و از حقوق کپی‌رایت کاربران حمایت می‌کند.

گوگل هوش مصنوعی