گوگل از مدلهای هوش مصنوعی Imagen 3 و Veo برای تولید تصاویر و ویدیو رونمایی کرد
پلتفرم Vertex AI گوگل میزبان دو مدل جدید هوش مصنوعی به نامهای Imagen 3 و Veo است. این مدلها میتوانند بهصورت مستقل عمل کنند یا بهطور همزمان با یکدیگر استفاده شوند. Imagen 3 قابلیت تولید تصویر بر اساس یک متن ورودی را دارد، در حالی که Veo میتواند یک تصویر ثابت را دریافت کرده و بر اساس ورودی متنی، آن را متحرکسازی کند.
قابلیتهای Imagen 3
Imagen 3 نسبت به نسخههای قبلی خود پیشرفتهای چشمگیری در جزئیات، نورپردازی و کاهش نویز دارد. این مدل از هفته آینده برای تمامی کاربران Vertex AI در دسترس خواهد بود. ویژگیهای بیشتری برای کاربرانی که در لیست تأیید قرار دارند ارائه میشود، از جمله:
- Inpainting: افزودن عناصر جدید به تصویر موجود.
- Outpainting: گسترش تصویر فراتر از مرزهای اصلی.
- Product Background: تغییر خودکار پسزمینه تصویر.
همچنین کسبوکارها میتوانند تصاویر مرجع را همراه با متن ورودی ارائه دهند. با قابلیت Imagen 3 Customization، کاربران میتوانند برند، سبک، لوگو، یا ویژگیهای محصول خود را در تصاویر تولید شده وارد کنند.
امکانات Veo
Veo که اکنون در نسخه پیشنمایش خصوصی ارائه شده است، به کاربران اجازه میدهد یک تصویر ثابت را دریافت کرده و با ارائه دستورالعملهای صحنه، آن را متحرک کنند.
ویژگیهای امنیتی
خروجیهای هر دو مدل Imagen و Veo به کمک فناوری SynthID از DeepMind بهصورت نامرئی واترمارک میشوند تا از سوءاستفاده بهعنوان محتوای واقعی جلوگیری شود. فیلترهای ایمنی نیز مانع تولید محتوای آسیبزا توسط این هوش مصنوعی میشوند. علاوه بر این، گوگل تأکید کرده است که دادههای کاربران برای آموزش این مدلها استفاده نشده و از حقوق کپیرایت کاربران حمایت میکند.