گوگل قابلیت Gemini Avatar را گسترش داد؛ ساخت نسخه هوش مصنوعی از خودتان ممکن شد

گوگل در حال گسترش قابلیت جدید Gemini Avatar برای کاربران پولی سرویس Gemini است. این ویژگی به کاربران اجازه میدهد نسخهای دیجیتالی و مبتنی بر هوش مصنوعی از خود ایجاد کنند که بتواند در تولید ویدئوها و سایر محتواهای هوش مصنوعی مورد استفاده قرار گیرد.
قابلیت Gemini Avatar بر پایه مدل جدید Gemini Omni توسعه یافته است؛ مدلی که گوگل آن را یکی از پیشرفتهترین فناوریهای تولید محتوای چندرسانهای خود معرفی میکند. این سیستم میتواند ظاهر، صدا و نحوه صحبت کردن کاربران را شبیهسازی کرده و یک آواتار شخصیسازیشده بسازد.
کاربران برای فعالسازی این قابلیت باید از طریق تنظیمات اپلیکیشن Gemini وارد بخش Avatar شوند. در مرحله نخست، سیستم با استفاده از دوربین گوشی از زوایای مختلف چهره کاربر را اسکن میکند تا مدل دقیقی از ساختار صورت ایجاد شود. سپس در مرحله دوم، کاربر باید چند عبارت و عدد تصادفی را با صدای بلند بخواند تا هوش مصنوعی بتواند ویژگیهای صوتی، لحن، لهجه و الگوی گفتاری او را تحلیل کند.
پس از تکمیل این مراحل، آواتار ساختهشده به حساب گوگل کاربر متصل میشود و میتواند در تجربههای مختلف Gemini مورد استفاده قرار گیرد. کاربران حتی قادر خواهند بود در گفتگوهای خود با دستورات مشخص، این آواتار را فراخوانی کنند.
گوگل برای جلوگیری از سوءاستفاده از این فناوری، چندین لایه امنیتی نیز در نظر گرفته است. تنها افراد بالای ۱۸ سال امکان ساخت آواتار دارند و صاحب حساب باید شخصاً در تمام مراحل ثبت اطلاعات حضور داشته باشد. همچنین تمامی ویدئوهای تولیدشده با Gemini Avatar دارای فناوری SynthID هستند؛ واترمارکی نامرئی که امکان تشخیص محتوای تولیدشده توسط هوش مصنوعی را فراهم میکند.
گوگل اعلام کرده است که این قابلیت به تدریج برای کاربران پولی Gemini در دسترس قرار میگیرد و در آینده ممکن است امکانات بیشتری نیز به آن افزوده شود.
گسترش Gemini Avatar نشان میدهد رقابت شرکتهای فناوری برای ساخت «دوقلوهای دیجیتالی» کاربران وارد مرحله جدیدی شده است. این قابلیت میتواند برای تولیدکنندگان محتوا، آموزش آنلاین و حتی کسبوکارهای دیجیتال فرصتهای جذابی ایجاد کند.
با این حال، نگرانیهای مربوط به جعل هویت، حریم خصوصی و انتشار محتوای فیک نیز پررنگتر خواهد شد. برای کاربران، آشنایی با سازوکارهای امنیتی مانند SynthID اهمیت زیادی دارد؛ زیرا احتمالاً در آینده نزدیک نمونههای مشابه این فناوری در سرویسهای دیگر نیز فراگیر خواهند شد.




