گوگل زیرنویس‌های زنده را با Expressive Captions مبتنی بر هوش مصنوعی ارتقا می‌دهد

گوگل روز پنجشنبه از یک ویژگی ارتقای هوش مصنوعی (AI) جدید به نام “زیرنویس‌های رسا” (Expressive Captions) رونمایی کرد. این ویژگی در حال عرضه به ویژگی زیرنویس‌های زنده آن در اندروید است. با این ویژگی، کاربران قادر خواهند بود زیرنویس‌های زنده ویدیوهای پخش شده در دستگاه را در قالب جدیدی مشاهده کنند تا بتوانند بهتر زمینه صداها را درک کنند.

این ویژگی هوش مصنوعی هیجان، فریاد زدن و بلندی صدا را با نمایش متن با حروف بزرگ نشان می‌دهد. در حال حاضر، زیرنویس‌های رسا به زبان انگلیسی در دستگاه‌های اندروید 14 و اندروید 15 در ایالات متحده در دسترس است.

ویژگی “Expressive Captions” گوگل به هوش مصنوعی متکی است

این غول جستجو جزئیاتی را در مورد ویژگی جدید هوش مصنوعی که به زیرنویس‌های زنده اندروید اضافه می‌شود، به اشتراک گذاشت و گفت که در حالی که زیرنویس‌ها برای اولین بار در دهه 1970 به عنوان ابزاری برای دسترسی جامعه ناشنوایان و کم‌شنوایان محبوب شدند، ارائه آن‌ها در 50 سال گذشته تغییر نکرده است.

امروزه بسیاری از افراد هنگام پخش محتوا آنلاین در مکان‌های عمومی شلوغ، برای درک بهتر آنچه گفته می‌شود یا هنگام مصرف محتوا به زبان خارجی، از زیرنویس‌ها استفاده می‌کنند. گوگل با توجه به محبوبیت زیرنویس‌ها در بین کاربران اندروید، گفت که اکنون از هوش مصنوعی برای نوآوری در اطلاعاتی که زیرنویس‌ها منتقل می‌کنند، استفاده می‌کند.

با زیرنویس‌های رسا، زیرنویس‌های زنده قادر خواهند بود مواردی مانند لحن، حجم صدا، نشانه‌های محیطی و همچنین صداهای انسانی را انتقال دهند. گوگل گفت: “این چیزهای کوچک تفاوت زیادی در انتقال آنچه فراتر از کلمات است ایجاد می‌کنند، به ویژه برای محتواهای زنده و اجتماعی که زیرنویس‌های از پیش بارگذاری شده یا باکیفیت ندارند.”

یکی از راه‌های نوآوری زیرنویس‌های رسا با نشان دادن حروف بزرگ برای نشان دادن شدت گفتار، چه هیجان، بلندی صدا یا عصبانیت باشد. این زیرنویس‌ها همچنین صداهایی مانند آه کشیدن، غرغر کردن و نفس نفس زدن را شناسایی می‌کنند و به کاربران کمک می‌کنند تا تفاوت‌های ظریف گفتار را بهتر درک کنند. علاوه بر این، صداهای محیطی مانند کف زدن و تشویق که در پیش‌زمینه و پس‌زمینه پخش می‌شوند را نیز ضبط می‌کند.

گوگل می‌گوید زیرنویس‌های رسا بخشی از زیرنویس‌های زنده هستند و این ویژگی در سیستم عامل تعبیه شده است و در سراسر دستگاه اندروید، صرف نظر از اینکه کاربر در کدام برنامه یا رابط کاربری است، در دسترس خواهد بود. در نتیجه، کاربران می‌توانند زیرنویس‌های هوش مصنوعی بلادرنگ را هنگام تماشای پخش‌های زنده، پست‌های رسانه‌های اجتماعی و خاطرات در Google Photos و همچنین ویدیو‌های به اشتراک گذاشته شده در پلتفرم‌های پیام‌رسانی پیدا کنند.

قابل توجه است که پردازش هوش مصنوعی برای زیرنویس‌های رسا روی دستگاه انجام می‌شود، به این معنی که کاربران حتی زمانی که دستگاه به اینترنت متصل نیست یا در حالت هواپیما است، آن‌ها را مشاهده خواهند کرد.

ممکن است شما دوست داشته باشید
ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.