گوگل زیرنویسهای زنده را با Expressive Captions مبتنی بر هوش مصنوعی ارتقا میدهد
گوگل روز پنجشنبه از یک ویژگی ارتقای هوش مصنوعی (AI) جدید به نام “زیرنویسهای رسا” (Expressive Captions) رونمایی کرد. این ویژگی در حال عرضه به ویژگی زیرنویسهای زنده آن در اندروید است. با این ویژگی، کاربران قادر خواهند بود زیرنویسهای زنده ویدیوهای پخش شده در دستگاه را در قالب جدیدی مشاهده کنند تا بتوانند بهتر زمینه صداها را درک کنند.
این ویژگی هوش مصنوعی هیجان، فریاد زدن و بلندی صدا را با نمایش متن با حروف بزرگ نشان میدهد. در حال حاضر، زیرنویسهای رسا به زبان انگلیسی در دستگاههای اندروید 14 و اندروید 15 در ایالات متحده در دسترس است.
ویژگی “Expressive Captions” گوگل به هوش مصنوعی متکی است
این غول جستجو جزئیاتی را در مورد ویژگی جدید هوش مصنوعی که به زیرنویسهای زنده اندروید اضافه میشود، به اشتراک گذاشت و گفت که در حالی که زیرنویسها برای اولین بار در دهه 1970 به عنوان ابزاری برای دسترسی جامعه ناشنوایان و کمشنوایان محبوب شدند، ارائه آنها در 50 سال گذشته تغییر نکرده است.
امروزه بسیاری از افراد هنگام پخش محتوا آنلاین در مکانهای عمومی شلوغ، برای درک بهتر آنچه گفته میشود یا هنگام مصرف محتوا به زبان خارجی، از زیرنویسها استفاده میکنند. گوگل با توجه به محبوبیت زیرنویسها در بین کاربران اندروید، گفت که اکنون از هوش مصنوعی برای نوآوری در اطلاعاتی که زیرنویسها منتقل میکنند، استفاده میکند.
با زیرنویسهای رسا، زیرنویسهای زنده قادر خواهند بود مواردی مانند لحن، حجم صدا، نشانههای محیطی و همچنین صداهای انسانی را انتقال دهند. گوگل گفت: “این چیزهای کوچک تفاوت زیادی در انتقال آنچه فراتر از کلمات است ایجاد میکنند، به ویژه برای محتواهای زنده و اجتماعی که زیرنویسهای از پیش بارگذاری شده یا باکیفیت ندارند.”
یکی از راههای نوآوری زیرنویسهای رسا با نشان دادن حروف بزرگ برای نشان دادن شدت گفتار، چه هیجان، بلندی صدا یا عصبانیت باشد. این زیرنویسها همچنین صداهایی مانند آه کشیدن، غرغر کردن و نفس نفس زدن را شناسایی میکنند و به کاربران کمک میکنند تا تفاوتهای ظریف گفتار را بهتر درک کنند. علاوه بر این، صداهای محیطی مانند کف زدن و تشویق که در پیشزمینه و پسزمینه پخش میشوند را نیز ضبط میکند.
گوگل میگوید زیرنویسهای رسا بخشی از زیرنویسهای زنده هستند و این ویژگی در سیستم عامل تعبیه شده است و در سراسر دستگاه اندروید، صرف نظر از اینکه کاربر در کدام برنامه یا رابط کاربری است، در دسترس خواهد بود. در نتیجه، کاربران میتوانند زیرنویسهای هوش مصنوعی بلادرنگ را هنگام تماشای پخشهای زنده، پستهای رسانههای اجتماعی و خاطرات در Google Photos و همچنین ویدیوهای به اشتراک گذاشته شده در پلتفرمهای پیامرسانی پیدا کنند.
قابل توجه است که پردازش هوش مصنوعی برای زیرنویسهای رسا روی دستگاه انجام میشود، به این معنی که کاربران حتی زمانی که دستگاه به اینترنت متصل نیست یا در حالت هواپیما است، آنها را مشاهده خواهند کرد.