تبلیغات
هوش مصنوعی

گوگل Gemini 3.5 Live Translate را معرفی کرد؛ ترجمه همزمان مکالمات در بیش از 70 زبان

گوگل از Gemini 3.5 Live Translate رونمایی کرد؛ مدل جدیدی که امکان ترجمه صوتی همزمان و طبیعی میان زبان‌های مختلف را فراهم می‌کند. این قابلیت از امروز در اپلیکیشن Google Translate، رابط برنامه‌نویسی Gemini Live API و همچنین Google Meet برای کاربران سازمانی در دسترس قرار گرفته است.

برخلاف ابزارهای ترجمه سنتی که تا پایان جمله منتظر می‌مانند، Gemini 3.5 Live Translate ترجمه را به‌صورت زنده و تنها با چند ثانیه تأخیر ارائه می‌دهد. این سیستم به‌طور خودکار زبان گوینده را تشخیص می‌دهد و نیازی به تنظیمات دستی ندارد.

یکی از مهم‌ترین ویژگی‌های این فناوری، حفظ لحن، آهنگ صدا و نحوه بیان گوینده است. در نتیجه، صدای ترجمه‌شده طبیعی‌تر به نظر می‌رسد و شباهت بیشتری به صدای اصلی فرد دارد. گوگل همچنین اعلام کرده که این مدل برای عملکرد در محیط‌های شلوغ و پر سر و صدا بهینه شده و می‌تواند در تماس‌های پشتیبانی، کلاس‌های آموزشی، سرویس‌های حمل‌ونقل و رویدادهای زنده کاربرد داشته باشد.

پشتیبانی از بیش از ۷۰ زبان

گوگل می‌گوید Gemini 3.5 Live Translate از بیش از ۷۰ زبان پشتیبانی می‌کند. توسعه‌دهندگان از همین امروز می‌توانند از طریق Gemini Live API و Google AI Studio به نسخه آزمایشی عمومی آن دسترسی داشته باشند.

در بخش سازمانی نیز قابلیت جدید به Google Meet اضافه می‌شود. این به‌روزرسانی محدودیت قبلی ترجمه میان پنج زبان را حذف کرده و امکان پشتیبانی از بیش از ۲ هزار جفت زبانی مختلف را در یک جلسه فراهم می‌کند؛ آن هم بدون محدود شدن به ترجمه از یا به زبان انگلیسی.

عرضه برای کاربران اندروید و iOS

کاربران عادی می‌توانند این قابلیت را از طریق اپلیکیشن Google Translate در سیستم‌عامل‌های اندروید و iOS تجربه کنند. گوگل اعلام کرده استفاده از هر نوع هدفون برای شنیدن ترجمه‌ها امکان‌پذیر است.

همچنین کاربران اندروید به قابلیت جدیدی به نام Listening Mode دسترسی خواهند داشت که صدای ترجمه‌شده را از طریق بلندگوی مکالمه گوشی پخش می‌کند؛ قابلیتی که در مواقعی که هدفون در دسترس نباشد، کاربردی خواهد بود.

گوگل تأیید کرده است که تمامی خروجی‌های صوتی تولیدشده توسط Gemini 3.5 Live Translate دارای واترمارک نامرئی SynthID هستند تا مشخص شود محتوا توسط هوش مصنوعی تولید شده است. این شرکت همچنین اعلام کرده که در حال حاضر امکان حذف این واترمارک وجود ندارد.

ورود Gemini 3.5 Live Translate می‌تواند یکی از مهم‌ترین گام‌های گوگل در نزدیک کردن ارتباطات چندزبانه به مکالمات طبیعی باشد. حفظ لحن و ویژگی‌های صوتی گوینده، تفاوت مهمی با نسل‌های قبلی مترجم‌های ماشینی ایجاد می‌کند و تجربه‌ای انسانی‌تر ارائه می‌دهد. از سوی دیگر، ادغام این فناوری با Google Meet می‌تواند جلسات بین‌المللی و همکاری‌های سازمانی را متحول کند. رقابت میان گوگل، مایکروسافت و سایر شرکت‌های فعال در حوزه ترجمه مبتنی بر هوش مصنوعی نیز با این محصول وارد مرحله جدیدی خواهد شد.

اگر عملکرد Gemini 3.5 Live Translate در شرایط واقعی به اندازه وعده‌های گوگل موفق باشد، می‌تواند یکی از کاربردی‌ترین ابزارهای هوش مصنوعی برای سفر، آموزش و ارتباطات بین‌المللی در سال‌های آینده باشد.

زهرا رضوی

من زهرا رضوی هستم، فارغ‌التحصیل مهندسی شهرسازی. اما عشق به کتاب، فیلم، سریال و تکنولوژی، مسیر حرفه‌ای مرا به‌طور کامل به سمت نویسندگی در این حوزه تغییر داده است. امروز به‌عنوان نویسنده‌ای تخصصی در زمینه فناوری، سینما و ادبیات فعالیت می‌کنم.
نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا