گوگل Gemini 3.5 Live Translate را معرفی کرد؛ ترجمه همزمان مکالمات در بیش از 70 زبان

گوگل از Gemini 3.5 Live Translate رونمایی کرد؛ مدل جدیدی که امکان ترجمه صوتی همزمان و طبیعی میان زبانهای مختلف را فراهم میکند. این قابلیت از امروز در اپلیکیشن Google Translate، رابط برنامهنویسی Gemini Live API و همچنین Google Meet برای کاربران سازمانی در دسترس قرار گرفته است.
برخلاف ابزارهای ترجمه سنتی که تا پایان جمله منتظر میمانند، Gemini 3.5 Live Translate ترجمه را بهصورت زنده و تنها با چند ثانیه تأخیر ارائه میدهد. این سیستم بهطور خودکار زبان گوینده را تشخیص میدهد و نیازی به تنظیمات دستی ندارد.
یکی از مهمترین ویژگیهای این فناوری، حفظ لحن، آهنگ صدا و نحوه بیان گوینده است. در نتیجه، صدای ترجمهشده طبیعیتر به نظر میرسد و شباهت بیشتری به صدای اصلی فرد دارد. گوگل همچنین اعلام کرده که این مدل برای عملکرد در محیطهای شلوغ و پر سر و صدا بهینه شده و میتواند در تماسهای پشتیبانی، کلاسهای آموزشی، سرویسهای حملونقل و رویدادهای زنده کاربرد داشته باشد.
پشتیبانی از بیش از ۷۰ زبان
گوگل میگوید Gemini 3.5 Live Translate از بیش از ۷۰ زبان پشتیبانی میکند. توسعهدهندگان از همین امروز میتوانند از طریق Gemini Live API و Google AI Studio به نسخه آزمایشی عمومی آن دسترسی داشته باشند.
در بخش سازمانی نیز قابلیت جدید به Google Meet اضافه میشود. این بهروزرسانی محدودیت قبلی ترجمه میان پنج زبان را حذف کرده و امکان پشتیبانی از بیش از ۲ هزار جفت زبانی مختلف را در یک جلسه فراهم میکند؛ آن هم بدون محدود شدن به ترجمه از یا به زبان انگلیسی.
عرضه برای کاربران اندروید و iOS
کاربران عادی میتوانند این قابلیت را از طریق اپلیکیشن Google Translate در سیستمعاملهای اندروید و iOS تجربه کنند. گوگل اعلام کرده استفاده از هر نوع هدفون برای شنیدن ترجمهها امکانپذیر است.
همچنین کاربران اندروید به قابلیت جدیدی به نام Listening Mode دسترسی خواهند داشت که صدای ترجمهشده را از طریق بلندگوی مکالمه گوشی پخش میکند؛ قابلیتی که در مواقعی که هدفون در دسترس نباشد، کاربردی خواهد بود.
گوگل تأیید کرده است که تمامی خروجیهای صوتی تولیدشده توسط Gemini 3.5 Live Translate دارای واترمارک نامرئی SynthID هستند تا مشخص شود محتوا توسط هوش مصنوعی تولید شده است. این شرکت همچنین اعلام کرده که در حال حاضر امکان حذف این واترمارک وجود ندارد.
ورود Gemini 3.5 Live Translate میتواند یکی از مهمترین گامهای گوگل در نزدیک کردن ارتباطات چندزبانه به مکالمات طبیعی باشد. حفظ لحن و ویژگیهای صوتی گوینده، تفاوت مهمی با نسلهای قبلی مترجمهای ماشینی ایجاد میکند و تجربهای انسانیتر ارائه میدهد. از سوی دیگر، ادغام این فناوری با Google Meet میتواند جلسات بینالمللی و همکاریهای سازمانی را متحول کند. رقابت میان گوگل، مایکروسافت و سایر شرکتهای فعال در حوزه ترجمه مبتنی بر هوش مصنوعی نیز با این محصول وارد مرحله جدیدی خواهد شد.
اگر عملکرد Gemini 3.5 Live Translate در شرایط واقعی به اندازه وعدههای گوگل موفق باشد، میتواند یکی از کاربردیترین ابزارهای هوش مصنوعی برای سفر، آموزش و ارتباطات بینالمللی در سالهای آینده باشد.




