جمینی 3 منتشر شد: مهمترین نکاتی که باید بدانید!

گوگل رسماً Gemini 3، پیشرفتهترین مدل هوش مصنوعی خود تا به امروز، را معرفی کرد. این نسخه جدید بر پایه پایههای Gemini 1 و 2 بنا شده و ارتقاءهای عمدهای در استدلال، درک چندوجهی و کدگذاری مبتنی بر عامل به آن اضافه شده است.
Gemini 3 اکنون چندین محصول گوگل، از جمله جستجو، برنامه Gemini و پلتفرم توسعهدهندگان جدید این شرکت، Google Antigravity، را پشتیبانی میکند.
۱. پاسخهای هوشمندتر و صادقانهتر
جمینی ۳ نشاندهنده تغییری در رویکرد گوگل نسبت به نحوه تعامل هوش مصنوعی با کاربران است. این مدل از تعارفات و پاسخهای غیرضروری دوری میکند و بر ارائه پاسخهای دقیق، روشن و کاربردی تمرکز دارد. گوگل میگوید جمینی ۳ پاسخهایی هوشمندانه و مستقیم ارائه میدهد.
این بهروزرسانی بازتابدهنده هدف بزرگتر گوگل برای تبدیل هوش مصنوعی به یک «همفکر» واقعی است. جمینی ۳ قادر است ظرافتهای زمینهای را درک کند و لحن خود را براساس نوع وظیفه تغییر دهد. گوگل ادعا میکند این ویژگیها باعث میشوند هوش مصنوعی در استفادههای واقعی، صادقانهتر و سازندهتر عمل کند.
۲. درک بهتر از همهچیز
جمینی ۳ از چندحالتهبودن ذاتی پشتیبانی میکند. این سیستم میتواند متن، تصویر، ویدئو، صوت و کد را در یک جریان کاری واحد پردازش کند. کاربران میتوانند ترکیبی از محتوا—از جمله دستنوشتهها، اسکرینشاتها یا حتی یک سخنرانی کامل—را بارگذاری کنند و مدل میتواند همه آنها را بهصورت یکپارچه تفسیر کند. سپس قادر است بر اساس این ورودیها، فلشکارتهای تعاملی، خلاصههای دقیق، یا شبیهسازیهای بصری تولید کند.
گوگل همچنین پنجرهی متنی مدل را به یک میلیون توکن افزایش داده است. این موضوع به جمینی ۳ اجازه میدهد اسناد و مکالمات فوقالعاده طولانی را بخواند و حفظ کند و در نتیجه عملکرد آن در وظایف پژوهشی یا دانشگاهی بهطور قابلتوجهی بهبود مییابد.
۳. پیشتاز در تمام بنچمارکها
جمینی ۳ تقریباً در تمام آزمونهای شاخص هوش مصنوعی عملکردی بهتر از دیگر مدلهای پیشرفته داشته است. این مدل اکنون با امتیاز Elo برابر با ۱۵۰۱ در صدر جدول LMArena قرار دارد. همچنین ۹۱.۹٪ در GPQA Diamond، حدود ۳۷.۵٪ در آزمون Humanity’s Last Exam و ۲۳.۴٪ در MathArena Apex کسب کرده است.
در آزمونهای چندحالته، جمینی ۳ امتیاز ۸۱٪ در MMMU-Pro و ۸۷.۶٪ در Video-MMMU را بهدست آورده است. میزان دقت factual آن در SimpleQA Verified به ۷۲.۱٪ میرسد. این نتایج نشان میدهد جمینی ۳ هم در استدلال آکادمیک و هم در حل مسائل دنیای واقعی بسیار توانمند است.
برای توسعهدهندگان، جمینی ۳ با امتیاز ۱۴۸۷ در WebDev Arena پیشتاز است. همچنین ۷۶.۲٪ در SWE-Bench Verified و ۵۴.۲٪ در Terminal-Bench 2.0 کسب کرده است. این معیارها توانمندی آن در توسعه نرمافزار، کارهای خط فرمان و کدنویسی خودکار را تأیید میکنند.
۴. عاملهایی که خودشان کدنویسی میکنند
گوگل یک پلتفرم توسعه جدید مبتنی بر عاملها با نام Antigravity راهاندازی کرده است. این پلتفرم که به جمینی ۳ مجهز شده، اجازه میدهد عاملها بهصورت مستقل کد بنویسند، تست کنند و اجرا کنند؛ آن هم در یک محیط توسعه کامل. عاملهای جمینی بهطور مستقیم به ویرایشگر کد، مرورگر و ترمینال دسترسی دارند.
این سیستم از توانایی استدلال و استفاده از ابزارهای جمینی ۳ برای مدیریت وظایف فولاستک نرمافزاری بهره میبرد. در آزمایشهای داخلی، این عاملها یک اپلیکیشن ردیاب پرواز را از صفر برنامهریزی و پیادهسازی کردند. این عامل بدون دخالت انسان از طریق شبیهسازیهای مبتنی بر مرورگر، نتایج کار خود را اعتبارسنجی کرد.
۵. نتایج تعاملی در جستجو
جمینی ۳ اکنون در «حالت هوش مصنوعی» گوگل سرچ در دسترس است. این مدل توانایی تولید چیدمانهای بصری پویا، ابزارهای تعاملی و شبیهسازیها را مستقیماً در نتایج جستجو فراهم میکند. هنگامی که کاربران سوالات پیچیدهای مطرح میکنند، جمینی ۳ میتواند پاسخهای زنده شامل جدول، نمودار یا حتی ماشینحسابهای سفارشی تولید کند.
برای مثال، هنگام جستجوی موضوعاتی مانند فیزیک مداری یا مقایسههای مالی، جمینی ۳ قادر است ماژولهای تعاملی ایجاد کند تا نتایج را بهتر توضیح دهد. این قابلیتها به کمک تواناییهای داخلی آن در تولید کد و طراحی رابط کاربری امکانپذیر شدهاند.
۶. پیشرفتهای جدید در آموزش مدل
پژوهشگران دیپمایند موفقیت جمینی ۳ را نتیجه پیشرفت در مراحل پیشتمرین و پستمرین میدانند. «اوریول وینالس»، معاون گوگل، اعلام کرد که پیشرفت از نسخه ۲.۵ به ۳.۰ بزرگترین جهشی بوده که تیم تجربه کرده است. او همچنین گفت فرآیند پیشتمرین هنوز به سقف نرسیده و جای رشد وجود دارد.
بسیاری از متخصصان معتقد بودند مدلها دیگر دادهای در اینترنت برای یادگیری ندارند. اما گوگل ظاهراً توانسته ارزش بیشتری از دادههای موجود استخراج کند یا از مجموعه دادههای داخلی استفاده کرده که برای سایر رقبا در دسترس نیست. این موضوع یک مزیت بلندمدت برای گوگل در ساخت نسلهای آینده هوش مصنوعی محسوب میشود.
۷. ایمنی و ارزیابی قویتر
گوگل میگوید جمینی ۳ امنترین مدل این شرکت تاکنون است. این سیستم در برابر حملات پرامپت اینجکشن، رفتارهای چاپلوسانه و سوءاستفادهها آزمایش شده است. گروههای امنیتی خارجی مانند Vaultis و Dreadnode در ارزیابیها شرکت داشتهاند. همچنین گوگل با سازمانهایی مانند AISI بریتانیا برای بررسی توسعه مسئولانه همکاری کرده است.
نسخه Gemini 3 Pro اکنون در سراسر جهان از طریق اپلیکیشن Gemini و «حالت هوش مصنوعی» گوگل سرچ برای کاربران نسخه Pro و Ultra در دسترس است. نسخه پیشرفتهتر با نام «Deep Think» همچنان تحت بررسیهای ایمنی است و بعداً منتشر خواهد شد.




