جمینی 3 منتشر شد: مهم‌ترین نکاتی که باید بدانید!

تحریریه تکنولوژی چیکاو1404-08-29 | 16:05

خواندن این مطلب 3 دقیقه زمان میبرد

جمینی 3 منتشر شد: مهم‌ترین نکاتی که باید بدانید! - چیکاو

گوگل رسماً Gemini 3، پیشرفته‌ترین مدل هوش مصنوعی خود تا به امروز، را معرفی کرد. این نسخه جدید بر پایه پایه‌های Gemini 1 و 2 بنا شده و ارتقاءهای عمده‌ای در استدلال، درک چندوجهی و کدگذاری مبتنی بر عامل به آن اضافه شده است.

فهرست مطلب

Gemini 3 اکنون چندین محصول گوگل، از جمله جستجو، برنامه Gemini و پلتفرم توسعه‌دهندگان جدید این شرکت، Google Antigravity، را پشتیبانی می‌کند.

۱. پاسخ‌های هوشمندتر و صادقانه‌تر

جمینی ۳ نشان‌دهنده تغییری در رویکرد گوگل نسبت به نحوه تعامل هوش مصنوعی با کاربران است. این مدل از تعارفات و پاسخ‌های غیرضروری دوری می‌کند و بر ارائه پاسخ‌های دقیق، روشن و کاربردی تمرکز دارد. گوگل می‌گوید جمینی ۳ پاسخ‌هایی هوشمندانه و مستقیم ارائه می‌دهد.

این به‌روزرسانی بازتاب‌دهنده هدف بزرگ‌تر گوگل برای تبدیل هوش مصنوعی به یک «هم‌فکر» واقعی است. جمینی ۳ قادر است ظرافت‌های زمینه‌ای را درک کند و لحن خود را براساس نوع وظیفه تغییر دهد. گوگل ادعا می‌کند این ویژگی‌ها باعث می‌شوند هوش مصنوعی در استفاده‌های واقعی، صادقانه‌تر و سازنده‌تر عمل کند.

۲. درک بهتر از همه‌چیز

جمینی ۳ از چندحالته‌بودن ذاتی پشتیبانی می‌کند. این سیستم می‌تواند متن، تصویر، ویدئو، صوت و کد را در یک جریان کاری واحد پردازش کند. کاربران می‌توانند ترکیبی از محتوا—از جمله دست‌نوشته‌ها، اسکرین‌شات‌ها یا حتی یک سخنرانی کامل—را بارگذاری کنند و مدل می‌تواند همه آن‌ها را به‌صورت یکپارچه تفسیر کند. سپس قادر است بر اساس این ورودی‌ها، فلش‌کارت‌های تعاملی، خلاصه‌های دقیق، یا شبیه‌سازی‌های بصری تولید کند.

گوگل همچنین پنجره‌ی متنی مدل را به یک میلیون توکن افزایش داده است. این موضوع به جمینی ۳ اجازه می‌دهد اسناد و مکالمات فوق‌العاده طولانی را بخواند و حفظ کند و در نتیجه عملکرد آن در وظایف پژوهشی یا دانشگاهی به‌طور قابل‌توجهی بهبود می‌یابد.

۳. پیشتاز در تمام بنچمارک‌ها

جمینی ۳ تقریباً در تمام آزمون‌های شاخص هوش مصنوعی عملکردی بهتر از دیگر مدل‌های پیشرفته داشته است. این مدل اکنون با امتیاز Elo برابر با ۱۵۰۱ در صدر جدول LMArena قرار دارد. همچنین ۹۱.۹٪ در GPQA Diamond، حدود ۳۷.۵٪ در آزمون Humanity’s Last Exam و ۲۳.۴٪ در MathArena Apex کسب کرده است.

در آزمون‌های چندحالته، جمینی ۳ امتیاز ۸۱٪ در MMMU-Pro و ۸۷.۶٪ در Video-MMMU را به‌دست آورده است. میزان دقت factual آن در SimpleQA Verified به ۷۲.۱٪ می‌رسد. این نتایج نشان می‌دهد جمینی ۳ هم در استدلال آکادمیک و هم در حل مسائل دنیای واقعی بسیار توانمند است.

برای توسعه‌دهندگان، جمینی ۳ با امتیاز ۱۴۸۷ در WebDev Arena پیشتاز است. همچنین ۷۶.۲٪ در SWE-Bench Verified و ۵۴.۲٪ در Terminal-Bench 2.0 کسب کرده است. این معیارها توانمندی آن در توسعه نرم‌افزار، کارهای خط فرمان و کدنویسی خودکار را تأیید می‌کنند.

۴. عامل‌هایی که خودشان کدنویسی می‌کنند

گوگل یک پلتفرم توسعه جدید مبتنی بر عامل‌ها با نام Antigravity راه‌اندازی کرده است. این پلتفرم که به جمینی ۳ مجهز شده، اجازه می‌دهد عامل‌ها به‌صورت مستقل کد بنویسند، تست کنند و اجرا کنند؛ آن هم در یک محیط توسعه کامل. عامل‌های جمینی به‌طور مستقیم به ویرایشگر کد، مرورگر و ترمینال دسترسی دارند.

این سیستم از توانایی استدلال و استفاده از ابزارهای جمینی ۳ برای مدیریت وظایف فول‌استک نرم‌افزاری بهره می‌برد. در آزمایش‌های داخلی، این عامل‌ها یک اپلیکیشن ردیاب پرواز را از صفر برنامه‌ریزی و پیاده‌سازی کردند. این عامل بدون دخالت انسان از طریق شبیه‌سازی‌های مبتنی بر مرورگر، نتایج کار خود را اعتبارسنجی کرد.

۵. نتایج تعاملی در جستجو

جمینی ۳ اکنون در «حالت هوش مصنوعی» گوگل سرچ در دسترس است. این مدل توانایی تولید چیدمان‌های بصری پویا، ابزارهای تعاملی و شبیه‌سازی‌ها را مستقیماً در نتایج جستجو فراهم می‌کند. هنگامی که کاربران سوالات پیچیده‌ای مطرح می‌کنند، جمینی ۳ می‌تواند پاسخ‌های زنده شامل جدول، نمودار یا حتی ماشین‌حساب‌های سفارشی تولید کند.

برای مثال، هنگام جستجوی موضوعاتی مانند فیزیک مداری یا مقایسه‌های مالی، جمینی ۳ قادر است ماژول‌های تعاملی ایجاد کند تا نتایج را بهتر توضیح دهد. این قابلیت‌ها به کمک توانایی‌های داخلی آن در تولید کد و طراحی رابط کاربری امکان‌پذیر شده‌اند.

۶. پیشرفت‌های جدید در آموزش مدل

پژوهشگران دیپ‌مایند موفقیت جمینی ۳ را نتیجه پیشرفت در مراحل پیش‌تمرین و پس‌تمرین می‌دانند. «اوریول وینالس»، معاون گوگل، اعلام کرد که پیشرفت از نسخه ۲.۵ به ۳.۰ بزرگ‌ترین جهشی بوده که تیم تجربه کرده است. او همچنین گفت فرآیند پیش‌تمرین هنوز به سقف نرسیده و جای رشد وجود دارد.

بسیاری از متخصصان معتقد بودند مدل‌ها دیگر داده‌ای در اینترنت برای یادگیری ندارند. اما گوگل ظاهراً توانسته ارزش بیشتری از داده‌های موجود استخراج کند یا از مجموعه داده‌های داخلی استفاده کرده که برای سایر رقبا در دسترس نیست. این موضوع یک مزیت بلندمدت برای گوگل در ساخت نسل‌های آینده هوش مصنوعی محسوب می‌شود.

۷. ایمنی و ارزیابی قوی‌تر

گوگل می‌گوید جمینی ۳ امن‌ترین مدل این شرکت تاکنون است. این سیستم در برابر حملات پرامپت اینجکشن، رفتارهای چاپلوسانه و سوءاستفاده‌ها آزمایش شده است. گروه‌های امنیتی خارجی مانند Vaultis و Dreadnode در ارزیابی‌ها شرکت داشته‌اند. همچنین گوگل با سازمان‌هایی مانند AISI بریتانیا برای بررسی توسعه مسئولانه همکاری کرده است.

نسخه Gemini 3 Pro اکنون در سراسر جهان از طریق اپلیکیشن Gemini و «حالت هوش مصنوعی» گوگل سرچ برای کاربران نسخه Pro و Ultra در دسترس است. نسخه پیشرفته‌تر با نام «Deep Think» همچنان تحت بررسی‌های ایمنی است و بعداً منتشر خواهد شد.

برچسب ها

تحریریه تکنولوژی چیکاو1404-08-29 | 16:05

خواندن این مطلب 3 دقیقه زمان میبرد

۱. پاسخ‌های هوشمندتر و صادقانه‌تر

۲. درک بهتر از همه‌چیز

۳. پیشتاز در تمام بنچمارک‌ها

۴. عامل‌هایی که خودشان کدنویسی می‌کنند

۵. نتایج تعاملی در جستجو

۶. پیشرفت‌های جدید در آموزش مدل

۷. ایمنی و ارزیابی قوی‌تر

تحریریه تکنولوژی چیکاو

Grok-3 گام جسورانه xAI در مسیر تکامل هوش مصنوعی!

نقد و بررسی گلکسی واچ 6 و واچ 6 کلاسیک سامسونگ

مقایسه مشخصات اسنپدراگون 8 الیت نسل پنجم در مقابل دایمنسیتی 9500

بررسی بحران هوش مصنوعی اپل: مشکلات پنهان فاش شد!

دیدگاهتان را بنویسید لغو پاسخ