گوگل دیپ‌مایند مرزهای رباتیک هوشمند را با جمینی 1.5 جابجا کرد

خواندن این مطلب 2 دقیقه زمان میبرد

دیپ‌مایند با معرفی Gemini Robotics 1.5 تلاش می‌کند مرز میان هوش مصنوعی و عاملیت انسانی را باریک‌تر از همیشه کند؛ جایی که ربات‌ها پیش از انجام حرکت، قادر به تفکر و برنامه‌ریزی می‌شوند.

فهرست مطلب

این رونمایی شامل دو مدل مکمل است: Gemini Robotics 1.5 به‌عنوان یک سیستم بینایی-زبان-عمل، و Gemini Robotics-ER 1.5 که بر استدلال و برنامه‌ریزی تجسم‌یافته تمرکز دارد. ترکیب این دو، چشم‌انداز دیپ‌مایند را برای گذر از چت‌بات‌های صرف به سوی ربات‌های فعال در دنیای واقعی نمایان می‌کند.

یک مغز، چند بدن

برخلاف بسیاری از مدل‌های رباتیک که دستورها را مستقیم به حرکت تبدیل می‌کنند، Gemini Robotics 1.5 ابتدا زنجیره‌ای از استدلال‌های زبانی تولید کرده و سپس گام‌های عملی را انتخاب می‌کند. این فرایند، اجرای وظایف پیچیده را به بخش‌های کوچک‌تر و ایمن‌تر تقسیم کرده و شفافیت بیشتری برای توسعه‌دهندگان به همراه می‌آورد. در کنار آن، مدل ER 1.5 نقش «مغز» را بر عهده دارد: نقشه‌برداری از فضا، بررسی گزینه‌ها، استفاده از ابزارهای بیرونی و هدایت حرکات مدل VLA.

دیپ‌مایند می‌گوید این فناوری قادر است بدون نیاز به آموزش مجدد، میان ربات‌های مختلف ـ از بازوهای صنعتی تا نمونه‌های انسان‌نما ـ مهارت‌ها را منتقل کند. این توانایی می‌تواند موانع موجود در به‌کارگیری ربات‌های هوش مصنوعی در صنایع متنوع را کاهش دهد.

نتایج و دستاوردها

در آزمایش‌ها، Gemini Robotics-ER 1.5 توانسته است در ۱۵ معیار استاندارد استدلال رباتیک، رکوردهای جدیدی ثبت کند؛ از درک فضایی گرفته تا حل مسئله‌های تعاملی. هرچند معیارها معادل دنیای واقعی نیستند، اما پیشرفت نسبت به نسل‌های پیشین چشمگیر است.

دیپ‌مایند همچنین ایمنی را در مرکز این پروژه قرار داده است. این سیستم‌ها پیش از اقدام، درباره خطرات احتمالی استدلال می‌کنند و علاوه بر آن، مجهز به لایه‌های حفاظتی مانند جلوگیری از برخورد هستند. این شرکت مجموعه آزمایشی ASIMOV را نیز برای ارزیابی ایمنی معنایی گسترش داده تا عملکرد ربات‌ها نه تنها درست، بلکه همسو با ارزش‌ها و استانداردهای انسانی باشد.

از آزمایشگاه تا زندگی روزمره

مدل Gemini Robotics-ER 1.5 از طریق API جمینی در Google AI Studio در دسترس توسعه‌دهندگان قرار گرفته است. نسخه عملیاتی‌تر، یعنی Gemini Robotics 1.5، فعلاً به‌طور محدود و برای شرکای منتخب عرضه می‌شود؛ تصمیمی که نشان‌دهنده حساسیت اعطای قدرت فیزیکی به ماشین‌هاست.

به باور دیپ‌مایند، این نقطه عطفی در مسیر هوش مصنوعی است؛ جایی که توانایی استدلال مدل‌های زبانی با قابلیت تعامل در دنیای فیزیکی ادغام می‌شود. موفقیت این پروژه می‌تواند آینده صنایعی چون لجستیک و کمک‌های خانگی را دگرگون کرده و ربات‌هایی پدید آورد که بیاموزند، سازگار شوند و در زندگی روزمره یاری‌رسان باشند.

اما همان‌طور که دیپ‌مایند تأکید دارد، هرچه اختیار ربات‌ها بیشتر شود، مسئولیت انسانی نیز سنگین‌تر خواهد بود. جمینی رباتیکس تنها درباره هوشمندی بیشتر ماشین‌ها نیست؛ بلکه تلاشی است برای ساخت ربات‌هایی که فکر کنند، برنامه‌ریزی کنند و مانند انسان ـ اما ایمن ـ عمل کنند.

برچسب ها