گوگل دیپمایند مرزهای رباتیک هوشمند را با جمینی 1.5 جابجا کرد

دیپمایند با معرفی Gemini Robotics 1.5 تلاش میکند مرز میان هوش مصنوعی و عاملیت انسانی را باریکتر از همیشه کند؛ جایی که رباتها پیش از انجام حرکت، قادر به تفکر و برنامهریزی میشوند.
این رونمایی شامل دو مدل مکمل است: Gemini Robotics 1.5 بهعنوان یک سیستم بینایی-زبان-عمل، و Gemini Robotics-ER 1.5 که بر استدلال و برنامهریزی تجسمیافته تمرکز دارد. ترکیب این دو، چشمانداز دیپمایند را برای گذر از چتباتهای صرف به سوی رباتهای فعال در دنیای واقعی نمایان میکند.
یک مغز، چند بدن
برخلاف بسیاری از مدلهای رباتیک که دستورها را مستقیم به حرکت تبدیل میکنند، Gemini Robotics 1.5 ابتدا زنجیرهای از استدلالهای زبانی تولید کرده و سپس گامهای عملی را انتخاب میکند. این فرایند، اجرای وظایف پیچیده را به بخشهای کوچکتر و ایمنتر تقسیم کرده و شفافیت بیشتری برای توسعهدهندگان به همراه میآورد. در کنار آن، مدل ER 1.5 نقش «مغز» را بر عهده دارد: نقشهبرداری از فضا، بررسی گزینهها، استفاده از ابزارهای بیرونی و هدایت حرکات مدل VLA.
دیپمایند میگوید این فناوری قادر است بدون نیاز به آموزش مجدد، میان رباتهای مختلف ـ از بازوهای صنعتی تا نمونههای انساننما ـ مهارتها را منتقل کند. این توانایی میتواند موانع موجود در بهکارگیری رباتهای هوش مصنوعی در صنایع متنوع را کاهش دهد.

نتایج و دستاوردها
در آزمایشها، Gemini Robotics-ER 1.5 توانسته است در ۱۵ معیار استاندارد استدلال رباتیک، رکوردهای جدیدی ثبت کند؛ از درک فضایی گرفته تا حل مسئلههای تعاملی. هرچند معیارها معادل دنیای واقعی نیستند، اما پیشرفت نسبت به نسلهای پیشین چشمگیر است.
دیپمایند همچنین ایمنی را در مرکز این پروژه قرار داده است. این سیستمها پیش از اقدام، درباره خطرات احتمالی استدلال میکنند و علاوه بر آن، مجهز به لایههای حفاظتی مانند جلوگیری از برخورد هستند. این شرکت مجموعه آزمایشی ASIMOV را نیز برای ارزیابی ایمنی معنایی گسترش داده تا عملکرد رباتها نه تنها درست، بلکه همسو با ارزشها و استانداردهای انسانی باشد.
از آزمایشگاه تا زندگی روزمره
مدل Gemini Robotics-ER 1.5 از طریق API جمینی در Google AI Studio در دسترس توسعهدهندگان قرار گرفته است. نسخه عملیاتیتر، یعنی Gemini Robotics 1.5، فعلاً بهطور محدود و برای شرکای منتخب عرضه میشود؛ تصمیمی که نشاندهنده حساسیت اعطای قدرت فیزیکی به ماشینهاست.
به باور دیپمایند، این نقطه عطفی در مسیر هوش مصنوعی است؛ جایی که توانایی استدلال مدلهای زبانی با قابلیت تعامل در دنیای فیزیکی ادغام میشود. موفقیت این پروژه میتواند آینده صنایعی چون لجستیک و کمکهای خانگی را دگرگون کرده و رباتهایی پدید آورد که بیاموزند، سازگار شوند و در زندگی روزمره یاریرسان باشند.
اما همانطور که دیپمایند تأکید دارد، هرچه اختیار رباتها بیشتر شود، مسئولیت انسانی نیز سنگینتر خواهد بود. جمینی رباتیکس تنها درباره هوشمندی بیشتر ماشینها نیست؛ بلکه تلاشی است برای ساخت رباتهایی که فکر کنند، برنامهریزی کنند و مانند انسان ـ اما ایمن ـ عمل کنند.




