متا مدل جدید هوش مصنوعی خود را برای شناسایی اشیا منتشر کرد
متا مدل جدیدی از هوش مصنوعی (AI) را روز دوشنبه منتشر کرد که می تواند وظایف پیچیده بینایی کامپیوتری را انجام دهد. این مدل که Segment Anything Model 2 (SAM 2) نامیده می شود، پس از نسخه قبلی خود که سال گذشته راه اندازی شد و در ابزارهای Backdrop و Cutouts اینستاگرام گنجانده شد، دنبال می شود.
جانشین این مدل اکنون با قابلیتهای پیشرفتهای عرضه میشود و این شرکت میگوید که میتواند شناسایی و ردیابی بخش را حتی بر روی ویدیوها نیز انجام دهد. مانند بسیاری از مدل های زبان بزرگ متا (LLM)، SAM 2 نیز یک مدل AI منبع باز است.
Segment Anything Model 2 متا رونمایی شد
در یک پست اتاق خبر، متا مدل جدید هوش مصنوعی را معرفی کرد که در درجه اول بر تجزیه و تحلیل بخش روی ویدیوها تمرکز دارد و در عین حال قابلیت های تقسیم بندی تصویر خود را بهبود می بخشد.
متا با برجسته کردن دستاوردهای سلف خود، گفت که مدل هوش مصنوعی در ویژگی های پس زمینه و Cutouts اینستاگرام استفاده شده است، در حالی که دانشمندان دریایی از آن برای “تقسیم بندی تصاویر سونار و تجزیه و تحلیل صخره های مرجانی، تجزیه و تحلیل تصاویر ماهواره ای برای امداد رسانی در بلایا، و در زمینه پزشکی، بخش بندی استفاده کردند. تصاویر سلولی و کمک به تشخیص سرطان پوست».
SAM 2 قادر به تقسیم بندی اشیا در یک تصویر و ویدیو و همچنین ردیابی آن در فریم های مختلف یک ویدیو در زمان واقعی است. هوش مصنوعی همچنین میتواند اشیاء را در سناریوهایی که اشیا به سرعت حرکت میکنند، ظاهرشان تغییر میکند یا توسط اشیاء دیگر یا صحنهای کاملاً متفاوت پنهان میشوند، ردیابی و قطعهبندی کند.
مدل پایه برای تقسیمبندی بصری مبتنی بر سریع بر روی یک معماری ترانسفورماتور ساده ساخته شده است. این دارای یک حافظه استریم است که به آن امکان می دهد فیلم ها را در زمان واقعی پردازش کند. این شرکت همچنین ادعا کرد که این مدل بر روی بزرگترین مجموعه داده تقسیم بندی ویدیویی خود با نام مجموعه داده SA-V آموزش دیده است.
متا گفت که مدل هوش مصنوعی می تواند به تسهیل فرآیند ویرایش ویدیو یا تولید ویدیو مبتنی بر هوش مصنوعی و همچنین تقویت تجربیات جدید در اکوسیستم واقعیت ترکیبی شرکت کمک کند. این شرکت افزود، قابلیت ردیابی اشیا در ویدئوها همچنین می تواند به حاشیه نویسی سریعتر داده های بصری برای آموزش سایر سیستم های بینایی کامپیوتری کمک کند.
از آنجایی که این یک مدل AI منبع باز است، این شرکت وزن خود را در صفحه GitHub خود میزبانی کرده است. افراد علاقه مند می توانند مدل هوش مصنوعی را دانلود و آزمایش کنند. قابل ذکر است که تحت مجوز Apache 2.0 مجوز دارد که امکان استفاده تحقیقاتی، آکادمیک و غیرتجاری را فراهم می کند.