درک پارس سگ شما ممکن است به زودی با هوش مصنوعی امکان پذیر شود
تا به حال به این فکر کرده اید که دوست پشمالوی شما وقتی پارس می کند چه می خواهد بگوید؟ خب، به زودی شاید دیگر لازم نباشد تعجب کنید! به لطف پیشرفت در هوش مصنوعی (AI)، درک پارس سگ شما می تواند به واقعیت تبدیل شود.
محققان در حال جستجو در دنیای ارتباطات سگ ها هستند و از هوش مصنوعی برای تجزیه و تحلیل پوست و رمزگشایی معانی آنها استفاده می کنند. این پیشرفت می تواند نحوه تعامل ما با همراهان چهارپای خود را متحول کند و ما را به درک افکار و احساسات آنها نزدیک تر کند. بیایید به جزئیات بپردازیم.
محققان دانشگاه میشیگان در حال بررسی احتمالات هوش مصنوعی برای توسعه ابزارهایی هستند که می توانند تشخیص دهند که آیا پارس سگ نشان دهنده بازیگوشی یا پرخاشگری است.
طبق پست دانشگاه میشیگان، این مدلها همچنین میتوانند جزئیات بیشتری از آواز حیوانات، از جمله سن، نژاد و جنسیت حیوان را استخراج کنند.
از طریق همکاری با موسسه ملی اخترفیزیک، اپتیک و الکترونیک مکزیک (INAOE) در پوئبلا، این مطالعه نشان میدهد که مدلهای هوش مصنوعی که در ابتدا برای گفتار انسان طراحی شدهاند، میتوانند به عنوان پایهای برای آموزش سیستمهای جدید متناسب با ارتباطات حیوانات عمل کنند.
توسعه مدلهای هوش مصنوعی برای تجزیه و تحلیل آوازهای حیوانات به دلیل کمیاب بودن دادههای در دسترس عموم، با یک مانع بزرگ مواجه است. بر خلاف گفتار انسان، که منابع فراوانی برای ضبط دارد، جمعآوری دادهها در مورد آوازهای حیوانات چالش برانگیز است.
به عنوان یک نتیجه از این کمبود داده، تکنیک های تجزیه و تحلیل صدای سگ دشوار است، و آنهایی که وجود دارند به دلیل کمبود مواد آموزشی محدود شده اند. برای پرداختن به این موضوع، محققان یک مدل موجود را که در اصل برای تجزیه و تحلیل گفتار انسان طراحی شده بود، تغییر داده اند.
محققان از 74 سگ از نژاد، سن و جنس مختلف در موقعیتهای مختلف، صدای پارس سگها را ضبط کردند. Humberto Pérez-Espinosa، با همکاری INAOE، این تلاش جمع آوری داده ها را رهبری کرد. Abzaliev سپس از این ضبطها برای تغییر یک مدل یادگیری ماشینی استفاده کرد، یک برنامه کامپیوتری که الگوها را در مجموعههای بزرگی از دادهها پیدا میکند. آنها مدلی به نام Wav2Vec2 را انتخاب کردند که در ابتدا با استفاده از داده های گفتاری انسان آموزش داده شد.
با استفاده از این مدل، محققان توانستند بازنمایی هایی از داده های صوتی جمع آوری شده از سگ ها تولید کنند و این بازنمایی ها را تفسیر کنند. آنها کشف کردند که Wav2Vec2 نه تنها در چهار کار مختلف به خوبی عمل می کند، بلکه بهتر از سایر مدل هایی که به طور خاص بر روی داده های پوست سگ آموزش داده شده اند، با سطوح دقت تا 70 درصد عمل می کند.
به گفته محققان، درک تفاوتهای ظریف صداهای سگها میتواند نحوه تفسیر و پاسخ انسان به نیازهای عاطفی و فیزیکی سگها را تا حد زیادی بهبود بخشد، در نتیجه مراقبت از آنها را افزایش داده و از موقعیتهای بالقوه خطرناک جلوگیری میکند.