مدیاتک از بهینهسازی هوش مصنوعی مایکروسافت Phi-3.5 بر روی تراشههای Dimensity خبر داد
مدیاتک اعلام کرده که چیپستهای موبایل خود را برای اجرای بهینهتر مدلهای هوش مصنوعی Phi-3.5 مایکروسافت بهینه کرده است. این اقدام به کاربران گوشیهای هوشمند مجهز به این چیپستها امکان میدهد تا از قابلیتهای هوش مصنوعی مولد به صورت مستقیم روی دستگاه خود و با سرعت و کارایی بالاتر بهرهمند شوند.
مدلهای Phi-3.5 مایکروسافت چه هستند؟
مایکروسافت در ماه اوت از سری مدلهای زبان کوچک (SLM) خود با نام Phi-3.5 رونمایی کرد. این سری شامل سه مدل اصلی است:
- Phi-3.5 Mixture of Experts (MoE): مدلی قدرتمند با معماری «ترکیب متخصصان» که برای انجام وظایف پیچیده طراحی شده است. این مدل با داشتن ۱۶x۳.۸ میلیارد پارامتر (که در حالت استفاده معمولی تنها ۶.۶ میلیارد آن فعال است)، عملکردی بسیار خوب در خلاصهسازی متن و سایر وظایف مرتبط با زبان دارد.
- Phi-3.5 Mini: مدلی سبکتر با ۳.۸ میلیارد پارامتر که برای انجام وظایفی مانند کدنویسی، حل مسائل ریاضی و استدلال منطقی بهینه شده است. این مدل با وجود حجم کمتر، عملکرد قابل توجهی دارد.
- Phi-3.5 Vision: مدلی چندوجهی که قابلیت درک و پردازش تصاویر را به قابلیتهای زبانی اضافه میکند. این مدل برای وظایفی مانند درک کلی تصویر، تشخیص کاراکترها، درک نمودار و جدول و خلاصهسازی ویدئو مناسب است.
نکته مهم در مورد این مدلها این است که آنها «مدل دستوری» هستند، به این معنی که برای دریافت خروجی مورد نظر، کاربر باید دستورالعملهای مشخصی را به مدل ارائه دهد. این رویکرد، کنترل بیشتری بر عملکرد مدل به کاربر میدهد.
بهینهسازی چیپستهای دایمنسیتی برای Phi-3.5
مدیاتک اعلام کرده که چیپستهای دایمنسیتی ۹۴۰۰، ۹۳۰۰ و ۸۳۰۰ خود را برای اجرای بهینهتر مدلهای Phi-3.5 بهینه کرده است. این بهینهسازی شامل موارد زیر است:
- استفاده از واحدهای پردازش عصبی (NPU): چیپستهای دایمنسیتی با بهرهگیری از NPUهای قدرتمند خود، میتوانند پردازشهای مربوط به هوش مصنوعی را به صورت مستقیم و با سرعت بالا روی دستگاه انجام دهند.
- بهینهسازی معماری و سختافزار: مدیاتک با بهینهسازی معماری و سختافزار چیپستها، جریان داده، دسترسی به حافظه و قدرت پردازش را برای اجرای مؤثرتر مدلهای Phi-3.5 تنظیم کرده است.
مزایای این بهینهسازی
بهینهسازی چیپستها برای مدلهای Phi-3.5 مزایای متعددی برای کاربران به همراه دارد:
- کاهش تأخیر: پردازش سریعتر اطلاعات توسط چیپست، منجر به کاهش تأخیر در پاسخگویی مدلهای هوش مصنوعی میشود و تجربه کاربری روانتری را فراهم میکند.
- کاهش مصرف انرژی: بهینهسازیهای انجام شده باعث کاهش مصرف انرژی توسط چیپست در هنگام اجرای مدلهای هوش مصنوعی میشود و در نتیجه عمر باتری دستگاه افزایش مییابد.
- افزایش توان عملیاتی: چیپستهای بهینهشده قادرند حجم بیشتری از دادهها را در واحد زمان پردازش کنند و در نتیجه، عملکرد کلی برنامههای مبتنی بر هوش مصنوعی بهبود مییابد.
- اجرای هوش مصنوعی مولد روی دستگاه: این بهینهسازیها امکان اجرای مستقیم و کارآمد مدلهای هوش مصنوعی مولد مانند Phi-3.5 را روی دستگاه فراهم میکند و نیاز به اتصال دائمی به اینترنت یا سرورهای ابری را کاهش میدهد.
دسترسی به مدلهای Phi-3.5
توسعهدهندگان میتوانند از راههای مختلفی به مدلهای Phi-3.5 دسترسی داشته باشند:
- Hugging Face: این پلتفرم، مدلهای متنباز Phi-3.5 را به صورت مستقیم در اختیار توسعهدهندگان قرار میدهد.
- Azure AI Model Catalogue: این کاتالوگ نیز دسترسی به مدلهای Phi-3.5 را فراهم میکند.
- NeuroPilot SDK مدیاتک: کیت ابزار NeuroPilot SDK مدیاتک، ابزارهایی را برای توسعه برنامههای بهینهشده برای اجرای مدلهای Phi-3.5 روی چیپستهای دایمنسیتی ارائه میدهد.
عملکرد مدلها
مایکروسافت ادعا میکند که مدل Phi-3.5 MoE در بنچمارک SQuALITY، که خوانایی و دقت خلاصهسازی متن را میسنجد، از مدلهای Gemini 1.5 Flash و GPT-4o mini عملکرد بهتری داشته است.
به طور خلاصه، همکاری مدیاتک و مایکروسافت و بهینهسازی چیپستهای دایمنسیتی برای مدلهای Phi-3.5، گامی مهم در جهت ارائه تجربهای بهتر از هوش مصنوعی مولد روی دستگاههای موبایل است. این اقدام به کاربران امکان میدهد تا از قابلیتهای پیشرفته هوش مصنوعی به صورت مستقیم، سریع و کارآمد روی گوشیهای هوشمند خود بهرهمند شوند.