Liquid AI مدل های تولید کننده پایه مایع هوش مصنوعی با حافظه کوچکتر را معرفی کرد
Liquid AI، یک استارتآپ هوش مصنوعی (AI) مستقر در ماساچوست، اولین مدلهای هوش مصنوعی تولیدی خود را اعلام کرد که بر اساس معماری ترانسفورماتور موجود ساخته نشدهاند.
این معماری جدید که مدل بنیاد مایع (LFM) نامیده می شود، از ترانسفورماتورهای از پیش آموزش دیده (GPT) که پایه و اساس مدل های هوش مصنوعی محبوب مانند سری GPT توسط OpenAI، Gemini، Copilot و غیره است، فاصله می گیرد.
این استارتآپ ادعا میکند که مدلهای جدید هوش مصنوعی از اصول اولیه ساخته شدهاند و از مدلهای زبان بزرگ (LLM) در براکت اندازههای قابل مقایسه بهتر عمل میکنند.
مدلهای جدید پایه مایع هوش مصنوعی مایع
این استارتاپ در سال 2023 توسط محققان مؤسسه فناوری ماساچوست (MIT) در آزمایشگاه علوم رایانه و هوش مصنوعی (CSAIL) تأسیس شد و هدف آن ساخت معماری جدیدتر برای مدلهای هوش مصنوعی است که میتوانند در سطح مشابهی عمل کنند یا از GPT ها پیشی بگیرند.
این LFMهای جدید در سه اندازه پارامتر 1.3B، 3.1B و 40.3B موجود هستند. دومی یک مدل ترکیبی از کارشناسان (MoE) است، به این معنی که از مدلهای مختلف زبان کوچکتر تشکیل شده است و هدف آن مقابله با وظایف پیچیدهتر است. LFM ها اکنون در Liquid Playground شرکت، Lambda for Chat UI و API و Perplexity Labs موجود هستند و به زودی به Cerebras Inference اضافه خواهند شد. علاوه بر این، مدلهای هوش مصنوعی برای سختافزارهای Nvidia، AMD، Qualcomm، Cerebras و Apple بهینهسازی میشوند.
LFM ها نیز به طور قابل توجهی با فناوری GPT تفاوت دارند. این شرکت تاکید کرد که این مدل ها از اصول اولیه ساخته شده اند. اصول اول اساساً یک رویکرد حل مسئله است که در آن یک فناوری پیچیده به اصول خود تجزیه می شود و سپس از آنجا ساخته می شود.
به گفته این استارتاپ، این مدل های جدید هوش مصنوعی بر روی چیزی به نام واحدهای محاسباتی ساخته شده اند. به زبان ساده، این طراحی مجدد سیستم توکن است و در عوض، این شرکت از عبارت Liquid system استفاده می کند. اینها حاوی اطلاعات فشرده با تمرکز بر به حداکثر رساندن ظرفیت دانش و استدلال هستند.
این استارتآپ ادعا میکند که این طراحی جدید به کاهش هزینههای حافظه در طول استنتاج کمک میکند و خروجی عملکرد را در ویدیو، صدا، متن، سریهای زمانی و سیگنالها افزایش میدهد.
این شرکت همچنین ادعا میکند که مزیت مدلهای هوش مصنوعی مبتنی بر مایع این است که معماری آن میتواند به طور خودکار برای یک پلتفرم خاص بر اساس نیازها و اندازه حافظه پنهان استنتاج بهینه شود.
در حالی که صدف های ساخته شده توسط این استارت آپ بلند هستند، عملکرد و کارایی آنها تنها زمانی قابل ارزیابی است که توسعه دهندگان و شرکت ها شروع به استفاده از آنها برای گردش کار هوش مصنوعی خود کنند. این استارتآپ منبع مجموعه دادههای خود یا اقدامات ایمنی اضافه شده به مدلهای هوش مصنوعی را فاش نکرد.