Liquid AI مدل های تولید کننده پایه مایع هوش مصنوعی با حافظه کوچکتر را معرفی کرد

خواندن این مطلب 2 دقیقه زمان میبرد

Liquid AI مدل های تولید کننده پایه مایع هوش مصنوعی با حافظه کوچکتر را معرفی کرد - چیکاو

Liquid AI، یک استارت‌آپ هوش مصنوعی (AI) مستقر در ماساچوست، اولین مدل‌های هوش مصنوعی تولیدی خود را اعلام کرد که بر اساس معماری ترانسفورماتور موجود ساخته نشده‌اند.

این معماری جدید که مدل بنیاد مایع (LFM) نامیده می شود، از ترانسفورماتورهای از پیش آموزش دیده (GPT) که پایه و اساس مدل های هوش مصنوعی محبوب مانند سری GPT توسط OpenAI، Gemini، Copilot و غیره است، فاصله می گیرد.

این استارت‌آپ ادعا می‌کند که مدل‌های جدید هوش مصنوعی از اصول اولیه ساخته شده‌اند و از مدل‌های زبان بزرگ (LLM) در براکت اندازه‌های قابل مقایسه بهتر عمل می‌کنند.

مدل‌های جدید پایه مایع هوش مصنوعی مایع

این استارتاپ در سال 2023 توسط محققان مؤسسه فناوری ماساچوست (MIT) در آزمایشگاه علوم رایانه و هوش مصنوعی (CSAIL) تأسیس شد و هدف آن ساخت معماری جدیدتر برای مدل‌های هوش مصنوعی است که می‌توانند در سطح مشابهی عمل کنند یا از GPT ها پیشی بگیرند.

این LFMهای جدید در سه اندازه پارامتر 1.3B، 3.1B و 40.3B موجود هستند. دومی یک مدل ترکیبی از کارشناسان (MoE) است، به این معنی که از مدل‌های مختلف زبان کوچک‌تر تشکیل شده است و هدف آن مقابله با وظایف پیچیده‌تر است. LFM ها اکنون در Liquid Playground شرکت، Lambda for Chat UI و API و Perplexity Labs موجود هستند و به زودی به Cerebras Inference اضافه خواهند شد. علاوه بر این، مدل‌های هوش مصنوعی برای سخت‌افزارهای Nvidia، AMD، Qualcomm، Cerebras و Apple بهینه‌سازی می‌شوند.

LFM ها نیز به طور قابل توجهی با فناوری GPT تفاوت دارند. این شرکت تاکید کرد که این مدل ها از اصول اولیه ساخته شده اند. اصول اول اساساً یک رویکرد حل مسئله است که در آن یک فناوری پیچیده به اصول خود تجزیه می شود و سپس از آنجا ساخته می شود.

به گفته این استارتاپ، این مدل های جدید هوش مصنوعی بر روی چیزی به نام واحدهای محاسباتی ساخته شده اند. به زبان ساده، این طراحی مجدد سیستم توکن است و در عوض، این شرکت از عبارت Liquid system استفاده می کند. اینها حاوی اطلاعات فشرده با تمرکز بر به حداکثر رساندن ظرفیت دانش و استدلال هستند.

این استارت‌آپ ادعا می‌کند که این طراحی جدید به کاهش هزینه‌های حافظه در طول استنتاج کمک می‌کند و خروجی عملکرد را در ویدیو، صدا، متن، سری‌های زمانی و سیگنال‌ها افزایش می‌دهد.

این شرکت همچنین ادعا می‌کند که مزیت مدل‌های هوش مصنوعی مبتنی بر مایع این است که معماری آن می‌تواند به طور خودکار برای یک پلتفرم خاص بر اساس نیازها و اندازه حافظه پنهان استنتاج بهینه شود.

در حالی که صدف های ساخته شده توسط این استارت آپ بلند هستند، عملکرد و کارایی آنها تنها زمانی قابل ارزیابی است که توسعه دهندگان و شرکت ها شروع به استفاده از آنها برای گردش کار هوش مصنوعی خود کنند. این استارت‌آپ منبع مجموعه داده‌های خود یا اقدامات ایمنی اضافه شده به مدل‌های هوش مصنوعی را فاش نکرد.

برچسب ها