اوپن‌ای‌آی می تواند از مدل هوش مصنوعی چندوجهی جدیدی رونمایی کند که با مردم صحبت می کند و اشیا را تشخیص می دهد

بوسیله تیم چیکاو در اردیبهشت 24, 1403

OpenAI می تواند از مدل هوش مصنوعی چندوجهی جدیدی رونمایی کند که با مردم صحبت می کند و اشیا را تشخیص می دهد - چیکاو

مدتی است که ما زیاد می شنویم که انتظار می رود OpenAI امروز موتور جستجوی مبتنی بر هوش مصنوعی خود را برای رقابت با جستجوی گوگل معرفی کند. به نظر می رسد OpenAI در حال برنامه ریزی برای ربودن توجه گوگل درست قبل از رویداد سالانه آن است.

اکنون، یک گزارش جدید نشان می دهد که OpenAI می تواند یک مدل هوش مصنوعی چندوجهی جدید را رونمایی کند. با خواندن همراه باشید تا بدانید که انتظار می‌رود مدل جدید هوش مصنوعی چه چیزی ارائه دهد.

طبق گزارش The Information (از طریق The Verge)، مدل هوش مصنوعی چندوجهی OpenAI می تواند با شما صحبت کند و اشیا را تشخیص دهد. انتظار می رود این مدل هوش مصنوعی بخشی از چیزی باشد که این شرکت قصد دارد در روز دوشنبه رونمایی کند.

مدل جدید احتمالاً تفسیر سریع‌تر و دقیق‌تری از تصاویر و صدا در مقایسه با مدل‌های رونویسی جداگانه و متن به گفتار OpenAI ارائه می‌کند.

به نظر می‌رسد این مدل به نمایندگی‌های خدمات مشتری این امکان را می‌دهد که «بلای صدای تماس‌گیرندگان یا طعنه‌آمیز بودن آن‌ها را بهتر درک کنند» و «از لحاظ نظری» می‌تواند به دانش‌آموزان در مسائل ریاضی کمک کند یا علائم دنیای واقعی را ترجمه کند.

این مدل ممکن است از GPT-4 Turbo در «پاسخ دادن به انواع سؤالات» پیشی بگیرد، اما همچنان مستعد خطاهای مطمئن است.

به نظر می رسد OpenAI روی برقراری تماس های تلفنی در داخل chatGPT کار می کند. احتمالاً این بخش کوچکی از رویداد اعلام شده در روز دوشنبه خواهد بود.

این امکان وجود دارد که OpenAI همچنین در حال آماده سازی یک ویژگی یکپارچه جدید در ChatGPT برای برقراری تماس های تلفنی باشد، همانطور که توسعه دهنده Ananay پیشنهاد داده است که تصویری از کد مربوط به تماس ها را به اشتراک گذاشته است. آرورا همچنین به شواهدی اشاره کرد که نشان می‌دهد OpenAI سرورهایی برای ارتباطات صوتی و تصویری بلادرنگ ارائه کرده است.

با توجه به اینکه همه این جزئیات از گزارش ها و افشاگری ها ناشی می شود، عاقلانه است که منتظر اعلام رسمی OpenAI باشیم. هر آنچه OpenAI در فروشگاه دارد، از طریق پخش زنده در وب سایت آن در روز دوشنبه در ساعت 10 صبح PT / 22:00 IST آشکار خواهد شد.

منبع digit

گوگل هوش مصنوعی