اوپنایآی می تواند از مدل هوش مصنوعی چندوجهی جدیدی رونمایی کند که با مردم صحبت می کند و اشیا را تشخیص می دهد
مدتی است که ما زیاد می شنویم که انتظار می رود OpenAI امروز موتور جستجوی مبتنی بر هوش مصنوعی خود را برای رقابت با جستجوی گوگل معرفی کند. به نظر می رسد OpenAI در حال برنامه ریزی برای ربودن توجه گوگل درست قبل از رویداد سالانه آن است.
اکنون، یک گزارش جدید نشان می دهد که OpenAI می تواند یک مدل هوش مصنوعی چندوجهی جدید را رونمایی کند. با خواندن همراه باشید تا بدانید که انتظار میرود مدل جدید هوش مصنوعی چه چیزی ارائه دهد.
طبق گزارش The Information (از طریق The Verge)، مدل هوش مصنوعی چندوجهی OpenAI می تواند با شما صحبت کند و اشیا را تشخیص دهد. انتظار می رود این مدل هوش مصنوعی بخشی از چیزی باشد که این شرکت قصد دارد در روز دوشنبه رونمایی کند.
مدل جدید احتمالاً تفسیر سریعتر و دقیقتری از تصاویر و صدا در مقایسه با مدلهای رونویسی جداگانه و متن به گفتار OpenAI ارائه میکند.
به نظر میرسد این مدل به نمایندگیهای خدمات مشتری این امکان را میدهد که «بلای صدای تماسگیرندگان یا طعنهآمیز بودن آنها را بهتر درک کنند» و «از لحاظ نظری» میتواند به دانشآموزان در مسائل ریاضی کمک کند یا علائم دنیای واقعی را ترجمه کند.
این مدل ممکن است از GPT-4 Turbo در «پاسخ دادن به انواع سؤالات» پیشی بگیرد، اما همچنان مستعد خطاهای مطمئن است.
به نظر می رسد OpenAI روی برقراری تماس های تلفنی در داخل chatGPT کار می کند. احتمالاً این بخش کوچکی از رویداد اعلام شده در روز دوشنبه خواهد بود.
این امکان وجود دارد که OpenAI همچنین در حال آماده سازی یک ویژگی یکپارچه جدید در ChatGPT برای برقراری تماس های تلفنی باشد، همانطور که توسعه دهنده Ananay پیشنهاد داده است که تصویری از کد مربوط به تماس ها را به اشتراک گذاشته است. آرورا همچنین به شواهدی اشاره کرد که نشان میدهد OpenAI سرورهایی برای ارتباطات صوتی و تصویری بلادرنگ ارائه کرده است.
با توجه به اینکه همه این جزئیات از گزارش ها و افشاگری ها ناشی می شود، عاقلانه است که منتظر اعلام رسمی OpenAI باشیم. هر آنچه OpenAI در فروشگاه دارد، از طریق پخش زنده در وب سایت آن در روز دوشنبه در ساعت 10 صبح PT / 22:00 IST آشکار خواهد شد.