جادویی‌ترین هوش مصنوعی جهان رونمایی شد: سریع، جهانی و مهم‌تر از همه، رایگان!

مدل زبانی بزرگ جدید GPT-4o شرکت OpenAI در جریان مراسم ویژهٔ این شرکت رونمایی شد. GPT-4o نسخهٔ اصلاح‌شدهٔ مدل زبانی GPT-4 است که به‌عنوان قلب تپندهٔ چت‌بات معروف ChatGPT عمل می‌کند. حرف o در عبارت GPT-4o مخفف Omni به معنی عالم‌گیر یا جهانی است.

به گزارش خبرآنلاین و به نقل از زومیت، «میرا موراتی» مدیر ارشد فناوری OpenAI در این مراسم گفت که مدل جدید این شرکت بسیار سریع‌تر است و درزمینهٔ درک متن و محتوای تصویری و محتوای صوتی، عملکرد چشمگیری از خود نشان می‌دهد.

OpenAI می‌گوید که مدل زبانی بزرگ GPT-4o به رایگان در دسترس همهٔ مردم قرار می‌گیرد، بااین‌حال محدودیت ظرفیت کاربران نسخهٔ اشتراکی پنج برابرِ کاربران نسخهٔ رایگان است؛ به این معنی که کاربران اشتراکی می‌توانند روزانه پنج برابر درخواست بیشتر ارسال کنند.

در بخشی از مراسم OpenAI شاهد عملکرد حیرت‌انگیز GPT-4o در حل مسائل ریاضی و حتی درک لحن حرف زدن کاربر بودیم. قابلیت صوتی جدید GPT-4o به احساسات کاربر کاملاً واکنش نشان می‌دهد و با لحنی صمیمی مشغول صحبت کردن و حتی داستان گفتن می‌شود.

سم آلتمن، مدیرعامل OpenAI، اعلام کرد که مدل GPT-4o به‌صورت ذاتی، چندحالته است؛ یعنی مدل جدید می‌تواند افزون بر متن، محتواهای صوتی و تصویری را تولید کند و بفهمد.

هوش مصنوعی GPT-4o مکالمات انسان و کامپیوتر را طبیعی‌تر می‌کند

توسعه‌دهندگانی که به GPT-4o علاقه‌مندند، می‌توانند API این مدل هوش مصنوعی را با نصف قیمت GPT-4 Turbo خریداری کنند. جالب‌تر اینکه GPT-4o به میزان دو برابر سریع‌تر از نسخهٔ Turbo است.

بر اساس گفتهٔ OpenAI، اکثر قابلیت‌های مدل هوش مصنوعی جدید این شرکت به‌صورت تدریجی در دسترس قرار می‌گیرند؛ بااین‌حال قابلیت‌های متنی و تصویری از همین امروز در چت‌بات ChatGPT در دسترس است.

مدل زبانی GPT-4o قدمی در راستای طبیعی شدن تعامل انسان با کامپیوتر است و می‌تواند در تنها ۲۳۲ میلی‌ثانیه (میانگین ۳۲۰ میلی‌ثانیه)، به ورودی‌های صوتی پاسخ دهد؛ OpenAI ادعا می‌کند که زمان پاسخ‌دهی GPT-4o مشابه زمان پاسخ‌دهی انسان در مکالمات روزمره است.

GPT-4o درزمینهٔ فهم متن‌های انگلیسی و کد، هم‌سطح نسخهٔ Turbo ظاهر می‌شود، اما ارزان‌تر و بسیار سریع‌تر است. این مدل زبانی جدید به‌طور ویژه در توانایی درک محتوای بصری و صوتی تقویت شده است.

تا پیش از انتشار GPT-4o می‌توانستید از طریق قابلیت Voice Mode و با تأخیر ۲٫۸ ثانیه‌ای در GPT-3.5 یا ۵٫۴ ثانیه‌ای در GPT-4 با ChatGPT گفت‌وگو کنید؛ اما Voice Mode برای ارائهٔ این قابلیت، به سه مدل اتکا می‌کند: یک مدل ساده برای تبدیل صدا به متن، GPT-3.5 یا GPT-4 برای تبدیل متن به متن و درنهایت مدل سوم برای تبدیل متن به صدا.

با انتشار GPT-4o، سازوکار قابلیت صوتی ChatGPT تغییر می‌کند. OpenAI می‌گوید مدل جدیدی را توسعه داده است که به‌طور کامل به متن و صدا و تصویر دسترسی دارد و سرعت بسیار بالاتری ارائه می‌دهد.

بر اساس گفتهٔ OpenAI، مدل هوش مصنوعی GPT-4o در کنار عملکرد سریع و دقیق، توجه ویژه‌ای به ایمنی دارد و محتواهای حساس را تولید نمی‌کند.

دسترسی رایگاه به GPT Store

OpenAI تعدادی از ویژگی‌های فروشگاه جی‌پی‌تی استور را که قبلاً فقط مختص مشترکین پولی بود، در دسترس کاربران رایگان خود قرار می‌دهد. مهم‌ترین ویژگی، ایجاد چت‌بات‌های سفارشی و گشت‌وگذار در GPT Store است.

شرکت OpenAI چهار ماه پیش در ۱۰ ژانویه (۲۰ دی)، GPT Store را برای مشترکین پولی افتتاح کرد. این فروشگاه امکان ساخت چت‌بات‌هایی به نام GPT و به اشتراک‌گذاری آن‌ها را به کاربران می‌دهد.

درحال‌حاضر برخی از بات‌های پرطرفدار سفارشی هوش مصنوعی شامل بات تولیدکنندهٔ تصویر، چت‌باتی به نام Consensus (که برای کمک به تحقیقات علمی طراحی شده) و بات سازندهٔ لوگو هستند.

OpenAI گفت که برنامهٔ اشتراک درآمد را که بر اساس تعامل است، برای سازندگان GPTها ارائه خواهد کرد که آزمایش آن در ماه مارس (اسفند و فروردین) آغاز شده است. مخاطبان بات‌ها به دلیل محدودیت این ویژگی به کاربران اشتراک پولی محدود شده است.

ارائه نسخه دسکتاپ ChatGDP، فقط مخصوص macOS

OpenAI هم‌چنین با معرفی اپلیکیشن دسکتاپ ChatGPT برای کاربران macOS، اعلام کرد که اپلیکیشن دسکتاپ از رابط کاربری جدیدی مشابه با نسخهٔ موبایل بهره می‌برد.

میرا موراتی، مدیر ارشد فناوری OpenAI، در مراسم نشان داد که اپلیکیشن دسکتاپ ChatGPT از گفت‌وگوی صوتی نیز پشتیبانی می‌کند؛ قابلیتی که تاکنون تنها روی گوشی‌ها در دسترس بود.

OpenAI اعلام کرد: «ما اپلیکیشن مخصوص macOS را از امروز برای کاربران سرویس پلاس منتشر می‌کنیم و در هفته‌های آینده آن را به طور گسترده در دسترس قرار خواهیم داد. ما همچنین قصد داریم نسخهٔ مخصوص ویندوز را تا پایان ۲۰۲۴ رونمایی کنیم».

۵۴۵۴