ChatGPT 4o یا چت جی‌پی‌تی فور اُو چیست

مدل GPT-4o، نسل جدیدی از مدل‌های هوش مصنوعی است که قابلیت استدلال در حوزه‌های صوتی، تصویری و متنی را به‌صورت همزمان و در زمان واقعی دارد. تلفظ GPT-4o به صورت...

انتشار: , زمان مطالعه: 4 دقیقه
ChatGPT 4o یا چت جی‌پی‌تی فور اُو چیست
دسته بندی: معرفی تکنولوژی تعداد بازدید: 517

معرفی مدل GPT-4o: پیشرفت‌های جدید در هوش مصنوعی

مدل GPT-4o، نسل جدیدی از مدل‌های هوش مصنوعی است که قابلیت استدلال در حوزه‌های صوتی، تصویری و متنی را به‌صورت همزمان و در زمان واقعی دارد. تلفظ GPT-4o به صورت چت جی‌پی‌تی فور اُو تلفظ می شود.مدل GPT-4o (که "o" به معنای "همه‌جانبه" است) به تعامل طبیعی‌تر بین انسان و کامپیوتر کمک می‌کند. این مدل می‌تواند هر ترکیبی از متن، صدا و تصویر را به عنوان ورودی بپذیرد و خروجی‌های مشابهی را تولید کند. این مدل قادر است به ورودی‌های صوتی در حداقل ۲۳۲ میلی‌ثانیه و به‌طور متوسط در ۳۲۰ میلی‌ثانیه پاسخ دهد، که مشابه زمان پاسخ‌دهی انسان در مکالمه است. عملکرد این مدل در زمینه متن به زبان انگلیسی و کد نویسی برابر با GPT-4 Turbo است و در متون به زبان‌های غیرانگلیسی بهبود قابل توجهی دارد. علاوه بر این، GPT-4o در مقایسه با مدل‌های موجود، درک بهتری از تصاویر و صدا دارد.

توانایی‌های مدل

پیش از GPT-4o، استفاده از حالت صوتی برای صحبت با مدل‌های هوش مصنوعی با تأخیرهای زمانی مواجه بود که به‌طور متوسط برای GPT-3.5 حدود ۲.۸ ثانیه و برای GPT-4 حدود ۵.۴ ثانیه بود. در این حالت، صدا به متن تبدیل می‌شد، سپس متن توسط مدل پردازش می‌شد و در نهایت متن به صدا تبدیل می‌شد. این فرآیند باعث می‌شد که مدل هوش مصنوعی اطلاعات زیادی را از دست بدهد و نتواند به‌طور مستقیم لحن، تعداد گویندگان یا صداهای پس‌زمینه را تشخیص دهد و نمی‌توانست خنده، آواز یا احساسات را به خروجی تبدیل کند.

با معرفی GPT-4o، یک مدل جدید به‌صورت یکپارچه در تمامی زمینه‌های متن، تصویر و صدا آموزش داده شده است، به‌طوری‌که تمامی ورودی‌ها و خروجی‌ها توسط یک شبکه عصبی پردازش می‌شوند. از آنجا که GPT-4o اولین مدلی است که تمامی این ورودی‌ها را ترکیب می‌کند، همچنان در مراحل ابتدایی کشف توانایی‌ها و محدودیت‌های این مدل هستیم. این مدل زمانی که شما یک مقاله علمی تولید می کنید قادر است منابع مقاله را هم به شما اعلام کند.

ارزیابی مدل

بر اساس معیارهای سنتی، GPT-4o به سطح عملکرد GPT-4 Turbo در زمینه‌های متنی، استدلال و کدنویسی دست یافته و در زمینه‌های چندزبانه، صوتی و تصویری توانسته استانداردهای جدیدی را ثبت کند.

ایمنی و محدودیت‌های مدل

مدل GPT-4o از طراحی ایمن در تمامی زمینه‌ها بهره می‌برد و از تکنیک‌هایی نظیر فیلتر کردن داده‌های آموزشی و بهینه‌سازی رفتار مدل پس از آموزش استفاده می‌کند. همچنین سیستم‌های ایمنی جدیدی برای محدود کردن خروجی‌های صوتی ایجاد شده‌اند.

بررسی‌های انجام‌شده بر روی این مدل نشان می‌دهد که در زمینه امنیت سایبری، CBRN (شیمیایی، بیولوژیکی، رادیولوژیکی و هسته‌ای)، تأثیرگذاری و خودمختاری مدل، GPT-4o در هیچ یک از این دسته‌ها بالاتر از سطح متوسط قرار نمی‌گیرد. این ارزیابی شامل اجرای مجموعه‌ای از ارزیابی‌های خودکار و انسانی در طول فرآیند آموزش مدل بود. نسخه‌های قبل و بعد از کاهش خطرات مدل با استفاده از تنظیمات دقیق و پراپ‌های سفارشی بررسی شده‌اند تا توانایی‌های مدل به‌طور کامل ارزیابی شود.

مدل GPT-4o همچنین تحت آزمایشات گسترده خارجی با همکاری بیش از ۷۰ کارشناس در حوزه‌هایی مانند روان‌شناسی اجتماعی، تعصب و انصاف، و اطلاعات نادرست قرار گرفته است تا خطرات ناشی از قابلیت‌های جدید شناسایی شوند. از این آموخته‌ها برای ساخت مداخلات ایمنی استفاده شده است تا امنیت تعامل با GPT-4o بهبود یابد و ریسک‌های جدیدی که شناسایی می‌شوند، به‌طور مداوم کاهش یابند.

دسترسی مدل

مدل GPT-4o گام جدیدی در پیشبرد مرزهای یادگیری عمیق و بهبود کاربردپذیری عملی هوش مصنوعی است. تلاش‌های بسیاری برای بهبود کارآیی در هر لایه از پشته انجام شده است و نتیجه این تلاش‌ها، ارائه مدلی در سطح GPT-4 به‌صورت گسترده‌تر است. قابلیت‌های متنی و تصویری GPT-4o در حال حاضر در برخی پلتفرم‌ها ارائه شده‌اند و به‌زودی نسخه جدید حالت صوتی این مدل نیز عرضه خواهد شد.

توسعه‌دهندگان نیز اکنون می‌توانند به مدل GPT-4o در API به‌عنوان مدل متنی و تصویری دسترسی داشته باشند. این مدل دو برابر سریع‌تر است، نصف قیمت دارد و محدودیت‌های نرخی پنج برابری بالاتر از GPT-4 Turbo دارد. قابلیت‌های صوتی و ویدئویی جدید GPT-4o نیز به‌زودی برای گروه کوچکی از همکاران مورد اعتماد در API ارائه خواهند شد.


دیدگاه های مربوط به این مقاله (برای ارسال دیدگاه در سایت حتما باید عضو باشید و پروفایل کاربری شما تکمیل شده باشد)

تعداد 2 دیدگاه ثبت شده
فرشاد عباسی می گه: زمان ثبت: 6 ماه پیش

از اینکه وقت میزارید و کوهتا و مفید مطالب رو مینویسید بسیار ممنونیم

ابراهیم شفیعی می گه: زمان ثبت: 6 ماه پیش

سلامت باشی فرشاد عزیز❤️