شرکت OpenAI از GPT-4.1 رونمایی کرد

شرکت OpenAI سه مدل را معرفی کرده است: GPT-4.1، GPT-4.1 mini و GPT-4.1 nano. این مدل‌ها دارای پنجره‌های متنی بزرگ تا 1 میلیون توکن و محدودیت دانش تا ژوئن 2024 هستند.

این شرکت می‌گوید این مدل‌ها از GPT-4o که اخیراً به‌روزرسانی شده و GPT-4o mini که در ژوئیه گذشته عرضه شد، عملکرد بهتری دارند. GPT-4.1 فعلاً فقط از طریق API قابل استفاده است، بنابراین هنوز نمی‌توانید از آن در ChatGPT استفاده کنید. توجه داشته باشید که GPT‑4.1 فقط از طریق API در دسترس خواهد بود. در ChatGPT، بسیاری از پیشرفت‌ها در دنبال کردن دستورالعمل‌ها، کدنویسی و هوش به تدریج در آخرین نسخه GPT‑4o گنجانده شده است و ما همچنان با انتشار نسخه‌های آینده، موارد بیشتری را به آن اضافه خواهیم کرد.

اعداد بنچمارک، پیشرفت‌های نسخه 4.1 را نشان می‌دهند. این نسخه در SWE-bench Verified، امتیاز 54 درصد را کسب کرده است که 21 امتیاز بیشتر از GPT-4o است. این سیستم در MultiChallenge، یک معیار دنبال کردن دستورالعمل، به 38 درصد امتیاز دست یافت و در معیار Video-MME، که در آن مدل‌ها ویدیوهایی تا یک ساعت بدون زیرنویس را تجزیه و تحلیل می‌کنند، رکورد جدیدی در درک ویدیوهای طولانی با امتیاز 72 درصد ثبت کرد.

OpenAI همچنین با شرکای آلفا همکاری کرد تا عملکرد GPT-4.1 را در موارد استفاده در دنیای واقعی آزمایش کند. عملکرد یک چیز است، اما سرعت نیز مهم است. OpenAI می‌گوید GPT-4.1 اولین توکن خود را در حدود ۱۵ ثانیه هنگام پردازش 128 هزار توکن و تا 30 ثانیه در یک میلیون کامل برمی‌گرداند. Mini و nano حتی سریع‌تر هستند.

شرکت OpenAI از GPT-4.1 رونمایی کرد

GPT-4.1 nano معمولاً در کمتر از 5 ثانیه برای درخواست‌هایی با 128 هزار توکن ورودی پاسخ می‌دهد. ذخیره‌سازی سریع می‌تواند به کاهش بیشتر تأخیر و در عین حال صرفه‌جویی در هزینه‌ها کمک کند. درک تصویر نیز شاهد جهش قابل توجهی بود. به طور خاص، GPT‑4.1 mini در انواع بنچمارک‌های بینایی، عملکرد بهتری نسبت به GPT‑4o داشت.

در MMMU ، هوش مصنوعی GPT‑4.1 mini امتیاز 73 درصد را کسب کرد. این بالاتر از GPT‑4.5 و بسیار بهتر از GPT‑4o mini است. در MathVista ، GPT‑4.1 و GPT‑4.1 mini هر دو به 57% می‌رسند و GPT‑4o mini با 37% در رتبه‌ی پایین‌تری قرار می‌گیرد. در CharXiv-Reasoning، که در آن مدل‌ها بر اساس نمودارهای علمی به سؤالات پاسخ می‌دهند، GPT‑4.1 همچنان پیشتاز است.

در Video-MME (ویدیوهای طولانی بدون زیرنویس)، GPT‑4.1 امتیاز 72 درصد را کسب می‌کند که به طور قابل توجهی نسبت به 65% GPT‑4o بهبود یافته است.