شرکت OpenAI از GPT-4.1 رونمایی کرد

شرکت OpenAI سه مدل را معرفی کرده است: GPT-4.1، GPT-4.1 mini و GPT-4.1 nano. این مدلها دارای پنجرههای متنی بزرگ تا 1 میلیون توکن و محدودیت دانش تا ژوئن 2024 هستند.
این شرکت میگوید این مدلها از GPT-4o که اخیراً بهروزرسانی شده و GPT-4o mini که در ژوئیه گذشته عرضه شد، عملکرد بهتری دارند. GPT-4.1 فعلاً فقط از طریق API قابل استفاده است، بنابراین هنوز نمیتوانید از آن در ChatGPT استفاده کنید. توجه داشته باشید که GPT‑4.1 فقط از طریق API در دسترس خواهد بود. در ChatGPT، بسیاری از پیشرفتها در دنبال کردن دستورالعملها، کدنویسی و هوش به تدریج در آخرین نسخه GPT‑4o گنجانده شده است و ما همچنان با انتشار نسخههای آینده، موارد بیشتری را به آن اضافه خواهیم کرد.
اعداد بنچمارک، پیشرفتهای نسخه 4.1 را نشان میدهند. این نسخه در SWE-bench Verified، امتیاز 54 درصد را کسب کرده است که 21 امتیاز بیشتر از GPT-4o است. این سیستم در MultiChallenge، یک معیار دنبال کردن دستورالعمل، به 38 درصد امتیاز دست یافت و در معیار Video-MME، که در آن مدلها ویدیوهایی تا یک ساعت بدون زیرنویس را تجزیه و تحلیل میکنند، رکورد جدیدی در درک ویدیوهای طولانی با امتیاز 72 درصد ثبت کرد.
OpenAI همچنین با شرکای آلفا همکاری کرد تا عملکرد GPT-4.1 را در موارد استفاده در دنیای واقعی آزمایش کند. عملکرد یک چیز است، اما سرعت نیز مهم است. OpenAI میگوید GPT-4.1 اولین توکن خود را در حدود ۱۵ ثانیه هنگام پردازش 128 هزار توکن و تا 30 ثانیه در یک میلیون کامل برمیگرداند. Mini و nano حتی سریعتر هستند.
GPT-4.1 nano معمولاً در کمتر از 5 ثانیه برای درخواستهایی با 128 هزار توکن ورودی پاسخ میدهد. ذخیرهسازی سریع میتواند به کاهش بیشتر تأخیر و در عین حال صرفهجویی در هزینهها کمک کند. درک تصویر نیز شاهد جهش قابل توجهی بود. به طور خاص، GPT‑4.1 mini در انواع بنچمارکهای بینایی، عملکرد بهتری نسبت به GPT‑4o داشت.
در MMMU ، هوش مصنوعی GPT‑4.1 mini امتیاز 73 درصد را کسب کرد. این بالاتر از GPT‑4.5 و بسیار بهتر از GPT‑4o mini است. در MathVista ، GPT‑4.1 و GPT‑4.1 mini هر دو به 57% میرسند و GPT‑4o mini با 37% در رتبهی پایینتری قرار میگیرد. در CharXiv-Reasoning، که در آن مدلها بر اساس نمودارهای علمی به سؤالات پاسخ میدهند، GPT‑4.1 همچنان پیشتاز است.
در Video-MME (ویدیوهای طولانی بدون زیرنویس)، GPT‑4.1 امتیاز 72 درصد را کسب میکند که به طور قابل توجهی نسبت به 65% GPT‑4o بهبود یافته است.