محققان دریافتند GPT و سایر مدل های هوش مصنوعی نمی توانند پرونده SEC را تجزیه و تحلیل کنند

آذر 29, 1402

محققان استارتاپی به نام Patronus AI دریافتند که مدل‌های زبان بزرگ، شبیه به آنچه در قلب ChatGPT وجود دارد، اغلب در پاسخ به سؤالات ناشی از پرونده‌های کمیسیون بورس و اوراق بهادار ناکام می‌مانند.

حتی بهترین پیکربندی مدل هوش مصنوعی که آنها آزمایش کردند، GPT-4-Turbo OpenAI، هنگامی که به توانایی خواندن تقریباً یک پرونده کامل در کنار سؤال مجهز شد، تنها 79٪ پاسخ ها را درست در آزمایش جدید Patronus AI، بنیانگذاران شرکت، دریافت کرد. به CNBC گفت.

اغلب اوقات، مدل‌های به اصطلاح زبان بزرگ از پاسخ دادن خودداری می‌کنند، یا ارقام و حقایقی را که در پرونده‌های SEC نبود، «توهم» می‌کنند.

آناند کانپان، یکی از بنیانگذاران هوش مصنوعی Patronus گفت: «این نوع نرخ عملکرد کاملاً غیرقابل قبول است. برای اینکه واقعاً به روشی خودکار و آماده تولید کار کند، باید بسیار بالاتر باشد.»

این یافته‌ها برخی از چالش‌های پیش روی مدل‌های هوش مصنوعی را نشان می‌دهد، زیرا شرکت‌های بزرگ، به‌ویژه در صنایع تحت نظارت مانند امور مالی، به دنبال استفاده از فناوری‌های پیشرفته در عملیات خود هستند، چه برای خدمات مشتری یا تحقیقات.

از زمان انتشار ChatGPT در اواخر سال گذشته، توانایی استخراج سریع اعداد مهم و انجام تجزیه و تحلیل بر روی روایت های مالی به عنوان یکی از امیدوارکننده ترین برنامه های کاربردی برای چت بات ها دیده می شود. پرونده‌های SEC پر از داده‌های مهم هستند، و اگر یک ربات بتواند آن‌ها را به‌طور دقیق خلاصه کند یا به‌سرعت به سؤالات مربوط به آنچه در آن‌ها است پاسخ دهد، می‌تواند به کاربر در صنعت رقابتی مالی کمک کند.

در سال گذشته، بلومبرگ LP مدل هوش مصنوعی خود را برای داده‌های مالی توسعه داد ، اساتید دانشکده بازرگانی تحقیق کردند که آیا ChatGPT می‌تواند سرفصل‌های مالی را تجزیه کند یا خیر، و JPMorgan
CNBC قبلا گزارش داده بود که روی یک ابزار سرمایه گذاری خودکار مبتنی بر هوش مصنوعی کار می کند . بر اساس پیش بینی اخیر مک کینزی، هوش مصنوعی مولد می تواند صنعت بانکداری را تریلیون ها دلار در سال تقویت کند .

اما ورود GPT به صنعت هموار نبوده است. زمانی که مایکروسافت
اولین بار بینگ چت خود را با استفاده از GPT OpenAI راه اندازی کرد، یکی از نمونه های اصلی آن استفاده از ربات چت برای خلاصه کردن سریع بیانیه مطبوعاتی درآمد بود. ناظران به سرعت متوجه شدند که اعداد در مثال مایکروسافت خاموش بودند و برخی از اعداد کاملاً ساخته شده بودند.

آذر 29, 1402

ما را دنبال کنید

نوشته های مشابه

معرفی Google Gemini برای آیفون؛ آیا اپل از رقبا عقب مانده است؟

چالش خلاقیت در دنیای موسیقی هوش مصنوعی

گوگل اپلیکیشن هوش مصنوعی Gemini را برای آیفون عرضه کرد

Gemini در Gmail؛ مدیریت ایمیل و تقویم در یک پنل

دیدگاهتان را بنویسید لغو پاسخ