UC San Diego اعلام کرده است که مدل GPT-4 با موفقیت 54% آزمون تورینگ را پشت سر گذاشته است. در این آزمون، شرکتکنندگان انسانی نیز به اشتباه در 67 درصد مواقع به عنوان هوش مصنوعی شناسایی شدند. این نتایج توسط بازجوهایی به دست آمد که از روشهای متنوعی همچون طرح سؤالات شخصی و منطقی استفاده کردند.
دانشگاه کالیفرنیا سن دیگو با انتشار مقالهای در این زمینه، بهنظر میرسد که اولین شواهد معتبر از موفقیت یک سیستم هوش مصنوعی در آزمون مشهور تورینگ را ارائه کرده است. این آزمایش چه اهمیتی دارد و چگونه انجام شده است؟ بیایید این موفقیت بزرگ را بررسی کنیم و پیامدهای آن را برای زندگی دیجیتال در نظر بگیریم.
آزمون تورینگ چیست و چرا اهمیت دارد؟
آزمون تورینگ توسط آلن تورینگ، ریاضیدان برجسته، برای ارزیابی اینکه آیا یک ماشین میتواند هوشی مشابه انسان داشته باشد، پیشنهاد شد. این آزمون شامل گفتگوی متنی یک قاضی با یک انسان و یک ماشین است. اگر قاضی نتواند تفاوت میان انسان و ماشین را تشخیص دهد، ماشین آزمون را گذرانده است.
در ابتدا تصور میشد اگر دستگاهی بتواند بازجویان انسانی را در 30 درصد مواقع متقاعد کند که با یک انسان صحبت میکنند، تست را با موفقیت پشت سر گذاشته است. با این حال، بسیاری از دانشمندان اکنون معتقدند که دستیابی به نرخ قبولی 50 درصد به معنای واقعی بودن هوش مصنوعی است.
بررسی نتایج آزمون تورینگ توسط UC San Diego
محققان دانشگاه کالیفرنیا سن دیگو، کامرون آر. جونز و بنجامین کی. برگن، مقالهای با عنوان «مردم نمیتوانند GPT-4 را از انسان تشخیص دهند» منتشر کردند. این مطالعه اولین شواهد قوی و تجربی را از گذراندن آزمون تورینگ توسط یک سیستم هوش مصنوعی ارائه میدهد.
این آزمون با 500 شرکتکننده و مکالمات متنی 5 دقیقهای بین مدلهای هوش مصنوعی GPT-3.5 و GPT-4 در مقایسه با یک چتبات قدیمی به نام ELIZA اجرا شد. هر شرکتکننده پس از پایان هر گفتگو باید تصمیم میگرفت که با یک انسان یا ماشین صحبت کرده است.
تنظیمات آزمون و رویکرد بازجویی
بازجوها پیامهای اولیه را ارسال کرده و تنها یک پیام در هر زمان برای هر طرف مجاز بود. همچنین، مدلهای هوش مصنوعی به نحوی تنظیم شده بودند که با استفاده از اشتباهات املایی و زبان محاوره، تجربهای انسانیتر به بازجو ارائه دهند. این رویکرد باعث شد تا مدلهای هوش مصنوعی از سرعت تایپ بالا و پاسخدهی سریع که ممکن بود نشانهای از هوش مصنوعی باشد، دوری کنند.
نتیجهگیری: چه معنایی دارد؟
نتایج این آزمایش نشاندهنده پیشرفتهای چشمگیر در توسعه هوش مصنوعی است. اینکه یک مدل AI بتواند در بیش از نیمی از مواقع از تشخیص بازجویان انسانی فرار کند، معنای بزرگی برای آینده فناوری دارد. این موفقیتها نشاندهنده پتانسیل بالای AI برای ایفای نقش در زندگی روزمره ما و تأثیرات آن بر تعاملات دیجیتال است.