OpenAI خزنده وب را برای آماده سازی GPT-5 به کار می گیرد
OpenAI یک ابزار خزنده وب به نام “GPTBot” را معرفی کرده است که هدف آن تقویت قابلیت های مدل های آینده GPT است.
این شرکت میگوید دادههای جمعآوریشده از طریق GPTBot به طور بالقوه میتواند دقت مدل را افزایش داده و قابلیتهای آن را گسترش دهد و گام مهمی در تکامل مدلهای زبان مبتنی بر هوش مصنوعی باشد.
خزنده های وب – که به آنها عنکبوت های وب نیز گفته می شود – نقشی اساسی در نمایه سازی محتوا در گستره وسیع اینترنت دارند. موتورهای جستجوی معروفی مانند گوگل و بینگ برای پر کردن نتایج جستجوی خود با صفحات وب مرتبط به این ربات ها متکی هستند.
GPTBot OpenAI هدف مشخصی خواهد داشت: جمعآوری دادههای در دسترس عموم و در عین حال دور زدن منابعی که شامل دیوارهای پرداخت، جمعآوری دادههای شخصی یا محتوایی است که با خطمشیهای OpenAI مغایرت دارد.
صاحبان وبسایتها میتوانند از خزیدن GPTBot در سایتهایشان به سادگی با اجرای دستور «عدم اجازه» در یک فایل سرور استاندارد جلوگیری کنند. این امر به آنها اجازه می دهد تا کنترل کنند که کدام بخش از محتوای آنها برای خزنده وب قابل دسترسی است.
اعلامیه OpenAI دقیقاً پس از ارائه درخواست علامت تجاری توسط این شرکت برای “GPT-5” دنبال میشود که پیشبینی میشود جایگزین مدل فعلی GPT-4 شود.
این پرونده که در 18 ژوئیه در اداره ثبت اختراع و علائم تجاری ایالات متحده انجام شد، شامل استفاده از “GPT-5” در گفتار و متن انسان مبتنی بر هوش مصنوعی، تبدیل صدا به متن، تشخیص صدا و ترکیب گفتار است.
با این حال، در حالی که برنامه علامت تجاری GPT-5 باعث ایجاد هیجان در بین علاقه مندان به هوش مصنوعی شده است، سم آلتمن، مدیر عامل OpenAI نسبت به انتظارات زودهنگام هشدار داد. آلتمن فاش کرد که این شرکت هنوز تا شروع آموزش GPT-5 فاصله دارد، زیرا باید قبل از شروع این فرآیند، ممیزی های ایمنی گسترده ای انجام شود.
تلاشهای اخیر OpenAI بدون بحث و جدل نبوده است. نگرانیهایی در مورد شیوههای جمعآوری دادههای شرکت، بهویژه مسائل مربوط به کپی رایت و رضایت ایجاد شده است.
در ژوئن، رگولاتور حریم خصوصی ژاپن هشداری به OpenAI درباره جمعآوری غیرمجاز دادهها صادر کرد. در اوایل سال جاری، ایتالیا استفاده از ChatGPT را به دلیل نقض قوانین حریم خصوصی اتحادیه اروپا به طور موقت ممنوع کرد.
OpenAI و مایکروسافت در حال حاضر با یک شکایت دسته جمعی توسط 16 شاکی که ادعا می کنند به اطلاعات خصوصی از تعاملات کاربر ChatGPT بدون رضایت مناسب دسترسی پیدا کرده اند، روبرو هستند. این شرکتها همچنین با شکایتی بر سر GitHub Copilot شکایت کردهاند و مدعیان ادعا میکنند که ابزار تولید کد با حذف کد آنها بدون ارائه انتساب مناسب، حقوق توسعهدهندگان را نقض کرده است.
اگر این ادعاها صحت داشته باشند، OpenAI و مایکروسافت به طور بالقوه می توانند قانون کلاهبرداری و سوء استفاده رایانه ای را نقض کنند، یک سابقه قانونی در ارتباط با پرونده های خراش دادن وب.
همانطور که OpenAI به پیشبرد مرزهای فناوری هوش مصنوعی ادامه می دهد، باید این چالش ها را برای اطمینان از توسعه مسئولانه و اخلاقی در چشم انداز هوش مصنوعی بررسی کند.