هوش مصنوعی بازی ساز گوگل معرفی شد
گوگل مدل هوش مصنوعی مولد دیگری را معرفی کرده که میتواند تعداد بیپایانی از بازیهای پلتفرمی دوبعدی ایجاد کند. Genie به عنوان یک مدل جهانی قابل کنترل اکشن معرفی شده که بر روی دادههای بازیهای ویدیویی بدون نظارت آموزش دیده است. از تجزیه و تحلیل پیش بینی برای تولید سطوح بازی ویدیویی استفاده کرده و همچنین میتواند یک شخصیت قابل بازی را کنترل کند و حرکات آن را تعیین کند. جالب اینجاست که OpenAI اوایل این ماه یک مدل جهانی به نام Sora را نیز معرفی کرد که میتواند ویدیوهای فوق واقعی تا یک دقیقه تولید کند.
این اعلامیه توسط تیم راکتشل، سرپرست تیم Open-Endedness، گوگل DeepMind، از طریق یک پستی در X اعلام کرد. او گفت:
ما Genie را معرفی میکنیم، یک مدل جهانی بنیادی که به طور انحصاری از ویدیوهای اینترنتی آموزش داده شده که میتواند با توجه به درخواستهای تصویر، تنوع بیپایانی از جهانهای دوبعدی قابل کنترل را ایجاد کند. Genie از این نظر منحصر به فرد است که فقط میتواند یک چیز خاص را تولید کند و همچنین تنها مدل تولید کننده بازی ویدیویی بودهکه تاکنون به صورت عمومی اعلام شده است.
Genie گوگل هنوز برای عموم آزاد نیست و در حال حاضر تنها به عنوان یک مدل تحقیقاتی وجود دارد. به همین دلیل است که عملکردهای کاربر محور آن هنوز شناخته شده نیست. میتواند سطوح بازی ویدیویی را با استفاده از تصاویر ایجاد کند، اما مشخص نیست که آیا میتواند پیامهای متنی یا حتی درخواستهای ویدیویی را دریافت کند. نسخه پیش چاپ مقاله به صورت آنلاین منتشر شد که جنبه های فنی آن را برجسته می کند. مدل هوش مصنوعی بدون نظارت بر روی 200000 ساعت فیلم بازی ویدیویی آموزش داده شد و حاوی 11 میلیارد پارامتر است. معماری این مدل از سه بخش مختلف استفاده میکند، یک نشانهساز ویدئوی فضایی-زمانی، یک مدل دینامیک اتورگرسیو و یک مدل عمل نهفته ساده و مقیاسپذیر.
برای سادهتر کردن، توکنایزر ویدیوی فضایی-زمانی فیلم بازی ویدیویی را میگیرد، آن را به تکههای کوچکتری از مجموعه دادهها، معروف به نشانهها، تقسیم میکند که میتواند توسط مدل پایه به کار گرفته شود. Spatiotemporal توضیح میدهد که دادهها هم از نظر زمان و هم در مکان تجزیه میشوند.
مدل پویا اتورگرسیو در مرحله بعدی قرار میگیرد. مدلهای خودرگرسیون اساساً آینده را بر اساس نحوه عملکرد چیزی در گذشته پیشبینی میکنند و یک مدل پویا مسئول درک چگونگی تغییر و حرکت چیزها در طول زمان است. بنابراین این بخش جایی بوده که تجزیه و تحلیل پیش بینی آغاز میشود. مؤلفه نهایی، مدل کنش پنهان است. اینجاست که هوش مصنوعی متوجه میشود که شخصیت قابل بازی چگونه در دنیای بازیهای ویدیویی حرکت میکند.