گوگل ویژگیهای ویدئوی زنده جمینی و اشتراکگذاری صفحه را ارائه میکند

طبق گزارشها، گوگل دو ویژگی اصلی Gemini خود را ارائه میکند، ویدیوی زنده و اشتراکگذاری صفحه. غول فناوری مبتنی بر Mountain View برای اولین بار از این ویژگی ها در Google I/O 2024 پرده برداری کرد. این ویژگی ها توسط Google DeepMind تحت پروژه Astra توسعه یافته اند، این ویژگی ها با قابلیت پردازش داده های چندوجهی زنده ارائه می شوند و به چت ربات هوش مصنوعی (AI) اجازه می دهد تا به سوالات مربوط به دستگاه کاربر و محیط اطرافش در زمان واقعی پاسخ دهد. این شرکت قبلاً گفته بود که این ویژگیهای جدید تا ماه مارس عرضه خواهند شد. قابل ذکر است، در حال حاضر این ویژگی ها فقط برای مشترکین Gemini Advanced در برنامه های تلفن همراه در دسترس است.
اولین بار توسط 9to5Google مشاهده شد، کاربر Reddit Kien_PS اخیراً تصویری را در زیر ردیت Bard ارسال کرده است که ویژگی «اشتراکگذاری صفحه یا زنده» را به نمایش میگذارد. همان کاربر روز یکشنبه مجدداً یک ویدیوی نمایشی از این ویژگی منتشر کرد و نحوه عملکرد آن را برجسته کرد.
به طور جداگانه، الکس جوزف، سخنگوی گوگل به The Verge گفت که ویژگی های جدید هوش مصنوعی در جمینی لایو منتشر می شود. جدا از اشتراکگذاری صفحه، Gemini همچنین میتواند به دوربین دستگاه کاربر دسترسی داشته باشد و به سؤالات مربوط به هر آنچه کاربر در زمان واقعی میبیند پاسخ دهد.
این قابلیت پردازش بیدرنگ داده اکنون به کاربران این امکان را می دهد که با نشان دادن کمد لباس خود یا شناسایی یک بنای یادبود یا فروشگاه در خارج از منزل، سؤالاتی درباره پیشنهادات لباس جوزا بپرسند. ویژگی اشتراکگذاری صفحه، که نسخه پیشرفتهای از ویژگی موجود «Talk about the screen» است، به Gemini این امکان را میدهد که هنگام حرکت در صفحههای مختلف گوشی هوشمند خود به کاربر کمک کند.
هر دوی این ویژگیها بخشی از Gemini Live هستند که سال گذشته برای کاربران عرضه شد و میتوانند یک مکالمه صوتی زنده دو طرفه با کاربران داشته باشند. گوگل قبلا گفته بود که می خواهد Gemini را در موقعیت های واقعی مفیدتر کند.
قابل ذکر است که ویژگی ویدیوی زنده Gemini شبیه حالت صدای پیشرفته OpenAI با ویژگی Vision برای ChatGPT و ویژگی ویدیوی بلادرنگ در عینک هوشمند Ray-Ban Meta است. با پیشرفت هوش مصنوعی و زیرساخت های زیربنایی پشت این فناوری، و توانمندی سرورهای ابری، غول های فناوری اکنون می توانند استنتاج سریع تری را برای موارد استفاده بلادرنگ ارائه دهند.