Droider[Наука] 2025-07-11 11:37
🤖**Gemini AI превращает фото в видеоролики с озвучкой**
Google [запустила](https://blog.google/products/gemini/photo-to-video/) новую функцию в Gemini AI, которая трансформирует статичные фотографии в полноценные видеоклипы. **Новая возможность работает на базе модели Veo 3 и создаёт восьмисекундные ролики с полностью сгенерированным аудиосопровождением**.
Функция доступна подписчикам Google AI Ultra и Pro. Запуск происходит постепенно — сначала в веб-версии, затем в течение недели на мобильных устройствах. Пользователи могут анимировать повседневные объекты, оживлять рисунки и картины или добавлять движение к природным пейзажам.
**Процесс предельно простой.** В строке ввода нужно выбрать «инструменты», затем «видео», загрузить фотографию и добавить текстовое описание желаемого движения. Можно указать требования к диалогам, звуковым эффектам и фоновым шумам — Google обещает, что аудио будет «идеально синхронизировано с визуалом».
Готовые видео сохраняются в формате MP4 с разрешением 720p и соотношением сторон 16:9. **Каждый ролик получает видимый водяной знак о его AI-происхождении плюс невидимую цифровую метку SynthID** для отслеживания контента.
Мы считаем Veo 3 самой продвинутой нейросетью для генерации видео на рынке. **С новой функцией анимации фотографий Google ещё больше отрывается от конкурентов** — к такому уровню интеграции и качества другим компаниям предстоит добираться ещё долго.
@droidergram