Как работает оживление фото через нейросеть
Технология держится на двух вещах: распознавании лиц и генерации движения. Нейросеть сначала находит на фото ключевые точки — глаза, нос, рот, контур лица. Потом просчитывает как эти точки должны сместиться чтобы получилось естественное движение: моргание, улыбка, поворот головы.
Дальше в дело вступает генеративная модель. Она не просто дёргает пиксели а дорисовывает то чего на исходном фото не было: зубы когда человек улыбается, второй глаз при повороте головы, фон который открывается при движении. Именно поэтому результат выглядит натурально, а не как кривая анимация из 2000-х.
6 нейросетей для оживления фото: сравнение
1. Kling AI — лучший результат
Китайский сервис от Kuaishou, на голову выше конкурентов по качеству оживления. Движения плавные, мимика естественная, артефактов минимум. Поддерживает image-to-video — загружаете фото и получаете видео до 10 секунд.
Главная фишка Kling — режим Motion Control. Вы задаёте направление движения и интенсивность. Хотите чтобы человек медленно повернул голову влево? Выставляете слайдеры — и готово. Без этого управления движение может быть хаотичным.
Минус — бесплатных кредитов дают мало, около 6 генераций в сутки. Для пары фотографий хватит, для массовой обработки нужна подписка. Цена — от 10 долларов за 660 кредитов (хватает примерно на 60 видео).
2. Pika Labs — быстро и просто
Американский сервис, запускался как конкурент Runway. Интерфейс простой как топор: загрузили фото, выбрали область движения, нажали кнопку. Через минуту видео готово.
Pika хорошо справляется с простыми сценариями: моргание, лёгкая улыбка, развевающиеся волосы. На сложных движениях вроде поворота головы или ходьбы начинает сыпаться — появляются артефакты, лицо плывёт.
Бесплатный тариф — 10 генераций в день, с водяным знаком. Платный от 10 долларов в месяц убирает логотип и даёт больше кредитов.
3. Runway Gen-4 — для профи
Runway — флагман среди видеонейросетей. Gen-4 (последняя версия) умеет не только оживлять фото но и создавать видео с нуля по тексту, заменять фон, удалять объекты и ещё десяток вещей.
Качество оживления — второе место после Kling. Хорошо держит текстуру кожи при движении, не смазывает детали. Минус — цена кусается. Бесплатного тарифа считай что нет (дают 125 кредитов один раз при регистрации, дальше от 15 долларов в месяц).
Если оживление фото нужно для коммерческого проекта — Runway оправдан. Для домашнего альбома — дороговато.
4. Hedra — фокус на лицо
Узкоспециализированный сервис: загружаете фото и аудиодорожку, нейросеть анимирует лицо под речь. Губы двигаются синхронно с голосом, брови и глаза добавляют эмоций.
Идеально для озвучки персонажей, мемов и коротких видео для соцсетей. С фото дедушки под его голос — пробивает на слезу. Но если нужно просто оживить снимок без звука — Hedra избыточен, берите Kling или Pika.
5. Viggle — перенос движения
Бесплатный сервис который работает иначе: вы загружаете фото и видео-образец движения, нейросеть накладывает движение с образца на ваше фото. Парень на фото начинает танцевать как в клипе, бабушка — двигаться как актриса из фильма.
Результаты неровные: иногда получается смешно и вирально, иногда — жутковато (эффект зловещей долины никто не отменял). Но для развлечения и соцсетей — отличный инструмент. И да, действительно бесплатный.
6. Luma Dream Machine — для сцен
Luma отличается от остальных: она оживляет не только лица а всю сцену целиком. Загрузили пейзаж — облака поплыли, вода заструилась. Загрузили интерьер — шторы заколыхались от ветра.
С лицами работает хуже Kling, но для пейзажей и предметов — лучший выбор. Бесплатно 30 генераций в месяц, дальше от 10 долларов.
Сравнительная таблица
| Сервис | Лучшее применение | Бесплатный лимит | Цена от |
|---|---|---|---|
| Kling AI | Оживление лиц, высшее качество | 6/день | $10/660 кредитов |
| Pika Labs | Быстрые анимации, простота | 10/день | $10/мес |
| Runway Gen-4 | Профессиональная работа с видео | 125 кредитов (разово) | $15/мес |
| Hedra | Анимация лица под речь | Есть | Бесплатно |
| Viggle | Перенос движения, мемы | Не ограничен | Бесплатно |
| Luma Dream | Оживление пейзажей, сцен | 30/мес | $10/мес |
Как оживить фото: пошаговая инструкция
Лицо крупным планом — Kling или Pika. Фото с речью — Hedra. Пейзаж или интерьер — Luma. Мем или танец — Viggle.
Фото должно быть чётким, лицо — хорошо освещённым и без сильных теней. Анфас работает лучше чем профиль. Групповые снимки — хуже чем одиночные (нейросеть путается кого оживлять).
В Kling выберите режим Image-to-Video, загрузите фото, настройте Motion Control если нужно. В Pika просто загрузите и нажмите Generate.
Генерация занимает от 30 секунд до 3 минут. Если результат не понравился — повторите. Нейросети выдают разный результат при каждом запуске, даже с одним и тем же фото.
Какие фотографии лучше оживляются а какие — нет
За год тестирования вывел для себя несколько правил:
- Портреты анфас — идеально. Пол-оборота — приемлемо. Профиль — нейросеть может «додумать» второй глаз и промахнуться.
- Очки и головные уборы — мешают. Нейросеть путает где заканчивается лицо и начинается аксессуар.
- Старые фото с низким разрешением — сначала апскейл. Kling и Pika имеют встроенные улучшалки, для других сервисов поднимите качество заранее.
- Дети на фото — нейросети часто ошибаются с пропорциями лица, результат может выглядеть неестественно.