Что такое DALL-E и как он устроен
DALL-E — это generative AI для картинок. Если совсем просто: вы пишете текст, нейросеть превращает его в изображение. Работает на базе языковых моделей OpenAI — той же компании что сделала ChatGPT.
Первая версия DALL-E вышла в начале 2021 и умела генерировать мелкие картинки 256×256 пикселей. DALL-E 2 подтянул разрешение до 1024×1024 и научился реалистичному стилю. DALL-E 3 — текущая версия — встроен прямо в ChatGPT и понимает промты на русском языке.
Главное отличие DALL-E от конкурентов — он понимает контекст. Можно писать длинные промты на русском: «нарисуй уютную кухню в скандинавском стиле, утро, солнечный свет из окна, на столе чашка кофе и круассан, на подоконнике кот». И он не перепутает кота с круассаном.
Что умеет DALL-E 3
Перечислю возможности которые реально работают, а не из пресс-релиза:
- Фотореализм. Если явно попросить «фотографию» а не «рисунок» — результат бывает трудно отличить от реального снимка. Особенно хорошо получаются интерьеры, натюрморты и портреты.
- Понимание русского. В отличие от Midjourney где промты только на английском, DALL-E нормально воспринимает русский язык. Пишете «нарисуй медведя с балалайкой» — получаете медведя с балалайкой, а не непонятно что.
- Сложные сцены. Пять объектов с разными свойствами? Без проблем. «Красный мяч на синем стуле, зелёная ваза на жёлтом столе, серый кот под стулом» — DALL-E расставит всё по местам.
- Текст на картинках. Это слабое место всех нейросетей, но DALL-E 3 справляется лучше конкурентов. Короткие надписи из 2-3 слов получаются читаемыми. Длинный текст — пока нет.
- Стилизация. Масло, акварель, пиксель-арт, 3D-рендер, комикс, аниме — переключается по щелчку. Достаточно дописать «в стиле ...» в конце промта.
Как пользоваться DALL-E: пошаговая инструкция
DALL-E 3 встроен в ChatGPT. Зайдите на chatgpt.com, авторизуйтесь. Нужна подписка ChatGPT Plus, Pro или Team — в бесплатной версии DALL-E недоступен.
В чате начните с фразы «нарисуй...» или «сгенерируй изображение...». Дальше — описание того что хотите увидеть. Подробности работают лучше чем короткие фразы. Вместо «нарисуй закат» лучше «нарисуй закат над морем, облака подсвечены оранжевым, силуэты пальм на переднем плане, фотореалистичный стиль».
После генерации можно попросить изменить детали: «сделай небо темнее», «добавь птиц», «убери пальмы». ChatGPT поймёт контекст предыдущего запроса и скорректирует картинку.
Кликните по картинке — откроется в полном размере. Нажмите кнопку скачивания (стрелка вниз в правом верхнем углу). Изображение сохранится в формате WebP, при необходимости конвертируйте в JPEG или PNG.
Сколько стоит DALL-E
DALL-E 3 не продаётся отдельно. Он включён в подписку ChatGPT Plus за 20 долларов в месяц. Лимит — около 50 картинок в сутки (OpenAI не называет точную цифру, на практике при 70-80 запросах начинает тормозить).
ChatGPT Pro за 200 долларов в месяц даёт расширенные лимиты и приоритетный доступ. Для коммерческой работы с большими объёмами — оправдано. Для домашнего использования — Plus хватает за глаза.
ChatGPT Team и Enterprise — корпоративные тарифы где все сгенерированные изображения принадлежат компании а не OpenAI. Если делаете картинки для бизнеса — смотрите в эту сторону.
DALL-E vs Midjourney vs Stable Diffusion — что выбрать
| Критерий | DALL-E 3 | Midjourney | Stable Diffusion |
|---|---|---|---|
| Язык промтов | Русский и английский | Только английский | Английский (русский через плагины) |
| Сложность входа | Нулевая — внутри ChatGPT | Нужен Discord | Высокая — нужен мощный ПК или аренда сервера |
| Качество (реализм) | Высокое | Очень высокое | Зависит от модели |
| Текст на картинке | Короткие фразы — да | Плохо | Плохо (SDXL чуть лучше) |
| Сложные сцены | Отлично | Хорошо | Средне |
| Цена | 20 $/мес (ChatGPT Plus) | от 10 $/мес | Бесплатно (на своём железе) |
| Цензура | Строгая | Умеренная | Минимальная |
- Понимает русский язык — не надо переводить промты
- Встроен в ChatGPT — не нужен отдельный сервис
- Хорошо держит сложные сцены с несколькими объектами
- Лучший среди конкурентов по тексту на изображениях
- Строгая цензура — отклоняет безобидные запросы
- Разрешение 1024×1024 — ниже чем у Midjourney
- Нет бесплатной версии — только по подписке
- Нельзя дообучить на своих фото
Для русскоязычных пользователей это самый простой вход в генерацию изображений. Написали промт на русском — получили картинку. Midjourney даст более впечатляющий результат но потребует английских промтов и Discord. Stable Diffusion — для тех кто любит копаться в настройках и хочет полный контроль.