OpenAI встроила генератор изображений прямо в GPT‑4o. И он не просто рисует — он понимает.
Что случилось?
В конце марта 2025 года OpenAI без лишнего шума выкатила одну из самых мощных фич года — нативную генерацию изображений в GPT‑4o, своём флагманском «всё-в-одном» ИИ.
Теперь ChatGPT может создавать полноценные, фотореалистичные или мультяшные картинки прямо в диалоге — по описанию, по контексту, по прикреплённому изображению. Всё как в фантастике, но уже в бета-доступе для всех пользователей ChatGPT, включая бесплатных.
Чем GPT‑4o ( SORA ) отличается от DALL·E?
- Контекст. GPT‑4o помнит, что вы ему до этого писали. Он может доработать картинку, добавить детали, подстроиться под стиль диалога.
- Чистота рендеров. Он рисует текст (в том числе на кириллице), схемы, меню, мемы и комиксы без искажений и «нейросетевого безумия».
- Реализм + мультяшность. По запросу может имитировать Polaroid 2000-х, фотку с iPhone 15 Pro Max, или телеграм-стикер с енотом и клубникой.
- Сложность. До 20 объектов в одной сцене, с правильными отношениями между ними. Например, кот с моноклем и RPG-интерфейсом в стимпанк-Манхэттене.
Где это уже используется?
- Маркетинг: меню для корейского ресторана с иллюстрациями в стиле Peter Rabbit.
- Образование: наглядный разбор опыта Ньютона с призмой в блокноте студента.
- Юмор и соцсети: мемы в стиле «S-car go» — улитка на спорткаре.
- Игры: создание игровых персонажей с UI, квестами и инвентарём.
- Инфографика: диаграммы, виньетки, научные схемы с точной подачей данных.
Ограничения (пока что)
- Иногда кадрирует слишком агрессивно — теряется часть картинки.
- Может галлюцинировать детали, если мало информации.
- Редактирование частей картинки всё ещё нестабильное.
- Трудности с мелким текстом и нелатиницей (но русский чаще всего ок).
OpenAI активно дорабатывает эти моменты и обещает улучшения уже в ближайшие апдейты.
Где доступно?
- В ChatGPT Free, Plus, Pro, Team (включено по умолчанию)
- Sora — видеогенератор от OpenAI (поддерживает 4o-графику)
- API для разработчиков — rollout в течение ближайших недель
- DALL·E остался доступен как отдельная GPT
Безопасность и маркировка
- Все картинки снабжены C2PA-метаданными — можно отследить источник.
- Фильтры контента: отсекаются NSFW, фейки, жестокость, дипфейки.
- Контент с реальными людьми — под повышенным контролем.
Как это использовать?
Хочешь постер — говоришь:
«Сделай инфографику "Почему в Сан-Фране туман" — акварелью на белом фоне»
Хочешь стикер — говоришь:
«Минималистичный енот с клубникой и белой обводкой, фон — прозрачный»
И всё, через минуту получаешь готовую картинку в стиле Telegram.
Почему это важно?
До этого момент генерация изображений была отдельным шагом. DALL·E нужно было отдельно запускать, API отдельно настраивать, контекст терялся. А теперь:
- Картинка — часть диалога
- Контекст — на уровне памяти
- Рендер — на уровне практики
GPT‑4o становится не просто болтуном, а визуальным помощником, дизайнером, сценаристом, инфографом и иллюстратором — в одном окне.
Заключение
Это огромный шаг к тому, чтобы ИИ стал полноценным творческим соавтором, а не просто генератором. У GPT‑4o теперь не просто интеллект — у него есть визуальный язык. Он умеет не только объяснить… но и показать.