API SORA для автоматизаций в make : GPT‑4o теперь генерирует картинки

OpenAI встроила генератор изображений прямо в GPT‑4o. И он не просто рисует — он понимает.

Что случилось?

В конце марта 2025 года OpenAI без лишнего шума выкатила одну из самых мощных фич года — нативную генерацию изображений в GPT‑4o, своём флагманском «всё-в-одном» ИИ.

Теперь ChatGPT может создавать полноценные, фотореалистичные или мультяшные картинки прямо в диалоге — по описанию, по контексту, по прикреплённому изображению. Всё как в фантастике, но уже в бета-доступе для всех пользователей ChatGPT, включая бесплатных.

Чем GPT‑4o ( SORA ) отличается от DALL·E?

Контекст. GPT‑4o помнит, что вы ему до этого писали. Он может доработать картинку, добавить детали, подстроиться под стиль диалога.
Чистота рендеров. Он рисует текст (в том числе на кириллице), схемы, меню, мемы и комиксы без искажений и «нейросетевого безумия».
Реализм + мультяшность. По запросу может имитировать Polaroid 2000-х, фотку с iPhone 15 Pro Max, или телеграм-стикер с енотом и клубникой.
Сложность. До 20 объектов в одной сцене, с правильными отношениями между ними. Например, кот с моноклем и RPG-интерфейсом в стимпанк-Манхэттене.

Где это уже используется?

Маркетинг: меню для корейского ресторана с иллюстрациями в стиле Peter Rabbit.
Образование: наглядный разбор опыта Ньютона с призмой в блокноте студента.
Юмор и соцсети: мемы в стиле «S-car go» — улитка на спорткаре.
Игры: создание игровых персонажей с UI, квестами и инвентарём.
Инфографика: диаграммы, виньетки, научные схемы с точной подачей данных.

Ограничения (пока что)

Иногда кадрирует слишком агрессивно — теряется часть картинки.
Может галлюцинировать детали, если мало информации.
Редактирование частей картинки всё ещё нестабильное.
Трудности с мелким текстом и нелатиницей (но русский чаще всего ок).

OpenAI активно дорабатывает эти моменты и обещает улучшения уже в ближайшие апдейты.

Где доступно?

В ChatGPT Free, Plus, Pro, Team (включено по умолчанию)
Sora — видеогенератор от OpenAI (поддерживает 4o-графику)
API для разработчиков — rollout в течение ближайших недель
DALL·E остался доступен как отдельная GPT

Безопасность и маркировка

Все картинки снабжены C2PA-метаданными — можно отследить источник.
Фильтры контента: отсекаются NSFW, фейки, жестокость, дипфейки.
Контент с реальными людьми — под повышенным контролем.

Как это использовать?

Хочешь постер — говоришь:

«Сделай инфографику "Почему в Сан-Фране туман" — акварелью на белом фоне»

Хочешь стикер — говоришь:

«Минималистичный енот с клубникой и белой обводкой, фон — прозрачный»

И всё, через минуту получаешь готовую картинку в стиле Telegram.

Почему это важно?

До этого момент генерация изображений была отдельным шагом. DALL·E нужно было отдельно запускать, API отдельно настраивать, контекст терялся. А теперь:

Картинка — часть диалога
Контекст — на уровне памяти
Рендер — на уровне практики

GPT‑4o становится не просто болтуном, а визуальным помощником, дизайнером, сценаристом, инфографом и иллюстратором — в одном окне.

Заключение

Это огромный шаг к тому, чтобы ИИ стал полноценным творческим соавтором, а не просто генератором. У GPT‑4o теперь не просто интеллект — у него есть визуальный язык. Он умеет не только объяснить… но и показать.