OpenAI представила функцию генерации точных изображений в ChatGPT на базе GPT-4o — она доступна бесплатно

OpenAI встроила функцию генерации точных изображений непоcредственно в ChatGPT. Новая функция, именуемая 4o Image Generation, опирается на мультимодальную большую языковую модель GPT-4o. Она понимает контекст, сложные инструкции, взаимодействия объектов и даже генерирует текстовые надписи без артефактов. Доступ для всех откроют сегодня.

 Источник изображения: OpenAI

Источник изображений: OpenAI

ChatGPT и прежде умел генерировать изображения с помощью нейросети Dall-E 3. Однако обновлённая функция работает куда лучше и точнее. Представитель OpenAI Тайя Кристиансон (Taya Christianson) уточнила, что лимиты для бесплатных пользователей останутся такими же, как у DALL-E, то есть три изображения в день. Доступ к DALL-E по-прежнему возможен через пользовательский интерфейс ChatGPT.

Как отметил глава исследований Габриэль Го (Gabriel Goh), использование GPT-4o позволяет ИИ работать с любыми типами данных — текстом, изображениями, аудио и видео. Кроме того, Sora получила ключевое улучшение, заключающееся в корректном соотношении атрибутов и объектов (binding). Го объяснил, что большинство ИИ путаются при обработке 5–8 элементов. Например, ИИ может получить запрос нарисовать синюю звезду и красный треугольник, но создать красную звезду и нечто отличное от треугольника. 4o Image Generation справляется с 15–20 объектами без ошибок.

 Источник изображения: OpenAI

Пользователи также заметят улучшение в отрисовке текста, что позволяет генерировать на изображениях читаемый текст без опечаток. В существующих инструментах для генерации изображений текст часто искажался и достижение качественного рендеринга в этом смысле было серьёзной проблемой, так как даже небольшие ошибки в заголовках или текстовых элементах могут сделать всё изображение полностью непригодным.

 Генерация по запросу «сделайте очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha)

Генерация по запросу «Cделай очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha)

Система также использует теперь нестандартный метод генерации. Изображения создаются последовательно, слева направо и сверху вниз, а не целиком, как это происходит в DALL-E. По мнению Го, это объясняет превосходство 4o Image Generation в работе с текстом и сложными сценами.

OpenAI продемонстрировала возможности 4o Image Generation на научных диаграммах, например, эксперимент Ньютона с призмой, комиксах и постерах. Также были показаны практические применения в создании изображений с прозрачным фоном для стикеров, меню ресторанов и логотипов. 4o Image Generation со всеми заданиями справилась успешно, не допустив в тексте никаких ошибок.

Также 4o Image Generation способен редактировать загруженные пользователем изображения по простым запросам, добавляя на них элементы или наоборот убирая.

 Пример добавление элементов на фотографию с помощью GPT-4o

Пример добавление элементов на фотографию с помощью GPT-4o

Однако новая система генерирует изображения дольше, чем предыдущие, но OpenAI считает это оправданным компромиссом. «Хотя у нас определённо есть возможности для улучшения времени отклика, качество этих изображений, возможности, знание о мире действительно компенсируют дополнительные секунды ожидания», — сказали в компании.

 Источник изображения: OpenAI

Отвечая на вопросы о мерах безопасности, упоминая скандальные дипфейки Тейлор Свифт (Taylor Swift), созданные с помощью модели Microsoft, способность Grok от xAI изобразить Камалу Харрис (Kamala Harris) с оружием и удаление водяных знаков в Google Gemini, команда OpenAI подчеркнула наличие надёжных механизмов защиты от злоупотреблений.

Директор по дизайну OpenAI Шеннон Джагер (Jackie Shannon) заявила, что инструмент предотвращает удаление водяных знаков, блокирует генерацию дипфейков, связанных с телом человека и отказывает в запросах на создание материалов с различным родом насилия над детьми (CSAM). Кроме того, Шеннон пояснила, что все сгенерированные изображения будут включать стандартные метаданные C2PA, чтобы отметить изображение как созданное OpenAI.

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий

hacklink vevobahis giriş vevobahis güncel giriş vevobahis güncel vidobet güncel vidobet güncel giriş vidobet güncel giriş joybet güncel joybet güncel giriş tempobet tempobet giriş tempobet güncel tempobet güncel giriş casinolevant casinolevant giriş casinolevant güncel casinolevant güncel giriş bets10 bets10 giriş bets10 güncel bets10 güncel giriş linksdiamond.com casinolevant betlike betlike giriş betlike güncel giriş casinolevant giriş casinolevant güncel casinolevant güncel giriş casinolevant stonebahis stonebahis giriş stonebahis güncel giriş masterbetting masterbetting giriş masterbetting güncel giriş teosbet teosbet giriş teosbet güncel giriş casinolevant casinolevant giriş casinolevant güncel casinolevant güncel giriş italya vize betpipo betpipo giriş betpipo güncel betpipo güncel giriş enbet enbet giriş enbet güncel enbet güncel giriş wbahis wbahis giriş wbahis güncel wbahis güncel giriş meybet meybet giriş meybet güncel meybet güncel giriş prizmabet prizmabet giriş prizmabet güncel prizmabet güncel giriş roketbet roketbet roketbet giriş roketbet güncel roketbet güncel giriş stonebahis stonebahis giriş stonebahis güncel giriş tempobet tempobet giriş tempobet güncel tempobet güncel betlike betlike giriş betlike güncel giriş oslobet oslobet giriş oslobet güncel oslobet güncel giriş polobet polobet giriş polobet güncel polobet güncel giriş tlcasino tlcasino giriş tlcasino güncel giriş efesbet efesbet giriş efesbet güncel giriş stonebahis stonebahis giriş stonebahis güncel giriş stonebahis güncel betlike betlike giriş betlike güncel giriş betlike güncel masterbetting masterbetting giriş masterbetting güncel giriş casinolevant casinolevant giriş casinolevant giriş casinolevant güncel casinolevant güncel giriş betticket betticket giriş betticket güncel giriş casinolevant casinolevant giriş casinolevant güncel casinolevant güncel giriş casinolevant casinolevant giriş casinolevant güncel casinolevant güncel giriş masterbetting masterbetting giriş masterbetting güncel giriş atlasbet atlasbet giriş atlasbet güncel atlasbet güncel giriş wbahis wbahis giriş wbahis güncel wbahis güncel giriş romabet romabet giriş romabet güncel romabet güncel giriş orisbet orisbet giriş orisbet güncel giriş tlcasino tlcasino giriş tlcasino güncel giriş süratbet süratbet giriş süratbet güncel giriş teosbet teosbet giriş teosbet güncel giriş betticket betticket giriş betticket güncel giriş bahislion bahislion giriş bahislion güncel giriş bahislion güncel betasus betasus giriş betasus güncel betasus güncel giriş prizmabet prizmabet giriş prizmabet güncel prizmabet güncel giriş casinoroyal casinoroyal giriş casinoroyal güncel giriş betmabet betmabet giriş betmabet güncel betmabet güncel giriş casinolevant casinolevant giriş casinolevant güncel casinolevant güncel giriş casinolevant casinolevant giriş casinolevant güncel casinolevant güncel giriş bets10 bets10 giriş bets10 güncel giriş