OpenAI объявляет о крупном обновлении ИИ-генерации изображений в ChatGPT

Зарегистрируйтесь и зарабатывайте 1000$ в день ⋙

Компания OpenAI только что официально представила значительное обновление возможностей генерации изображений на основе ИИ в ChatGPT, что является важным шагом вперед по сравнению с использованием отдельной модели генерации изображений, как в предыдущей DALL-E. Эта новая функция была интегрирована непосредственно в GPT-4o, что привело к значительным улучшениям.

Преодоление присущих ограничений

Хотя многие современные модели генерации изображений на основе ИИ способны создавать впечатляющие художественные изображения, они часто испытывают трудности с такими элементами, как текст, логотипы или повседневные предметы. OpenAI утверждает, что новый GPT-4o способен преодолеть эти ограничения благодаря своим возможностям:

  • Отображать текст правильно
  • Строго соблюдать требования пользователя
  • Используйте базовые знания и разговорный контекст
  • Позволяет редактировать загруженные фотографии или создавать новые фотографии на основе исходных фотографий.
  • Широко доступно

Эта новая функция в настоящее время доступна пользователям ChatGPT Free, ChatGPT Plus, Pro и Team и станет доступна в ChatGPT Enterprise и Edu в ближайшие недели. Примечательно, что это будет инструмент создания изображений по умолчанию в ChatGPT, что позволит пользователям легко получить к нему доступ без дополнительных опций. Пользователи могут настраивать фотографии с помощью:

  • Определенное соотношение сторон
  • Точный цвет (используя шестнадцатеричный код)
  • Прозрачный фон
  • Поддержка нескольких платформ

OpenAI объявляет о крупном обновлении ИИ-генерации изображений в ChatGPT

Помимо ChatGPT, эта функция также будет доступна на таких платформах, как Sora (генерация изображений), специализированный DALL·E GPT и GPT-4o API (для разработчиков, запуск в ближайшие недели).

Несмотря на обещание множества улучшений, новая модель все еще имеет некоторые ограничения:

  • Время генерации изображения может достигать 1 минуты из-за высокой детализации.
  • Нежелательная обрезка вертикальных фотографий
  • Иногда «фабрикуют» информацию, не требуя большого контекста
  • Трудность обработки более 10-20 концепций одновременно
  • Трудности с нелатинскими языками
  • Подробные исправления (например, исправления орфографических ошибок) не очень эффективны.
  • Трудно отображать подробную информацию при малых размерах

Все изображения, созданные GPT-4o, будут содержать метаданные C2PA, что позволит проверять происхождение с помощью внутренних инструментов OpenAI.

Несмотря на некоторые ограничения, GPT-4o обещает обеспечить более точную и настраиваемую визуализацию. OpenAI заявляет, что продолжит совершенствовать модель в ближайшие месяцы, открывая новые возможности для создания визуального контента с использованием ИИ.

Благодаря этому масштабному обновлению OpenAI продолжает укреплять свое лидерство в гонке креативного ИИ, предоставляя более удобный и мощный интерфейс для пользователей на различных платформах.

Sign up and earn $1000 a day ⋙

Leave a Comment

8 основных недостатков телефонов со складным экраном, которых вы не ожидали

8 основных недостатков телефонов со складным экраном, которых вы не ожидали

Нельзя отрицать, что складные телефоны — это очень круто. Однако после некоторого времени использования у этого устройства обнаруживается немало странностей. Вот 5 основных недостатков телефонов со складным экраном, которых вы не ожидаете!

Adobe внедряет технологию создания видео на основе искусственного интеллекта в Premiere Pro

Adobe внедряет технологию создания видео на основе искусственного интеллекта в Premiere Pro

Компания Adobe по-новому представила технологию создания видео на основе искусственного интеллекта широким массам, хотя ей еще предстоит создать законченный фильм с использованием этой технологии.

Последние коды Genshin Impact за апрель 2025 г.

Последние коды Genshin Impact за апрель 2025 г.

Код Genshin Impact 5.5 поможет вам обменять его на Первичные камни, магические минералы, опыт и многие другие награды.

Как превратить ваш iPad в дополнительный дисплей Mac

Как превратить ваш iPad в дополнительный дисплей Mac

macOS Catalina и iPadOS поддерживают новую функцию Sidecar, которая позволяет использовать iPad в качестве дополнительного дисплея для Mac.

Обои 1280, красивые обои для телефона Nokia 1280

Обои 1280, красивые обои для телефона Nokia 1280

Это набор обоев для Nokia 1280. Если вы когда-либо отправляли смс с просьбой получить обои для телефона 1280, обои для телефона-кирпича, то попробуйте взглянуть на эти обои.

Гиперзвуковой космический самолет достиг скорости 11 115 км/ч

Гиперзвуковой космический самолет достиг скорости 11 115 км/ч

Компания Venus Aerospace опубликовала первые изображения своего нового гиперзвукового самолета под названием Stargazer, который может развивать максимальную скорость 11 115 км/ч, что эквивалентно числу Маха 9.

Употребление бананов на завтрак помогает уменьшить вздутие живота

Употребление бананов на завтрак помогает уменьшить вздутие живота

Вздутие живота может случиться с каждым. Хорошая новость заключается в том, что завтрак — это отличное время, чтобы добавить в свой рацион некоторые ингредиенты, которые помогут уменьшить вздутие живота. Этот ингредиент — банан.

OpenAI объявляет о крупном обновлении ИИ-генерации изображений в ChatGPT

OpenAI объявляет о крупном обновлении ИИ-генерации изображений в ChatGPT

Компания OpenAI только что официально представила значительное обновление возможностей генерации изображений на основе ИИ в ChatGPT, что является важным шагом вперед по сравнению с использованием отдельной модели генерации изображений, как в предыдущей DALL-E.

Deepseek выпускает бесплатную языковую модель v3, которая отлично работает на распространенных конфигурациях оборудования

Deepseek выпускает бесплатную языковую модель v3, которая отлично работает на распространенных конфигурациях оборудования

Китайский стартап DeepSeek в области искусственного интеллекта только что официально представил свою новейшую большую языковую модель (LLM) DeepSeek-V3-0324.

Причины отказаться от Gboard и перейти на клавиатуру Samsung

Причины отказаться от Gboard и перейти на клавиатуру Samsung

Gboard уже давно является основной клавиатурой на телефонах Android. Однако многие люди недавно перешли на клавиатуру Samsung и не пожалели об этом.

Сладкие и романтические пожелания на выходные для влюбленных

Сладкие и романтические пожелания на выходные для влюбленных

Отправьте своей второй половинке сладкие и романтические пожелания на выходные. Хотя это всего лишь слова или послания, они станут значимыми духовными дарами, которые помогут укрепить ваши отношения.

Для успеха телесериала о Гарри Поттере необходимы следующие элементы:

Для успеха телесериала о Гарри Поттере необходимы следующие элементы:

Ожидается, что премьера ремейка «Гарри Поттера» от HBO состоится в 2026 году. Вот что делает телевизионный «Гарри Поттер» успешным.

Потрясающие фотографии суперлуния со всего мира

Потрясающие фотографии суперлуния со всего мира

Красивые фотографии луны не редкость в Интернете. В статье будут представлены самые красивые фотографии Луны в мире.

Пользователи AMD Ryzen должны установить это обновление BIOS для бесплатного повышения производительности

Пользователи AMD Ryzen должны установить это обновление BIOS для бесплатного повышения производительности

Теперь AMD отреагировала на проблемы с неэффективной флагманской линейкой процессоров, выпустив новое обновление, которое может обеспечить несколько дополнительных кадров в секунду.

Стоимость X упала с 44 миллиардов долларов до менее 10 миллиардов долларов

Стоимость X упала с 44 миллиардов долларов до менее 10 миллиардов долларов

В октябре 2022 года Илон Маск потратил 44 миллиарда долларов на приобретение X, но на сегодняшний день стоимость платформы упала на 78,6% и составляет около 9,4 миллиарда долларов.