Компания Google выпустила последнюю версию Imagen 3 — инструмента для преобразования изображений в текст на базе искусственного интеллекта, который в настоящее время доступен только пользователям в США, сообщает VentureBeat. Сообщается, что инструмент, доступ к которому можно получить через AI Test Kitchen от Google, создает изображения с «лучшей детализацией, более насыщенными цветами, освещением и меньшим количеством отвлекающих факторов», чем предыдущие модели искусственного интеллекта Google.

Компания Google впервые анонсировала обновленный инструмент Imagen 3 на своем мероприятии I/O в мае, но широкое распространение он получил только через платформу Vertex AI от Google в последние несколько дней. Некоторые пользователи Reddit начали экспериментировать с Imagen 3 на прошлой неделе, а во вторник Google опубликовала исследовательскую статью об этом инструменте.
Как и другие генераторы изображений на основе искусственного интеллекта, Imagen 3 может генерировать подробные изображения на основе запрашиваемого вами текста. Вы также можете редактировать изображение, выделив определенную часть и описав, что именно вы хотите изменить.
Несмотря на то, что это продвинутый ИИ-генератор изображений, в инструменте все же действуют некоторые правила безопасности: например, он откажется генерировать изображения знаменитостей, таких как Леди Гага, а также не будет генерировать изображения оружия. И хотя он остановится перед созданием именованных персонажей, вы все равно сможете создавать подробные изображения, описывая персонажа, которого хотите создать.

И вы можете использовать этот инструмент для создания изображений таких культовых персонажей, как Марио, Соник, Пикачу... в то время как мой коллега может создавать персонажей, похожих на Микки Мауса. Я также заметил, что он может генерировать логотипы таких компаний, как Apple, Macy's, Hershey's и даже Google, как вы можете видеть на изображении в верхней части этой статьи.
Несмотря на относительно гибкие правила безопасности, Imagen 3 по-прежнему резко контрастирует с Grok — X-платформенным инструментом визуализации на базе искусственного интеллекта Илона Маска. Grok использовался для создания несколько «дикого» контента, включая изображения наркотиков, насилия и знаменитостей.
Однако у инструментов искусственного интеллекта Google есть и некоторые проблемы. Ранее в этом году Google прекратила разрешать пользователям создавать изображения с помощью своего чат-бота Gemini AI после того, как пользователи обнаружили, что он создает исторически неточные изображения.