Несмотря на значительные успехи с момента своего первого выпуска, DALL-E далек от совершенства. Инструменту для создания произведений искусства приходится преодолевать ряд проблем, многие из которых становятся более очевидными при регулярном использовании. Несоответствия и неправильные размеры — это всего лишь несколько примеров.
Хотя ИИ не очень хорош в написании текста на изображениях, после перепробования десятков инструментов для создания произведений искусства на основе ИИ, DALL-E является одним из худших вариантов в этом отношении. В целом, с простыми запросами вы справитесь, но, как вы можете видеть ниже, программное обеспечение все еще испытывает трудности с вводом знаков ударения для слова «Café».
Изображение кофейни, созданное в DALL-E
Вы также заметите, что DALL-E не воспроизводит разборчивый текст на уличных знаках и подобных объектах.
2. Не изменяйте размер изображений по запросу.
DALL-E хорошо понимает необходимость создания изображения, но не может изменить его размер при необходимости. Например, автор статьи попросил программное обеспечение изменить размер изображений несколько раз для разных блогов; Но каждый раз DALL-E просто воссоздает изображение заново.
К счастью, обрезать и изменять размер изображений довольно просто. Многие бесплатные инструменты, такие как Canva , позволяют это сделать. Однако было бы неплохо, если бы это можно было сделать без использования стороннего программного обеспечения.
3. Невозможно создать реалистичные изображения.
У DALL-E нет особых проблем с глубиной резкости, но она плохо справляется с созданием реалистичных изображений. Например, автор статьи сначала просит ИИ сгенерировать изображение золотистого ретривера в горах внизу (не уточняя, какой это тип изображения).
Изображение собаки на горе, созданное с помощью DALL-E
Несмотря на всю красоту фотографии, очевидно, что она была создана с использованием искусственного интеллекта. Тогда автор попросил DALL-E сделать его более фотореалистичным. Однако результат выглядит еще более фальшивым (даже немного жутким).
Использование GPT для настройки самой фотографии полезно, но для доступа к нему вам понадобится премиум-подписка. В противном случае вы можете обратиться к многочисленным инструментам искусственного интеллекта для создания художественных произведений, которые позволяют получать фотореалистичные результаты, например, Adobe Firefly.
4. Программное обеспечение не слушается, когда вы говорите ему не делать чего-либо
Один из способов создания более эффективных напоминаний в Midjourney , ChatGPT и других инструментах искусственного интеллекта — указать, чего вы не хотите, чтобы делало программное обеспечение. Во многих случаях это даст лучшие результаты. Однако DALL-E является исключением.
Во многих случаях автор просил DALL-E не включать определенные элементы в свои изображения. Однако, несмотря на это, инструмент все равно их добавляет. Иногда помогает повторное создание образа, но лучше этого не делать.
Напротив, при использовании Adobe Firefly вы редко столкнетесь с этой проблемой.
5. Непоследовательность в некоторых областях
Многие инструменты ИИ для создания произведений искусства имеют недостатки; Например, при тестировании Photo AI он особенно плохо создавал руки. DALL-E также содержит ошибки и несоответствия во многих областях.
Хотя DALL-E отлично справляется с созданием изображений в целом, он не всегда хорош при создании изображений людей, держащих предметы. Кроме того, это программное обеспечение плохо подходит для создания компьютерных экранов. Обычно он дает вам случайный набор фигур. Иногда может помочь команда программному обеспечению выключить экран компьютера.
6. Непоследовательный стиль изображения
DALL-E может генерировать несколько типов изображений; Вы можете создавать произведения ИИ, которые будут выглядеть как картины, а также можете создавать изображения, которые будут выглядеть более трехмерными. Однако такое разнообразие в соз��ании изображений иногда может привести к непоследовательности стилей.
Обращаясь к DALL-E с просьбой создать изображение, вы должны четко указать, чего именно вы хотите. В противном случае вы можете получить что-то случайное. Это не проблема, если вы просто тестируете приложение, но проблема возникает, если вам нужен единый стиль.
7. Размер артефакта
Если вы заботитесь о точности фотографии, важно, чтобы объекты на фотографии выглядели пропорционально их реальным аналогам. К сожалению, DALL-E иногда не позволяет объектам выглядеть так, как задумано. Например, если вы попросите программу сгенерировать изображение человека, держащего телефон в руке, иногда телефон будет слишком большим.
Хотя я и пытался попросить программное обеспечение сделать изображение шире, чтобы решить эту проблему, это на самом деле усугубило проблему, сделав конечное изображение ненастоящим. Попытка выполнить различные запросы на редактирование DALL-E может сработать, но в целом пока что не существует решения этой проблемы.
Изображение человека, держащего телефон, созданное в DALL-E
8. DALL-E испытывает трудности с созданием внешних материалов.
На первый взгляд DALL-E может показаться отличным способом создания персональных календарей, поздравительных открыток, обоев для телефона и т. д. Однако вы быстро обнаружите, что программное обеспечение не очень хорошо справляется с этой задачей.
Например, пытаясь создать обложку поздравительной открытки с помощью DALL-E, автор этой статьи хотел создать изображение в приложении, а затем загрузить его на такой сервис, как Moonpig. К сожалению, результатом неизменно становится дизайн с поздравительной открыткой на фотографии.
Ошибки в тексте и дизайне поздравительной открытки в DALL-E 3
Если вы действительно хотите использовать DALL-E для подобных дизайнов, не стоит говорить, что вы собираетесь использовать его на поздравительной открытке. Вместо этого укажите, что именно должна делать программа, а затем измените размер позже.
Примечание : лучше всего просто создать изображение в DALL-E и добавить текст в другом приложении.
9. На изображении не показаны все необязательные требования.
Иногда вы не знаете, какую именно модель ИИ хотите использовать. В таких случаях имеет смысл обратиться к генератору и попросить его создать несколько вариантов изображений. Однако по личному опыту DALL-E часто оказывается довольно «ленивым», когда пользователи запрашивают много вариантов.
Во многих случаях полученные фотографии выглядят очень похожими. Поэтому вам следует задать конкретный вопрос. Создавать одно изображение за другим эффективнее, чем требовать создания множества вариаций.
Хотя многим людям в целом нравится использовать DALL-E, программное обеспечение несовершенно, и в конечном итоге вы столкнетесь с проблемами. Например, он не подходит для создания фотореалистичных изображений без пользовательского GPT. Более того, это программное обеспечение зачастую не удаляет нежелательные элементы на фотографии. Тем не менее, вам все равно следует попробовать DALL-E, чтобы самостоятельно убедиться в наличии у вас подобных проблем.