Home
» Wiki
»
Почему ИИ не может писать текст на изображениях?
Почему ИИ не может писать текст на изображениях?
Если вы использовали инструменты генеративного ИИ для создания изображений, у вас могли возникнуть проблемы с написанием текста на изображениях. Знание причин этого поможет избежать этой проблемы, а также найти способы ее решения.
Основная причина, по которой ИИ не может писать текст, — это прошлые входные данные. Хотя ИИ в целом довольно хорош в создании изображений, некоторые аспекты, такие как текст, не использовались на том же уровне для обучения больших языковых моделей (LLM) . Поэтому ИИ не очень хорош в генерации текста на изображениях.
Несмотря на свою продвинутость, инструменты искусственного интеллекта все еще находятся на ранних стадиях своего развития. Кроме того, у некоторых инструментов ИИ заканчиваются данные для обучения. Еще есть вероятность, что инструменты-генераторы смогут генерировать более качественный текст, но на данный момент вам придется попробовать альтернативу.
Есть ли альтернатива нечитаемому тексту на изображениях ИИ?
Хотя генерация текста на изображениях с помощью ИИ — довольно сложная задача, она не невозможна. Вот наиболее эффективные методы на данный момент...
1. Дайте инструменту более конкретные подсказки
Когда люди впервые начинают использовать ИИ, их навыки быстрого письма зачастую не соответствуют стандартам. Самая большая ошибка — давать расплывчатые подсказки вроде «создай изображение уличной сцены».
Неудивительно, что вы получаете некачественные результаты. Лучший способ использовать генеративный ИИ — рассматривать свои подсказки как творческое задание. Чем конкретнее, тем лучше. Вот пример подсказки:
Создайте изображение внешнего вида итальянского кафе. Я хочу, чтобы на вывеске было написано «Кафе», и это должно быть в солнечный день.
Примерный перевод : Создайте внешнее изображение итальянского кафе. Я хочу, чтобы на вывеске было написано «Кафе» в солнечный день.
Как видно на изображении ниже, ChatGPT показал себя весьма неплохо. Этого бы не произошло, если бы вы просто сказали: «Создайте внешний вид итальянского кафе».
Изображение кофейни, созданное в DALL-E
По личному опыту, простые изображения кажутся более эффективными. Например, на изображении выше меньше элементов, чем на тестируемом изображении ниже, а это значит, что ИИ нужно меньше пытаться и учиться.
Уличная сцена, настроенная в приложении DALL-E 3
2. Используйте вариации слова «Текст»
Небольшое изменение языка в подсказке может иметь большое значение. Попробовав термин «текст» несколько раз, вы начнете чувствовать, что ходите по кругу, поэтому попробуйте разные синонимы.
Например, вместо «текст» можно попробовать:
Заголовок
Алфавит
Письменное слово
Символ
Если ничего из этого не помогло, продолжайте пробовать альтернативные варианты. То, что работает, а что нет, может варьироваться в зависимости от того, что вы пытаетесь создать. Например, вы, вероятно, не будете использовать слово «символ», если попытаетесь создать поздравительную открытку ко дню рождения. Ключевым моментом здесь является экспериментирование с различными идеями подсказок ИИ, и разные инструменты могут работать по-разному.
3. Добавьте текст с помощью инструментов замены.
Не следует добавлять текст с помощью инструментов замены, если слова должны быть частью изображения, но это хорошая идея, если вы пытаетесь создать больше графики. Это подойдет, если вы хотите разработать дизайн открытки, графики, обложки книги или чего-то подобного.
Если вы собираетесь это сделать, убедитесь, что на изображении достаточно места. Вы можете использовать любой инструмент, чтобы добавить текст к изображению. Рекомендованными вариантами являются Canva или Adobe Photoshop Express, но другие приложения, позволяющие добавлять текст к изображениям на смартфоне, также будут работать с контентом, созданным с помощью ИИ.
Вам также следует убедиться, что текст соответствует изображению, созданному искусственным интеллектом. Используйте шрифты, соответствующие настроению, которое вы пытаетесь передать, и видоизменяйте элементы так, как считаете нужным.
4. Текст должен быть коротким.
Генерация текста на изображениях с помощью ИИ часто дает сбой, потому что вы пытаетесь добавить слишком много текста. Честно говоря, это происходит всякий раз, когда вы пытаетесь создать что-то длиннее 10 символов. Подобно рекомендации делать изображения простыми, вам следует сделать все возможное, чтобы текст был коротким.
Чтобы проверить это, автор попробовал еще одну подсказку:
Создайте изображение банка с текстом «банк» на внешней стороне. Я хочу, чтобы он находился в центре города и представлял собой современную постройку, похожую на ту, что можно увидеть в городах США.
Примерный перевод : Создайте изображение банка со словом «банк» снаружи. Я хотел, чтобы это был центр города и современная застройка, похожая на ту, что можно увидеть в американском городе.
Как вы можете видеть ниже, ИИ-движок довольно хорошо справился с задачей прислушивания к пользователю. Однако в одной части изображения имеются некоторые ошибки. Поэтому скажите ИИ, что вам нужен только один или два знака, чтобы ограничить вероятность такого события. Подобные проблемы также возникают, когда текст меньше, так что имейте это в виду.
Изображение современного здания создано в DALL-E
5. Используйте инструменты для исправления текстовых ошибок
Подобно тому, как вы можете удалить недостатки на фотографиях, сделанных с помощью камеры, вы можете попробовать использовать инструмент, который помогает исправить текстовые ошибки на фотографиях. Существует множество приложений, которые исправляют ошибки на фотографиях, созданных с помощью искусственного интеллекта, например, Storia Lab.
Ошибка инструмента Textify AI Storia Lab
При использовании этих инструментов вы обычно можете выделить текст и изменить его содержимое по мере необходимости. Некоторые приложения бесплатны, но в других случаях вам понадобится платная подписка. Если вы создаете много изображений с помощью ИИ, вы можете приобрести ежемесячный или годовой план, чтобы получать к ним доступ в любое время.
6. Используйте инструменты ИИ для генерации точного текста
Возможно, вы слышали о Midjourney , DALL-E, Firefly и подобных генераторах изображений на базе ИИ. Но знаете ли вы, что существуют специальные генераторы искусственного интеллекта, которые создают точный текст на изображениях?
Поскольку одной из специальных функций Ideogram является создание читаемого текста, вы определенно можете попробовать это приложение для некоторых из своих творений. В Ideogram есть функция Magic Prompt, которая расширяет возможности вашей оригинальной функции, позволяя вам получать еще более точные результаты. В дополнение к бесплатному плану, платные подписные планы начинаются от 8 долларов в месяц.
Хотя ИИ имеет свои недостатки в создании изображений с читаемым текстом, вы найдете несколько альтернатив, если готовы мыслить нестандартно. Иногда лучшим вариантом будет предоставить инструменту подробные подсказки, которые будет проще воспринимать. Вы также можете исправить проблемы с изображениями с помощью другого программного обеспечения или воспользоваться инструментами, специально разработанными для создания точного текста.