OpenAI официально представила три новые модели: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели обладают огромными возможностями обработки контекста — до 1 миллиона токенов — и лимитами знаний, обновляемыми до июня 2024 года.
Компания утверждает, что эти модели превосходят недавно обновленные GPT-4o и GPT-4o mini, выпущенные в июле прошлого года. В настоящее время GPT-4.1 доступен только через API, поэтому вы пока не сможете использовать его напрямую в ChatGPT.
OpenAI отмечает, что GPT-4.1 будет доступен только через API. В ChatGPT многие улучшения в области соответствия инструкциям, программирования и интеллекта постепенно интегрировались в последнюю версию GPT-4o, и компания продолжит добавлять еще больше в будущих выпусках.

Тесты показывают значительные улучшения, которые обеспечивает GPT-4.1. Эта модель набрала 54,6% на тесте SWE-bench Verified, что на 21,4 балла больше, чем у GPT-4o. Модель набрала 38,3% по MultiChallenge — тесту, измеряющему соблюдение рекомендаций, — и установила новый рекорд по пониманию длинных видео, набрав 72,0% по тесту Video-MME, где модели анализируют видео продолжительностью до часа без субтитров.
OpenAI также сотрудничала с партнерами по альфа-тестированию для проверки производительности GPT-4.1 в реальных сценариях использования.
- Компания Thomson Reuters протестировала GPT-4.1 с помощью своего юридического помощника на основе искусственного интеллекта CoCounsel. По сравнению с GPT-4o, GPT-4.1 демонстрирует на 17% более высокую точность при оценке нескольких документов. Этот тип работы в значительной степени зависит от способности отслеживать контекст в нескольких источниках и выявлять сложные взаимосвязи, такие как конфликтующие термины или скрытые зависимости, и GPT-4.1 неизменно демонстрирует высокую производительность.
- Carlyle использовал GPT-4.1 для извлечения финансовых данных из длинных и сложных документов, включая файлы Excel и PDF. Согласно внутренним тестам компании, эта модель на 50% эффективнее предыдущих моделей при поиске документов. Это первая модель, которая надежно решает такие проблемы, как поиск «иголки в стоге сена», потеря информации в середине документа и аргументы, требующие объединения информации из нескольких файлов.
Производительность — это одно, но скорость не менее важна. По данным OpenAI, GPT-4.1 возвращает первый токен примерно через 15 секунд при обработке 128 000 токенов и до 30 секунд при обработке миллиона токенов. GPT-4.1 mini и nano еще быстрее.
GPT-4.1 nano обычно отвечает менее чем за 5 секунд на запросы с 128 000 входных токенов. Оперативное кэширование может дополнительно сократить задержку и сэкономить средства.
Значительный прогресс также был достигнут в понимании изображений. В частности, GPT-4.1 mini превосходит GPT-4o по различным визуальным тестам.
- По MMMU (включая графики, диаграммы и карты) GPT-4.1 mini набрал 73%. Это выше, чем у GPT-4.5, и намного превышает 56% у GPT-4o mini.
- В MathVista (которая проверяет способность решать задачи с изображениями) и GPT-4.1, и GPT-4.1 mini набрали 57%, что намного превышает 37% GPT-4o mini.
- В CharXiv-Reasoning , где модели отвечают на вопросы на основе научных графиков, GPT-4.1 продолжает лидировать.
- На Video-MME (длинные видео без субтитров) GPT-4.1 достиг 72%, что является значительным улучшением по сравнению с 65% у GPT-4o.
О цене:
- GPT-4.1 стоит 2 доллара за 1 миллион токенов на входе и 8 долларов на выходе.
- Цена GPT-4.1 mini составляет 0,40 долл. за вход и 1,60 долл. за выход.
- GPT-4.1 nano стоит 0,10 доллара на входе и 0,40 доллара на выходе.
Использование оперативного кэширования или пакетного API может еще больше сократить эти затраты, что отлично подходит для крупномасштабных приложений. OpenAI также готовится прекратить поддержку GPT-4.5 Preview 14 июля 2025 года, ссылаясь на более высокую производительность GPT-4.1, меньшую задержку и меньшую стоимость.