OpenAI представляет GPT-4.1 — самую умную модель для сложных задач

Зарегистрируйтесь и зарабатывайте 1000$ в день ⋙

OpenAI официально представила три новые модели: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели обладают огромными возможностями обработки контекста — до 1 миллиона токенов — и лимитами знаний, обновляемыми до июня 2024 года.

Компания утверждает, что эти модели превосходят недавно обновленные GPT-4o и GPT-4o mini, выпущенные в июле прошлого года. В настоящее время GPT-4.1 доступен только через API, поэтому вы пока не сможете использовать его напрямую в ChatGPT.

OpenAI отмечает, что GPT-4.1 будет доступен только через API. В ChatGPT многие улучшения в области соответствия инструкциям, программирования и интеллекта постепенно интегрировались в последнюю версию GPT-4o, и компания продолжит добавлять еще больше в будущих выпусках.

OpenAI представляет GPT-4.1 — самую умную модель для сложных задач

Тесты показывают значительные улучшения, которые обеспечивает GPT-4.1. Эта модель набрала 54,6% на тесте SWE-bench Verified, что на 21,4 балла больше, чем у GPT-4o. Модель набрала 38,3% по MultiChallenge — тесту, измеряющему соблюдение рекомендаций, — и установила новый рекорд по пониманию длинных видео, набрав 72,0% по тесту Video-MME, где модели анализируют видео продолжительностью до часа без субтитров.

OpenAI также сотрудничала с партнерами по альфа-тестированию для проверки производительности GPT-4.1 в реальных сценариях использования.

  • Компания Thomson Reuters протестировала GPT-4.1 с помощью своего юридического помощника на основе искусственного интеллекта CoCounsel. По сравнению с GPT-4o, GPT-4.1 демонстрирует на 17% более высокую точность при оценке нескольких документов. Этот тип работы в значительной степени зависит от способности отслеживать контекст в нескольких источниках и выявлять сложные взаимосвязи, такие как конфликтующие термины или скрытые зависимости, и GPT-4.1 неизменно демонстрирует высокую производительность.
  • Carlyle использовал GPT-4.1 для извлечения финансовых данных из длинных и сложных документов, включая файлы Excel и PDF. Согласно внутренним тестам компании, эта модель на 50% эффективнее предыдущих моделей при поиске документов. Это первая модель, которая надежно решает такие проблемы, как поиск «иголки в стоге сена», потеря информации в середине документа и аргументы, требующие объединения информации из нескольких файлов.

Производительность — это одно, но скорость не менее важна. По данным OpenAI, GPT-4.1 возвращает первый токен примерно через 15 секунд при обработке 128 000 токенов и до 30 секунд при обработке миллиона токенов. GPT-4.1 mini и nano еще быстрее.

GPT-4.1 nano обычно отвечает менее чем за 5 секунд на запросы с 128 000 входных токенов. Оперативное кэширование может дополнительно сократить задержку и сэкономить средства.

Значительный прогресс также был достигнут в понимании изображений. В частности, GPT-4.1 mini превосходит GPT-4o по различным визуальным тестам.

  • По MMMU (включая графики, диаграммы и карты) GPT-4.1 mini набрал 73%. Это выше, чем у GPT-4.5, и намного превышает 56% у GPT-4o mini.
  • В MathVista (которая проверяет способность решать задачи с изображениями) и GPT-4.1, и GPT-4.1 mini набрали 57%, что намного превышает 37% GPT-4o mini.
  • В CharXiv-Reasoning , где модели отвечают на вопросы на основе научных графиков, GPT-4.1 продолжает лидировать.
  • На Video-MME (длинные видео без субтитров) GPT-4.1 достиг 72%, что является значительным улучшением по сравнению с 65% у GPT-4o.

О цене:

  • GPT-4.1 стоит 2 доллара за 1 миллион токенов на входе и 8 долларов на выходе.
  • Цена GPT-4.1 mini составляет 0,40 долл. за вход и 1,60 долл. за выход.
  • GPT-4.1 nano стоит 0,10 доллара на входе и 0,40 доллара на выходе.

Использование оперативного кэширования или пакетного API может еще больше сократить эти затраты, что отлично подходит для крупномасштабных приложений. OpenAI также готовится прекратить поддержку GPT-4.5 Preview 14 июля 2025 года, ссылаясь на более высокую производительность GPT-4.1, меньшую задержку и меньшую стоимость.

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-pro — самая дорогая на сегодняшний день модель искусственного интеллекта OpenAI

O1-pro — самая дорогая на сегодняшний день модель искусственного интеллекта OpenAI

Компания OpenAI выпустила более мощную версию своей модели рассуждений ИИ o1, o1-pro, в своем API для разработчиков.

OpenAI анонсирует план ChatGPT Pro за колоссальные 200 долларов в месяц

OpenAI анонсирует план ChatGPT Pro за колоссальные 200 долларов в месяц

В настоящее время OpenAI предлагает четыре уровня подписки ChatGPT для удовлетворения потребностей различных групп клиентов.

OpenAI представляет проекты ChatGPT: новые функции для организации более интеллектуальных бесед

OpenAI представляет проекты ChatGPT: новые функции для организации более интеллектуальных бесед

Создав проект, пользователи могут хранить обсуждения, файлы и инструкции по настройке в одном месте. Это позволяет им легко вернуться к тому, что они делали.

OpenAI объявляет об инициативе по созданию стандартов ИИ для отраслей

OpenAI объявляет об инициативе по созданию стандартов ИИ для отраслей

OpenAI только что анонсировала программу Pioneers — попытку популяризации применения ИИ в реальных ситуациях.

Softbank планирует обойти Microsoft и стать крупнейшим инвестором OpenAI

Softbank планирует обойти Microsoft и стать крупнейшим инвестором OpenAI

Японский инвестиционный гигант Softbank планирует инвестировать от 15 до 25 миллиардов долларов в OpenAI. Если сделка состоится, Softbank станет крупнейшим инвестором OpenAI, заменив Microsoft, которая в настоящее время занимает эту позицию.

Пользователи могут общаться с Сантой, используя голосовой режим ChatGPT

Пользователи могут общаться с Сантой, используя голосовой режим ChatGPT

ChatGPT поможет вам сделать все лучше, предоставив возможность напрямую общаться с Санта-Клаусом.

OpenAI выпустит Orion, свою следующую большую модель искусственного интеллекта, в декабре

OpenAI выпустит Orion, свою следующую большую модель искусственного интеллекта, в декабре

По данным The Verge, OpenAI планирует запустить Orion, свою следующую крупную модель искусственного интеллекта, в декабре.

Alibaba запускает модель искусственного интеллекта, способную считывать человеческие эмоции

Alibaba запускает модель искусственного интеллекта, способную считывать человеческие эмоции

Китайский гигант электронной коммерции Alibaba продолжает оказывать влияние на общественное мнение, запустив новую модель искусственного интеллекта, которая, по его утверждению, способна считывать человеческие эмоции.

OpenAI запускает GPT Store и команду ChatGPT, выводя экосистему ChatGPT на новый уровень

OpenAI запускает GPT Store и команду ChatGPT, выводя экосистему ChatGPT на новый уровень

После долгого ожидания и бесчисленных слухов компания OpenAI наконец-то объявила о долгожданном запуске GPT Store и ChatGPT Team.

Amazon анонсирует звуковую модель Nova Sonic, утверждая, что ее производительность превосходит OpenAI и Google

Amazon анонсирует звуковую модель Nova Sonic, утверждая, что ее производительность превосходит OpenAI и Google

Сегодня компания Amazon представила Nova Sonic — усовершенствованную модель преобразования речи, которая позволяет разработчикам создавать приложения, способные общаться с помощью голосов, имитирующих человеческие, в режиме реального времени.

Copilot — лучший способ бесплатного использования GPT-4 Turbo

Copilot — лучший способ бесплатного использования GPT-4 Turbo

Если вы хотите попробовать GPT-4 Turbo, лучшим способом сделать это будет использование инструмента Copilot от Microsoft.

OpenAI тихо убивает «героя» GPT-4

OpenAI тихо убивает «героя» GPT-4

OpenAI официально прекращает поддержку GPT-4, одной из самых известных моделей искусственного интеллекта компании, которая стала вирусной два года назад.

OpenAI близка к заключению сделки с Samsung об использовании ее функций искусственного интеллекта в телефонах Galaxy

OpenAI близка к заключению сделки с Samsung об использовании ее функций искусственного интеллекта в телефонах Galaxy

По данным южнокорейского издания The Korea Herald, гигант искусственного интеллекта OpenAI хочет позиционировать себя как потенциального конкурента Google.

OpenAI разрабатывает технологию реконструкции голоса всего по 15-секундной записи

OpenAI разрабатывает технологию реконструкции голоса всего по 15-секундной записи

OpenAI запускает технологию, которая может воссоздать голос любого человека всего с помощью 15-секундной записи.

Как музыка стимулирует мозг

Как музыка стимулирует мозг

Большинство людей знают, что музыка — это не только развлечение, но и нечто гораздо большее. Вот несколько способов, которыми музыка стимулирует развитие нашего мозга.

Наиболее часто встречающиеся дефицитные питательные вещества в рационе

Наиболее часто встречающиеся дефицитные питательные вещества в рационе

Диета очень важна для нашего здоровья. Однако в большинстве наших рационов питания зачастую не хватает этих шести важных питательных веществ.

Как использовать приложение CK Club от Circle K, чтобы получать выгодные предложения

Как использовать приложение CK Club от Circle K, чтобы получать выгодные предложения

Чтобы быстрее получать рекламную информацию от Circle K, вам следует установить приложение CK Club. Приложение сохраняет платежи при совершении покупок или оплате в Circle K, а также количество собранных марок.

Instagram разрешит ролики длиной до 3 минут

Instagram разрешит ролики длиной до 3 минут

Instagram только что объявил, что позволит пользователям публиковать видеоролики Reels продолжительностью до 3 минут, что вдвое больше предыдущего лимита в 90 секунд.

Как просмотреть информацию о процессоре Chromebook

Как просмотреть информацию о процессоре Chromebook

В этой статье вы узнаете, как просмотреть информацию о процессоре и проверить скорость процессора непосредственно на Chromebook.

8 крутых вещей, которые можно сделать со старым планшетом Android

8 крутых вещей, которые можно сделать со старым планшетом Android

Если вы не хотите продавать или отдавать свой старый планшет, вы можете использовать его 5 способами: как высококачественную фоторамку, музыкальный проигрыватель, устройство для чтения электронных книг и журналов, помощника по дому и как дополнительный экран.

Как быстро сделать ногти красивыми

Как быстро сделать ногти красивыми

Вы хотите быстро иметь красивые, блестящие и здоровые ногти. Эти простые советы по созданию красивых ногтей будут вам полезны.

Секреты цветового вдохновения, известные только дизайнерам

Секреты цветового вдохновения, известные только дизайнерам

В этой статье будут перечислены советы по работе с цветом, которыми поделились ведущие дизайнеры из сообщества Creative Market, чтобы вы могли каждый раз получать идеальное сочетание цветов.

Все, что вам нужно, чтобы заменить ваш ноутбук телефоном

Все, что вам нужно, чтобы заменить ваш ноутбук телефоном

Можно ли на самом деле заменить ноутбук телефоном? Да, но вам понадобятся соответствующие аксессуары, чтобы превратить ваш телефон в ноутбук.

ChatGPT скоро сможет видеть все, что происходит на вашем экране

ChatGPT скоро сможет видеть все, что происходит на вашем экране

Важный момент в полном видео с мероприятия заключается в том, что была продемонстрирована будущая функция приложения ChatGPT, но никаких реальных подробностей раскрыто не было. Это способность ChatGPT видеть все, что происходит на экране устройства пользователя.

ИИ учится обманывать людей, несмотря на то, что его учили быть честным

ИИ учится обманывать людей, несмотря на то, что его учили быть честным

Согласно новому исследованию, многие ведущие ИИ, несмотря на то, что их обучают быть честными, в ходе обучения учатся обманывать и систематически внушают пользователям ложные убеждения.

Как изменить вопросы в ChatGPT

Как изменить вопросы в ChatGPT

В ChatGPT теперь есть опция изменения вопроса, так что пользователи могут редактировать вопрос или контент, которым они обмениваются с ChatGPT.

Как распознать поддельные QR-коды и защитить свои данные

Как распознать поддельные QR-коды и защитить свои данные

QR-коды кажутся довольно безобидными, пока вы не отсканируете плохой QR-код и не получите что-то неприятное в своей системе. Если вы хотите защитить свой телефон и данные, есть несколько способов распознать поддельные QR-коды.

Qualcomm выпускает модем X85 5G с серией заметных улучшений

Qualcomm выпускает модем X85 5G с серией заметных улучшений

На сцене MWC 2025 компания Qualcomm произвела фурор, представив восьмое поколение модема 5G под названием X85, который, как ожидается, будет использоваться во флагманских смартфонах, выпуск которых запланирован на конец этого года.

Новая технология позволяет телефонам гибко менять цвет

Новая технология позволяет телефонам гибко менять цвет

У вас модный iPhone 16 «Ультрамарин», но в один прекрасный день вам внезапно становится скучно от этого цвета; Что вы будете делать?