Deepseek выпускает бесплатную языковую модель v3, которая отлично работает на распространенных конфигурациях оборудования

Зарегистрируйтесь и зарабатывайте 1000$ в день ⋙

Китайский стартап DeepSeek в области искусственного интеллекта только что официально представил свою новейшую большую языковую модель (LLM) DeepSeek-V3-0324. Эта модель с емкостью до 641 ГБ была анонсирована на платформе AI Hugging Face без раскрытия особой информации, в соответствии с секретным стилем новых продуктов, который компания всегда применяла до сих пор.

Особенностью этой модели является лицензия MIT, которая допускает бесплатное использование в коммерческих целях. Первоначальные результаты тестов показывают, что DeepSeek-V3-0324 способен работать на основных аппаратных конфигурациях, таких как Mac Studio от Apple с чипом M3 Ultra. Специалист по искусственному интеллекту Авни Ханнун сообщил, что с помощью этой конфигурации можно достичь скорости обработки более 20 токенов в секунду. Эта возможность запускать большую языковую модель на локальном стандартном оборудовании резко контрастирует с традиционным подходом использования огромной инфраструктуры центра обработки данных для поддержки расширенных моделей ИИ.

Deepseek выпускает бесплатную языковую модель v3, которая отлично работает на распространенных конфигурациях оборудования

По информации DeepSeek, первоначальные тесты показали значительные улучшения по сравнению с предыдущими версиями. Эта модель была тщательно протестирована внутренними заинтересованными сторонами и продемонстрировала превосходную производительность, превзойдя даже все другие конкурирующие модели и обойдя Claude Sonnet 3.5 компании Anthropic в задачах, не требующих глубокого мышления. Однако в отличие от моделей Sonnet, требующих платной подписки, DeepSeek-V3-0324 можно загрузить и использовать совершенно бесплатно.

Технически DeepSeek-V3-0324 использует смешанную экспертную архитектуру (MoE). Он выделяется своей способностью выборочно использовать около 37 миллиардов из 685 миллиардов параметров для каждой задачи, что повышает эффективность за счет снижения вычислительных требований при сохранении производительности. В этой модели также применяются технологии Multi-Head Latent Attention (MLA) и Multi-Token Prediction (MTP), которые способствуют улучшению контекстной памяти и ускорению вывода.

Пользователи могут получить доступ к DeepSeek-V3-0324 через Hugging Face, чат-интерфейс и API OpenRouter, а также при желании через чат-платформу DeepSeek. Поставщик услуг вывода Hyperbolic Labs также предоставляет доступ к модели.

С выпуском DeepSeek-V3-0324 компания продолжает укреплять свои позиции в гонке за разработку крупных языковых моделей, одновременно предоставляя мощный и доступный вариант для сообщества исследователей и разработчиков ИИ. Возможность работы на общедоступном оборудовании в сочетании с бесплатной лицензией, безусловно, откроет множество возможностей практического применения этой модели в ближайшем будущем.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft интегрирует DeepSeek в платформу PC Copilot+

Microsoft интегрирует DeepSeek в платформу PC Copilot+

В январе Microsoft объявила о планах внедрения оптимизированных для NPU версий модели DeepSeek-R1 непосредственно на компьютеры Copilot+, работающие на процессорах Qualcomm Snapdragon X.

Как быстро зарегистрировать аккаунт DeepSeek

Как быстро зарегистрировать аккаунт DeepSeek

Китайское приложение на основе искусственного интеллекта DeepSeek в настоящее время лидирует в чартах магазинов приложений.

Мошенники используют Deepseek для кражи данных пользователей

Мошенники используют Deepseek для кражи данных пользователей

Злоумышленники создают тысячи веб-сайтов, подобных DeepSeek, в надежде, что ничего не подозревающие пользователи предоставят им свою личную информацию.

Softbank планирует обойти Microsoft и стать крупнейшим инвестором OpenAI

Softbank планирует обойти Microsoft и стать крупнейшим инвестором OpenAI

Японский инвестиционный гигант Softbank планирует инвестировать от 15 до 25 миллиардов долларов в OpenAI. Если сделка состоится, Softbank станет крупнейшим инвестором OpenAI, заменив Microsoft, которая в настоящее время занимает эту позицию.

Эти фейковые объявления DeepSeek распространяют опасное вредоносное ПО

Эти фейковые объявления DeepSeek распространяют опасное вредоносное ПО

Серия мошеннических объявлений DeepSeek в Google распространяет опасное вредоносное ПО, крадущее информацию, среди ничего не подозревающих пользователей DeepSeek.

DeepSeek приглашает пользователей заглянуть за кулисы открытого исходного кода ИИ компании

DeepSeek приглашает пользователей заглянуть за кулисы открытого исходного кода ИИ компании

Китайский стартап в области искусственного интеллекта DeepSeek планирует стать более «прозрачным» в отношении технологий, лежащих в основе его моделей ИИ с открытым исходным кодом, таких как модель рассуждений R1.

Huawei выпускает складной телефон Pura X с помощником DeepSeek AI

Huawei выпускает складной телефон Pura X с помощником DeepSeek AI

Компания Huawei вступает в эру полного отказа от Android с Pura X — новым складным телефоном, работающим под управлением программного обеспечения HarmonyOS 5 и не предусматривающим возможности использования операционной системы Google.

4 причины отказаться от ChatGPT и начать использовать DeepSeek

4 причины отказаться от ChatGPT и начать использовать DeepSeek

DeepSeek — название китайской компании, занимающейся искусственным интеллектом, и ее одноименного чат-бота. Флагманские модели компании, DeepSeek-V3 и DeepSeek-R1, произвели фурор, поскольку они дешевле в обучении и использовании, чем их аналоги.

Забудьте о RTX 5070, даже RTX 5080 не сможет превзойти RTX 4090

Забудьте о RTX 5070, даже RTX 5080 не сможет превзойти RTX 4090

Прошедшая неделя не была радостной для инвесторов и поклонников Nvidia.

США рассматривают возможность расследования контрабанды графических процессоров Nvidia в Китай для запуска DeepSeek

США рассматривают возможность расследования контрабанды графических процессоров Nvidia в Китай для запуска DeepSeek

Китайская компания DeepSeek, стоящая за бесплатной моделью искусственного интеллекта, которая потрясла мир технологий, столкнулась с рядом негативных обвинений, включая использование контрабандных графических процессоров Nvidia для обучения и запуска своей одноименной модели искусственного интеллекта.

8 основных недостатков телефонов со складным экраном, которых вы не ожидали

8 основных недостатков телефонов со складным экраном, которых вы не ожидали

Нельзя отрицать, что складные телефоны — это очень круто. Однако после некоторого времени использования у этого устройства обнаруживается немало странностей. Вот 5 основных недостатков телефонов со складным экраном, которых вы не ожидаете!

Adobe внедряет технологию создания видео на основе искусственного интеллекта в Premiere Pro

Adobe внедряет технологию создания видео на основе искусственного интеллекта в Premiere Pro

Компания Adobe по-новому представила технологию создания видео на основе искусственного интеллекта широким массам, хотя ей еще предстоит создать законченный фильм с использованием этой технологии.

Последние коды Genshin Impact за апрель 2025 г.

Последние коды Genshin Impact за апрель 2025 г.

Код Genshin Impact 5.5 поможет вам обменять его на Первичные камни, магические минералы, опыт и многие другие награды.

Как превратить ваш iPad в дополнительный дисплей Mac

Как превратить ваш iPad в дополнительный дисплей Mac

macOS Catalina и iPadOS поддерживают новую функцию Sidecar, которая позволяет использовать iPad в качестве дополнительного дисплея для Mac.

Обои 1280, красивые обои для телефона Nokia 1280

Обои 1280, красивые обои для телефона Nokia 1280

Это набор обоев для Nokia 1280. Если вы когда-либо отправляли смс с просьбой получить обои для телефона 1280, обои для телефона-кирпича, то попробуйте взглянуть на эти обои.

Гиперзвуковой космический самолет достиг скорости 11 115 км/ч

Гиперзвуковой космический самолет достиг скорости 11 115 км/ч

Компания Venus Aerospace опубликовала первые изображения своего нового гиперзвукового самолета под названием Stargazer, который может развивать максимальную скорость 11 115 км/ч, что эквивалентно числу Маха 9.

Употребление бананов на завтрак помогает уменьшить вздутие живота

Употребление бананов на завтрак помогает уменьшить вздутие живота

Вздутие живота может случиться с каждым. Хорошая новость заключается в том, что завтрак — это отличное время, чтобы добавить в свой рацион некоторые ингредиенты, которые помогут уменьшить вздутие живота. Этот ингредиент — банан.

OpenAI объявляет о крупном обновлении ИИ-генерации изображений в ChatGPT

OpenAI объявляет о крупном обновлении ИИ-генерации изображений в ChatGPT

Компания OpenAI только что официально представила значительное обновление возможностей генерации изображений на основе ИИ в ChatGPT, что является важным шагом вперед по сравнению с использованием отдельной модели генерации изображений, как в предыдущей DALL-E.

Deepseek выпускает бесплатную языковую модель v3, которая отлично работает на распространенных конфигурациях оборудования

Deepseek выпускает бесплатную языковую модель v3, которая отлично работает на распространенных конфигурациях оборудования

Китайский стартап DeepSeek в области искусственного интеллекта только что официально представил свою новейшую большую языковую модель (LLM) DeepSeek-V3-0324.

Причины отказаться от Gboard и перейти на клавиатуру Samsung

Причины отказаться от Gboard и перейти на клавиатуру Samsung

Gboard уже давно является основной клавиатурой на телефонах Android. Однако многие люди недавно перешли на клавиатуру Samsung и не пожалели об этом.

Сладкие и романтические пожелания на выходные для влюбленных

Сладкие и романтические пожелания на выходные для влюбленных

Отправьте своей второй половинке сладкие и романтические пожелания на выходные. Хотя это всего лишь слова или послания, они станут значимыми духовными дарами, которые помогут укрепить ваши отношения.

Для успеха телесериала о Гарри Поттере необходимы следующие элементы:

Для успеха телесериала о Гарри Поттере необходимы следующие элементы:

Ожидается, что премьера ремейка «Гарри Поттера» от HBO состоится в 2026 году. Вот что делает телевизионный «Гарри Поттер» успешным.

Потрясающие фотографии суперлуния со всего мира

Потрясающие фотографии суперлуния со всего мира

Красивые фотографии луны не редкость в Интернете. В статье будут представлены самые красивые фотографии Луны в мире.

Пользователи AMD Ryzen должны установить это обновление BIOS для бесплатного повышения производительности

Пользователи AMD Ryzen должны установить это обновление BIOS для бесплатного повышения производительности

Теперь AMD отреагировала на проблемы с неэффективной флагманской линейкой процессоров, выпустив новое обновление, которое может обеспечить несколько дополнительных кадров в секунду.

Стоимость X упала с 44 миллиардов долларов до менее 10 миллиардов долларов

Стоимость X упала с 44 миллиардов долларов до менее 10 миллиардов долларов

В октябре 2022 года Илон Маск потратил 44 миллиарда долларов на приобретение X, но на сегодняшний день стоимость платформы упала на 78,6% и составляет около 9,4 миллиарда долларов.