Microsoft интегрирует DeepSeek в платформу PC Copilot+
В январе Microsoft объявила о планах внедрения оптимизированных для NPU версий модели DeepSeek-R1 непосредственно на компьютеры Copilot+, работающие на процессорах Qualcomm Snapdragon X.
Китайский стартап DeepSeek в области искусственного интеллекта только что официально представил свою новейшую большую языковую модель (LLM) DeepSeek-V3-0324. Эта модель с емкостью до 641 ГБ была анонсирована на платформе AI Hugging Face без раскрытия особой информации, в соответствии с секретным стилем новых продуктов, который компания всегда применяла до сих пор.
Особенностью этой модели является лицензия MIT, которая допускает бесплатное использование в коммерческих целях. Первоначальные результаты тестов показывают, что DeepSeek-V3-0324 способен работать на основных аппаратных конфигурациях, таких как Mac Studio от Apple с чипом M3 Ultra. Специалист по искусственному интеллекту Авни Ханнун сообщил, что с помощью этой конфигурации можно достичь скорости обработки более 20 токенов в секунду. Эта возможность запускать большую языковую модель на локальном стандартном оборудовании резко контрастирует с традиционным подходом использования огромной инфраструктуры центра обработки данных для поддержки расширенных моделей ИИ.
По информации DeepSeek, первоначальные тесты показали значительные улучшения по сравнению с предыдущими версиями. Эта модель была тщательно протестирована внутренними заинтересованными сторонами и продемонстрировала превосходную производительность, превзойдя даже все другие конкурирующие модели и обойдя Claude Sonnet 3.5 компании Anthropic в задачах, не требующих глубокого мышления. Однако в отличие от моделей Sonnet, требующих платной подписки, DeepSeek-V3-0324 можно загрузить и использовать совершенно бесплатно.
Технически DeepSeek-V3-0324 использует смешанную экспертную архитектуру (MoE). Он выделяется своей способностью выборочно использовать около 37 миллиардов из 685 миллиардов параметров для каждой задачи, что повышает эффективность за счет снижения вычислительных требований при сохранении производительности. В этой модели также применяются технологии Multi-Head Latent Attention (MLA) и Multi-Token Prediction (MTP), которые способствуют улучшению контекстной памяти и ускорению вывода.
Пользователи могут получить доступ к DeepSeek-V3-0324 через Hugging Face, чат-интерфейс и API OpenRouter, а также при желании через чат-платформу DeepSeek. Поставщик услуг вывода Hyperbolic Labs также предоставляет доступ к модели.
С выпуском DeepSeek-V3-0324 компания продолжает укреплять свои позиции в гонке за разработку крупных языковых моделей, одновременно предоставляя мощный и доступный вариант для сообщества исследователей и разработчиков ИИ. Возможность работы на общедоступном оборудовании в сочетании с бесплатной лицензией, безусловно, откроет множество возможностей практического применения этой модели в ближайшем будущем.
В январе Microsoft объявила о планах внедрения оптимизированных для NPU версий модели DeepSeek-R1 непосредственно на компьютеры Copilot+, работающие на процессорах Qualcomm Snapdragon X.
Китайское приложение на основе искусственного интеллекта DeepSeek в настоящее время лидирует в чартах магазинов приложений.
Злоумышленники создают тысячи веб-сайтов, подобных DeepSeek, в надежде, что ничего не подозревающие пользователи предоставят им свою личную информацию.
Японский инвестиционный гигант Softbank планирует инвестировать от 15 до 25 миллиардов долларов в OpenAI. Если сделка состоится, Softbank станет крупнейшим инвестором OpenAI, заменив Microsoft, которая в настоящее время занимает эту позицию.
Серия мошеннических объявлений DeepSeek в Google распространяет опасное вредоносное ПО, крадущее информацию, среди ничего не подозревающих пользователей DeepSeek.
Китайский стартап в области искусственного интеллекта DeepSeek планирует стать более «прозрачным» в отношении технологий, лежащих в основе его моделей ИИ с открытым исходным кодом, таких как модель рассуждений R1.
Компания Huawei вступает в эру полного отказа от Android с Pura X — новым складным телефоном, работающим под управлением программного обеспечения HarmonyOS 5 и не предусматривающим возможности использования операционной системы Google.
DeepSeek — название китайской компании, занимающейся искусственным интеллектом, и ее одноименного чат-бота. Флагманские модели компании, DeepSeek-V3 и DeepSeek-R1, произвели фурор, поскольку они дешевле в обучении и использовании, чем их аналоги.
Прошедшая неделя не была радостной для инвесторов и поклонников Nvidia.
Китайская компания DeepSeek, стоящая за бесплатной моделью искусственного интеллекта, которая потрясла мир технологий, столкнулась с рядом негативных обвинений, включая использование контрабандных графических процессоров Nvidia для обучения и запуска своей одноименной модели искусственного интеллекта.
Нельзя отрицать, что складные телефоны — это очень круто. Однако после некоторого времени использования у этого устройства обнаруживается немало странностей. Вот 5 основных недостатков телефонов со складным экраном, которых вы не ожидаете!
Компания Adobe по-новому представила технологию создания видео на основе искусственного интеллекта широким массам, хотя ей еще предстоит создать законченный фильм с использованием этой технологии.
Код Genshin Impact 5.5 поможет вам обменять его на Первичные камни, магические минералы, опыт и многие другие награды.
macOS Catalina и iPadOS поддерживают новую функцию Sidecar, которая позволяет использовать iPad в качестве дополнительного дисплея для Mac.
Это набор обоев для Nokia 1280. Если вы когда-либо отправляли смс с просьбой получить обои для телефона 1280, обои для телефона-кирпича, то попробуйте взглянуть на эти обои.
Компания Venus Aerospace опубликовала первые изображения своего нового гиперзвукового самолета под названием Stargazer, который может развивать максимальную скорость 11 115 км/ч, что эквивалентно числу Маха 9.
Вздутие живота может случиться с каждым. Хорошая новость заключается в том, что завтрак — это отличное время, чтобы добавить в свой рацион некоторые ингредиенты, которые помогут уменьшить вздутие живота. Этот ингредиент — банан.
Компания OpenAI только что официально представила значительное обновление возможностей генерации изображений на основе ИИ в ChatGPT, что является важным шагом вперед по сравнению с использованием отдельной модели генерации изображений, как в предыдущей DALL-E.
Китайский стартап DeepSeek в области искусственного интеллекта только что официально представил свою новейшую большую языковую модель (LLM) DeepSeek-V3-0324.
Gboard уже давно является основной клавиатурой на телефонах Android. Однако многие люди недавно перешли на клавиатуру Samsung и не пожалели об этом.
Отправьте своей второй половинке сладкие и романтические пожелания на выходные. Хотя это всего лишь слова или послания, они станут значимыми духовными дарами, которые помогут укрепить ваши отношения.
Ожидается, что премьера ремейка «Гарри Поттера» от HBO состоится в 2026 году. Вот что делает телевизионный «Гарри Поттер» успешным.
Красивые фотографии луны не редкость в Интернете. В статье будут представлены самые красивые фотографии Луны в мире.
Теперь AMD отреагировала на проблемы с неэффективной флагманской линейкой процессоров, выпустив новое обновление, которое может обеспечить несколько дополнительных кадров в секунду.
В октябре 2022 года Илон Маск потратил 44 миллиарда долларов на приобретение X, но на сегодняшний день стоимость платформы упала на 78,6% и составляет около 9,4 миллиарда долларов.