Cerebras запускает самую быструю в мире технологию вывода искусственного интеллекта, производительность которой в 20 раз выше, чем у NVIDIA

Зарегистрируйтесь и зарабатывайте 1000$ в день ⋙

Компания Cerebras Systems только что официально анонсировала Cerebras Inference, которая считается самым быстрым в мире решением для вывода на основе искусственного интеллекта. Cerebras Inference обеспечивает производительность до 1800 токенов в секунду для моделей Llama 3.1 8B (8 миллиардов параметров) и 450 токенов в секунду для Llama 3.1 70B, что почти в 20 раз быстрее решений для вывода ИИ на базе графических процессоров NVIDIA, доступных в современных гипермасштабируемых облаках по всему миру, включая Microsoft Azure.

Помимо невероятной производительности, стоимость услуг этого нового решения для вывода также очень низкая и составляет лишь малую часть стоимости популярных облачных платформ на базе графических процессоров. Например, клиент может получить один миллион токенов всего за 10 центов, тем самым обеспечив в 100 раз более высокую производительность при выполнении рабочих нагрузок ИИ.

16-битная точность Cerebras и в 20 раз более высокая скорость вывода позволят разработчикам создавать высокопроизводительные приложения ИИ следующего поколения без ущерба для скорости или стоимости. Такое революционное соотношение цены и производительности стало возможным благодаря системе Cerebras CS-3 и процессору искусственного интеллекта Wafer Scale Engine 3 (WSE-3). CS-3 обеспечивает в 7000 раз большую пропускную способность памяти, чем Nvidia H100, решая техническую проблему пропускной способности памяти для генеративного ИИ.

Cerebras запускает самую быструю в мире технологию вывода искусственного интеллекта, производительность которой в 20 раз выше, чем у NVIDIA

В настоящее время Cerebras Inference доступен на следующих трех уровнях:

  • Бесплатный уровень предлагает бесплатный доступ к API и щедрые лимиты использования для всех, кто зарегистрируется.
  • Уровень разработчика предназначен для гибких развертываний без использования серверов, предоставляя пользователям конечные точки API по цене, составляющей лишь малую часть стоимости существующих альтернатив на рынке: модели Llama 3.1 8B и 70B стоят всего 10 и 60 центов за миллион токенов соответственно.
  • Планы Enterprise Tier предлагают точно настроенные модели, индивидуальные соглашения об уровне обслуживания и специализированную поддержку. Идеально подходит для постоянных рабочих нагрузок: предприятия могут получить доступ к Cerebras Inference через частное облако, управляемое Cerebras, или локально.

Благодаря рекордной производительности, конкурентоспособным ценам и открытому доступу к API Cerebras Inference устанавливает новый стандарт для открытой разработки и развертывания LLM. Cerebras — единственное решение, способное обеспечить как высокоскоростное обучение, так и вывод, что открывает совершенно новые возможности для ИИ.

Поскольку тенденции в области искусственного интеллекта стремительно развиваются, а NVIDIA в настоящее время занимает доминирующее положение на рынке, появление таких компаний, как Cerebras и Groq, сигнализирует о потенциальном изменении динамики всей отрасли. Поскольку спрос на более быстрые и экономичные решения для вывода ИИ растет, такие решения, как Cerebras Inference, имеют все шансы побороться за лидерство NVIDIA, особенно в сфере вывода.

Sign up and earn $1000 a day ⋙

Leave a Comment

Что такое 1314?

Что такое 1314?

1314 — число, которое молодые люди часто используют в качестве любовного кода. Однако не все знают, что такое 1314 и что оно означает?

Как защитить свое психическое и физическое здоровье в токсичной среде

Как защитить свое психическое и физическое здоровье в токсичной среде

Справляться с токсичными ситуациями может быть невероятно сложно. Вот несколько советов, которые помогут вам тактично справляться с токсичной средой и сохранять душевное спокойствие.

Как музыка стимулирует мозг

Как музыка стимулирует мозг

Большинство людей знают, что музыка — это не только развлечение, но и нечто гораздо большее. Вот несколько способов, которыми музыка стимулирует развитие нашего мозга.

Наиболее часто встречающиеся дефицитные питательные вещества в рационе

Наиболее часто встречающиеся дефицитные питательные вещества в рационе

Диета очень важна для нашего здоровья. Однако в большинстве наших рационов питания зачастую не хватает этих шести важных питательных веществ.

Как использовать приложение CK Club от Circle K, чтобы получать выгодные предложения

Как использовать приложение CK Club от Circle K, чтобы получать выгодные предложения

Чтобы быстрее получать рекламную информацию от Circle K, вам следует установить приложение CK Club. Приложение сохраняет платежи при совершении покупок или оплате в Circle K, а также количество собранных марок.

Instagram разрешит ролики длиной до 3 минут

Instagram разрешит ролики длиной до 3 минут

Instagram только что объявил, что позволит пользователям публиковать видеоролики Reels продолжительностью до 3 минут, что вдвое больше предыдущего лимита в 90 секунд.

Как просмотреть информацию о процессоре Chromebook

Как просмотреть информацию о процессоре Chromebook

В этой статье вы узнаете, как просмотреть информацию о процессоре и проверить скорость процессора непосредственно на Chromebook.

8 крутых вещей, которые можно сделать со старым планшетом Android

8 крутых вещей, которые можно сделать со старым планшетом Android

Если вы не хотите продавать или отдавать свой старый планшет, вы можете использовать его 5 способами: как высококачественную фоторамку, музыкальный проигрыватель, устройство для чтения электронных книг и журналов, помощника по дому и как дополнительный экран.

Как быстро сделать ногти красивыми

Как быстро сделать ногти красивыми

Вы хотите быстро иметь красивые, блестящие и здоровые ногти. Эти простые советы по созданию красивых ногтей будут вам полезны.

Секреты цветового вдохновения, известные только дизайнерам

Секреты цветового вдохновения, известные только дизайнерам

В этой статье будут перечислены советы по работе с цветом, которыми поделились ведущие дизайнеры из сообщества Creative Market, чтобы вы могли каждый раз получать идеальное сочетание цветов.

Все, что вам нужно, чтобы заменить ваш ноутбук телефоном

Все, что вам нужно, чтобы заменить ваш ноутбук телефоном

Можно ли на самом деле заменить ноутбук телефоном? Да, но вам понадобятся соответствующие аксессуары, чтобы превратить ваш телефон в ноутбук.

ChatGPT скоро сможет видеть все, что происходит на вашем экране

ChatGPT скоро сможет видеть все, что происходит на вашем экране

Важный момент в полном видео с мероприятия заключается в том, что была продемонстрирована будущая функция приложения ChatGPT, но никаких реальных подробностей раскрыто не было. Это способность ChatGPT видеть все, что происходит на экране устройства пользователя.

ИИ учится обманывать людей, несмотря на то, что его учили быть честным

ИИ учится обманывать людей, несмотря на то, что его учили быть честным

Согласно новому исследованию, многие ведущие ИИ, несмотря на то, что их обучают быть честными, в ходе обучения учатся обманывать и систематически внушают пользователям ложные убеждения.

Как изменить вопросы в ChatGPT

Как изменить вопросы в ChatGPT

В ChatGPT теперь есть опция изменения вопроса, так что пользователи могут редактировать вопрос или контент, которым они обмениваются с ChatGPT.

Как распознать поддельные QR-коды и защитить свои данные

Как распознать поддельные QR-коды и защитить свои данные

QR-коды кажутся довольно безобидными, пока вы не отсканируете плохой QR-код и не получите что-то неприятное в своей системе. Если вы хотите защитить свой телефон и данные, есть несколько способов распознать поддельные QR-коды.