Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

Зарегистрируйтесь и зарабатывайте 1000$ в день ⋙

На конференции I/O 2024 компания Google анонсировала следующую линейку моделей Gemma 2, и теперь компания наконец-то выпускает облегченные модели под открытой лицензией. Говорят, что новая модель Gemma 2 27B очень многообещающая и превосходит некоторые более крупные модели, такие как Llama 3 70B и Qwen 1.5 32B. Чтобы проверить это утверждение, давайте сравним Gemma 2 и Llama 3 — две ведущие модели с открытым исходным кодом на сегодняшний день.

Творческое письмо

Для начала давайте посмотрим, насколько хороши Gemma 2 и Llama 3 с точки зрения творческого письма. Автор статьи попросил обеих моделей написать небольшой рассказ о взаимоотношениях Луны и Солнца. Оба приложения отлично справляются со своей задачей, но модель Gemma 2 от Google выделяется благодаря увлекательному языку повествования и хорошему сюжету.

Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?
Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

С другой стороны, Llama 3 выглядит немного скучно и роботизированно. Компания Google всегда успешно справлялась с генерацией текста с помощью моделей Gemini, и модель меньшего размера Gemma 2 27B не является исключением.

Выигрышный вариант: Джемма 2

Многоязычное тестирование

В следующем раунде посмотрим, насколько хорошо обе модели справятся с языками, отличными от английского. Поскольку Google утверждает, что Gemma 2 хорошо понимает несколько языков, автор сравнил ее с моделью Llama 3 от Meta. Автор попросил обеих моделей перевести отрывок на хинди. Gemma 2 и Llama 3 показали себя очень хорошо.

Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?
Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

Автор также попробовал другой язык, бенгали, и модели дали столь же хорошие результаты. По крайней мере, в отношении индийских языков можно сказать, что Gemma 2 и Llama 3 хорошо обучены на большом корпусе. Однако Gemma 2 27B почти в 2,5 раза меньше Llama 3 70B, что делает ее еще более впечатляющей.

Выигрышные варианты: Джемма 2 и Лама 3

Проверьте логику.

Хотя Gemma 2 и Llama 3 не являются самыми умными моделями на рынке, они могут выполнять некоторые общие тесты на логическое мышление, как и гораздо более крупные модели. В предыдущем сравнении Llama 3 и GPT-4 модель Meta 70B была впечатляющей, поскольку продемонстрировала довольно высокий уровень интеллекта даже при своих меньших размерах.

Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?
Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

В этом раунде Llama 3 победила Gemma 2 с большой разницей в счете. Лама 3 ответила правильно на 2 из 3 вопросов, в то время как Джемма 2 не смогла ответить правильно даже на один. Джемма 2 просто не обучена решать сложные логические задачи.

С другой стороны, Llama 3 имеет прочную основу для рассуждений, которую, скорее всего, можно вывести из зашифрованного набора данных. Несмотря на свой небольшой размер — по крайней мере, по сравнению с моделями с триллионом параметров, такими как GPT-4, — он демонстрирует более чем приличный уровень интеллекта. В конечном итоге использование большего количества токенов для обучения модели фактически приводит к получению более мощной модели.

Выигрышный вариант: Лама 3

Следуйте инструкциям.

В следующем раунде автор попросил Джемму 2 и Ламу 3 придумать 10 слов, заканчивающихся на слово «NPU». А Лама 3 получила 10/10 правильных ответов. Напротив, Gemma 2 выдала только 7 правильных предложений из 10. Во многих предыдущих выпусках модели Google, включая Gemini, не очень хорошо следовали инструкциям пользователя. И та же тенденция продолжается с Gemma 2.

Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?
Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

Для моделей ИИ решающее значение имеет соблюдение инструкций пользователя. Он обеспечивает надежность и дает точную обратную связь по вашим указаниям. С точки зрения безопасности это также помогает удерживать модель на земле для лучшего соответствия протоколам безопасности.

Выигрышный вариант: Лама 3

Найти информацию

Длина контекста Gemma 2 и Llama 3 составляет 8 тыс. токенов. Автор добавил огромный блок текста, взятый непосредственно из книги «Гордость и предубеждение», содержащий более 17 000 символов и 3,8 тыс. токенов. Как всегда, автор помещает случайную цитату где-то в тексте и просит обе модели найти ее.

Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

Джемма 2 быстро разобралась в информации и указала, что цитата была вставлена ​​случайным образом. Llama 3 также обнаружил и предположил, что это утверждение представляется неуместным. Что касается долговременной контекстной памяти, то, хотя она и ограничена 8К токенами, обе модели в этом отношении весьма сильны.

Обратите внимание, что автор провел этот тест на HuggingChat (веб-сайт), поскольку meta.ai отказался выполнять эту подсказку, скорее всего, из-за нарушения авторских прав на контент.

Выигрышные варианты: Джемма 2 и Лама 3

Проверьте наличие галлюцинаций.

Меньшие модели, как правило, страдают от галлюцинаций ИИ из-за ограниченных данных для обучения, часто фальсифицируя информацию, когда модель сталкивается с незнакомыми темами. Поэтому автор вставил вымышленное название страны, чтобы проверить, не галлюцинируют ли Джемма 2 и Лама 3. И, что удивительно, они этого не сделали, а это значит, что и у Google, и у Meta есть довольно хорошая основа для своих моделей.

Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?
Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?
Gemma 2 или Llama 3 — лучшая модель с открытым исходным кодом?

Автор также задал еще один (ложный) вопрос, чтобы проверить достоверность моделей, но они снова не были галлюциногенными. Кстати, автор тестировал Llama 3 на HuggingChat, пока meta.ai просматривал интернет в поисках актуальной информации по соответствующим темам.

Выигрышные варианты: Джемма 2 и Лама 3

Заключение

Хотя модель Gemma 2 27B от Google не очень хорошо справляется с тестами на логическое мышление, она способна выполнять ряд других задач. Он отлично подходит для творческого письма, поддерживает несколько языков, имеет хорошую память и, что самое главное, не такой галлюциногенный, как предыдущие модели.

Конечно, Llama 3 лучше, но это также значительно более крупная модель, обученная на 70 миллиардах параметров. Разработчики найдут модель Gemma 2 27B полезной для широкого спектра вариантов использования. И для ровного счета, Gemma 2 9B также доступна.

Кроме того, пользователям стоит обратить внимание на Gemini 1.5 Flash, которая также является гораздо меньшей моделью и также поддерживает многомодальный ввод. Не говоря уже о том, что это невероятно быстро и эффективно.

Sign up and earn $1000 a day ⋙

Leave a Comment

Разница между обычным телевизором и Smart TV

Разница между обычным телевизором и Smart TV

Умные телевизоры действительно покорили мир. Благодаря множеству замечательных функций и возможности подключения к Интернету технологии изменили то, как мы смотрим телевизор.

Почему в морозильной камере нет подсветки, а в холодильнике есть?

Почему в морозильной камере нет подсветки, а в холодильнике есть?

Холодильники — привычные бытовые приборы. Холодильники обычно имеют 2 отделения: холодильное отделение просторное и имеет подсветку, которая автоматически включается каждый раз, когда пользователь ее открывает, а морозильное отделение узкое и не имеет подсветки.

2 способа устранения перегрузки сети, которая замедляет Wi-Fi

2 способа устранения перегрузки сети, которая замедляет Wi-Fi

На сети Wi-Fi влияют многие факторы, помимо маршрутизаторов, пропускной способности и помех, но есть несколько разумных способов улучшить работу вашей сети.

Как перейти с iOS 17 на iOS 16 без потери данных с помощью Tenorshare Reiboot

Как перейти с iOS 17 на iOS 16 без потери данных с помощью Tenorshare Reiboot

Если вы хотите вернуться к стабильной версии iOS 16 на своем телефоне, вот базовое руководство по удалению iOS 17 и понижению версии с iOS 17 до 16.

Что происходит с организмом, если вы едите йогурт каждый день?

Что происходит с организмом, если вы едите йогурт каждый день?

Йогурт — замечательная еда. Полезно ли есть йогурт каждый день? Как изменится ваше тело, если вы будете есть йогурт каждый день? Давайте узнаем вместе!

Какой вид риса лучше всего подходит для здоровья?

Какой вид риса лучше всего подходит для здоровья?

В этой статье рассматриваются наиболее питательные виды риса и способы максимально увеличить пользу для здоровья любого выбранного вами вида риса.

Как просыпаться вовремя утром

Как просыпаться вовремя утром

Установление режима сна и отхода ко сну, смена будильника и корректировка рациона питания — вот некоторые из мер, которые помогут вам лучше спать и вовремя просыпаться по утрам.

Советы по игре Rent Please! Симулятор арендодателя для новичков

Советы по игре Rent Please! Симулятор арендодателя для новичков

Арендуйте, пожалуйста! Landlord Sim — мобильная игра-симулятор для iOS и Android. Вы будете играть за владельца жилого комплекса и начнете сдавать квартиры в аренду, чтобы улучшить интерьер своих апартаментов и подготовить их к приему арендаторов.

Последние коды защиты башни в ванной и как вводить коды

Последние коды защиты башни в ванной и как вводить коды

Получите игровой код Bathroom Tower Defense Roblox и обменяйте его на потрясающие награды. Они помогут вам улучшить или разблокировать башни с более высоким уроном.

Конструкция, обозначения и принципы работы трансформаторов

Конструкция, обозначения и принципы работы трансформаторов

Давайте максимально подробно изучим конструкцию, обозначения и принципы работы трансформаторов.

4 способа, которыми ИИ делает умные телевизоры лучше

4 способа, которыми ИИ делает умные телевизоры лучше

От лучшего качества изображения и звука до голосового управления и многого другого — эти функции на базе искусственного интеллекта делают смарт-телевизоры намного лучше!

Почему ChatGPT лучше DeepSeek

Почему ChatGPT лучше DeepSeek

Поначалу люди возлагали большие надежды на DeepSeek. Как ИИ-чат-бот, позиционируемый как серьезный конкурент ChatGPT, он обещает интеллектуальные возможности и возможности чата.

Встречайте Fireflies.ai: бесплатный секретарь на базе искусственного интеллекта, который сэкономит вам часы работы

Встречайте Fireflies.ai: бесплатный секретарь на базе искусственного интеллекта, который сэкономит вам часы работы

Легко упустить важные детали, записывая другие важные вещи, а попытки делать заметки во время общения могут отвлекать. Решение — Fireflies.ai.

Как вырастить Аксолотля Майнкрафт, приручить Саламандру Майнкрафт

Как вырастить Аксолотля Майнкрафт, приручить Саламандру Майнкрафт

Аксолот в Minecraft станет отличным помощником для игроков при действиях под водой, если они знают, как им пользоваться.

A Quiet Place: The Road Ahead Конфигурация игры для ПК

A Quiet Place: The Road Ahead Конфигурация игры для ПК

Конфигурация A Quiet Place: The Road Ahead имеет довольно высокий рейтинг, поэтому вам нужно будет рассмотреть ее перед принятием решения о загрузке.