Home
» Wiki
»
Google случайно опубликовал документацию о том, как работает поиск
Google случайно опубликовал документацию о том, как работает поиск
Зарегистрируйтесь и зарабатывайте 1000$ в день ⋙
В понедельник произошла утечка внутренних документов, описывающих факторы, которые Google Search учитывает при ранжировании и отображении результатов поиска.
Google случайно раскрыл, как работает поиск
Эти документы были опубликованы Рэндом Фишкиным из компании-разработчика программного обеспечения SparkToro. Ранее Фискин работал в сфере поисковой оптимизации (SEO).
Этот «репозиторий контента API Google» содержит внутреннюю документацию API, которая объясняет сотрудникам, как работают различные компоненты, генерирующие результаты поиска. Всего более 2500 страниц. В некоторых документах описываются старые системы, но другие документы, по-видимому, соответствуют современным требованиям.
Судя по опубликованным данным, Google, по-видимому, сделал его общедоступным — возможно, случайно — через GitHub начиная с 27 марта. Затем, 7 мая, были опубликованы пояснительные документы. Однако, поскольку примерно в то же время он был проиндексирован сторонним сервисом, его копия осталась доступной даже после того, как Google удалил его.
Хотя эти данные показывают, какие факторы Google Search может учитывать при ранжировании результатов поиска, они не показывают, насколько важен каждый фактор для окончательного рейтинга.
Эти данные могут оказаться полезными для представителей сообщества SEO, пытающихся адаптироваться к изменениям в рейтингах поиска Google и занять более высокие позиции на странице. Изучив этот документ, они обнаружили, что он противоречит публичному заявлению Google о работе поиска.
Google пока не прокомментировала утечку публично. В марте компания анонсировала последнее крупное обновление Поиска, целью которого является показ более аутентичного и «полезного» контента. Его основная система ранжирования была обновлена, чтобы определить, «создана ли страница для поисковых систем, а не для людей » .
Самые важные выводы из утечки
Ясно одно: алгоритм поиска Google не был раскрыт, и у SEO-экспертов не появилось внезапно всех ответов. Однако объем информации, просочившейся в тысячи внутренних документов Google, по-прежнему огромен. Это беспрецедентный взгляд на обычно тщательно охраняемую внутреннюю работу Google.
Выживание веб-сайтов зависит от поискового трафика, и многие из них готовы пойти на многое — и большие расходы — чтобы обойти конкурентов и подняться на вершину результатов поиска. Более высокие рейтинги означают больше трафика на сайт, а значит, больше денег. В результате операторы веб-сайтов внимательно отслеживают каждое слово, публикуемое Google, а также каждую публикацию в социальных сетях относительно рейтингов поиска.
На протяжении многих лет представители Google неоднократно отрицали, что клики пользователей влияют на ранжирование веб-сайтов, однако в просочившихся документах отмечается, что определенные типы кликов пользователей влияют на рейтинг поиска. Показания по предыдущему антимонопольному делу Министерства юстиции США выявили фактор ранжирования под названием Navboost, который использует клики пользователей для продвижения контента в результатах поиска.
«Для меня самым важным выводом является то, что многие публичные заявления Google о том, какие данные они собирают и как работает их поисковая система, не соответствуют действительности», — рассказал The Verge по электронной почте Рэнд Фишкин, эксперт в области поисковой оптимизации (SEO) .
Утечка впервые стала вирусной после того, как эксперты по поисковой оптимизации Фишкин и Майк Кинг ранее на этой неделе опубликовали часть содержания конфиденциального документа вместе с сопутствующим анализом. Утечка документов API включает в себя репозитории, заполненные информацией и определениями о данных, которые собирает Google, некоторые из которых могут помочь определить рейтинг веб-сайтов в результатах поиска. Первоначально Google уклонялся от ответов на вопросы о подлинности просочившихся документов, прежде чем официально подтвердить их в прошлую среду.
«Мы предостерегаем от неверных предположений о поиске, основанных на оторванной от контекста, устаревшей или неполной информации», — сообщил представитель Google Дэвис Томпсон в письме The Verge в среду. «Мы поделились обширной информацией о том, как работает Поиск, и о типах факторов, которые учитывают наши системы, и мы работаем над тем, чтобы защитить целостность наших результатов от манипуляций » .
В документации нет места, где говорилось бы о том, как взвешивать различные атрибуты. Также возможно, что некоторые из свойств, указанных в документации, например идентификатор «небольшого персонального сайта» или понижение рейтинга для обзоров продуктов, могли быть реализованы в какой-то момент, но затем удалены. Возможно, они никогда не использовались для ранжирования веб-сайтов.
«Мы не обязательно знаем, как [элементы] используются, за исключением различных их описаний. Хотя это не очень богато, для нас это все равно много информации», — сказал Кинг. «На какие аспекты следует обратить особое внимание при создании или оптимизации веб-сайта?».
Идея о том, что крупнейшая в мире поисковая платформа не ранжирует результаты поиска на основе того, как пользователи взаимодействуют с контентом, кажется абсурдной. Однако многократные опровержения, тщательно сформулированные ответы и отраслевые публикации делают их спорной темой.
Еще один важный момент, который подчеркнули Фишкин и Кинг, касается того, как Google может использовать данные Chrome в своих поисковых рейтингах. Представители Google Search заявили, что не используют данные Chrome для ранжирования, однако просочившиеся документы свидетельствуют о том, что это может быть неправдой. Например, в одном разделе перечислены «chrome_trans_clicks», чтобы указать, какие ссылки с домена отображаются под основным сайтом в результатах поиска. Фишкин объясняет, что это означает, что Google «берёт количество кликов на страницах в браузере Chrome и использует это число для определения наиболее популярных/важных URL-адресов на сайте, которые затем рассчитываются для включения в функцию дополнительных ссылок » .
В документе упоминается более 14 000 объектов недвижимости, и исследователям пришлось бы потратить несколько недель, чтобы найти подсказки, содержащиеся на страницах. «Твиддлеры» или настройки рейтинга применяются вне основных обновлений системы для повышения или понижения рейтинга контента в соответствии с определенными критериями. Охватываются такие элементы сайта, как информация об авторе, а также показатели «авторитета» сайта. Фишкин отмечает, что в документах многое не отражено, например, информация о результатах поиска, сгенерированных искусственным интеллектом.
Так что же все это значит? Во-первых, возможно, любой владелец веб-сайта прочитает об этой утечке и попытается разобраться в ней. Издатели, компании электронной коммерции и предприятия, скорее всего, разработают различные эксперименты, чтобы попытаться проверить некоторые из положений, предложенных в документе. Когда это происходит, веб-сайты могут начать ощущаться немного по-другому — все это потому, что они пытаются осмыслить эту новую, но все еще неоднозначную волну информации.
«Журналистам и издателям, освещающим SEO и поиск Google, нужно перестать повторять публичные заявления Google и более внимательно и критически взглянуть на риторику поискового гиганта», — сказал Фишкин . «Публикации, в которых заявления Google повторяются так, как будто это факты, лишь помогают Google создавать историю, полезную для компании, но не для специалистов, пользователей или общественности».