В феврале 15 года сервис Гугл представил новый алгоритм под названием Knowledge-Based Trust (KBT), направленный на оценку достоверности информации на веб-сайтах. Он был описан в научной статье, опубликованной 12 февраля 2015 года, где инженеры Гугл предложили обновлённый подход к ранжированию сайтов, основанный на точности представленных фактов, а не на традиционных внешних сигналах, таких как структура ссылок. Этот алгоритм основан на оценке достоверности информации, предоставляемой ресурсами, и в первую очередь затрагивает информационные и аналитические сайты.

Основной принцип работы KBT заключается в определении степени достоверности информации на сайте. Чем меньше неверных фактов обнаруживается в его содержании, тем больше уровень доверия к ресурсу.

Почему появился алгоритм KBT?

Главная цель поисковых алгоритмов — определить полезность раздела для пользователя, а качество контента становится ключевым критерием. Традиционные факторы ранжирования, такие как ссылочная масса и история посещений, отражают лишь популярность сайта, но не гарантируют правдивость представленных данных. В результате широко известные ресурсы могут содержать недостоверные сведения, в то время как менее популярные сайты с точной информацией остаются незамеченными. Именно поэтому KBT фокусируется на достоверности веб-источников.

Веб-сайты, содержащие небольшое количество фактической информации, не подвергнутся санкциям нового алгоритма, если их данные корректны.

Как работает KBT?

При анализе контента KBT извлекает логические триплеты (структуры "субъект — предикат — объект"), например: "Мадрид — столица Испании". Достоверность фактов проверяется путем их сопоставления с базой знаний Google (Knowledge Vault). Но, несмотря на значительный объем данных, эта база не является абсолютно точной.

Истоки Knowledge Vault уходят к проекту Freebase, который изначально заполнялся энтузиастами, а затем перешел в Wikidata. В настоящее время примерно 16% сведений в Knowledge Vault относятся к категории неопровержимых фактов, тогда как остальная информация идёт как вспомогательная.

ИИ и оценка достоверности

В процессе разработки алгоритма возникли сложности, связанные с необходимостью обработки большого объема данных и их комбинаций. Использование многослойной вероятностной модели позволило анализировать пересекающиеся факты и выявлять источник ошибок — будь то некорректные сведения на сайте или неточности в Knowledge Vault.

Ожидается, что со временем KBT сможет не только проверять факты, но и синтезировать новые знания на их основе.

Заключение

Уровень достоверности сайта становится важным показателем его качества. В ближайшем будущем KBT может занять ведущую роль в системе ранжирования наряду с традиционными метриками, такими как PageRank. Это особенно важно для информационных ресурсов, которым теперь необходимо уделять еще больше внимания точности публикуемых данных.

Пока алгоритм ориентирован на англоязычные сайты, но в дальнейшем его влияние распространится и на рунет.