15 июня 2013 г.

Гуглопедия отказалась от ссылок на источники

Оригинал статьи: Google No Longer Mentions Data Sources

В одном забавном видео два сотрудника Google — Майк Лебо (Mike LeBeau) и Аманда Розенберг (Amanda Rosenberg) — находят ответы на разные вопросы с помощью Google Glass.

И один из вопросов такой: «Кто исполняет песню, в которой парень повторяет “How Bizarre”?» Очки Google Glass дают правильный ответ (OMC) и перечисляют несколько сайтов, где приводится такой ответ. Если задать этот вопрос в мобильном приложении Поиск (Google Search), то Google под ответом приводит сообщение: «Упоминается в результатах поиска, приведённых ниже».

Приятно, что Google начал понимать длинные вопросы. Неприятно, что Google перестал перечислять источники ответа на вопросы. Например, запрос [everest height] (‘высота эвереста’) раньше давал и результат, и список источников.

Теперь, после апгрейда Поиска до Гуглопедии (Knowledge Graph), это выглядит так:

Google извлекает факты с самых разных веб-страниц, так что перечисление источников было бы уместно и помогло бы пользователям выбрать уважаемые источники. Если ответ неверен или устарел, всегда можно сослаться на то, что так в источнике. Как говорит Википедия, «проверяемость… означает, что читатель должен иметь возможность удостовериться в том, что представленный в Википедии материал уже был опубликован в авторитетных источниках».

Google говорит, что «Схема знаний (Knowledge Graph) основывается не только на открытых источниках вроде Freebase, Википедии и Всемирной книге фактов ЦРУ. Она дополняется на широкомасштабной основе, поскольку мы стремимся к всеобъемлющей ширине и глубине. Сегодня в [Гуглопедии] — более 500 млн объектов, а также более 3,5 млрд фактов об этих объектах и отношениях между ними. Она выстраивается на основании того, что ищут люди и что мы находим в Сети».

Вот пример неверного ответа: Google считает, что продолжительность фильма «Аппаратные войны» ([hardware wars running time]) — 60 минут, хотя правильный ответ — 13 минут.

Ещё один неверный ответ: «Аппаратные войны» вышли не в 1977 году, а в 1978-м.

От переводчика

В принципе, сразу давать информацию, а референцию к ней выводить только по явному желанию пользователя — это правильный подход. Как раз такой подход вроде бы и реализован: если нажать на ссылку «More info», Google выдаёт список источников. Однако это не те источники: на самом деле выдаются результаты поиска по запросу, и среди них есть, конечно, источники, на основании которых сформирован факт, выданный в карточке Гуглопедии, но они никак дополнительно не обозначаются (и далеко не всегда это первые результаты поиска). Выделить их в отдельный раздел — и всё будет правильно. (А то, что данные об американском фильме берутся не из IMDb, — это странно.)