5 мая 2013 г.

Неестественные подсказки в Поиске

Оригинал статьи: Artificial Google Suggestions

По большей части подсказки, который Google предлагает по мере набора поискового запроса, полезны. Google пытается угадать, чем закончится запрос, предлагая популярные запросы, которые начинаются с уже набранных ключевых слов.

Порой Google также предлагает подсказки, взятые с веб-страниц, и в большинстве своём они длинные и многословные. Они выглядят неестественно, ведь маловероятно, что такое могут искать реальные пользователи в сколько-нибудь значимом количестве. Google составляет список часто встречающихся на веб-страницах N-грамм и использует его в подсказках Живого поиска (Google Instant). Тут можно найти заголовки страниц, цитаты из статей Википедии и пресс-релизов — а также незавершённые фрагменты, которые не имеют смысла.

Эти неестественные подсказки легко заметить: надо лишь набирать запрос, пока длина его не станет такой, что Google перестанет выводить подсказки, а затем набрать ещё пару слов — и Google внезапно выдаст хоть одну длинную подсказку.

Например:

В последнем случае первоначальный запрос был [«the * why it’s inaccurate»], однако после набора следующего за «the» слова вдруг появились странные подробные подсказки. Если искать [why would it be inaccurate] (‘почему некорректно’), то Google выдаст только одну подсказку: [why would it be inaccurate to speak of an nacl molecule] (‘почему некорректно говорить о молекуле NaCl’, то есть хлорида натрия, то есть поваренной соли). Однако если продолжить: [why would it be inaccurate to call t] — то появится подсказка: [why would it be inaccurate to call the pituitary gland the master gland of the body] (‘почему некорректно называть гипофиз главной железой организма’). Эту длинную фразу нельзя найти ни на одной веб-странице, однако Google выводит эту подсказку, полученную в результате объединения нескольких словосочетаний.

От переводчика

Очевидно, последняя упомянутая подсказка появилась вследствие популярности запросов/заголовков типа [why would it be inaccurate to call] (‘почему некорректно называть’) и распространённости определения гипофиза как главной железы организма (гипофиз ведь и правда центральный орган эндокринной системы).