16 ноября 2012 г.

Gmail ищет однокоренные слова и слова с опечатками

Оригинал статьи: Gmail Finds Similar Words and Spelling Mistakes

В последние месяцы поиск по Gmail постоянно улучшается. Были добавлены: проверка правописания, предложения по исправлению, поиск внутри вложений — а вот теперь при поиске Gmail находит однокоренные слова. Соответственно, можно найти письмо, даже если не помнишь точной формы слова — и это очень полезно.

Ищешь [cat] — находишь и [cats], ищешь [start] — находишь и [starting], ищешь [usable] — находишь и [usability], ищешь [colour] — находишь и [color], [coloured], [colours], [multicolor] и т. д.

Даже если ошибёшься, набрав, например, «clours» — Gmail поймёт, что это «colours».

Правда, эта функция в Gmail не настолько изощрённа, как в Поиске Google (Web Search); так, синонимы и аббревиатуры она не учитывает: при запросе [NY] письмо, содержащее «New York», найдено не будет, равно как и не найдётся письмо со словом «tv» при поиске [television]. Ну, по крайней мере, пока не учитывает.

Чтобы поиск в Gmail производился без учёта однокоренных слов, нужно использовать оператор +: например, при поиске [+usable] Gmail не станет включать в список результатов письма, где нет слова «usable», а есть лишь «usability».

От переводчика

На русском языке такого нет. Морфология учитывается: поиск прилагательного в любой форме (род, число, падеж, краткость) даёт одинаковые результаты; такие же даёт и поиск наречия (которое часто совпадает с краткой формой прилагательного в среднем роде) — то есть одинаковые результаты будут при поиске [полезно], [полезный], [полезен] [полезная], [полезными] и т. д. Но результаты поиска по запросам [польза], [использовать], [использованный] отличаются и от вышеприведённых, и между собой. А запросы [ползно] или [палезно] дают ноль на выходе; равно как и запрос [полчаса] не находит письмо, в котором написано «пол-часа».

Ну, может быть, со временем и для русского языка реализуют.