• Как русские поисковики интернета воспринимают словоформы и морфологию языка

    Posted on Март 28th, 2008 admin No comments

    Поисковик Яндекс - понимает: при индексации происходит нормализация, то есть слово ставится в свою исходную форму (для существительных — именительный падеж единственного числа, для глаголов — неопределенная форма и т.д.) и в таком виде учитывается в базе. Алгоритм морфологического разбора умеет корректно обрабатывать и слова, не найденные в словаре. Морфология работает для русского и английского языков. Также индексируются числа.

    Поисковик Рамблер - понимает и английскую и русскую морфологию, но дает некоторое преимущество в результатах поиска страницам, содержащим точные словоформы.

    Поисковик Google - не понимает морфологию русского языка вообще. Для английского языка есть Stemming: Google now uses stemming technology. Thus, when appropriate, it will search not only for your search terms, but also for words that are similar to some or all of those terms. If you search for pet lemur dietary needs, Google will also search for pet lemur diet needs, and other related variations of your terms. Any variants of your terms that were searched for will be highlightedin the snippet of text accompanying each result.

    Поисковик Mail.ru - морфология языка включена в поиске по умолчанию. Можно отключить морфологию если выбрать наверху страницы результата поиска галочку “искать точные формы слов”.

    Поисковик Апорт - понимает как морфологию русского языка, так и морфологию английского языка.

    Leave a reply

    Я не робот.
    сделано dimoning.ru