Выделение основы слова. Стеммер Портера

Привет!
Сегодня, я расскажу про стемминг и его применение.

Что такое стемминг?
Стемминг - это процесс нахождения основы слова. Например, для слова "приставка" основой будет "приставк", а корнем слова "став".

Далее... Зачем нужен стемминг?
Обычно в простых поисковых системах, в которых не требуется учет морфологии, применяется стемминг для обобщения пользовательских запросов.
В этих поисковых системах документы разбиваются на множества основ слов.
Поиск осуществляется по основам слова.

Реализация алгоритма стемминга на C#
Применение стеммера
Источники
Стемминг
Russian stemming algorithm
Эвристическое (без словаря) извлечение корня из русского слова
Вероятностный морфологический анализатор русского и украинского языков

3 Responses to "Выделение основы слова. Стеммер Портера"

Ернат Асанов Says :
17 ноября 2009 г. в 02:18

Выявлен баг. Класс неправильно выделяет основу слова.

Philip Says :
14 января 2016 г. в 17:42

Спасибо за стеммер! Очень выручили!

Отправить комментарий