алгоритмы, стеммер, техничка5, c#
- понедельник, ноября 16, 2009 - 3 коммент.
Выделение основы слова. Стеммер Портера
Привет!
Сегодня, я расскажу про стемминг и его применение.
Что такое стемминг?
Стемминг - это процесс нахождения основы слова. Например, для слова "приставка" основой будет "приставк", а корнем слова "став".
Далее... Зачем нужен стемминг?
Обычно в простых поисковых системах, в которых не требуется учет морфологии, применяется стемминг для обобщения пользовательских запросов.
В этих поисковых системах документы разбиваются на множества основ слов.
Поиск осуществляется по основам слова.
Реализация алгоритма стемминга на C#
Применение стеммера
Источники
Стемминг
Russian stemming algorithm
Эвристическое (без словаря) извлечение корня из русского слова
Вероятностный морфологический анализатор русского и украинского языков
Сегодня, я расскажу про стемминг и его применение.
Что такое стемминг?
Стемминг - это процесс нахождения основы слова. Например, для слова "приставка" основой будет "приставк", а корнем слова "став".
Далее... Зачем нужен стемминг?
Обычно в простых поисковых системах, в которых не требуется учет морфологии, применяется стемминг для обобщения пользовательских запросов.
В этих поисковых системах документы разбиваются на множества основ слов.
Поиск осуществляется по основам слова.
Реализация алгоритма стемминга на C#
Применение стеммера
Стемминг
Russian stemming algorithm
Эвристическое (без словаря) извлечение корня из русского слова
Вероятностный морфологический анализатор русского и украинского языков
Выявлен баг. Класс неправильно выделяет основу слова.
Баг исправлен
Спасибо за стеммер! Очень выручили!