|

Модели и методы автоматической классификации текстовых документов

Авторы: Андреев А.М., Березкин Д.В., Сюзев В.В., Шабанов В.И. Опубликовано: 06.05.2014
Опубликовано в выпуске: #4(53)/2003  
DOI:

 
Раздел: Информатика и вычислительная техника  
Ключевые слова:

Рассмотрена задача выделения терминов из текста и определения их значимости для программ обработки текстовой информации (поиска, классификации, квазиреферирования, кластеризации). Проанализированы возможные варианты решения задачи, для каждого из вариантов разработаны алгоритмы и соответствующее программное обеспечение. На примере программы автоматической классификации проведено экспериментальное сравнение методов. Наилучшие результаты получены методом приближенного выделения словосочетаний, основанным на статистической информации.