Модели и методы автоматической классификации текстовых документов
Авторы: Андреев А.М., Березкин Д.В., Сюзев В.В., Шабанов В.И. | Опубликовано: 06.05.2014 |
Опубликовано в выпуске: #4(53)/2003 | |
DOI: | |
Раздел: Информатика и вычислительная техника | |
Ключевые слова: |
Рассмотрена задача выделения терминов из текста и определения их значимости для программ обработки текстовой информации (поиска, классификации, квазиреферирования, кластеризации). Проанализированы возможные варианты решения задачи, для каждого из вариантов разработаны алгоритмы и соответствующее программное обеспечение. На примере программы автоматической классификации проведено экспериментальное сравнение методов. Наилучшие результаты получены методом приближенного выделения словосочетаний, основанным на статистической информации.