Модели и методы автоматической классификации текстовых документов
| Авторы: Андреев А.М., Березкин Д.В., Сюзев В.В., Шабанов В.И. | Опубликовано: 06.05.2014 |
| Опубликовано в выпуске: #4(53)/2003 | |
| DOI: | |
| Раздел: Информатика и вычислительная техника | |
| Ключевые слова: | |
Рассмотрена задача выделения терминов из текста и определения их значимости для программ обработки текстовой информации (поиска, классификации, квазиреферирования, кластеризации). Проанализированы возможные варианты решения задачи, для каждого из вариантов разработаны алгоритмы и соответствующее программное обеспечение. На примере программы автоматической классификации проведено экспериментальное сравнение методов. Наилучшие результаты получены методом приближенного выделения словосочетаний, основанным на статистической информации.
| 