Использование статистических методов для создания лингвистического обеспечения информационно-поисковой системы
Авторы: Смирнов Ю.М., Андреев А.М., Березкин Д.В., Брик А.В. | Опубликовано: 04.09.2014 |
Опубликовано в выпуске: #2(43)/2001 | |
DOI: | |
Раздел: Информатика и вычислительная техника | |
Ключевые слова: |
Рассмотрены проблемы создания информационно-поисковой системы с естественно-языковым интерфейсом запросов, в частности, подготовка словарей и поискового индекса, учитывающего синтаксическую структуру предложений документа. Предложен метод автоматического построения морфологического словаря и словаря словосочетаний, использующий статистический анализ достаточно большого множества текстов. Рассмотрен двухступенчатый алгоритм синтаксического анализа текста (использующий на первом этапе простой формально-грамматический анализ, а на втором - уточнение результатов его работы статистическими методами), а также алгоритм текстового поиска на основе результатов его работы. Приведены экспериментальные оценки качества работы предложенных методов.