Разработка синтаксического анализатора для русского языка с помощью категориальной грамматики в NTLK и синтаксических правил AOT

Москвина Анна Денисовна

Целью работы является создание синтаксического анализатора для русского языка с использованием инструментов NLTK для Python. Анализ проводится на основании разработанной нами формальной грамматики и использует морфологическую разметку, принятую в системе PyMorphy2. При создании грамматики мы адаптировали под нашу систему правила, описанные в проекте АОТ. В статье обсуждаются возможности синтаксического компонента NLTK, преимущества выбранной категориальной грамматики, особенности разработанных правил и алгоритм работы программы.

Библиография: 

АОТ: Синтаксический анализ. Построение дерева зависимостей всего предложения. URL: http://www.aot.ru/docs/synan.html
Москвина А. Д., Орлова Д., Паничева П. В., Митрофанова О. А. Разработка ядра синтаксического анализатора для русского языка на основе библиотек NLTK // Труды XIX Международной объединенной научной конференции «Интернет и современное общество». СПб., 2016.
Русская грамматика. Т. 2: Синтаксис / Н. Ю. Шведова (гл. ред.). М.: Наука, 1980. Bird S., Klein E., Loper E. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. URL: http://www.nltk.org/book/
Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages. Analysis of Images, Social Networks and Texts // 4th International Conference, AIST 2015. Yekaterinburg, Russia, April 9–11, 2015.

Текст статьи: 
Страницы: 
187—191