СРАВНЕНИЕ СИНТАКСИЧЕСКОГО АНАЛИЗА ПРЕДЛОЖЕНИЯ ЕСТЕССТВЕННОГО ЯЗЫКА

COMPARISON OF PARSING METHODS FOR THE ANALISYS OF A NATURAL LANGUAGE SENTENCE

САК Александр Николаевич, БЕССОНОВА Елена Владимировна

SAK Alexander Nikolaevich, BESSONOVA Elena Vladimirovna

Балтийский гуманитарный журнал, № 1(34) 28.02.2021

Аннотация:
При построении систем машинного перевода важной задачей является представление данных с помощью графов, где в качестве вершин выступают слова, а в качестве ребер - отношения между словами в предложении. Одной из таких задач на первом этапе анализа является классификация слов как частей речи, а на следующем этапе анализа - определение принадлежности слов к членам предложения. В статье рассматриваются методы синтаксического анализа как на основе правил, прописанных заранее с помощью традиционного объектно-ориентированного программирования, так и на основе анализа с помощью графовых сверточных нейросетей с их последующим обучением. В качестве тезауруса выступают онлайн словари.

Ключевые слова:
теория графов,бинарный граф,синтаксис,семантика,графовые сверточные нейронные сети,объектно-ориентированное программирование,естественная обработка языка,функция активации,функция ошибки,матрица весов,матрица признаков,матрица степени
Description:
When constructing machine translation systems, an important task is to represent data using graphs, where words act as vertices, and relations between words in a sentence act as edges. One of these tasks at the first stage of the analysis is the classification of words as parts of speech, and at the next stage of the analysis to determine the belonging of words to the sentence members’ classes. The article discusses methods of parsing both on the basis of rules determined in advance by means of traditional object-oriented programming, and on the basis of analysis by means of graph convolutional neural networks with their subsequent training. Online dictionaries act as a thesaurus.

Key words:
graph theory,binary graph,syntax,semantics,graph convolutional neural networks,object-oriented programming,natural language processing,activation function,error function,weight matrix,feature matrix,degree matrix