Начала компьютерной лингвистики
Функцией морфологического анализа являются выделение основы слова и определение морфологической информации, приписываемой этой основе по таблицам аффиксов и словарю.
Рассмотрим алгоритм морфологического анализа (а также другие обрабатывающие алгоритмы) на следующем примере. Сколько каменн(ого) угл(я) перевез(ено) железнодорожн(ым) транспорт(ом) в 1975-м год(у)?
Морфологический анализ, отсекая аффиксы (заключенные в скобки), приписывает полученным основам морфологическую информацию, со-ответствующую этому аффиксу. Далее производится обращение с полученной основой к словарю для определения, существует ли такая основа:
СКОЛЬКО числительное количественное
КАМЕННОГО падеж: родительный/винительный
число: единственное
род: мужской/средний
одушевленность: любая / одушевленное прилагательное
УГЛЯ падеж: родительный
число: единственное
род: мужской
одушевленность: неодушевленное существительное
ПЕРЕВЕЗЕНО время: любое
число: единственное
род: средний
залог: пассивный
глагол
ЖЕЛЕЗНОДОРОЖНЫМ падеж: творительный / дательный
число: единственное / множественное
род: мужской/ средний / любой
прилагательное
ТРАНСПОРТОМ падеж: творительный
число: единственное
род: мужской
одушевленность: неодушевленное
существительное
В падеж: винительный / предложный
число: любое
род: любой
одушевленность: любая
предлог
1975 падеж: предложный
число: единственное
род: мужской / средний
одушевленность: неодушевленный / любая
числительное порядковое
ГОДУ падеж: дательный / предложный
число: единственное
род: мужской
одушевленность: неодушевленное
существительное
Рис. 7.4.
В результате работы МА получается информация, поступающая на вход алгоритма синтаксического анализа (СиА), который осуществляет перебор возможных о точки зрения синтаксиса омонимичных способов разбиения всех вариантов разбора синтаксических отношений. СиА служит для установления синтаксической взаимосвязи между словами входного предложения (запроса).
Алгоритм синтаксического анализа использует модели управления. В рассмотренном примере у основы ПЕРЕВЕЗ присутствует модель управления, поэтому она выбирается в качестве головной (вершина дерева). По морфологической информации подбираются слова, имеющие такую же морфологическую информацию в словах предложения, строятся синтаксические отношения (рис..7.5). По правилам русского языка реализуются синтаксические отношения.
Полученная синтаксическая структура обрабатывается алгоритмом семантического анализа.
Рис.7.5
Семантический анализ (СеА) осуществляет построение интенсионального выражения смысла обрабатываемого предложения в виде семантического графа.
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52