0 просмотров

Устранение неоднозначности в лингвистике и компьютерной лингвистике

Лицо неоднозначной личности

Доктор Ричард Нордквист — почетный профессор риторики и английского языка в Южном университете Джорджии и автор нескольких университетских учебников по грамматике и сочинению.

В лингвистике устранение неоднозначности — это процесс определения того, какое значение слова используется в конкретном контексте. Также известен как лексическая неоднозначность.

В компьютерной лингвистике этот процесс различения называется определение смысла слова (WSD).

Примеры и наблюдения

«Так получилось, что наше общение на разных языках позволяет использовать одну и ту же форму слова для обозначения разных вещей в отдельных коммуникативных операциях. данное слово среди его потенциально связанных смыслов. двусмысленность возникающие из таких множественных формо-смысловых ассоциаций находятся на лексическом уровне, их часто приходится разрешать посредством более широкого контекста из дискурса, заключающего слово.Следовательно, различные значения слова «обслуживание» можно было бы отличить друг от друга только в том случае, если бы мы могли смотреть за пределы самого слова, например, противопоставляя «обслуживание игрока в Уимблдоне» «обслуживанию официанта в Шератоне». Этот процесс определения значений слов в дискурсе обычно известен как смысл слова устранение неоднозначности (WSD)" (Ой Йи Квонг, Новые взгляды на вычислительные и когнитивные стратегии устранения неоднозначности смысла слов. Спрингер, 2013 г.)

Лексическая неоднозначность и смысловая неоднозначность (WSD)

"Лексический устранение неоднозначности в своем самом широком определении это не что иное, как определение значения каждого слова в контексте, что, по-видимому, является в значительной степени бессознательным процессом у людей. В качестве вычислительной задачи ее часто называют «ИИ-полной», то есть задачей, решение которой предполагает полное понимание естественного языка или здравого смысла (Иде и Веронис, 1998).

«В области компьютерной лингвистики проблема обычно называется устранением неоднозначности смысла слова (WSD) и определяется как проблема компьютерного определения того, какой «смысл» слова активируется при использовании слова в конкретном контексте. WSD — это по существу, это задача классификации: значения слов — это классы, контекст предоставляет свидетельство, и каждое появление слова относится к одному или нескольким его возможным классам на основе свидетельства Это традиционная и общепринятая характеристика WSD, которая видит как эксплицитный процесс устранения неоднозначности по отношению к фиксированному набору смыслов слов.Предполагается, что слова имеют конечный и дискретный набор смыслов из словаря, базы лексических знаний или онтологии (в последнем смыслы соответствуют понятиям). что слово лексикализируется).Например, в условиях машинного перевода (MT) можно рассматривать переводы слов как смыслы слов, подход, который становится все более осуществимым из-за наличия больших многоязычных параллельных корпусов, которые могут служить обучающими данными. Фиксированный перечень традиционных WSD снижает сложность проблемы, но существуют и альтернативные поля. . .." (Энеко Агирре и Филип Эдмондс, "Введение". Многозначность смысла слова: алгоритмы и приложения. Спрингер, 2007 г.)

Омонимия и неоднозначность

"Лексический устранение неоднозначности хорошо подходит, в частности, для случаев омонимии, например, появления бас должны быть сопоставлены с любой из лексических единиц bass1 или бас2, в зависимости от предполагаемого значения.

«Лексическая устранение неоднозначности подразумевает когнитивный выбор и представляет собой задачу, тормозящую процессы понимания. Ее следует отличать от процессов, ведущих к дифференциации смыслов слов. , Veronis 1998, 2001. Также было показано, что омонимичные слова, которые требуют устранения неоднозначности, замедляют лексический доступ, в то время как многозначные слова, которые активизируют множественность смыслов слова, ускоряют лексический доступ (Rodd et al. 2002).

«Однако как продуктивная модификация семантических значений, так и прямой выбор между лексически разными элементами имеют общее то, что они требуют дополнительной нелексической информации». (Питер Бош, «Производительность, полисемия и индексальность предикатов». Логика, язык и вычисления: 6-й Международный Тбилисский симпозиум по логике, языку и вычислениям, изд. Бальдер Д. Тен Кейт и Хенк В. Зиват. Спрингер, 2007 г.)

Устранение неоднозначности лексической категории и принцип правдоподобия

«Корли и Крокер (2000) представляют широкую модель лексической категории. устранение неоднозначности на основе Принцип вероятности. В частности, они предполагают, что для предложения, состоящего из слов ж . . . жн, обработчик предложений выбирает наиболее вероятную последовательность частей речи т . . . тн. В частности, их модель использует две простые вероятности: (я) условная вероятность слова жя учитывая определенную часть речи тя, а также (II) вероятность тя учитывая предыдущую часть речи тя-1. По мере того, как встречается каждое слово в предложении, система присваивает ему ту часть речи, тя, который максимизирует произведение этих двух вероятностей. Эта модель основана на понимании того, что многие синтаксические неоднозначности имеют лексическую основу (MacDonald et al., 1994), как в (3):

«Эти предложения временно двусмысленны между чтением, в котором Цены или же делает является основным глаголом или частью сложного существительного. После обучения на большом корпусе модель предсказывает наиболее вероятную часть речи для Цены, правильно учитывающий тот факт, что люди понимают цена как существительное, но делает как глагол (см. Crocker & Corley, 2002, и цитируемые там ссылки). Эта модель не только объясняет ряд предпочтений по устранению неоднозначности, основанных на неоднозначности лексических категорий, но и объясняет, почему в целом люди очень точно разрешают такие неоднозначности» (Мэттью В. Крокер, «Рациональные модели понимания: обращение к Парадокс производительности». Психолингвистика двадцать первого века: четыре краеугольных камня, изд. Энн Катлер. Лоуренс Эрлбаум, 2005 г.)

голоса
Рейтинг статьи
Статья в тему:  Факты о гренландских акулах (Somniosus microcephalus)
Ссылка на основную публикацию
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
Adblock
detector