УПРАЖНЕНИЯ

22.1. Прочитайте следующий текст с описанием процедуры, состоящей из четырех этапов, чтобы понять его смысл, и запомните столько, сколько сможете. Достигнутые вами успехи будут оценены позже.
Эта процедура фактически весьма проста. Сначала нужно распределить вещи по разным группам. Конечно, для одного раза может оказаться достаточно одной стопки, в зависимости от того, сколько еще предстоит сделать. Если вам потребуется отправиться куда-то еще из-за нехватки необходимых средств, то в этом будет состоять следующий этап, а если нет, то вы уже достаточно хорошо подготовились. Набирая вещи, важно не переусердствовать. Это означает, что лучше сразу проделывать эту процедуру со слишком малым, чем со слишком большим количеством вещей. Если прошло еще мало времени с начала процедуры, это может показаться неважным, но могут легко возникнуть осложнения. И в этом случае ошибки обходятся дорого. Сначала вся эта процедура будет казаться сложной. Однако вскоре она станет просто еще одним аспектом вашей жизни. Трудно представить себе, что в недалеком будущем исчезнет потребность в выполнении этой задачи, но об этом трудно судить со всей определенностью. После выполнения процедуры вещи нужно снова распределить по разным группам. Затем их можно разложить по соответствующим им местам. В конечном итоге они опять станут использованными и придется еще раз повторить весь цикл. Однако это занятие — часть повседневной жизни.
22.2. Используя систему обозначений DCG, напишите грамматику языка, который полностью аналогичен Јl9 за исключением того, что требует соблюдения согласования между подлежащим и сказуемым предложения, поэтому не позволяет формировать такие предложения, как "I smells the wumpus".
22.3. Дополните грамматику ?± таким образом, чтобы в ней соблюдалось согласование артикля и существительного. Иными словами, обеспечьте, чтобы слово "agents" рассматривалось как словосочетание NP, a "agent" и "an agents" — нет.
22.4. Опишите основные различия между языком Java (или любым другим языком программирования, с которым вы знакомы) и естественным языком, прокомментировав в каждом случае проблему "понимания". Рассмотрите такие аспекты, как грамматика, синтаксис, семантика, прагматика, композициональ-ность, контекстная зависимость, лексическая неоднозначность, синтаксическая неоднозначность, разрешение ссылок (включая местоимения), фоновые знания, а самое главное, укажите, что означает "понимание" текста на том и другом языке.
22.5. Какие из приведенных ниже соображений послужили причинами для введения квазилогической формы?
а) Упрощение написания простых композиционных грамматических правил.
б) Расширение выразительности языка семантического представления.
в) Получение возможности представлять в краткой форме варианты неод-
нозначности в области определения кванторов (кроме всего прочего).
г) Упрощение задачи устранения семантической неоднозначности.
22.6. Определите, какая семантическая интерпретация была бы получена при син-
таксическом анализе приведенных ниже предложений с помощью граммати-
ки, описанной в данной главе.
а) It is a wumpus.
б) The wumpus is dead.
в) The wumpus is in [2,2].
Было бы целесообразно предусмотреть в качестве семантической интерпретации для предложения "It is a wumpus" просто Зх х е Wumpuses? Рассмотрите альтернативные предложения, такие как "It was a wumpus".
22.7. Не просматривая повторно текст, приведенный в упр. 22.1, ответьте на пере-
численные ниже вопросы.
а) Каковыми являются указанные четыре этапа?
б) Какой этап пропущен?
в) Каковыми являются "вещи", упомянутые в тексте?
г) Какого рода ошибка может оказаться дорогостоящей?
д) Лучше ли в данном случае проделать эту процедуру со слишком большим
или слишком малым количеством вещей? Объясните, почему.
22.8. В этом упражнении речь идет о грамматиках для очень простых языков.
а) Напишите контекстно-свободную грамматику для языка апЬп.
б) Напишите контекстно-свободную грамматику для языка палиндромов —
для множества всех строк, вторая половина которых представляет собой
обращение первой половины.
в) Напишите контекстно-зависимую грамматику для языка дубликатов —
для множества всех строк, вторая половина которых является такой же,
как и первая половина.
22.9. Рассмотрите предложение "Someone walked slowly to the supermarket" (Некто
медленно шел в супермаркет) и следующий словарь:
Pronoun —> someone
V —> walked
Adv —> slowly
Prep —> to
Det -> the
Noun —> supermarket
Какая из трех приведенных ниже грамматик в сочетании с этим словарем вырабатывает указанное предложение? Покажите соответствующее дерево (деревья) синтаксического анализа.
РР -> Prep NP
Применив каждую из трех приведенных здесь грамматик, запишите три правильных и три неправильных английских предложения, сформированных с помощью этой грамматики. Каждое предложение должно иметь значительные отличия от другого, состоять не меньше чем из шести слов и быть основанным на полностью новом множестве словарных записей (которые вы должны определить). Предложите способы совершенствования каждой грамматики, предотвращающие выработку неправильных английских предложений.
22.10. (Й) Реализуйте версию алгоритма диаграммного синтаксического анализа, ко-
торый возвращает упакованное дерево из всех ребер, охватывающих весь объ-
ем входных данных.
22.11. ш Реализуйте версию алгоритма диаграммного синтаксического анализа, который возвращает упакованное дерево для самого длинного крайнего левого ребра, а если это ребро не охватывает весь объем входных данных, продолжает синтаксический анализ с конца этого ребра. Покажите, почему требуется вызывать процедуру Predict перед продолжением синтаксического анализа. Окончательным результатом становится такой список упакованных деревьев, что этот список в целом охватывает входные данные.
22.12. (Составлено по материалам книги [77].) Данное упражнение относится к языку, получившему название Buffalo*1, который очень напоминает английский (или по меньшей мере его версию ?0), если не считать того, что единственным словом в его словаре является buffalo, которое пишется со строчной буквы (и обозначает в данном контексте "стадо буйволов", если рассматривается как существительное, а в позиции глагола означает "терроризировать") или с прописной (и обозначает название города — Буффало). Ниже приведены два предложения на этом языке.
Buffalo buffalo buffalo Buffalo buffalo.
Buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.
Если вы не верите, что это действительно предложения, рассмотрите два английских предложения с соответствующей синтаксической структурой:
Dallas cattle bewilder Denver cattle. (Стадо из Далласа терроризирует стадо из Денвера.)
Chefs London critics admire cook French food. (Шеф-повара, которых обожают лондонские критики, готовят блюда французской кухни.)
Напишите грамматику для языка Buffalo11. Его лексическими категориями являются имя собственное с обозначением города, имя существительное во множественном числе и (переходный) глагол; кроме того, должно быть предусмотрено одно грамматическое правило для предложения, одно — для глагольного словосочетания и три — для именного словосочетания: существительное во множественном числе, именное словосочетание, которому предшествует в качестве модификатора название города, и именное словосочетание, за которым следует сокращенное относительное предложение. Сокращенным относительным предложением называется такое относительное предложение, в котором исключено относительное местоимение. Кроме того, относительное предложение состоит из субъектного именного словосочетания, за которым следует глагол без объекта. Примером сокращенного относительного предложения является "London critics admire" из приведенного выше примера. Рассчитайте количество возможных вариантов синтаксического анализа для языка Buffalo11 при п, не превышающем 10. Дополнительное указание. Карл де Маркен рассчитал, что количество предложений на языке Buffalo11 с длиной 200 (для грамматики, которую он использовал) равно 121 030 872 213 055 159 681 184 485. Как он это сделал?
22.13. Нарисуйте дерево синтаксического анализа речи для приведенного на с. 1087
рассказа о том, как Джон пообедал в модном ресторане. Воспользуйтесь двумя
грамматическими правилами для фрагмента текста Segment, указав соответ-
ствующее значение отношения связности CoherenceRelation для каждого
узла. (Результаты синтаксического анализа отдельных предложений показы-
вать не обязательно.) Теперь сделайте то же самое для выбранного вами фрагмента речи, состоящего из 5-10 предложений.
22.14. Мы забыли упомянуть, что текст, приведенный в упр. 22.1, должен быть озаглавлен "Стирка белья". Еще раз прочитайте этот текст и ответьте на вопросы, приведенные в упр. 22.7. Удалось ли вам на этот раз лучше справиться с заданием? Бренсфорд и Джонсон [173] использовали этот текст в эксперименте, проводимом под лучшим контролем, и обнаружили, что для его понимания очень важен заголовок. Какие выводы вы можете сделать по проблеме совершенствования речи?







Материалы

Яндекс.Метрика