Некоторые простые примеры

Рассмотрим некоторые общеизвестные примеры обучения на основе фоновых знаний. При этом необходимо учитывать, что во многих формах поведения, требующих логического вывода релевантных гипотез в связи с поступлением новых результатов наблюдения, не применимы даже самые элементарные принципы чистой индукции.
• Иногда возникают ситуации, в которых люди сразу же приходят к общим заключениям после одного лишь наблюдения. Перу Гэри Ларсона принадлежит юмористический рисунок, на котором вооруженный очками пещерный человек Зог поджаривает на огне ящерицу, насаженную на заостренную палочку. За ним наблюдает восхищенная толпа его менее интеллектуальных соплеменников, которые до сих пор всегда разогревали свою пищу над огнем, держа ее голыми руками. Этот наглядный пример является достаточным для того, чтобы ознакомить зрителей с общим принципом безболезненного приготовления пищи.
• В качестве еще одного примера рассмотрим случай, в котором путешественник, прибывший в Бразилию, встречает первого в своей жизни бразильца. Услышав от него речь на португальском языке, путешественник сразу же приходит к выводу, что бразильцы говорят на португальском, но узнав, что его собеседника зовут Фернандо, он не делает вывод, что все бразильцы носят имя Фернандо. Аналогичные примеры можно найти в любой научной области. Например, когда начинающий студент-физик измеряет плотность и проводимость медного образца при определенной температуре, он без колебаний обобщает эти данные на все предметы из меди. Но измерив затем массу этого образца, студент даже не рассматривает такую гипотезу, что все предметы из меди имеют такую же массу. С другой стороны, он может вполне резонно сделать такое обобщение относительно всех монет одинакового достоинства.
• Наконец, рассмотрим случай, в котором незнакомый с фармакологией, но глубоко освоивший специальность диагностики студент-медик присутствует на консультации, которую дает пациенту опытный терапевт. После ряда вопросов и ответов специалист сообщает пациенту, чтобы он прошел курс лечения каким-то конкретным антибиотиком. На основании увиденного студент-медик выводит общее правило, что данный конкретный антибиотик является эффективным средством лечения при данном конкретном типе инфекции.
Все эти случаи относятся к такому типу, в котором использование фоновых знаний обеспечивает гораздо более быстрое обучение по сравнению с тем, чего можно ожидать при использовании программы чисто индуктивного обучения.
Некоторые общие схемы
В каждом из предыдущих примеров имеется возможность обратиться к априорным знаниям, чтобы попытаться обосновать выбранный способ обобщения. В данном разделе рассмотрим, какого рода ограничения логического следствия применяются в каждом из этих случаев. В таких ограничениях, кроме гипотезы Hypothesis, описаний наблюдаемых примеров Descriptions и классификации Classifications, применяются фоновые знания Background.
В случае поджаривания ящерицы пещерный человек проводит обобщение, объясняя своим соплеменникам успех, достигнутый с помощью заостренной палочки, — он держит ящерицу над огнем и вместе с тем не приближает руки к огню. Из этого объяснения его соплеменники могут вывести общее правило, что для поджаривания небольших мясистых съедобных объектов можно использовать любой длинный, твердый, заостренный предмет. Процесс обобщения такого рода получил название обучения на основе объяснения, или сокращенно EBL (Explanation-Based Learning). Обратите внимание на то, что общее правило следует логически из фоновых знаний, которыми обладают рассматриваемые в данном примере пещерные люди. Поэтому ограничения логического следствия, которые удовлетворяются в процессе EBL, являются таковыми:
Hypothesis A Descriptions N Classifications Background (= Hypothesis
Поскольку в процессе EBL используется уравнение 19.3, на первых порах он рассматривался как наилучший способ обучения на примерах. Но в связи с тем, что для обучения на основе объяснения требуется, чтобы фоновые знания были достаточными для объяснения гипотезы Hypothesis, которая в свою очередь объясняет результаты наблюдений, в действительности агент из полученного экземпляра примера не извлекает никаких принципиально новых знаний. Дело в том, что агент мог бы просто вывести логическим путем предъявленный ему пример из того, что он уже знает, хотя для этого, возможно, потребовался бы неоправданно большой объем вычислений. В настоящее время обучение на основе объяснения рассматривается как метод преобразования теорий, складывающихся из основных принципов, в полезные знания специального назначения. Алгоритмы обучения на основе объяснения рассматриваются в разделе 19.3.
В следующем примере, когда речь шла о путешественнике в Бразилию, ситуация совсем иная, поскольку не каждый путешественник знает о том, почему встретившийся ему бразилец говорит именно на португальском языке, если этот путешественник никогда не слышал о соответствующих буллах, изданных папой Римским. Более того, к аналогичному обобщению мог бы прийти путешественник, полностью незнакомый с историей португальских колоний. Соответствующие априорные знания состоят в том, что в каждой конкретной стране большинство людей, как правило, говорят на одном и тот же языке; с другой стороны, не предполагается, что имя Фернандо носят все бразильцы, поскольку указанная закономерность, касающаяся общего языка для всей страны, не распространяется на имена. Аналогичным образом, начинающий студент-физик вряд ли мог бы объяснить, почему измеренные им значения проводимости и плотности меди являются именно таковыми. Но он знает, что проводимость объекта зависит и от материала, из которого состоит объект, и от его температуры. В данном случае априорные знания Background касаются релевантности множества характеристик по отношению к целевому предикату. Эти знания, наряду с результатами наблюдений, позволяют агенту вывести новое, общее правило, которое объясняет результаты наблюдений, следующим образом:
Hypothesis л Descriptions (= Classifications
Background л Descriptions л Classifications (= Hypothesis (19.4)
Мы будем называть обобщение такого рода обучением с учетом релевантности, или сокращенно RBL (Relevance-Based Learning), хотя такое название указанного метода обучения не является общепринятым. Обратите внимание на то, что в обучении с учетом релевантности используются результаты наблюдений, но не вырабатываются гипотезы, выходящие за пределы логического содержания фоновых знаний и наблюдений. Оно представляет собой дедуктивную форму обучения и поэтому не может само по себе рассматриваться как создание новых знаний с пустого места.
А в том случае, когда студент-медик наблюдает за работой опытного врача, предполагается, что априорных знаний студента достаточно, чтобы прийти к заключению на основании симптомов о том, каково заболевание D этого пациента. Но этого не достаточно, чтобы объяснить тот факт, что врач прописал конкретное лекарство м. Студент должен выдвинуть гипотезу, касающуюся еще одного правила, а именно, что лекарство М обычно является эффективным средством против заболевания D. С учетом этого правила и априорных знаний студент может теперь объяснить, почему в данном конкретном случае опытный врач прописал лекарство М. Этот пример можно обобщить так: указать, что он основан на приведенном ниже ограничении логического следствия.
Background A Hypothesis л Descriptions (= Classifications (19.5)
Это означает, что для объяснения примеров объединяются фоновые знания и новая гипотеза. Как и при чисто индуктивном обучении, алгоритм обучения должен выдвигать гипотезы, которые являются как можно более простыми и совместимыми сданным ограничением. Алгоритмы, удовлетворяющие ограничению 19.5, называются алгоритмами индуктивного обучения на основе знаний, или сокращенно KBIL (Knowledge-Based Inductive Learning).
Алгоритмы KBIL, которые подробно описаны в разделе 19.5, в основном исследовались в области индуктивного логического программирования, или сокращенно ILP (Inductive Logic Programming). В системах ILP априорные знания выполняют две описанные ниже ключевые функции при решении задачи уменьшения сложности обучения.
1. Поскольку любая сформированная гипотеза должна быть совместимой с априорными знаниями, а также с новыми наблюдениями, эффективный размер пространства гипотез сокращается таким образом, чтобы в него были включены только теории, согласованные с тем, что уже известно.
2. Для любого конкретного множества наблюдений размер гипотезы, требуемый для формирования объяснения полученных результатов наблюдений, может быть намного сокращен, поскольку доступны априорные знания, на которые могут опираться новые правила при формировании объяснений результатов наблюдений. А чем короче гипотеза, тем проще ее сформулировать.
Системы ILP не только позволяют использовать в процессе индукции априорные знания, но и дают возможность формулировать гипотезы на языке общей логики первого порядка, а не на ограниченном языке, основанном на атрибутах, который рассматривается в главе 18. Это означает, что подобные системы могут осуществлять обучение в таких вариантах среды, которые остаются недоступными для понимания при использовании более простых систем.







Материалы

Яндекс.Метрика