Ограничения онтологизации как метода представления знания

Ограничения онтологизации как метода представления знания

by Евгений Волков -
Number of replies: 0

Ограничения онтологизации как метода представления знания

Вступление к недописанной статье «Неонтологический метод представления знания посредством схем внимания»

Для функционирования автономных искусственных агентов или просто для развитых систем обработки информации качественное представление знания является одной из ключевых задач, определяющих общую способность системы решать задачи. Можно считать, что для широкого ряда узкоспециализированных задач наука и инженерия сумела найти достаточно успешные частные решения. Однако, и построение интеллектуальных систем, оперирующих сложными концептами, и мультидисциплинарная проблематика современных инженерных решений, их многодоменная ориентированность, и реализация программы AGI, требуют нахождения таких представлений знания и организации машинной памяти, которые бы превосходили существующие подходы.

Разработки в области искусственного интеллекта исторически разделены на два основных класса  автономных систем, две модели сознания или два подхода к представлению знания, на основании которых строятся архитектуры и алгоритмы. Первый —  когнитивистский (cognitivist), где для обработки информации используются символьные представления. Второй — эмерджентный, где основанием являются коннекционистские сети, а поведение или значение рассматриваются как эпифеномены. (Не рассматриваем здесь особые, но малораспространённые вариации эмерджентных систем, таких как динамические и энактивные (enactive) [Vernon 2007]) Существует достаточное количество работ, посвящённых анализу этих подходов и их сравнению [Duch 2008], [Langley 2009], [Thórisson 2012].

Символьный подход базируется на идее «физической символьной системы» (physical symbol system), сформулированной в [Newell 1976]. Данные системы оперируют формальными системами символов, обозначающих феномены реального мира в соответствии с произволом конструктора системы.  Самую значимую часть эмерджентных систем составляют коннекционистские архитектуры, в которых представления реализуются как макросостояния или паттерны активности сети с высокой параметрической размерностью.

И тот, и другой подход имеют свои преимущества и недостатки, которые определяют их основные сферы использования. Символьные системы работают с высокоуровневыми абстракциями, символьными вычислениями, логиками и семантикой. Коннекционистские системы показывают впечатляющие результаты в области распознавания образов и машинного обучения. Для обеих подходов констатируется низкая эффективности за рамками своей области. «Cognitivist systems are poor at functioning effectively outside narrow, well-defined problem domains.» [Christensen 2000] «Unfortunately large-scale semantic memories that contain both structural properties of concepts (chairs have legs, seat, etc) and their relations and associations (chair – table, sit, etc) and could be used in computationally efficient way do not exist.» [Duch 2008] Касаясь проблем одного из самых популярных ныне коннекционистских подходов в машинном обучении — dynamic reinforcement learning (DRL), Гарнелло приводит [Garnello et al, 2016] целый спектр ограничений, применимых в значительной мере ко многим или большинству коннекционистских архитектур, куда входит и указание на неспособность сети эффективно справляться с задачами за рамками того спектра, на котором она была натренирована.

Такая ситуация порождает попытки создавать гибридные системы [Sun, 1994] [Granlund, 2005], [Garnello, 2016], которые могли бы потенциально расширять сферы применимости или эффективности моделей. Успешно применяются статистические методы отображения между символьным пространством и коннекционистскими сетями, такие как популярный метод векторных представлений (word embeddings) [Bengio et al, 2003] и различные варианты его развития, например [Das, 2016], [Ans, 2016].

При работе с абстракциями высокого уровня возникает проблема основания символов (symbol grounding problem) [Harnad 1990]. Эта проблема частично может решаться [Steels, 2007] для относительно простых когнитивных агентов, работающих с 3D-средой через известные сенсорно-моторные комплексы. Однако, для проблемных областей, таких как Natural Language Understanding, Computational Semantics, Ontology Engineering и близких, символы, на которых строятся репрезентации, являются слишком генерализованными, чтобы некоторое количество простых сенсоров могли ухватить их смысловое содержание сколь-нибудь аналогично человеку. Коннекционистские методы, работающие со знанием и текстом, различают текст, как статистический ансамбль знаков без всякого основания. Элементами различения могут быть графические примитивы [Dehaene 2005], отдельные буквы [Zhang 2015], фонемы [Lee 1995], слова [Bengio 2003], предложения [Wu 2016], вершины синтаксического дерева [Wermter 2005] или факт-триплеты [Ans 2016], в любом случае входом для искусственной нейронной сети является не некое исходное феноменальное или мыслимое содержание, а его символьное представление, лишённое и семантики, и связи с миром. Функциональная способность систем таким образом ограничена выводами, делаемыми исключительно из статистических распределений знаков, а не из отношений между означаемыми (по Фреге).

Другой уровень проблем проявляет область онтологического моделирования, тесно связанная с вычислительной семантикой, пониманием естественного языка и областью управления знанием. Онтологизация — это метод организации концептуальных пространств, элементы которых выводятся из языка и представлены в виде формальной символьной модели, а вычисления производятся на основе логического вывода [Gruber, 1993].

В настоящее время онтологическая инженерия являет собой развитую дисциплину, технологическое и рыночное пространство, где количество прикладных доменных онтологий исчисляется сотнями. Необходимость в доменно-независимых онтологических генерализациях возникла рано и в данный момент является серьёзной научной и инженерной проблемой, т.к. функционирование систем, работающих в нескольких перекрывающихся доменах и/или рассматриваемых с концептуально различных позиций, влечёт за собой построение и сопряжение нескольких информационных моделей, а количество и сложность требований к таким системам и моделям растёт. Отдельно следует отметить проблематику AGI, где способность оперировать предельно обобщённым представлением знания является обязательным условием [Goerzel 2015].

Инженерные подходы к построению интероперабельных систем разделяются на три подвида: интеграция, унификация и федерализация [ISO 11354-1], [ISO 14258], каждый из которых адресуется концептуально различными решениями. Интеграция подразумевает создание моделей и систем на общей базе, когда между системами возможен обмен непосредственно исполняемыми сущностями, например, на базе  OASIS UN/CEFACT ebXML или специальной модели данных, непротиворечиво охватывающей все целевые домены. Это предполагает высокую степень зависимости между доменными моделями. Унификация ослабляет такие требования и вводит межсистемные медиаторы, обеспечивающие маппинг между независимыми онтологиями. Такими медиаторами могут служить онтологии верхнего уровня (upper ontology, top-level ontology), осуществляющие «вертикальную» связность между частными моделями через генерализации более высокого уровня, например [Herre 2007]. Предполагается, что онтология верхнего уровня способна непротиворечиво охватывать и генерализировать концепты из множества специализированных доменов. «Горизонтальную» интероперабельность без введения дополнительной онтологии выражается в понятии онтологического выравнивания (ontology alignment) и его реализуют онтологические мапперы [Ehrig 2004], в том числе и с применением нейронных сетей [Hariri 2006], языки метаописания [Lange 2012], распределённые онтологии [Schlicht 2008], [Chen 2011]. Федерализация предполагает самую слабую связность, где интероперабельность требует только сопряжения операций и интерфейсов на уровне примитивов.

Говоря о формальных системах представления сложного знания, нас интересуют прежде всего концептуально целостные модели, а не частные приёмы. Применение любого из вышеуказанных подходов к проблеме управления знанием с высоким концептуальным разнообразием и высокой сложностью даёт лишь ограниченный эффект, проявляя целый спектр разного рода недостатков. Широкого консенсуса относительно некоего наилучшего подхода нет и пока не предвидится [Milton 2004]. В качестве аргумента к этому тезису достаточно взглянуть хотя бы на количество вариантов реализаций таких представлений в различных системах, а также принять во внимание, что в настоящее время появляются и развиваются новые методы. В особенности стоит упомянуть коннекционистские представления на дифференцируемых архитектурах, где онтологии строятся на системе статистически определяемых кластеров, получаемых из исходного сенсорного материала с помощью нейронных сетей [Breen 2002], [Jou 2015]. Эти методы, однако, необходимо отличать от методов извлечения онтологий (ontology extraction, ontology learning), когда процесс создания онтологий на основании понятийной области и корпуса текстов автоматизируется в том числе с помощью нейронных сетей [Chen 2008], [Presutti 2009].

Проблему с онтологическим подходом в целом можно проиллюстрировать скептическими замечаниями относительно онтологий верхнего уровня [https://en.wikipedia.org/wiki/Upper_ontology#Arguments_for_the_infeasibility_of_an_upper_ontology], что в сумме можно свести к констатации неочевидности и неоднозначности деления мира на концепты в силу культурных, языковых, эпистемологических различий между группами людей. Я бы хотел указать следующий список ограничений онтологизации, как части символьного подхода в представлении знания, которые принципиально ограничивают использование онтологий для управления представлениями:

  1. Языковая привязка. Элементы онтологий берутся из языка и отражают язык. Даже если исключить из рассмотрения привязку к конкретному языку (английскому, например), проблема остаётся в том, что инвентарный список элементов изначально ограничен словарём. Рекомбинации терминов для идентификации сложных понятий могут дать некоторое линейное приращение, и уже при этом онтология становится чрезвычайно сложной для восприятия и понимания человеком. При этом, и модель и язык остаётся ещё относительно простым, отражающим относительно простую картину мира. Например, инженерная онтология ISO 15926 включает сотни классов и отношений и покрывает только некоторую часть инженерных доменов, не адресуя и не претендуя на онтологизацию социальной жизни, искусства, науки и пр. По факту, имеющиеся реализации схватывают только время-пространственные и функциональные примитивы мышления.
  2. Невозможность управлять люфтами семантик. Коннотации, тропы, омонимия и синонимия, как средства передачи смысла, в рамках одной описательной онтоединицы непредставимы или представимы неуклюже, частично, немасштабируемо.
  3. Психика и киберпсихика, рефлексивные и самоприменимые системы. Эта среда настолько динамична, аутопоэтична и высокосвязна, что онтологический подход с его разделением на design & run time (TBox и ABox) просто не способен сколь-нибудь качественно отражать транзит сложнозависимых состояний.
  4. Сложность и размер моделей. Онтологические описания сколь-нибудь сложных доменов представляют из себя огромные графы и переплетённые иерархии категорий, в развитии плохо пригодные для человеческого понимания. Расширение модели быстровозникающим новым доменным знанием затрудняется, а поддержка становится бременем для владельцев. Машинночитаемость онтологий не помогает в перспективе эволюции, в том числе и потому, что онтологии являются прежде всего инструментом, с помощью которого человек борется со сложностью мира. Диалектика ситуации состоит в том, что данный инструмент сам становится слишком сложным, отрицая себя.
  5. Слабая симметричность модели. Средством уменьшения сложности моделей является регуляризация инфраструктуры. Современные онтологии строятся исключительно в иерархичном стиле, которые имеют несколько топологических симметрий (например, отношение узлов «родитель-дети»), на которых в лучших случая могут реализовываться симметрии метаконцептуальных отношений, они же — «архитектурные паттерны». Построение моделей на паттернах и управление самим метаструктурным инвентарём может стать самостоятельной проблемой в силу вариативности описываемой среды. Попытки форсировать симметрии, даже с привлечением теории фракталов, приводят к красивым, но обычно слаборелевантным моделям, излучающим скорее романтизм, чем практичность. Изобретение вариативных паттернов и их параметризация/специализация приводит к необходимости поддерживать две иерархии, подверженных одним и тем же проблемам: собственно доменную онтологическую модель и метамодель управления с иерархией метаструктур.
  6. Сложность учёта множественности взглядов на мир. Стандарт архитектурных описаний ISO 42010 вводит концепцептуальную метамодель, где данная проблема некоторым образом учитывается в терминах Stakeholder, Concern, Architecture Viewpoint и пр. Однако, практическое применение данного подхода в онтологической инженерии некоторым образом адресует эту необходимую способность, но делает это за счёт внесения дополнительной сложности, субъективистская природа которой эпистемологически и исторически плохо совместима с натуралистическими установками, из которой вырос современный онтологический метод. Представляется, что прирост качества этой способности может достигаться за счёт более чем линейного или даже экспоненциального роста усилий на её реализацию в текущих рамках.
  7. Проблемы с учётом времени в онтологических описаниях. State-of-the-art в онтологической инженерии это 4D-модели, включающие время как четвёртый параметр к пространственному описанию. Для статистики или других матметодов временные ряды давно не представляют никакой особой сложности, а современные СУБД явно поддерживают 6 нормальную форму. Развиваются событийно-ориентированные подходы. Представляется, однако, что прогресс в описании, как уже выше указано, можно отнести только к некоторой относительно небольшой части доменов человеческой деятельности, где понимание времени и его квантификация доступны для натуралистической парадигмы. Нетривиальные структуры знания могут иметь и имеют гораздо более сложную времязависимую топологию (например, смешивание разнесённых во времени состояний и семантик, как в понятии «ностальгия»), которая в такие структуры не может уложиться никоим образом.
  8. Множественность онтологий. Множественность онтологических описаний неизбежна и неустранима в силу всех упомянутых ограничений метода. Управление же данной множественностью с помощью ещё одной онтологии не решает проблему, а повторяет её не другом уровне абстракции. Методы выравнивания онтологий, решая некоторые проблемы интероперабольности, приводят к уменьшению возможностей повторного использования концептуализаций [Hoekstra, 2009], что является одним из ключевых предназначений онтологии [Gruber, 1993], [Fernández-López, 2002], [Hoekstra, 2010].

Представляется очевидным, что обособленное развитие низкоуровневых, коннекционистских технологий или высокоуровневых, символьных, не даст возможности выйти за рамки указанных ограничений для систем, построенных в соответствии с одним из подходов. Технологическое сочетание подходов или гибридизация архитектур так же не является достаточным условием для существенного прогресса в решении обозначенных проблем. Онтологизация, как одна из несущих опор символьной парадигмы представления знания, несёт в себе особые ограничения, не разрешаемые изнутри. Это может служить указанием на необходимость привлечения других средств представления знания и третьего уровня в стеке репрезентативных систем. На наличие такого уровня указывает [Duch 2007], не определяя, впрочем, его нейрофизиологическую привязку:

«The three main branches of computational intelligence are thus inspired by evolutionary processes that structured brains and intelligence,

  1. low-level brain processes that enable perception and sensorimotor reactions (primary sensory and motor cortices),
  2. and intermediate level fuzzy concepts
  3. and associative reasoning (higher sensory areas in temporal and parietal lobes).»

Из этого списка видно, однако, что данный уровень не имеет собственного имени (intermediate), и концептуально плохо управляем, следствием чем является недетерминированность вывода в этой области (fuzzy). Это говорит о том, что данная область исследований наименее развита из трёх, и, возможно, именно там следует искать решения, которые смогут добавить нечто существенное в развитие систем представления знания и к архитектурам интеллектуальных агентов.

В следующем изложении я покажу, какие уже существующие исследования можно привлечь для развития темы, очерчу своё предложение по построению неонтологических систем репрезентации знания и покажу его место среди когнитивистской и эмерджентистской парадигм.

 

2021 words