Feb 12, 2011 12:49
Традиционно сравнение ISO 15926 со слоном: стандарт так же неисчерпаем для понимания разными людьми, как слон в байке о семи слепцах, пытающихся определить, на что похож слон. Так что для .15926 более пристало говорить не о человечьем roadmap, а о слоновьей тропе. Попробуем прикинуть тут возможные направления развития, и не будем мелочиться в потребных сроках и ресурсах.
1. Ситуационная инженерия мэппинга aka pragmatic web, "ISO 15926 outside"
В этом направлении .15926 -- это клей, которым в интеллектуальную систему склеиваются самые разные хранилища знаний.
Семантическому вебу теоретический каюк, ожидается прагматический веб -- когда много-много communities of practice начнут стыковать свои вычислительные установки, делая между их схемами данных ситуационный мэппинг (ибо один и тот же мэппинг ведь не может подходить для всех целей и случаев жизни!).
-- добиваемся "всеядности": умеем стыковаться с чужими RDL во всех возможных форматах (endpoints, разные варианты OWL и RDL). Предлагаем свой формат "слипания" RDL, более приспособленный к онтологической работе, чем текущий вариант Частей 8 и 9.
-- решаем задачу поиска ошибок (верификации) в федерации фасадов (что, вообще-то говоря, нетривиально). Тут две проблемы: традиционная верификация (традиционный "прувер", работающий в распределенной среде и оптимизированный для логики ISO 15926), и онтологическая верификация (когда мы находим ошибки онтологического кодирования: типа "диаметра", относимого не к ClassOfShapeDimension, а к INTEGER -- то есть занимаемся не только традиционной логической алгоритмикой, но и залезаем в лексический уровень и пытаемся понять сначала значение, а потом и смысл -- возможно, переспрашивая у авторов тех или иных RDL и автоматизируя процедуры исправления выявленных семантических и прагматических ошибок)
-- повторяем функциональность IRING mapping editor, строим свой "универсальный адаптер", опять же -- добиваемся всеядности: определяем онтологию "чужой структуры данных" и строим поддерживающий эту онтологию SDK, который позволяет парсить/синтезировать всё, что шевелится хоть как-то структурируется.
-- идём по пути автоматизации мэппинга, вплоть до интерактивного (т.е. в ходе уточняющего коллаборативного диалога с владельцами онтологий community of practice) автоматизированного (лексические и прагматические алгоритмы, активно задействующие механизмы поиска метафор и аналогий для мэппящихся онтологий) мэппинга.
2. Универсальный моделер, "ISO 15926 inside" [то есть language workbench -- это был основной текущий план]
В этом направлении .15926 -- это интеллектуальное хранилище самых разных знаний.
Если у нас есть средство для презентации всего, что только можно себе представить, то нужно
-- добавить средства нотационной инженерии, чтобы разрабатывать всевозможные DSL (редактор с отображением в заданной нотации и хранением в инстансах шаблонов).
-- использовать наличие upper ontology и механизм поднятия шаблонов для того, чтобы разработанные в разных группах описаний (то бишь DSL) модельки склеивались (механизм реализации correspondence rules из ISO 42010)
-- средства интерактивного программирования, чтобы донести ошибку, выскакивающую из-за несовместимости в одной из моделек до редактора в другой модельке, причем в высокоуровневых терминах этих моделей, а не в языке Части 2
-- сделать удобный "пользовательский синтаксис", и получить архитектурный язык нового (онтологического) поколения
-- сделать синтезатор текста на controlled english -- для валидации моделей
-- средства интеллектуального рендеринга и публикации моделей
-- средства коллаборативного редактирования моделей
-- интеграция моделей с внешними вычислителями (путь simantics)
-- модальности в моделях (модели требований, модели тестирования и т.д.)
-- исполнение моделей
3. Разработка нового поколения стандарта и демонстрационная реализация, "beyond ISO 15926"
В этом направлении .15926 говорит "до свидания" текущему состоянию ISO 15926 (2003г.) и потихоньку (как третье поколение разработчиков) реализует мечты и чаяния исследователей первого поколения (каковые мечты и чаяния были существенно прибиты "стандартизаторами", "семантик-вебовцами" и "реализаторами" второго поколения). То есть двигаемся к новой (например, 2015г.) версии стандарта -- как части 2, так и частям 7, 8, 9:
-- внимательно смотрим на критику Мэтью Веста и на HQDM
-- внимательно смотрим на критику Андриесса и на Gellish
-- внимательно смотрим на конкурирующие онтологические проекты (те, что уцелели после дождика грантов на развитие semantic web)
-- внимательно смотрим на достижения формальной прагматики, теории категорий и прочих: оцениваем, насколько нам хватает FOL как формализма (с учётом проблем выражения модальностей, а также прагматики -- т.е. выхода на интерпретацию контекста, а также "исполнение").
-- алгоритмика для нового представления: валидация и т.д.
-- плюём жирной слюной на OWL (да и RDF, да и XML), делаем новое коммуникационное представление (как серверное, так и передачей файлов)
-- пишем проект нового стандарта и пробиваем его рассмотрение
-- переделываем upper ontology (апдейт программы реализации современных воззрений: 4D, modality realism, non-well founded sets -- если это будут еще sets, и т.д.). Все философы и логики в гости к нам.
-- делаем новую "богатую" core RDL на базе новой upper ontology (data model), радикально выпрямляем текущий коленвал в RDS
Тут нужно учесть, что данное направление не включает в себя "лексической" компоненты. Ибо знаниевая работа требует не только развития "аналогового" лексического представления, но и развития формализмов и их алгоритмики. Прикрутка лексики и выход на языковые игры достаточно проявлены в других направлениях.
4. Кубарем, или "общий искусственный интеллект" (GAI)
Тут нужно прежде всего озаботиться:
-- добычей максимального количества информации, всеядностью (в том числе -- мэппинг в лексические базы данных). То есть реализовать "клей", мэппинг всего во всё
-- интерфейсами к разным внешним вычислителям (путь simantics -- интеграция не столько баз данных, сколько вычислителей)
-- прорыв в семантике/прагматике исполнения онтологического/знаниевого кода, причем обязательно мультипарадигмальность (ISO 15926 inside, плюс много-много алгоритмических находок, чтобы это хоть как-то шевелилось), это "путь CYC"
-- интерактивность на естественном языке с жестовым интерфейсом (сказать "что это? -- и тыкнуть пальцем в экран)
-- какая-то одна прикладная область (на много просто сил не хватит), ибо GAI -- это общий интеллект семилетнего ребенка "без заскоков и выкрутасов", плюс профессиональные умения в какой-то конкретной предметной области, типа "проектирование трубопроводов высокого давления".
То есть данный путь -- это эклектика из всех остальных путей.
Добавляйте.