?

Log in

No account? Create an account

Entries by category: литература

Почему ISO 15926
2019
ailev
За последнюю пару лет ситуация с объяснением того, почему интеграционные (федеративные, MDM и т.д.) решения нужно делать именно на основе ISO 15926, изменилась. Если раньше нужно было сравнивать реляционные и объект-атрибутные (то бишь традиционные ООП) модели данных традиционных MDM и иных "интеграционных" и "шинных" решений в их конкуренции с ISO 15926, то сегодня на рынке много самых разных игроков:
-- аристотелевская традиция (куда попадают практически все известные на сегодня варианты MDM-решений, SOA-реализаций с ESB, варианты "много интеграций точка-точка, и ничего в этом нет страшного").
-- простая интеграция на основе технологий семантического веба (т.е. факт-ориентированная модель, а не объект-ориентированная, но без какой-то онтологической начинки). Это новые игроки, которые подчёркивают преимущество, гибкость и всеохватность факт-ориентированной модели, считая что они легко моделируют "по потребности" недостающие справочные данные. Более того, они демонстрируют убедительные примеры. Грубо говоря, "всё то же самое, что ISO 15926, только без этих ваших сложностей овладения 201 типом, темплейтами, паттернами".
-- "словарное соответствие" ISO 15926 -- по факту, сюда попадает любая схема данных, если она опубликована и открыта (т.е. её можно пробовать мэппить независимо от разработчика). Например, XMpLant и множество схем данных CAD/PLM вендоров попадает в эту категорию. Это может быть как "семантические технологии" (то есть RDF/OWL), так и "просто XML схема" (в разы чаще).
-- "внеуставное моделирование" для ISO 15926 (попытка использовать кусочек RDL -- но не полностью, например, игнорируя 4D)
-- полноценное моделирование в ISO 15926, "как задумано разработчиками"

Сразу скажу, что полноценный разбор особенностей всего этого зоопарка реализаций выходит за рамки формата поста в нашем комьюнити .15926 (хотя мы регулярно обсуждаем эти вопросы с клиентами). Но понимание ситуации хороший повод вспомнить, для чего затевалась вся эта история с ISO 15926 и сформулировать ключевые конкурентные преимущества, отличающие от всех других решений (в том числе от относительно новых решений на базе трипл-сторов, предлагающих факт-ориентированные модели данных, и тем самых эквивалентных по преодолению проблемы "что в одном проекте объект, то в другом атрибут -- и наоборот").

Аналогичные аргументы используются и для обсуждения MDM-предложений (централизованное ведение RDL внутри компании с надеждой на обслуживание этой RDL партнёров и поставщиков в масштабе отрасли или бизнес-эко-системы).

Вот эти "преимущества ISO 15926" (и огромное спасибо Hans Teijgeler за обсуждение):

1. ISO 15926 -- это стандарт (да, включая и часть, находящуюся в JORD -- POSCCaesar Association "майнтейнер" этого стандарта-базы-данных для ISO). Вкладываться в изучение или написание софта для стандарта -- это вкладываться в что-то, что более стабильно, чем решения какого-то одного вендора или какого-то одного проекта. Стандарт описывает систему накопления знания в виде федерации библиотек справочных данных, но верхушка этой знаниевой пирамиды относительно стабильна. Далее могут быть много конкурирующих между собой вендоров с разными реализациями, много использующих эти реализации проектов, но знания об этой "верхушке пирамиды" будут переносимы людьми из проекта в проект. Обучение в одном проекте сможет быть использовано в другом проекте, где все вендоры другие.

Кроме того, вокруг стандарта возникает множество реализаций, которые конкурируют друг с другом по качеству и достаточно близки по функциям, чтобы потенциальные клиенты могли выбирать из их числа. Вокруг стандартов возникает рынок, выбор, разнообразие, что повышает доверие клиентов -- и тем самым защищает вендоров, вложившихся в поддержку стандарта. Для новых участников этого интеграционного рынка не нужно никаких договорённостей с поставщиками технологий, стандарт позволяет свободное присоединение новых участников.

2. "Простые решения", как основанные на ISO 15926 (но игнорирующие 4D онтологию), так и основанные на RDF/OWL, хорошо работают только в рамках одной стадии жизненного цикла (только проектирования, или только сооружения, или только эксплуатации). При выходе за рамки стадии жизненного цикла приходится моделировать всю сложность объекта "система", который изменяется во времени.

ISO 15926 за счет использования 4D онтологии предлагает нормализацию до 6й нормальной формы. Если использовать более простые модели данных, то денормализация порождает кошмар управления конфигурацией данных, находящихся у разных участников жизненного цикла: синхронизация изменений становится весьма и весьма нетривиальной, как в любом случае денормализации.

Все альтернативные решения не гарантируют этой нормализации по всему жизненному циклу системы, а ограничиваются только нормализацией вплоть до 5й нормальной формы на одной стадии жизненного цикла. Но ведь кто-то после этого должен будет проинтегрировать/профедерировать на всём жизненном цикле эти островки интеграции/федерации для одиночных стадий! В этот момент выяснится, что от "простых и быстрых решений" опять придётся переходить к специально предназначенным для этого решениям ISO 15926, переучивать людей, делать очередной мэппинг данных. Ибо модель данных ISO 15926 как раз и получилась такой нетривиальной из-за того, что решала проблему интеграции данных по всему жизненному циклу: в ней полностью поддержано понятие "система", в части постепенной эволюции и уточнения модели системы, а затем замены компонент в ходе функционирования воплощённой "в металле и бетоне" системы (подробнее о сложности понятия "система" и требований к языкам поддержки системы, в том числе необходимость поддержки темпоральных объектов и отношений, см. доклад http://incose-ru.livejournal.com/39744.html).

Управление конфигурацией данных жизненного цикла без активного задействования всей этой сложной модели данных со множественными классификациями (классификацией отношений, аппаратом классов классов), а также 4D (темпоральные части), плюс особенности поддержки понятия системы (физические объекты и функциональные физические объекты) представляется опрометчивым. В случае ISO 15926 есть набор типовых практик решения типовых возникающих при этом проблем, и эти практики не являются ноу-хау каких-то поставщиков: эти практики заложены в стандарт.

3. Стандарт позволяет организовывать массовую (bulk, batch) передачу не только "трансакционных" (проектных) данных как данных об индивидах, но и справочных данных -- данных о классах (классификаторов и справочников НСИ), единиц измерения, ограничений из нормативных актов (типа таблицы номинальных диаметров) и т.д.. Более простые (без использования классов классов и без возможности классифицировать отношения классификации и специализации) модели данных обычно трудно использовать для передачи не только данных, но и сопутствующих им справочных данных (что особенно хорошо проявляется при "странных" видах данных -- вроде каталогов промышленной продукции, которые точно не про экземпляры, а про классы -- много разных железок с серийными номерами для одной строчки каталога, но во многих чертах записи о моделях в каталоге ведут себя как экземпляры. Так же возникают обычно проблемы корректной массовой передачи как проектных, так и справочных данных при "дизайне в классах" и при обсуждении "типовых дизайнов" -- в этих случаях тоже довольно просто запутаться с управлением конфигурацией по всему жизненному циклу.

4. Для надёжности реализации модели данных, поддерживающей весь жизненный цикл, необходима коллективная работа и перепроверки со стороны представителей разных стадий жизненного цикла. Для этого модель данных должна быть
-- открыта для коллективных проверок
-- иметь явные процедуры пополнения, проверки и утверждения

Тем самым возникает необходимость иметь RDL, в которой:
-- публично известен и доступен формат обращения
-- понятно, как работать с метаданными
-- данные в которой имеют статус стандарта (и, соответственно, проходят коллективное обсуждение перед утверждением и публикацией).

ISO 15926 предоставляет детальное описание, как могла бы выглядеть RDL в форме файла, и в форме онлайн-фасада, какие должны быть мета-данные для ведения библиотеки (да, какие-то нюансы этого описания уторговываются прямо сейчас -- но мы же понимаем, что такие неуторгованные моменты всё одно всплывут в любых проприетари реализациях "библиотекоидов". Я намеренно использую суффикс "оид" для указания на объект, который похож на библиотеку, но не библиотка -- типа "гуманоид", который на человека похож, но не человек).

5. Особое внимание к повышению уровня языка:
-- над триплами реализована семантическая сетка из типов Части второй.
-- темплейты, что позволяет резко упростить работу.
-- паттерны, что позволяет ещё больше упростить работу.

Альтернативные интеграционные предолжения содержат какие-то свои собственные способы поднимать уровень высказываний по сравнению с "ассемблером из триплов", но указанных трёх уровней нет ни у кого.
* * *
Конечно, обратной стороной медали тут является сложность освоения модели данных ISO 15926 по сравнению с "простыми и поэтому надёжными решениями" для одной стадии жизненного цикла (неудивительно, что список "трудностей освоения" по факту совпадает со списком "главных достоинств" -- http://dot15926.livejournal.com/30492.html). Но наш опыт показывает, что не так страшен чёрт, как его малюют. Особенно, если учесть:
-- понимание, как осваивать стандарт, потихоньку растёт (см. http://dot15926.livejournal.com/27293.html, довольно много людей успешно продвинулись, следуя этой последовательности).
-- усилия по подъему уровня языка (т.е. освоение работы с паттернами, это писк ISO 15926-моды буквально последнего года) дадут ещё одно снижение образовательного ценза для подключения к работе с модельерами данных обычных инженеров
-- наличие такого софта, как .15926 Editor, который поддерживает всё вышеописанное "из коробки", свободно доступен и позволяет попробовать все решения без привлечения какого-то крупного поставщика RDL и программного обеспечения.

Освоение ISO 15926
2019
ailev
Освоение ISO 15926 по сегодняшнему состоянию требует следующих действий:

1. Понимания, для чего это всё нужно -- и уяснение основных принципов:

а) начинать нужно с чтения книжки Chris Partridge "Business Objects: Re-Engineering for Re-Use), она же "книжка BORO": http://ailev.livejournal.com/938647.html
614 страниц текста, но после них становится понятно, почему плохо моделировать данные объектами и атрибутами, а нужно обращение к факт-ориентированному подходу. Проблемы с этой книжкой в том, что она излагает основы BORO-метода (хотя слово "BORO" не встречается в книжке ни разу), она не использует привычной терминологии -- ни ISO 15926, ни какой-либо другой, она вообще не касается формализмов представления информации (там предлагаются очень элегантные диаграммки, которые больше никем и нигде не используются). Тем не менее, книжка обязательна к прочтению: без нее вам не отбиться от любого первокурсника, который будет не понимать, чем подход ISO 15926 лучше подхода если не реляционных, то объект-ориентированных (объекты с атрибутами вместо таблиц) баз данных -- зачем нужно учить что-то новое, если и старое еще не до конца освоено.

При чтении 7 главы (Physical Bodies as Four-Dimensional Objects) нужно обязательно поглядеть фильм с лекциями Юрия Балашова: http://ailev.livejournal.com/913373.html

б) продолжать нужно чтением книжки FIATECH "An Introduction to ISO 15926" -- http://fiatech.org/images/stories/techprojects/project_deliverables/iso-intro-ver1.pdf
Это 181 страница текста, после которых появляется представление об истории появления ISO 15926 и его возможных применениях.

в) заканчивать понимание основных принципов нужно:
-- чтением книжки Matthew West "Developing High Quality Data Models" (книжка HQDM): http://www.amazon.com/Developing-High-Quality-Data-Models/dp/0123751063 (но вы легко найдёте эту книжку в он-лайн библиотеках, она в электронном виде есть).
408 страниц текста, написанных ведущим разработчиком ISO 15926 уже после выхода стандарта. Это не ISO 15926, а "улучшение части 2 ISO 15926, если бы ее пришлось делать еще раз". Книжка очень кратко пересказывает до страницы 151 приложения рассказанной в книжке BORO теории к моделированию данных (книжка BORO вообще данных не касается, там про другое), затем страницы 151-201 рассказывают, как моделировать самые разные предметы окружающего мира -- организации, продукты, системы и т.д.. Далее до конца книжки идет описание модели данных HQDM и мэппинга ее в ISO 15926-2 (эту модель данных можно безболезненно пропустить).
-- чтением диссертации Andries van Renssen "Gellish. A Generic Extensible Ontological Language": http://repository.tudelft.nl/assets/uuid:de26132b-6f03-41b9-b882-c74b7e34a07d/its_renssen_20050914.pdf
Эти 268 страниц тоже не ISO 15926, и эта книжка также написана одним из соавторов ISO 15926 как "улучшение принятых при создании ISO 15926 решений". Можно, конечно, считать эту книжку "необязательной программой" (тем более, что есть многочисленные идеологические расхождения подхода Gellish и ISO 15926), но там содержится очень много знаний, вполне приложимых к ISO 15926. С учётом того, что большинство людей из сообщества ISO 15926 знакомы с подходом Gellish, эта книжка входит в "культурный минимум" модельера данных.

Итого: для понимания теоретических основ нужно одолеть примерно 1200 страниц текста, это (считая 1 страницу в 3Кзнака) примерно 4тыс. Кзнаков, и если читать за час 30Кзнаков (10 страниц в час), то это работа на 120 часов -- без упражнений и времени на разглядывание картинок и понимание. То есть за месяц по четыре часа в день (хотя и без выходных) вполне можно одолеть, нужно только сосредоточиться.

2. Практика -- ISO 15926 сам по себе
Увы, практика подразумевает обязательное выполнение упражнений -- но упражнений пока нет, их только предстоит разработать

а) нужно освоить ISO 15926 часть 2
Это 241 страница очень насыщенного текста: описание 201 типа, к которым нужно будет относить любую встреченную сущность (entity). Именно этот набор сущностей отличает ISO 15926 от любой другой онтологии -- будь то родственные IDEAS, HQDM, Gellish, или более далёкие CYC и DOLCHE. Это "Отче Наш", это и есть "ключевые слова" языка ISO 15926. Проблема в том, что без знаний из пункта 1 данного учебного плана понять эту часть стандарта невозможно.

б) провести разбирательство с PCA RDL (библиотекой справочных данных POSCCaesar Association, которая должна быть существенно улучшена проектом JORD). Для этого нужно:
-- читать 47 страниц проекта Части 6 (внимание! это еще не стандарт, только проект!) ISO 15926 -- правила ведения RDL, нужные для понимания, откуда что берется в PCA RDL (они также будут полезны для вашей собственной работы: вам же тоже придется разрабатывать корпоративную библиотеку справочных данных).
-- при помощи .15926 Editor разглядывать PCA RDL (см. документацию к этому софту), хотя пользы от этого столько же, сколько от чтения энциклопедии, там ведь порядка 50тыс. сущностей из самых разных предметных областей. Но внимание нужно обращать на общую структуру: как оно устроено хотя бы на верхнем уровне.

Читать Часть 4 не нужно, там просто задавалось начальное содержимое RDL, которое после некоторого развития (некоторые язвят -- замусоривания) привело к появлению PCA RDL в текущем состоянии.

в) Ознакомиться с механизмом шаблонов:
-- читать Часть 7 (механизм шаблонов) -- 126 страниц, без которых с шаблонами не разобраться.
-- увы, нужно читать также и Часть 8 (отображение шаблонов в языке OWL) -- это 58 страниц, которые вроде как предназначены только для программистов, которые пишут реализации ISO 15926, но многие важные для практической работы сведения (например, про пространства имён ISO 15926) приведены именно в этой части стандарта.

г) потратить время на чтение чужих справочных данных ("чтобы научиться писать свои программы/романы, нужно научиться читать чужие"):
-- в качестве обязательного материала (несмотря на то, что у автора этого вебсайта -- тоже одного из соавторов ISO 15926 -- своя точка зрения, не всегда совпадающая с "буквой ISO 15926") -- разбирательство с содержимым вебсайта http://15926.info/
-- можно найти некоторое количество примеров в комплекте поставки .15926 Editor (http://dot15926.livejournal.com/28678.html)

д) прочитать методику ижненерии справочных данных: http://techinvestlab.ru/files/RefDataEng/RefDataEngr_ver_2_25feb11.doc -- 18 страниц, описывающих метод "ISO 15926 Outside"

е) подписаться на дискуссии в комьюнити "ISO 15926" в LinkedIn и почитать их.

Итого: страниц текста всего около 500, но зато много-много разглядывания диаграмм и деревьев со структурированными данными. Времени это займёт много больше, чем чтение первой тысячи страниц -- минимальная оценка тут два месяца.

3. Практическая работа с кем-то из уже разобравшихся в теме:
Увы (или к счастью), ISO 15926 представляет себе фронтир современной мысли по моделированию данных -- и поэтому он во многом дан в устной традиции. Еще не было времени, чтобы выпустить достаточное количество учебных текстов, разработать упражнения. Поэтому важным является общение с носителями традиции: только чтения книжек и стандартов не будет хватать, многое в этих книжках не написано.

То есть начинайте собственный проект моделирования в избранной вами предметной области, но обязательно показывайте свои результаты опытным людям. Вы наверняка будете удивлены, услышав их комментарии к вашим первым работам.

Архитектурные языки, архитектурные подходы (frameworks), UML profiles и 4D extensionalism
2019
ailev
DoDAF 2.02 (Department of Defence Architecture Framework Version 2.02, принят в августе 2010г., http://cio-nii.defense.gov/sites/dodaf20/index.html) -- это обязательный для использования архитектурный подход министерства обороны США. Во всех военных проектах США используют предопределенный набор тематических групп описаний.

Этот набор описаний выражен в терминах метамодели MD2 (http://cio-nii.defense.gov/sites/dodaf20/DM2.html), so the architectures can be integrated, analyzed, and evaluated to mathematical precision. Эта метамодель представляет собой ограниченный словарь, в терминах которого описываются модели этой архитектуры. Фишка в том, что логический уровень этой метамодели представляет собой UML-профиль для IDEAS, которая является 4D upper ontology (http://cio-nii.defense.gov/sites/dodaf20/Ontology1.html), ближайшим родственником Части 2 ISO 15926.

Недавно была выложена книжка Chris Partridge "Business Objects: Re-Engineering for Re-Use", 2000г., с изложением основных идей технологии BORO (http://www.brunel.ac.uk/%7Ecssrcsp/BusObj.pdf). Именно технология BORO и легла в основу 4D онтологии IDEAS. В этой книжке педантично расписано (хотя и не в терминологии ISO 15926), какие проблемы решаются переходом от описаний в объектно-атрибутивной парадигме к логической (классы), и почему нужно было вводить 4D. Я бы считал, что для промышленных онтологов это обязательное чтиво, там есть множество объяснений, до которых не снисходят авторы текстов по ISO 15926. Конечно, при этом не нужно забывать, что тамошняя онтология совсем не похожа на ISO 15926, и учиться нужно не представленной там онтологии, а излагаемому в книжке куску философской логики.

А теперь критика DoDAF 2.02:
1. IDEAS там появилась из понимания, что архитектурной информацией нужно обмениваться между разными архитектурными системами. Идея интеграции (в данном случае архитектурных) данных неминуемо влечёт вызов онтологических духов, а современные онтологические духи всё чаще и чаще выбирают 4D, чтобы не запутаться в отслеживании превращения гусеницы Дуси в куколку Дусю, а затем и бабочку Дусю.
Мы вполне могли бы выбрать ISO 15926 для тех же целей: интеграции архитектурной информации, в том числе информации enterprise architecture. Но мы лучше выберем ISO 15926 не для задач outside (как была выбрана модель IDEAS), а для задач offsite и inside. Я пока не чувствую острой необходимости перегонять модели ARIS в модели DoDAF или ToGAF. Мне бы эти модели разрабатывать, и вряд ли с использованием этих архитектурных подходов. Тем не менее, я бы использовал ISO 15926 непосредственно в качестве метамодели: so the architectures can be integrated, analyzed, and evaluated to mathematical precision.

2. Идея сделать UML-профиль для ISO 15926, чтобы работать с UML-редакторами, мне представляется сугубо неправильной. Тут два возможных варианта:
-- поступить, как в BORO, и вместо диаграмм Части 7 придумать богатый графический язык для выражения ISO 15926 (в том числе расширяемый микротеориями, задающими "профили", как в UML)
-- сделать свой "похожий на UML" графический язык с онтологическими расширениями, пройдя по пути OPML (http://www.cesames.net/fichier.php?id=370, http://www.cesames.net/fichier.php?id=371).
-- считать, что будет много разных DSL, и принципиально не заморачиваться одним каким-то базовым графическим или текстовым языком. Много-много projectional editors, показывающих в разных DSL кусочки общей семантической сетки. И сосредоточиться на придумывании этих DSL для разных views. Пока склоняемся к этому варианту, ибо остальные являются частными случаями этого.

3. Что касается использования IDEAS, то два уровня неадекватности (UML-профиль, а поверх него давно критикуемый жестко определенный набор методов описаний собственно архитектуры) полностью закрывают возможные достоинства использования IDEAS -- я писал об этом механизме нивелирования достоинств технологий неудачностью использующих их приложений тут: http://ailev.livejournal.com/936771.html.
Мы тем самым должны отойти от жесткой заданности набора методов описаний, но дать все необходимые механизмы для ситуативного его построения (см. http://praxos.livejournal.com/12468.html).