Category: технологии

Category was added automatically. Read all entries about "технологии".

Sharge
  • vvagr

Семантические и онтологические технологии - одно и то же или нет?

ISO 15926 – онтология для семантического представления инженерных данных

"Семантика" и "онтология" становятся популярными терминами в ИТ-сфере. Наш новый короткий текст поясняет сферу применения семантических и онтологических технологий, их связи и различия, на примере работы с данными жизненного цикла крупных инженерных проектов.
2019
  • ailev

Платформенность .15926

С выпуском версии 1.2 (ждите, это совсем скоро!) нужно обратить внимание на то, куда мы движемся: от Browser к Editor, от Editor к Platform -- если в прошлой версии стало возможным делать пользовательские расширения с использованием Сканера и Билдера графа, то в версии 1.2 добавляются расширения для пользовательских паттернов.

Продукт у нас штучный и сложный, и неплохо бы поглядеть, как в таких условиях развиваются продукты аналогичного класса. Например, Robot Operation System (ROS) -- http://www.ros.org/wiki/ROS/Introduction (число участников тамошнего проекта сильно меньше, чем в Eclipse -- http://eclipse.org/, так что он больше похож на нас нынешних). По большому счёту все эти проекты ползут с ростом числа участников к пониманию "платформенности" как вариантам ручной сборки из разношёрстных и разномастных деталек к какой-то автоматизации и самосборке сложных конфигураций и достижению монструозности, а затем в рамках уже этой монструозности и избыточности софта появляется AppStore.

У нас уже есть:
-- последовательность самообразования (ибо без знания ISO 15926 никакого .15926 софта не нужно), в том числе методология разработки. Конечно, когда всё это собрано в кучку, становится понятным, как это всё компактно переписать и тем самым снизить входной порог.
-- файловые форматы (Часть 8 -- нам свезло, ибо остальным приходится сочинять что-то своё, а тут "безобразно, но единообразно").
-- фриварный движок, который медленно-медленно начинает стабилизироваться и к нему документированные API всех этих расширений
-- сделанные in house примеры расширений (их мало, но они есть)
-- интернет-комьюнити, где все это можно обсуждать (вот это, в котором находится данный пост).

Чего же не хватает для того, чтобы обозваться платформой? Нижняя граница -- пятеро независимых от нас и друг от друга разработчиков расширений, без которых "платформенности" как таковой по факту нет (я ориентируюсь на давнее наблюдение, что вики без пяти активных контрибуторов не взлетают -- с платформами должно быть что-то такое же, отсюда и число "пять независимых").

После этого придётся делать какую-то дополнительную инфраструктуру, чтобы поддержать разработчиков расширений. Интересно, когда наступит этот радостный момент. Конечно, нам уже сейчас время от времени сообщают, что давно и с пользой используют нашу софтинку для работы. Но узнаём мы об этом чаще всего случайно. Думаю, что мы узнаем о разработке пяти расширений, когда их реальное число будет разве что не пятьдесят. Не знаю, радоваться этому (молчат -- значит у них софтинка жужжит, и не падает, что хорошо), или печалиться (очень ведь хочется обратной связи).
Sharge
  • vvagr

Автоматизация онтологического моделирования документов на естественном языке

TechInvestLab.ru is starting a research program into an automation of formal modelling. The first project is developed together with ABBYY - the leading linguistic company. The project studies possibilities to build a Gellish-like formal model of a natural language technical document, for further transformation into an ISO 15926 compliant data model with TabLan.15926 engine. This presentation shows preliminary comparisons between syntactic and semantic structures parsed by ABBYY Compreno and manually prepared formal text models.

Мы начинаем исследовательскую программу по автоматизации информационного моделирования. Первый проект будет развиваться вместе с компанией ABBYY - мировым лидером в области лингвистических разработок. Проект изучает возможности построения по техническому документу на естественном языке Gellish-подобной модели, которую в дальнейшем можно будет трансформировать в формальную модель ISO 15926 (с помощью технологии TabLan.15926, например). Презентация по ссылке (спасибо дорогому супу за неработающий эмбед) показывает предварительные материалы проекта - сопоставление семантической и синтаксической структуры, построенной с помощью ABBYY Compreno, и подготовленной вручную формальной модели текста.

Ontology Modelling of an Engineering Document – Perspectives of Linguistics Analysis.
2019
  • ailev

Компиляции в .15926

Существует два основных варианта "компиляции":

1. С какого-то "выразительного языка" в "язык исполнения".
В .15926 мы планируем для этой цели использовать технологию language workbench. Когда проект только-только начинался, эта технология была очень маргинальна, примеров почти не было. Сейчас ситуация стремительно меняется: на конкурс language workbench 2011г. представлено 11 участников -- http://www.infoq.com/news/2011/03/lwc-2011.

Мы должны представить лёгкие средства разработки "компиляторов" различных (текстовых, графических, табличных и т.д.) DSL в общее представление ISO 15926.

Основная трудность тут в том, что речь идет об интерактивном программировании: нам нужно не просто в одностороннем порядке перевести с какого-то DSL на язык ISO 15926, но и суметь отобразить необходимый фрагмент семантической сетки ISO 15926 представления в DSL.

Аналогичные задачи решаются, конечно, современными language workbench, но в нашем случае речь идет о существенно декларативных представлениях, и заимствовать чужие решения наверняка не удастся. Будем топтать целину.

2. С языка "медленной интерпретации" в язык "быстрого выполнения".
В декларативных языках это получило название "компиляция знаний" (см., например, десятилетней давности обзорную статью http://www.jair.org/media/989/live-989-2063-jair.pdf и современные развороты темы тут: http://www.mpi-inf.mpg.de/departments/rg1/conferences/deduction10/).

Мы ожидаем, что база знаний может получаться неожиданно большой (загрузка начальной библиотеки справочных данных -- это 2.7млн. триплов, и это без проектных данных!), и нужны будут скоростные методы работы.