February 10th, 2014

2021 год
  • ailev

Новости хакатона-2014

Версия 1.4 .15926 Editor практически готова, идёт документирование и вялый дебаг перед релизом. Началась работа над версией 1.5, ранние образцы которой как раз и будут участвовать в хакатоне это версия, в которой будет задействован web framework Flask -- http://flask.pocoo.org/ (патамушта он Python и "it's intended for getting started very quickly").

Продолжают обсуждаться самые разные идеи того, что можно было бы сделать (например, http://ailev.livejournal.com/1105922.html).

Есть и забавные идеи по тому, откуда и какие борать датасеты (ибо хакатон -- это некоторое развлечение, и вовсе необязательно брать для развлечения инженерные данные):
-- взять наборы данных, для которых заведомо нет ничего "семантиквебового" (например, http://anidb.net с API в http://wiki.anidb.net/w/API где много информации по аниме, но не так много людей и http://myanimelist.net с API в http://myanimelist.net/modules.php?go=api где мало информации по аниме, но много людей плюс есть информация по мангам).
-- онтологии появляются там и тогда, где и когда приходит понимание, что таких источников данных много (например, в wikipedia можно найти информацию по содержанию эпизодов, ещё есть IMDB с технической информацией по формату выпуска, игровые вебсайты с играми, tvtropes.org с использованными тропами и т.д. -- как связать информацию всех этих сайтов?). За основу можно принять какую-то модель предметной области: например, крутую BBC Programmes ontology -- http://www.bbc.co.uk/ontologies/programmes/2009-09-07.shtml (ну, их таких много). В принципе, тут хорошее упражнение по ISO 15926 -- нужно сделать RDL, который будет использован при мэппинге всех этих многочисленных ресурсов: и этом можно делать либо опираясь на какую-то онтологию, либо опираясь сразу на модели данных "в руках".
-- представить какую-то смешанную информацию из этих двух (а потом и больше) баз данных в вебе, или провести какую-то взаимо верификацию (например, найти несовпадающие числа эпизодов, авторов или ещё что-нибудь в базах данных и т.д.) -- задач тут может быть миллион и маленькая тележка.

Окончательно определиться с тем, что мы будем делать на хакатоне, нам нужно к докладу vvagr 27 февраля 2014, когда мы представим этот конкретный проект международному сообществу. До этого момента можно менять и предлагать всё, что угодно (лишь бы оно отвечало теме Ontology Summit 2014: пересечение технологий прикладной онтологии, больших данных и семантического веба).