Nothing Special   »   [go: up one dir, main page]

Academia.eduAcademia.edu
СПРАВОЧНО-ИНФОРМАЦИОННЫЙ РАЗДЕЛ УДК [002.6+069+026/027+7/9]:004.652.5 А.Б. Антопольский, Д.Ю. Гук О подготовке русского перевода онтологии по культурному наследию CIDOC CRM Излагается история и современное состояние объектно-ориентированной онтологии по культурному наследию, известной под названием Концептуальная эталонная модель (CIDOC CRM). Сообщается о подготовке русского издания, запланированной ИНИОН РАН. Формулируются цели CIDOC CRM, важнейшими из которых признается обмен информацией и интеграция цифровых ресурсов институтов памяти. Кратко представлены основные понятия и теоретическая база CIDOC CRM, а также ее структура. Описываются различные функциональные расширения онтологии и ее применение в научных информационных системах широкого профиля. Рассматриваются состояние и перспективы применения CIDOC CRM в российской цифровой гуманитаристике. Ключевые слова: онтологии, культурное наследие, институты памяти, научные информационные системы, интеграция, обмен информацией DOI: 10.36535/0548-0019-2024-03-4 ВВЕДЕНИЕ Онтология по культурному наследию, которая имеет официальное название Концептуальная эталонная модель (CRM) Международного комитета по документации по разработке стандартов (CIDOC) Международного совета музеев (ICOM), а в научном обороте, как и в настоящей статье, сокращенно именуется CIDOC CRM, имеет достаточно длинную историю. Первые шаги по разработке объектно-ориентированной концептуальной эталонной модели CIDOC-CRM были сделаны в 1996 г. сотрудниками FORTH (Греция)1, опубликовавшими исходную версию документа [1]. Объектно-ориентированная Концептуальная эталонная модель CIDOC CRM была создана Группой по стандартам на документацию ICOM/CIDOC. С сентября 2000 г. CIDOC CRM стала разрабатываться как стандарт ISO Группой специальных интересов (SIG) CIDOC CRM совместно с ISO/TC46/SC4/WG9. Результатом этого сотрудничества стала разработка версий стандарта ISO 21127: 2006, а затем и ISO 21127: 2014. Это сотрудничество продолжается, и в 2021 г. была подготовлена очередная версия CIDOC CRM, положенная в основу действующей версии стандарта ISO 21127: 2023 [2]. Фонд исследований и технологий – "Эллада" (греческий: Ίδρυμα Τεχνολογίας και Έρευνας - ΙΤΕ) научно-исследовательский центр в Греции https://forth.gr/en/home/ 1 24 В 2021 г. инициативная группа разработчиков модели взялась за перевод на языки мира завершённой версии 7.1.2, подготовленной в качестве обновлённой версии международного стандарта ISO (ISO 21127:2023 ). В настоящее время CIDOC CRM уже переведен на ряд языков: китайский, французский, греческий, немецкий, японский чешский, португальский. На русский язык в 2005 г. в Казанском (Приволжском) федеральном университете по инициативе В. В. Иванова стали переводить уже версию CIDOC CRM 4.2.4. Этот перевод названия онтологии не вполне отражает её суть, но прочно вошёл в научный оборот, поэтому было решено оставить его в готовящемся издании. Заметим, что стандарт ISO 21127 получил несколько иное название, а именно: «Справочная онтология для обмена информацией о культурном наследии». Стандартом ISO 21127 (2006) послужила более поздняя версия CIDOC CRM 5.04, и на русский язык она не переводилась. Внесённые изменения в иерархию классов и свойств протоколируются и учитываются от версии к версии (https://cidoc-crm.org/ versions-of-the-cidoc-crm). Работа над развитием онтологии продолжается, и текущая версия имеет номер 7.2.х (https://cidoc-crm.org/versions-of-the-cidoc-crm). В Международном Совете музеев Россию представляет Государственный Эрмитаж, сотрудник которого Д.Ю. Гук участвует в специальной рабочей ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3 группе по интересам CIDOC CRM и, в частности, в группе по переводам CIDOC CRM. В 2023 г. ИНИОН РАН предложил подготовить русское издание CIDOC CRM, на что Государственный Эрмитаж дал свое согласие и это издание запланировано на вторую половину 2024 г. Перевод и редактирование выполнили авторы настоящей статьи. Выявленные технические ошибки, исправленные в последней версии, также были учтены. Названия классов и свойств переведены с учëтом действующей на территории РФ нормативной базы, этим понятиям подобраны эквивалентные термины, соответствующие описанию сущностей и их применению. Некоторые лексемы переведены разными словами, контекстуально более уместными. ЦЕЛЬ И ОБЛАСТЬ ПРИМЕНЕНИЯ CIDOC CRM Основная роль CIDOC CRM заключается в обеспечении обмена и интеграции информации из разнородных источников для реконструкции и интерпретации прошлого. Предполагаемая область применения CIDOC CRM может быть определена как вся информация, необходимая для научного документирования коллекций культурного наследия с целью обеспечения широкомасштабного обмена информацией и интеграции разнородных источников. Это определение требует некоторого пояснения. Термин "Научная документация" означает требование, что глубина и качество описательной информации, которая может обрабатываться CIDOC CRM, должны быть достаточными для серьезных академических исследований в данной области, а не просто для случайного просмотра. Это не означает, что информация, предназначенная для представления широкой публике, исключается, а скорее, что CIDOC CRM предназначена для обеспечения уровня детализации и точности, ожидаемого и требуемого музейными профессионалами и исследователями в данной области. Термин "Коллекции культурного наследия" означает охват всех типов материалов, собираемых и экспонируемых музеями и связанными с ними учреждениями, как это определено ICOM 2 . Сюда входят коллекции, места и памятники, относящиеся к естественной истории, этнографии, археологии, историГенеральной конференцией ИКОМ в Праге 24 августа 2022 г. принято новое определение музея. Приводим это определение на русском языке: Музей – это некоммерческое, действующее на постоянной основе учреждение на службе обществу, которое изучает, собирает, хранит, интерпретирует и экспонирует материальное и нематериальное наследие. Открытые для публики, доступные и инклюзивные, музеи способствуют многообразию культур и устойчивому развитию общества. Музеи осуществляют свою деятельность и коммуникацию на основе принципов этики и профессионализма, при участии сообществ, предлагая разнообразный опыт в целях образования, организации досуга, рефлексии и обмена знаниями. На первом Заседании Президиума ИКОМ России было решено принять перевод определения понятия музей в том виде, в котором он был представлен на Общем собрании. Источник: https://icom-russia.com/data/events/perevod-opredeleniya- ponyatiya-muzey / 2 ческие памятники, а также коллекции изобразительного и прикладного искусства. Обмен соответствующей информацией с библиотеками и архивами и гармонизация CIDOC CRM с их моделями представления знаний входят в предполагаемую сферу CIDOC CRM. Документация коллекций предназначена для подробного описания как отдельных предметов в коллекциях, так и групп предметов и коллекций в целом. Область применения CIDOC CRM – знания хранителей музейных коллекций – включает хранителей музейных коллекций и базу их знаний по предметной области. Информация, необходимая исключительно для администрирования учреждений культурного наследия, такая как информация, касающаяся персонала, бухгалтерского учета и статистики посетителей, выходит за рамки сферы CIDOC CRM. CIDOC CRM должна учитывать информацию об исторических и географических обстоятельствах и теоретических представлениях об отдельных объектах, которая придает им значимость и ценность. Структура и уровень детализации CIDOC CRM определяются целью обеспечения обмена информацией и интеграции между разнородными источниками. Эта цель определяет перспективу онтологии, которая обязательно является надинституциональной и абстрагируется от любых конкретных местных факторов. CIDOC CRM нацелена на использование современных технологий, обеспечивая при этом взаимодействие с устаревшими системами (http://cidoc.ics.forth.gr/ scope.html). Особую актуальность сформулированная нами цель прибрела по мере создания информационных систем для музеев, архивов, библиотек, а также для научных исследований. Формирующееся единое информационное пространство в области культурного и исторического наследия настоятельно требует согласования подходов при проектировании этих систем, прежде всего, в области представления знаний. Если для синтаксиса единого информационного пространства ценным инструментом совместимости становится Семантический Веб и разработанные в рамках этой платформы стандарты3, то семантика при интеграции разнородных источников остается наиболее сложной и противоречивой проблемой. Поэтому онтологии, такие как CIDOC CRM, являются чрезвычайно важным средством, с которым должны быть обязательно знакомы разработчики информационных систем и цифровых ресурсов. Особенно это касается информационных систем, в задачи которых входит интеграция информации из разнородных источников. КОНЦЕПТУАЛЬНАЯ ОСНОВА ОНТОЛОГИИ CIDOC CRM является объектно-ориентированной онтологией. Ее основу образуют классы объектов (сущностей), а также свойства (предикаты), заданные на этих классах. Классы и свойства могут быть свяСовокупность стандартов Семантического Веба представлены на сайте консорциума W3C https://www.w3.org/ 2001/sw/wiki/Main_Page 3 ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3 25 заны иерархическими отношениями (отношением специализации, IsA). Класс – это категория объектов, которые имеют один или несколько общих признаков, служащих критериями для идентификации объектов, принадлежащих к данному классу. Класс идентифицируется буквенно-цифровым кодом и мнемоническим именем. Эти свойства необязательно должны быть явно сформулированы в логических терминах, но могут быть описаны в примечании к области применения. Совокупность этих признаков называется интенсионалом класса и составляет его определение. Нижестоящие классы наследуют свойства и признаки вышестоящих. В CIDOC CRM допускается полииерархия, которая называется множественным наследованием, т.е. нижестоящий класс может наследовать признаки нескольких вышестоящих. Объекты, отнесенные к классу, называются его экземплярами. Поскольку основная цель CIDOC CRM – это интеграция и обмен информацией, классы имеют по возможности общий характер, чтобы включать возможно большее количество экземпляров, т.е. понятий и конкретных объектов сферы культурного наследия, которые могут использоваться в отраслевых, региональных, тематических, предметных и других информационных системах институтов памяти. Классы связаны со свойствами, выступая в качестве субъектов или объектов предикатов (или, в терминах естественного языка, в качестве подлежащих или дополнений при соответствующих глаголах). Субъекты предикатов в CIDOC CRM называются доменами, а объекты – диапазонами соответствующих предикатов (свойств). Свойство характеризуется интенсионалом, который описывается примечанием к области применения. Свойства могут иметь прямую и обратную (инверсную) формы, соответствующие активному и пассивному залогу в грамматике. В зависимости от поведения во времени CIDOC CRM различает статические и динамические сущности (которые называются эндурантами и пердурантами). Эндуранты полностью присутствуют (т.е. присутствуют все их надлежащие части) в любое время, когда они существуют. Пердуранты просто растягиваются во времени, накапливая различные временные части так, что в любое время, когда они присутствуют, они присутствуют лишь частично, в том смысле, что некоторые из них их надлежащие временные части (например, их предыдущая или будущая фазы) могут отсутствовать. Для концептуальной основы CIDOC CRM большое значение имеет принцип монотонности. Монотонность определяется как непротиворечивость утверждений, введенных в базу знаний и сделанных из них логических выводов. CRM CIDOC – это модель, разработанная для монотонных утверждений, она позволяет бесконфликтно объединять огромные массивы знаний. Один из важных принципов CIDOC CRM – принцип открытого мира. Открытый мир – это термин из теории баз знаний. Он характеризует системы баз знаний, предполагающие, что хранимая информация является неполной по отношению к универсуму, который они намереваются описать. В частности, отсутствие определенного свойства у объекта, описан- 26 ного в системе, не означает, что данный объект не обладает этим свойством. CIDOC CRM различает две категории объектов: универсалии и индивидуальности (частности). Фундаментальное онтологическое различие между ними может быть неформально понято при создании экземпляров: частности – это сущности, которые не тиражируются, т.е. у которых нет экземпляров ни в одном возможном мире; универсалии – это сущности, у которых действительно есть экземпляры. Классы и свойства обычно рассматриваются как универсалии. Формальная онтология, такая как CIDOC CRM, представляет собой контролируемый язык для высказываний о частностях, т. е. она предоставляет классы и свойства для категоризации частностей как так называемых “экземпляров” таким образом, чтобы их индивидуализация, единство и соответствующие свойства были настолько однозначными, насколько это возможно. CIDOC CRM не выступает против или в пользу существования духовной субстанции или субстанции, недоступной ни органам чувств, ни инструментам, и не предлагает материалистическую философию. Однако из практических соображений модель опирается на приоритет интеграции информации, основанной на доказательствах, доступных для любого человеческого опыта. CIDOC CRM фиксирует только материальную реальность, независимую от наблюдателя. CIDOC CRM – это формализованное представление исторического дискурса, формальная онтология. В этом качестве она предназначена для представления основанного на фактах аналитического дискурса о том, что происходило в прошлом, понятно человеку и обрабатываемо машиной способом. Она выполняет эту функцию, предлагая ряд формализованных свойств (отношений) и классов. Формализованные свойства поддерживают создание семантически явных утверждений, связывающих классы объектов. Таким образом, свойства CIDOC CRM обеспечивают формальное, логически явное описание отношений между отдельными объектами реального мира, классифицированными по различным онтологическим классам. Кодирование аналитических данных, относящихся к прошлому, в рамках такой системы утверждений обеспечивает стандартное представление данных и позволяет единообразно применять рассуждения к большим наборам данных. Основой этой логики высокого уровня является иерархическая система классов и отношений, обеспечивающих базовые онтологические различия, с помощью которых можно представить исторический дискурс. Знакомство с основными онтологическими различиями, проводимыми на верхнем уровне иерархии классов, обеспечивает базовую отправную точку для понимания того, как применять CIDOC CRM для отражения знаний. Самый высокий уровень в CIDOC CRM представлен понятиями: E77 Постоянная Сущность эквивалентным философскому понятию "долговечный", эндурант; E2 Временная Сущность, эквивалентным философскому понятию "постоянный", пердурант и, наконец, понятием E92 Область Пространства-Времени. ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3 В теоретическом разделе CIDOC CRM подробно рассматривается логика моделирования событий в пространственном, временном и пространственновременном аспектах. Эта логика базируется на классическом исследовании управления временными отношениями Дж.Ф. Аллена [3]. Важно, что временные отношения учитывают нечеткие границы событий. Введение принципа нечетких границ событий и временных периодов потребовало существенного пересмотра всей системы временных свойств. Пространственные отношения в CIDOC CRM тесно связаны с потенциальной совместимостью с географическими информационными системами (ГИС) и соответствующими технологиями. Эти аспекты применения CIDOC CRM исследованы в работе [4]. Для читателей, интересующихся логикой, синтаксис и формальная семантика, используемые CIDOC CRM, приведены в работе [5], где обсуждаются аспекты компьютерной реализации онтологии. В заключение заметим, что логика и правила представления данных в этой модели совместимы с платформой Семантического Веба, в том числе с основными стандартами RDF/OWL4, а все случаи различия специально оговариваются. В то же время отметим, что концептуальная основа CIDOC CRM имеет своих критиков. В работе [6] содержится пример такого взгляда. СТРУКТУРА CIDOC CRM Существующая версия CIDOC CRM, на основе которой готовится издание русского перевода, имеет следующую структуру. Основную часть онтологии предваряет достаточно детальное общее описание, включающее введение, цели CIDOC CRM, сферу его применения. Вводится и комментируется терминология, используемая в модели. Далее следует самостоятельный раздел, в котором излагаются принципы моделирования, применяемые в CIDOC CRM, вопросы совместимости с ним внешних информационных систем, механизмы возможных расширений, а также принципы наследования, минимализма и монотонности. Описание системы содержит также введение в основные понятия: отношения с событиями, пространственные, временные и пространственно-временные отношения. Отдельно рассматриваются специфические конструкции моделирования. Прежде всего речь идёт о понятии типов, обеспечивающих переход к внешним таксономиям, классификациям и тезаурусам, а также примитивах, т.е. понятиях, которые не могут быть логически выведены из других понятий. Основная часть онтологии – это декларации (которые в онтологии называются определениями) классов (объектов, сущностей) и свойств (предикатов). Всего онтология включает 80 классов и 160 свойств, не считая удаленных. Описание стандартов RDF можно найти на сайте http://www.w3.org/RDF/ , а языка веб-онтологий OWL – на сайте https://www.w3.org/TR/owl2-overview/ 4 Декларация каждого класса содержит следующие компоненты: • имена классов, представленных в виде заголовков, выделенных жирным шрифтом, которым предшествует уникальный идентификатор класса; • строку “Подкласс:” – объявляет суперкласс класса, от которого данный класс наследует свойства; • строку “Суперкласс из:” – является перекрестной ссылкой на подклассы этого класса; • строку “Примечание к области применения:” – содержит текстовое определение понятия, которое представляет класс; • строку “Примеры:” – содержит маркированный список примеров экземпляров этого класса. Если пример является экземпляром подкласса этого класса, то в скобках добавляется уникальный идентификатор подкласса. Если в примере создаются экземпляры двух классов, то уникальные идентификаторы обоих классов добавляются в круглых скобках. За примерами, не являющимися вымышленными, может следовать объяснение в квадратных скобках; • строку “Свойства:” объявляет список свойств класса; • каждое свойство представлено своим уникальным идентификатором, прямым и обратным именами и классом диапазона, на который это свойство ссылается, разделенными двоеточиями; • унаследованные свойства – не представлены; • свойства свойств – указаны с отступом и в круглых скобках под соответствующим свойством домена. Декларация каждого свойства включает: • имена свойств в виде заголовков, выделенных жирным шрифтом, которым предшествуют уникальные идентификаторы свойств; • строку “Домен:” – объявляет класс, для которого определено свойство; • строку “Диапазон:” – объявляет класс, на который указывает свойство или который представляет значение для свойства; • сроку “Суперсвойство:” – представляет собой перекрестную ссылку на любые подсвойства, которые могут быть у свойства; • строку “Количественная оценка:” – где объявляется возможное количество вхождений для экземпляров классов домена и диапазона для свойства. Возможные значения: 1-много, много-много, много-1; • строку “Примечание к области применения:” – содержит текстовое определение понятия, которое представляет свойство; • строку “Примеры:” – содержит маркированный список примеров экземпляров этого свойства. Если пример является экземпляром свойства этого свойства, то в скобках добавляется уникальный идентификатор подкласса. Если в примере создаются экземпляры двух свойств, то в скобках добавляются уникальные идентификаторы обоих свойств; • строку “Примеры:” – содержит наглядные примеры, показывающие, как следует использовать свойство. ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3 27 Кроме того CIDOC CRM содержит: ➢ иерархии классов и свойств, представленные в виде таблиц; ➢ таблицу дополнительных свойств (свойств свойств); ➢ список цитированной литературы; ➢ приложения, содержащие устаревшие классы и свойства, а также инструкции по переносу устаревших классов, инструкции по переносу для удаленного класса E81 Transformation, инструкции по переносу устаревших свойств. ПРИМЕНЕНИЕ CIDOC CRM В ИНФОРМАЦИОННЫХ СИСТЕМАХ ШИРОКОГО ПРОФИЛЯ Основное назначение CIDOC CRM – интеграция музейной информации и документации в цифровой среде. Это направление достаточно подробно рассмотрено во многих источниках, в том числе на сайте CIDOC CRM. Здесь мы коснемся расширения возможностей CIDOC CRM, в том числе инструментов совместимости этой онтологии с моделями представления знаний в информационных системах, в других институтах памяти, а также в системах широкого профиля. Наиболее тесное сотрудничество CIDOC CRM налажено с разработчиками библиотечно-библиографических информационных систем. Самым перспективным направлением в этой области является обеспечение совместимости с моделью функциональных требований к библиографической записи (RFBR), разработанной ИФЛА – Международной федерацией библиотечных ассоциаций. В итоге это привело к формированию в 2003 г. Международной рабочей группы по гармонизации FRBR / CIDOC CRM, которая объединяет представителей обоих сообществ с общими целями: а) приведение модели FRBR ИФЛА IFLA в соответствие с концепциями, инструментами, механизмами и условными обозначениями, предоставляемыми CIDOC CRM, и б) согласование (возможно, даже слияние) двух объектно-ориентированных моделей с целью внести вклад в решение проблемы семантической совместимости структур документации, используемой для представления библиотечной и музейной информации. В результате была разработана FRBROO – онтология базовой семантики библиографической информации, которая является расширением CIDOC CRM. Далее было создано еще одно расширение, получившее название PRESSoo – формальная онтология, предназначенная для сбора и представления базовой семантики библиографической информации о периодических изданиях (журналы, газеты и т.д.). В области библиографии можно указать также на разработку модели совместимости CIDOC CRM с форматом библиографической записи UNIMARC [7]. Подробности и конкретные материалы можно найти на страницах сайта CIDOC CRM (http://cidoc.ics.forth.gr/frbr_inro.html и https://cidoc-crm.org/pressoo/). Помимо этого разработаны модели совместимости CIDOC CRM с наиболее распространенной системой представления знаний в архивных информаци- 28 онных системах, а именно EAD [8] – универсальная модель, известная под названием Дублинское ядро метаданных [9] – и другие модели представления знаний, используемые в ряде европейских проектов. Создателями CIDOC CRM разработана также общая модель сопоставления CIDOC CRM с иными структурами данных в области культурного наследия и смежных областях. [10]. В последние годы для CIDOC CRM разработано еще несколько расширений, рассчитанных на применение в широком классе научно-информационных систем. Перечислим расширения, представленные на странице сайта CIDOC CRM, каждое из которых снабжено подробным описанием (https:// cidoc-crm.org/collaborations). CRMinf – формальная онтология, предназначенная для использования в качестве глобальной схемы для интеграции метаданных об аргументации и создания выводов в описательных и эмпирических науках, таких как биоразнообразие, геология, география, археология, культурное наследие, охрана природы, исследовательские ИТ-среды и библиотеки исследовательских данных. CRMarchaeo – расширение CIDOC CRM, созданное для поддержки процесса археологических раскопок и всех различных организаций и видов деятельности, связанных с ним. CRMsci – модель научного наблюдения – формальная онтология, предназначенная для использования в качестве глобальной схемы для интеграции метаданных о научных наблюдениях, измерениях и обработанных данных в описательных и эмпирических науках, таких как биоразнообразие, геология, география, археология, сохранение культурного наследия и других, а также в исследовательских ИТсредах и библиотеках исследовательских данных. CRMgeo – формальная онтология, предназначенная для использования в качестве глобальной схемы для интеграции пространственно-временных свойств временных сущностей и постоянных элементов. Его основная цель – предоставить схему, совместимую с CIDOC CRM, для интеграции геоинформации с использованием концептуализации, формальных определений, стандартов кодирования и топологических отношений, определенных Открытым геопространственным консорциумом (OGC). CRM Digital – онтология и схема RDF для кодирования метаданных об этапах и методах производства (происхождении) продуктов оцифровки и синтетических цифровых представлений, таких как 2D, 3D или даже анимированные модели, созданные с помощью различных технологий. CRMba – онтология и схема RDF для кодирования метаданных о документации археологических сооружений. CRMtex – расширение CIDOC CRM для поддержки изучения древних документов путем выявления соответствующих текстовых объектов и моделирования научного процесса, связанного с исследованием древних текстов и их особенностей, с целью содействия интеграции с другими областями исследования культурного наследия, такими как археология и история. ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3 CRMsoc – формальная онтология для интеграции данных о социальных явлениях и конструкциях, представляющих интерес для гуманитарных и социальных наук, на основе анализа документальных свидетельств. CRMact – определяет классы и свойства, необходимые для интеграции записей и документации о планах будущей деятельности и будущих событиях. Это расширение вызвано необходимостью моделирования правовых норм и применения законов, а также моделирования предложений по режиму сохранения объектов культурного наследия. Следует также отметить работу [11], в которой описывается применение CIDOC CRM для справочной онтологии в открытом облаке социальных и гуманитарных наук (SSHOCK). Предлагается общая схема метауровня, которая будет использоваться в качестве онтологии верхнего уровня для организации знаний и информации, распределенных по различным первичным источникам информации в открытом облаке социальных и гуманитарных наук. Онтология позволит обеспечить семантическую совместимость при описании жизненного цикла данных в социальных и гуманитарных науках. Это представляется особенно важным поскольку облако SSHOCK должно охватывать максимально широкий поток документов и данных, интегрируя, в частности, информацию библиотечного, музейного и архивного хранения. ЗАКЛЮЧЕНИЕ. СОСТОЯНИЕ И ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ CIDOC CRM В РОССИИ В настоящей статье мы показали широкую область применения онтологии CIDOC CRM для различных задач представления культурного наследия и, шире, научной информации в информационных ресурсах музейных, библиотечных и других информационных системах, а также в общенаучных ресурсах. В России опыт применения CIDOC CRM значительно скромнее. Личные контакты во время конференции ADIT/ CIDOC, проведённой Государственным Русским музеем в Санкт-Петербурге в 2003 г., позволили проверить теоретические наработки в области лингвистического обеспечения, положенные в основу музейной информационной системы «Атлант» [12]. Следующим шагом было создание электронной иллюстрированной энциклопедии Государственного Эрмитажа [13]. Проект в целом оказался успешным, но реализован лишь в локальной версии программного обеспечения. Нам известно о теоретической разработке облачной платформы российского наследия с использованием онтологии CIDOC CRM силами ИТМО [14]. Однако, судя по всему, этот проект также остался нереализованным. С учётом накопленного опыта разработок, проект, направленный на молодую аудиторию, как по содержанию, так и по уровню его исполнителей, получил название «Электронная энциклопедия Эрмитажа. Том.1. Археология» [15]. Поскольку состав исполнителей меняется, средства разработки обновляются, а данные аккумулируются из разных источ- ников и требуют постоянной актуализации, то концепция CIDOC-CRM подходит как нельзя лучше. На основе опыта Государственного Эрмитажа планируется использовать CIDOC CRM, а также инструменты расширения этой онтологии на библиографическую, архивную и общенаучную информацию при создании информационной системы о культурном наследии Сибири под названием «Сибериана», которая должна интегрировать ресурсы ряда сибирских библиотек, музеев и архивов. Возглавляет этот проект Сибирский федеральный университет. Мы надеемся, что издание русской версии CIDOC CRM будет способствовать распространению и популяризации этой онтологии в российской цифровой гуманитаристике. Особенно это важно при интеграции различных информационных ресурсов об историческом и культурном наследии в едином российском цифровом пространстве знаний, где онтология высокого уровня представляется совершенно необходимой. СПИСОК ЛИТЕРАТУРЫ 1. Doerr M., Crofts N. Electronic Esperanto: The Role of the Object Oriented CIDOC Reference Model // Cultural Heritage Informatics: selected papers from ICHIM99. Archives and Museum Informatics. – 1999. – Р.157-173. 2. ISO 21127:2023 Information and documentation. A reference ontology for the interchange of cultural heritage information. – URL: https://www.iso.org/ standard/85100.html (дата доступа 28.12.2023). 3. Allen J. F. Maintaining knowledge about temporal intervals // Communications of the ACM. – 1983. – № 26(11). – P. 832–843. DOI: 10.1145/182.358434 4. Doerr M., H iebel G. CRMgeo: Linking the CIDOC CRM to GeoSPARQL through a Spatiotemporal Refinement // Technical report: ICSFORTH/TR-435. – 2013. 5. Meghin i C., Doerr M. A first-order logic expression of the CIDOC conceptual reference model // International Journal of Metadata, Semantics and Ontologies. – 2018. –№13(2). – P.131–149. DOI: 10.1504/IJMSO.2018.098393. 6. Maranga S., Rousid is D., Gousiopoulo s A., Garoufallou E. Practical Application and Material Documentation of CIDOC – CRM (Conceptual Reference Model): A Scoping Review // Metadata and Semantic Research. MTSR 2022. Communications in Computer and Information Science, Vol. 1789. 2023. Cham.: Springer, 2023. DOI: 10.1007/978-3031-39141-5_9. 7. Le Boeu f P . Mapping from UNIMARC Bibliographic to CIDOC CRM. April 2006. – URL: http://cidoc.ics.forth.gr/crm_mappings.html (дата доступа 28.12.2023). 8. Theodoridou M., Doerr M. Mapping of the Encoded Archival Description DTD Element Set to the CIDOC CRM // Technical Report FORTH-ICS/ TR-289, June 2001. 9. Doerr M. Mapping of the Dublin Core Metadata Element Set to the CIDOC CRM // Technical Report ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3 29 10. 11. 12. 13. 30 FORTH-ICS/TR-274, July 2000. 2000. URL:// https://www.researchgate.net/publication/2537161_ Mapping_of_the_Dublin_Core_Metadata_Element_ Set_to_the_CIDOC_CRM (дата доступа 28.12.2023). Doerr M. Mapping a Data Structure to the CIDOC Conceptual Reference Model (ICS-FORTH, Crete, Greece) Heraklion, Crete, April 2, 2002. – URL: https://docs.yandex.ru/docs/view?url=ya-browser% 3A%2F%2F4DT1uXEPRrJRXlUFoewruHSY04Q1UI8j2-T4Woa4mwJ5VJApp9tEVyR6Fpcal DFnfDJylLgL7VTFo-th2EycYbxgajLdEjSuI33 ArdejdhiMDD02vxXINvlNGBcZmD0BAQbYXF2 OrFhw6YU50SKSA%3D%3D%3Fsign%3DQ7g8 rwMP4b1GZIPIQGpoM2CJmGZKWl0tyjf1oOagh 5s%3D&name=mapping.ppt&nosw=1 (дата доступа 28.12.2023). The case of SSHOCro Athina Kritsotaki, FORTH// 49th CIDOC CRM & 42nd FRBR CRM sig meeting; 8-11 March. – URL: https://cidoc-crm.org/sites/default/ files/Athina%20Kritsotaki.%20Mapping%20nonworkflow%20models%20to%20CIDOC%20CRM% 20based%20%28event%20centric%29%20ontologie s%3B%20SSHOCro.pdf (дата доступа 28.12.2023). Г ук Д.Ю. Лингвистическое обеспечение музейного электронного каталога: Автореф. дис. … канд. филол. наук. – Санкт-Петербург: Изд-во Государственного Эрмитажа, 2005. – 24 с. Г ук Д.Ю. , Бызова Э.П., Цапаева Н.Ю. Современные информационные технологии в музее: электронная иллюстрированная история Государственного Эрмитажа // Труды Государственного Эрмитажа. Т. XXXVI. Российский императорский двор и Европа. Диалоги культур. Избранные материалы конференции, состоявшейся 18-20 октября 2005 г. в Государственном Эрмитаже. – Санкт-Петербург: Изд-во Гос. Эрмитажа, 2007. – С. 375-380. 14. Черный Э., Хаазе П., Муромцев Д., Андреев А., Павлов Д. Применение CIDOC-CRM для облачной платформы Russian Heritage Cloud Platform. / ред. В: Морзи Т., Валдуриес П., Беллатрече Л. Новые тенденции в базах данных и информационных системах. ADBIS 2015. Коммуникации в компьютерных и информационных науках, том 539. – Cham: Спрингер, 2015. DOI: https://doi.org/10.1007/978-3-319-23201-0_45. 15. Г ук Д. Ю., Пиков Н.О. Археология Эрмитажа в формате электронной энциклопедии // Труды VI (XXII) Всероссийского археологического съезда в Самаре. В 3-х т. / отв. ред. А.П. Деревянко, Н.А. Макаров, О.Д. Мочалов. – Самара : СГСПУ, 2020 – Т. III. – С.118-119. 16. Bruseker G., Carbon i N., Guillem A. Cultural Heritage Data Management: The Role of Formal Ontology and CIDOC CRM // Heritage and Archaeology. Digital Age. Quantitative Methods in the Humanities and Social Sciences / eds. Vincent M., López-Menchero Bendicho V., Ioannides M., Levy T. – Cham: Springer, 2017. – P. 93–131. DOI: https:// doi.org/10.1007/978-3-319-65370-9_6. Материал поступил в редакцию 28.12.23. Сведения об авторах АНТОПОЛЬСКИЙ Александр Борисович – доктор технических наук, главный научный сотрудник ИНИОН РАН, Москва. e-mail: ale5695@yandex.ru ГУК Дарья Юрьевна – кандидат филологических наук, старший научный сотрудник Государственный Эрмитаж, Санкт-Петербург e-mail: hookk@hermitage.ru ISSN 0548-0019. НТИ СЕР. 1. ОРГ. И МЕТОДИКА ИНФОРМ. РАБОТЫ. 2024. № 3