Товары в корзине: 0 шт Оформить заказ
Стр. 1 

92 страницы

Определяет структуру TBX, разработанную для поддержки различных типов обработки терминологических данных, включая анализ, описательное представление, распространение и обмен в различных информационных средах. Основная цель TBX - обмен терминологическими данными. Области применения по назначению включают перевод и создание. TBX является модульный системой поддержки переменных типов терминологических данных или категорий данных, которые включены в различные терминологические базы данных (терминологические базы). TBX включает в себя два XML-модуля: основная структура и форма для идентификации ряда категорий данных и их ограничений. Термин в TBX относится к структуре, состоящей из этих двух взаимодействующих модулей. TBX позволяет максимизировать совместимость фактических терминологических данных, а также обеспечить набор категорий данных, которые используются в терминологических базах данных. Подмножества или супернаборы категорий данных по умолчанию могут использоваться в пределах структуры TBX, чтобы поддержать определенные пользовательские требования.

 Скачать PDF

Идентичен ISO 30042:2008

Оглавление

1 Область применения

2 Нормативные ссылки

3 Термины и определения

4 Отношение к другим стандартам

5 Применение TBX

6 Основные принципы

     6.1 Общая информация

     6.2 Принципы, касающиеся группировки и представления категорий данных

7 Требования для файлов TBX

     7.1 Требования соблюдения

     7.2 Примеры несоблюдения

     7.3 Уровни внедрения

8 Модуль основной структуры

     8.1 Введение

     8.2 Иерархия

     8.3 Компоненты терминологического входа

     8.4 Элементы, которые могут появиться на многократных уровнях входа

     8.5 Элементы, которые встречаются только в уровне термина или ниже

     8.6 Обработка текста

     8.7 Элементы метаданных

     8.8 Признаки

     8.9 Проблемы кодировки

     8.10 Язык

9 Ограничения категории данных по умолчанию

     9.1 Введение

     9.2 Категории данных встроены в основную DTD структуры TBX

     9.3 Категории данных специализированные от категорий метаданных до файла XCS

10 Примеры

     10.1 Пример типичного файла TBX

     10.2 Примеры кодирования элементов TBX

     10.3 Примеры записей TBX

11 Ссылка на объекты

     11.1 Общая информация о ссылке

     11.2 Ссылка на файл, который включен в аппарат файла TBX

     11.3 Ссылка на файл от аппарата

     11.4 Ссылка на файл непосредственно во входе

     11.5 Ссылка на внешний источник

     11.6 Ссылка и документирование библиографического источника

     11.7 Ссылка и документирование информации об ответственном человеке или организации

     11.8 Ссылка на внешнюю систему понятия, систему классификации или тезаурус

     11.9 Ссылка на вход TBX из корпуса

12 Создание настроек TBX TMLs

     12.1 Общая информация о TMLs

     12.2 Пример файла XCS для определенного пользователями TBX TML

     12.3 Создание пользовательских имен списка выбора дисплея

Приложение А (обязательное) DTD для основного модуля структуры

Приложение В (обязательное) DTD для ограничений категории данных (файл XCS)

Приложение С (обязательное) Файл XCS по умолчанию

Приложение D (обязательное) Описания основных элементов структуры и признаков и категорий данных по умолчанию

Приложение Е (обязательное) Описания элементов и признаков для файла XCS

Приложение F (справочное) Интегрированная схема и другие ресурсы TBX

Приложение G (справочное) TBX-основной

Приложение H (справочное) Сумма изменений

Приложение I (справочное) Индексы

Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов ссылочным национальным стандартам Российской Федерации

Библиография

 

92 страницы

Дата введения01.09.2017
Добавлен в базу05.05.2017
Актуализация01.01.2021

Этот ГОСТ находится в:

Организации:

30.11.2016УтвержденФедеральное агентство по техническому регулированию и метрологии1906-ст
РазработанАНО ИБТ
ИзданСтандартинформ2017 г.

Systems to manage terminology, knowledge and content. TermBase eXchange (TBX)

Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ

СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ, БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ

Обмен терминологическими базами [TermBase exchange (ТВХ)]

(ISO 30042:2008, IDT)

Издание официальное

Москва

Стандартинформ

2017

Предисловие

1    ПОДГОТОВЛЕН Автономной некоммерческой организацией «Институт безопасности труда» (АНО «ИБТ») на основе собственного перевода на русский язык англоязычной версии международного стандарта, указанного в пункте 4

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 55 «Терминология, элементы данных и документация в бизнес-процессах и электронной торговле»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 30 ноября 2016 г. № 1906-ст

4    Настоящий стандарт идентичен международному стандарту ИСО 30042:2008 «Системы для управления терминологией, знаниями и содержанием. Обмен терминологическими базами [TermBase exchange (ТВХ)]» [ISO 30042:2008, «Systems to manage terminology, knowledge and content — TermBase exchange (TBX)», IDT],

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА

5    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ «О стандартизации в Российской Федерации». Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок— в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

© Стандартинформ, 2017

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

ГОСТ Р ИСО 30042-2016

6.2 Принципы, касающиеся группировки и представления категорий данных

В ТВХ существуют четыре общих типа категорий данных. Понимание, что эти общие типы означают и как они представлены, облегчит понимание остальной части настоящего стандарта.

Примечание — В этой спецификации названия атрибута определены в знаке (@) в приложении D и выделены курсивом.

категория данных модуля основной структуры

Категория данных модуля основной структуры — любая категория данных, которая определена в DTD модуля основной структуры. Например, <date>. <term> и <descrip>.

категория метаданных

Категория метаданных — категория данных модуля основной структуры, которая берет признак типа, такой как <descrip>. <admin> и <termNote>. Это — общая категория данных, которая используется для группировки целей и отражения метамодели в стандарте ИСО 16642. Каждое значение атрибута типа отражено примерами категории метаданных в определенную терминологическую категорию данных, которая определена согласно ИСО 12620. Значения атрибута типа определены в файле XCS. Например, признак <descrip type="definition"> включает категорию метаданных <descrip>. отраженную примерами в терминологическую категорию данных, которую называют /definition/согласно ИСО 12620.

категория данных, осуществленная как использование признака

Использование категории данных признака является терминологической категорией данных, которая определена согласно ИСО 12620, такой как /definition/, и которая определена как ценность признака имени в файле XCS. В случае документа ТВХ эти категории данных появляются как ценность признака типа на элементе категории метаданных. Ценность этих категорий данных — содержание их соответствующего элемента. Например, /definition/ категория данных, представленная через признак <descrip type="definition">, берет свободный текст в качестве своего содержания, и /gender/ категория данных, представленная в признаке ctermNote type="grammaticalGender">, берет одно значение рода из разворачивающегося списка значений.

категория данных, осуществленная как содержание элемента

Категория данных, осуществленная как содержание элемента, является простой категорией данных, т. е. одной ценностью закрытого набора ценностей (разворачивающийся список). Эти терминологические категории данных также зарегистрированы согласно ISO 12620. Они перечислены в файле XCS как допустимое содержание категории метаданных, имеющей значение атрибута определенного типа. Например, категория метаданных <termNote>, у которой есть значение атрибута типа ’termType', может содержать ограниченный набор ценностей, который включает сокращение, акроним и т. д. В интегрированной схеме RNG, которая упомянута в приложении F, содержание элемента ограничено к разворачивающемуся списку через вложенные правила Schematron (для ссылки на Schematron см. библиографию).

Использование категорий метаданных в структуре ТВХ облегчает модульность. Основная структура (которая остается постоянной) является одним модулем и особым файлом XCS (который выражает ограничения на основную структуру). Комбинация этих двух модулей определяет особый TML. Этот подход определяет TMF (ИСО 16642) как модуль основной структуры, соответствующий абстрактной модели данных TMF. Это показывает взаимосвязь двух TML в пределах структуры ТВХ (основная структура) и их отличие (выраженное как различия между их файлами XCS). Этот модульный подход совместим с общепринятыми принципами модульности в программировании, позволяя программисту/ аналитику изучить основную структуру и структуру XCS отдельно, без изучения сложных схем.

7 Требования для файлов ТВХ

7.1 Требования соблюдения

TML, чтобы быть совместимым с ТВХ, должен соответствовать следующим критериям:

1.    TML должен определить случаи документа XML, которые действительны согласно модулю основной структуры ТВХ. Модуль основной структуры описан в 8 модуле основной структуры и определен формально ТВХ DTD (приложение А).

2.    TML должен содержать свои категории данных и их ограничения в файле XCS (приложение В) для ограничений категории данных в файле XCS. TML, содержащий категорию данных, указанную в XCS, должен использовать эту категорию данных согласно своему описанию, приведенному в приложении С.

5

3. TML может включать меньше или больше категорий данных, чем указанные в XCS (приложение С), и все еще быть совместим с ТВХ при условии, что те категории данных выражены в файле XCS. Если TML будет включать категории данных, которые не находятся в XCS, то дополнительные категории данных должны быть описаны в заголовке файла XCS.

Примечание — Несколько общих ограничений, таких как формат даты, формально не определены в DTD или в XCS, но описаны в соответствующих частях настоящего стандарта, таких как приложение D. Эти ограничения должны также применяться для соблюдения ТВХ.

Расширение для случая документа ТВХ — .tbx, расширение случая документа XCS — .xcs.

Хотя случай документа XCS должен существовать, чтобы формально определить ТВХ TML, он не должен использоваться для проверки соблюдения условий. Инструменты проверки XML общего назначения не признают ограничения в файле XCS, если эти ограничения не были включены в интегрированную схему, такую как упомянутая в приложении F.

Проверка соблюдения ТВХ — нейтральный язык определения схемы. В настоящем стандарте описаны три типа проверки соблюдения:

DTD и XCS

DTD, представляющая основную структуру ТВХ, приведена в приложении А. Файл XCS, представляющий по умолчанию набор категорий данных и их ограничений, приведен в приложении С. С DTD и файлом XCS случай документа ТВХ может быть подтвержден при помощи контролера соблюдения, который специально предназначен для файлов ТВХ.

Понижение NG

Понижение файла схемы NG, представляющего основную структуру и набор категорий данных и их ограничений, упомянуто в приложении F. Этот файл включает Schematron для некоторых ограничений категории данных. При помощи этого файла можно утвердить случай документа ТВХ для соответствия ТВХ TML при помощи любого контрольного устройства XML, которое поддерживается NG и Schematron. Соответствующим программным обеспечением поддреживается интегрированная схема NG, которая могла быть произведена для другого TBXTML, основанного на его XCS.

Другие методы

Проверка соблюдения ТВХ также возможна с использованием других методов, которые включают информацию от модуля основной структуры и ограничений категории данных. Дополнительные методы могут быть зарегистрированы в сети LISA.

7.2 Примеры несоблюдения

Соблюдение ТВХ включает следующие аспекты:

1.    правильность XML;

2.    правильность относительно модуля основной структуры;

3.    приверженность ограничениям категории данных в файле XCS.

Следующий пример неправильно построен, так как у первого <descrip> элемента есть ошибка правописания в конечном тэге и <term> у элемента нет заключительного признака.

<term>kitten <descrip type='definition'>Small feline</deescrip>

Следующий пример правильно построен, но недействительна основная структура, так как модуль основной структуры ТВХ не позволяет <descrip> признаку следовать <tig>.

<langSet xml:lang="fr-ca">

<tig><term>zone de soufflage</term>

</tig>

<descrip type="definition">Area where snow is thrown by a snowplow.</descrip> </langSet>

Следующий пример действителен согласно DTD основной структуры ТВХ, но не придерживается XCS, так как нет никакой категории данных ТВХ, названной «conflagration» в файле XCS.

<term>kitten</term> <descrip type='conflagration'>Small feline</descrip>

6

ГОСТ Р ИСО 30042-2016

7.3 Уровни внедрения

Существуют три уровня внедрения ТВХ для данного приложения относительно особой терминологической базы данных.

Уровень 1

Приложение должно экспортировать и импортировать файлы ТВХ, которые правильно построены и которые придерживаются по крайней мере одного файла XCS, а приложение должно обнаружить, когда случаи документа не будут правильно построены, либо недействительна основная структура, либо отсутствует соответствие XCS. Уровень 1 поддерживает обмен между системами, которые используют тот же самый XCS.

Уровень 2

Приложение должно достигнуть уровня внедрения и импортировать каждую категорию данных, которая находится в XCS. Уровень 2 поддерживает импорт файлов ТВХ из любого внешнего источника, а экспорт может быть ограничен категориями данных, которые придерживаются файла XCS.

Уровень 3

Приложение, достигшее уровня 2 и имеющее возможность проверки XCS, который поддерживает перенос данных без потерь от терминологической базы данных в применении к ТВХ TML и обратно. Таким образом, как только информация в терминологической базе данных была экспортирована в ТВХ, терминологическая база данных может быть форматирована и впоследствии повторно загружена информацией из файла ТВХ.

8 Модуль основной структуры

8.1 Введение

Эта секция описывает модуль основной структуры для ТВХ. Элементы модуля основной структуры приведены в приложении А и описаны в приложении D. Для быстрого доступа ко всем этим элементам необходимо обратиться к индексу (приложение I).

Существует обмен информацией между элементами высокого уровня модуля основной структуры и метамодели TMF (ИСО 16642), показанной на рисунке 1. Терминологический сбор данных (TDC) соответствует случаю документа ТВХ.

TMF метамодель

Рисунок 1 — Структура высокого уровня метамодели TMF (ИСО 16642)

7

8.2 Иерархия

Элемент XML высшего уровня в случае документа ТВХ — <martif> элемент, который состоит из <martifHeader> элемента и <text> элемент (см. рисунок 2, структуру MARTIF). Эти названия элемента взяты из ИСО 12200 и имеют корни в тексте.

<text> элемент на рисунке 2 состоит из терминологических записей, которые приложены в пределах одного <body> элемента, и дополнительной информации (метаобразцовый класс объекта). В ТВХ дополнительная информация содержится в <back> элементе.

<martifHeader> элемент соответствует глобальной информации в метамодели TMF и состоит из описания целого терминологического сбора данных (в <fileDesc> элементе), информации о применимом файле XCS (в <encodingDesc> элементе) и истории пересмотров (в <revisionDesc> элементе). Информация о кодировке символов должна быть включена в заголовок, когда признаком кодирования декларации XML в случае документа ТВХ не будет Unicode.

Рисунок 2 — Структура MARTIF

8.3 Компоненты терминологического входа

Каждый терминологический вход понятия в <body> элемент называют <termEntry>, он следует за структурой метамодели TMF.

Группа auxlnfo на рисунке 3 соответствует информации, которая может быть связана с любым из трех уровней: первый уровень (<termEntry>, т. е. уровень понятия), языковой уровень (<langSet>) и уровень термина (<ntig> или его упрощенная версия <tig>). <termNote> и <termNoteGrp> элементы могут появиться в уровне термина и ниже. <termCompList> элемент соответствует классу объекта секции компонента термина метамодели TMF.

Иерархический вход (termEntry) указан в рисунке 3.

Рисунок 3 — Уровни терминологического входа

ГОСТ Р ИСО 30042-2016

8.4    Элементы, которые могут появиться на многократных уровнях входа

Следующие элементы (представленные как группа auxlnfo на рисунке 3, уровнях терминологического входа) могут появиться на любом из трех уровней входа.

<descrip>

Предоставляет описательную информацию о рассматриваемом узле. Тип описательной информации обозначен ценностью признака типа. Это может быть ограничено определенными уровнями входа в зависимости от ценности признака типа, как обозначено в файле XCS. Если дополнительная информация (административная) должна быть связана с описанием, то она может быть вложена в элемент <descripGrp>.

<descripGrp>

Содержит один <descrip> элемент, сопровождаемый нулем или больше <descripNote>. <admin>. <adminGrp>. <transacGrp>. <note>. <ref> и <xref> элементы.

<admin>

Содержит информацию административного характера для рассматриваемого узла, такого как источник информации, проект или клиент. Тип административной информации обозначен ценностью признака типа. Если дополнительная информация (примечание или ссылка) должна быть предоставлена, то она может быть вложена в элемент <adminGrp>.

<adminGrp>

Содержит один <admin> элемент, сопровождаемый нулем или больше <adminNote>. <note>. <ref> и <xref> элементы.

<adminNote>

Содержит некоторую административную информацию, такую как источник примечания или другого текста.

<transacGrp>

Содержит один <transac> элемент, сопровождаемый нулем или больше <transacNote>. <date>. <note>. <ref> и <xref> элементы. Содержит такую информацию, как дата заполнения, оператор. Дата определена <date> элементом, а имя человека или организации определено <transacNote> элементом.

Примечание — Любая дата во входе ТВХ должна появиться в пределах <transacGrp> элемента.

<note>

Содержит любой вид.

<ref>

Перекрестная ссылка, которая указывает на другой элемент в пределах <martif> элемента.

<xref>

Перекрестная ссылка, которая указывает на внешний объект (URL или другой веб-адрес).

8.5    Элементы, которые встречаются только в уровне термина или ниже

Уровень термина в иерархии входа упомянут как ntig и tig на рисунке 3. Самый верхний элемент в уровне термина может быть или <ntia>. или его более простой вариант <tia>.

Следующие элементы могут произойти в уровне термина.

<tia>

Предоставляет всю информацию о термине. Содержит один <term> элемент, сопровождаемый нулем или большим количеством <termNote> элементов, сопровождаемых любым из элементов, описанных в п. 8.4.

<ntia>

Предоставляет всю информацию о термине. Содержит более глубокую структуру, чем более простой вариант <tjg>. Содержит один <termGrp> элемент, сопровождаемый любым из элементов, описанных в п. 8.4. Этот элемент должен быть выбран вместо <tia>. если необходимо зарегистрировать компоненты термина в рамках того же самого входа.

<termGrp>

Содержит один <term> элемент, сопровождаемый произвольно, или <termNote>. или <termNoteGrp> элемент, и ноль или больше <termCompList> элементов.

<termNoteGrp>

Содержит один <termNote> элемент и ноль или больше <admin>. <adminGrp>,<transacGrp>,<note>, <ref> и <xref> элементы.

9

<termNote>

Обеспечивает различные типы информации о термине в зависимости от ценности типа. Может содержать информацию, такую как род или часть речи, ссылки на другие связанные условия, административную информацию, такиую как источник термина или в каких областях он используется и т. д. Следующие элементы могут появиться на уровне компонента термина.

<termCompGrp>

Содержит один <termComp> элемент, сопровождаемый произвольно, или <termNote>. или <termNoteGrp> элемент, и ноль или больше <admin>. <adminGrp> <transacGrp>. <note>. <ref> и <xref> элементы, которые относятся к термину.

<termCompList>

Показывает внутренний состав термина и состоит из любого из элементов, описанных в п. 8.4, сопровождаемого одним или несколькими <termComp> или <termCompGrp> элементами.

<termComp>

Содержит компонент термина, такого как одно из слов, из которых термин составлен. Может содержаться в <termCompGrp> или <termCompList>.

8.6 Обработка текста

8.6.1    Типы текста

В ТВХ существуют пять различных случаев, когда элемент может содержать текст. noteText

текст примечания

noteText— предприятие, определенное в основной DTD. Элементы, которые определены с этим предприятием, могут взять текст в качестве своего содержания, и сам текст может содержать некоторые предопределенные элементы. noteText используется текстовыми элементами, которые могут потребовать повышения значения <descrip type="definition"> или <termNote type="usageNote">. basicText основной текст

basicText — также предприятие, определенное в основной DTD. Элементы, которые определены с этим предприятием, могут взять текст в качестве своего содержания, плюс один или более <Ы> элементов, чтобы представлять более ограниченные действующие стили повышения, чем разрешенный, noteText. basicText используется <term> и подобными термину элементами, такими как <termNote type="shortFormFor">. plaintext обычный текст

plainText обращается к тексту без любого действующего повышения. Это соответствует понижению определения NG <rng:text/> и определению DTD PCDATA. Элементы, которые используют этот тип данных, можно считать символом, таким как <descrip type="subjectField"> и <admin type="productSubset">. text as markup текст как повышение

Некоторые элементы, такие как <bpt>. содержат текст, который фактически представляет повышение от другой системы, такой как система Translation Memory, которая должна быть сохранена в ТВХ. Эти элементы описаны в п. 8.6.2. picklist

разворачивающийся список

Некоторые элементы вносятся путем предопределенного набора элементов из разворачивающегося списка. Например, элемент <termNote type="grammaticalGender"> может только содержать одну из последовательностей обычного текста согласно XCS. Элементы из списка определены в файле XCS. Тип данных, поддержанный каждой категорией данных ТВХ, определен в разделе 9.

8.6.2    Действующие элементы повышения

ТВХ содержит пять элементов повышения в пределах категорий данных, имеющих тип данных noteText, как определено в п. 9.2. Эти элементы используются, чтобы определить язык или функцию текстовых последовательностей или позволить случаям документа ТВХ содержать различные виды другого повышения (такие как HTML или относящееся к обработке текстов повышение), который должен быть сохранен, но не должен быть обязательно обработан во время управления терминологией. Данные элементы описаны ниже.

10

ГОСТ Р ИСО 30042-2016

<foreian>

Иностранный — <foreian> элемент используется, чтобы отметить сегмент текста на иностранном языке. Дополнительный признак xml:lang может использоваться, чтобы определить язык текста, содержавшегося в данном элементе.

<Ш>

Основной момент — <hi> элемент разграничивает часть текста. Может использоваться для различных задач обработки, например, чтобы отметить математическое выражение или вызванный термин в определении или другом текстовом поле. <hi> элемент также допустим в пределах <term> элемента, чтобы отметить части условий. Например, есть условия, у которых есть характер в приписке, или суперподлиннике, или компоненте в пределах термина, который выделен курсивом или требует другого форматирования.

<bpt>

Начните соединенный признак — <bpt> элемент используется, чтобы разграничить первую из соединенной последовательности родных кодексов (например, HTML<strong> признак). Каждый <bpt> будет иметь соответствующий <ept> элемент после него в пределах того же самого исходного элемента.

<ept>

Закончите соединенный признак — <ept> элемент используется, чтобы разграничить вторую из соединенной последовательности родных кодексов (например, HTML </strong> признак). Каждый <ept> буду иметь соответствующий <bot> элемент перед ним в пределах того же самого исходного элемента.

<ph>

Заполнитель — <ph>. элемент используется, чтобы разграничить последовательность родных автономных кодексов в сегменте, который не соединен с другим элементом (например, XHTML <br/> код). Он не должен использоваться для замены кодов, которые находятся в логических парах.

У любого вложенного повышения должны быть любые знаки признака начала («<») или амперсанды (&), преобразованные в их соответствующие предприятия, &lt; и &атр; это преобразование позволяет повышению быть сохраненным и обработанным во время показа или импорта, не усложняя основную структуру ТВХ, при необходимости включать XHTML DTD в основную структуру. Любой вид основанного на тексте повышения, включая RTF, может быть заключен в капсулу в этих признаках и позже восстановлен без потери информации.

/ (внутреннее соответствие) признак используется, чтобы соединить <bpt> элементы с их соответствующими <ept> элементами. Этот механизм предоставляет ТВХ поддержку, позволяя повысить возможно накладывающиеся диапазоны кодов HTML:

This is <i>some <b>sample HTML</i> markup </b> with improper nesting.

Вышеупомянутое повышение было бы представлено следующим образом, используя <ept> и <bpt>:

This is <bpt i="l">&lt; ix/bpt>some <bpt i="2">&lt;bx/bpt>sample HTML<ept

i="l">&lt;/ ix/ept> markup <ept i="2">&lt; /bx/ept> with improper nesting.

Значения / будут уникальны в пределах исходного элемента <bpt> или <ept> элемент.

8.6.3    Признак xmklang

У каждого элемента, содержащего свободный текст, должен быть язык текста явного или унаследованного признака xml:lang. В ТВХ признак xml:lang не относится ни к каким признакам или их значениям.

8.6.4    Кодирование

В ТВХ весь текст должен быть в Unicode (ISO/IEC 10646). Есть три допустимых encodings Unicode: UTF-8, UTF-16 и семибитный ASCII со знаками не ASCII, представленными как ссылки характера ссылок на их кодовую точку Unicode. Ссылки характера ссылок должны быть представлены, как это определено в стандарте XML.

8.6.5    Математические выражения в ТВХ

Время от времени необходимо представлять математические выражения в случаях документа ТВХ, включая в рамках условий и определений. Для математических выражений, которые требуют форматирования, кроме того доступного в простом текстовом формате, когда требуется проверка DTD ТВХ и файла XCS, <Ы> может использоваться как элемент со значением атрибута типа 'математика'. Поскольку механизм DTD не оказывает поддержку для пространства имен XML механизм, содержание

11

этого элемента должно состоять из LaTeX — данные о формате (который не использует маркировку XML-стиля). Следующие примеры показывают, как LaTeX математические выражения могут быть включены в случай документа ТВХ (для получения дополнительной информации о LaTeX математическом форматировании следут проконсультироваться с группой пользователей ТеХ в www.tua.oraL Следует отметить, что любые случаи < или & в LaTeX последовательностях должны быть заменены соответствующими предприятиями &lt; и &атр;.

Математический пример #1:

<descrip type="definition">

результат определен выражением <hi type="math"> |С| = \sqrt{C,/v{2} + С,,л{2}} = \sigma_{2} / \epsilon_{2} </hi>

</descrip>

Графический эквивалент содержания <hi> элемента в этом примере является следующим:

\С\ = \]с'2 + С"222.

Математический пример #2:

<descrip type="definition">

отношение фактических к критическому демпфированию, где критическое демпфирование состоит в том, которое требуется для пограничного условия между колебательным и неколебательным поведением. Демпфирование порции является функцией логарифмического декремента L: Это безразмерное уравнение: <hi type="math"> \ mu = \fгас{A/2\pi}{\sqrt{1+(a/2\pi)Л2}} = \sin \arctan (A/2\pi)

</hi> Для маленьких ценностей <hi type="math">A/\mu = A/2\pi</hi>

</descrip>

Два случая of <Ы> могут быть графически представлены следующим образом:

= А12я _ _ sin arctanj д / 2Я\

,/l + («/2*)2

и

А!ц = А!2л.

При желании MathML namespace может использоваться вместо LaTeX повышения. Однако если использовать основную DTD структуры для проверки, то некоторая предварительная обработка будет требоваться, а именно комментарии или удаление элементов пространства имен MathML. Проверка MathML невозможна с основной DTD. Обработка не требуется при схеме, которая поддерживает пространство имен XML.

8.7 Элементы метаданных

Элемент метаданных — элемент, у которого могут быть многократные различные модели содержания, один для каждой различной ценности его признака типа. Сохраняя название элемента постоянным, далее определяя элемент на уровне признака, элемент метаданных служит цели группировать категории данных, у которых есть общие признаки. Например, <descrip> элемент, содержащий различные описания, и <termNote> элемент, содержащий различную информацию об условиях. Ограничения содержания элементов метаданных определены XCS или в интегрированной схеме, такой как в Приложении F. Комбинация названия элемента и ценность его признака типа соответствуют категории данных, как определено в ИСО 12620. Например, элемент <descrip type="definition"> соответствует /definition/ категории данных от ИСО 12620.

Элементы метаданных в ТВХ:

- <termNote>

-    <termCompList>

-    <admin>

ГОСТ Р ИСО 30042-2016

-    <adminNote>

-    <transac>

-    <transacNote>

-    <descrip>

-    <descripNote>

-    <ref>

-    <xref>

-    <refObiectList>

Существует два случая, где категория данных не определена ценностью признака типа на элементе метаданных, который это логически описывает. Первый случай включает элементы данных о списке, т. е. <termCompList> и <refObiectList>. Эти два элемента данных берут признак типа, но значение этого признака типа фактически относится к компонентам списка, а не к самому списку. Например, для <termCompList> допустимые признаки типа включают ‘hyphenation', ‘морфологический элемент' и т. д. Эти особенности логически относятся к термину в списке, а не к самому списку. Это пример принципа наследования, где последующие элементы наследуют признаки типа исходных элементов.

Второй случай включает элементы данных группы, такие как <transacGrp> и <descripGrp>. Ни одному из этих элементов не разрешено иметь признак типа. Вместо этого тип группы обозначен в содержании ее основного последующего элемента. См. пример transacGrp в 10.3.4. Это показывает, что тип сделки, которая <transacGro> описывает, обозначен как содержание последующего элемента <transac>. Это — пример принципа обратного наследования.

В отличие от других элементов метаданных, элементы <adminNote> и <transac> иллюстрируются примерами как один datacategory, потому что у них есть только одна допустимая ценность их признака типа, т. е. <adminNote> берет только признак типа ‘sourceType1, и <transac> берет только признак типа ‘transactionType'. Однако их все еще считают элементами метаданных, потому что в целях расширяемости новые значения атрибута типа могли быть определены группой пользователей в таможенном файле XCS.

8.8 Признаки

Главными признаками, используемыми в ТВХ, являются xml:lang (язык), id (чтобы определить элемент уникально в рамках документа XML) и цель (чтобы указать на другой элемент или внешний объект). Ценность признака xml:lang наследуется вниз через подразумеваемую древовидную структуру документа XML, если это не отвергнуто другим признаком xml:lang. <martif> элемент требуется, чтобы иметь признак xml:lang. Язык, определенный в <martif> элементе, становится рабочим языком всего файла ТВХ. Каждый <lanaSet> элемент должен также определить язык, который относится к языковой секции, при этом становится языком объекта и рабочим языком языковой секции. Таким образом, содержание <descrip тип="определение"> элемент в первом уровне, как предполагается, находится на рабочем языке файла ТВХ, если иначе не определено, и примечание в языковой секции, как предполагается, находится на том же самом языке как языковая секция, если иное не определено явным признаком хглИалд. Допустимые значения признака xml:lang в ТВХ найдены в IETF RFC 4646 или его преемнике, как определено в IETF ВСР 47.

Id и целевые признаки взаимосвязаны и указывают на однозначность между элементами в том же самом файле ТВХ. Например, один вход:

<termEntry id="eid-database-5574">

. . . ( вход для "охотничья собака")

</termEntry>

мог быть указан другим входом:

<termEntry>

<descrip    type="superordinateConceptGeneric"    target="eid-database-

5574">охотничья собака </descrip>

... (вход для "ретривера" [тип охотничьей собаки])

</termEntry>

13

Содержание «охотничья собака» во втором входе дано для примера. Это обеспечивает видимую этикетку для связи с целевым входом.

Целевой признак указывает на внешний объект.

8.9    Проблемы кодировки

Множество мнемонических предприятий приведено в ИСО 12200, но ТВХ имеет более строгие требования. Могут быть использованы ссылки характера и мнемонические предприятия, встроенные в XML. Это должно уменьшить бремя на установленном порядке импорта, который не может содержать все мнемонические предприятия характера, которые могли бы использоваться. Файлы с данными ТВХ должны быть в одном из трех encodings Unicode: a) UTF-16, b) UTF-8 или с) чистый 7-битный ASCII (ISO/ IEC 646), в котором знаки не-ASCII закодированы как восемь знаков ASCII, использующих ссылку характера XML (таких как &#1103;), а также пять знаков, предопределяющих предприятия XML: кавычка, амперсанд, апостроф, знаки «меньше» и «больше».

Такие ссылки характера автоматически преобразованы в удобочитаемые знаки, в том случае когда файл сданными XML, содержащий их, показан в различных типах программного обеспечения, которое может отображать файлы XML. Этот третий тип кодирования можно формально считать UTF-8, хотя он и не использует метод UTF-8 кодирования знаков, кодовая точка которых выше 127.

8.10    Язык

<martif> и <langset> элементы — единственные элементы, для которых признак xml:lang обязателен.

На <martif> элементе этот признак указывает на рабочий язык случая документа ТВХ. Это относится ко всем элементам в случае документа ТВХ (если не исключено другим признаком xml:lang, таким как <langset> элемент).

На <langset> элементе этот признак указывает и на рабочий язык, и на язык объекта соответствующей языковой секции. Если не исключено другим признаком xml:lang на последующем элементе, содержание всех элементов в языковой секции, как предполагается, находится на языке, определенном xml:lang признаком <langset> элемента. Это не относится к содержанию элементов, которые являются элементами разворачивающегося списка, как определено в файле XCS. Чтобы изменить язык элемента в языковой секции, кроме важности xmklang признака <langset> элемента необходимо использовать признак xmlilang на этом элементе.

9 Ограничения категории данных по умолчанию

9.1 Введение

Эта секция описывает категории данных ТВХ и их ограничения. Эти категории данных и ограничения формально описаны в приложении D. Случай документа ТВХ может быть утвержден против категорий данных по умолчанию и ограничен при помощи файла XCS, который приведен в приложении С.

XCS по умолчанию не единственный XCS, который может использоваться для ТВХ-управляемыхтерминологических баз данных. Особые группы пользователей могут определить свой собственный файл XCS.

Рекомендации для кодирования категорий данных как элементы XML даны в п. 10.2.

Категории данных в следующих таблицах организованы в группах, которые отражают общее содержание или цель. Каждая категория данных, кроме категорий исходных данных, встроенных в основную DTD в первой секции ниже, связана с метамоделью, будучи классифицированной или как административная, или как описательная. Описательные категории данных описывают или понятие, или термин. За немногим исключением категории данных, которые используют элемент <descrip>. описывают понятие, а категории данных, которые используют элемент <termNote>. описывают термин. Все категории данных, которые используют элемент <admin> — административные. Категория данных, которой указывают целевой признак (как обозначено в XCS), указывает на отношение к другой информации, такой как другой термин, или понятие, или библиографическая ссылка.

Категории данных в п. 9.2 осуществлены непосредственно как элементы ТВХ или признаки в DTD основной структуры. Остальные таблицы содержат категории данных, которые являются специализациями (через ценности признака типа) категорий метаданных, которые определены в DTD основной структуры. Первая колонка — уникальное имя категории данных (по ИСО 12620). Вторая колонка (тип данных) указывает, какой текст позволен в элементе. Третья колонка указывает, может ли этот элемент взять целевой признак, когда это указывает, какой элемент может быть предназначен. Четвертая колонка

ГОСТ Р ИСО 30042-2016

Содержание

1    Область применения..................................................................1

2    Нормативные ссылки..................................................................1

3    Термины и определения...............................................................1

4    Отношение к другим стандартам........................................................4

5    Применение ТВХ.....................................................................4

6    Основные принципы..................................................................4

6.1    Общая информация...............................................................4

6.2    Принципы, касающиеся группировки и представления категорий данных...................5

7    Требования для файлов ТВХ...........................................................5

7.1    Требования соблюдения...........................................................5

7.2    Примеры несоблюдения...........................................................6

7.3    Уровни внедрения.................................................................7

8    Модуль основной структуры............................................................7

8.1    Введение........................................................................7

8.2    Иерархия........................................................................8

8.3    Компоненты терминологического входа...............................................8

8.4    Элементы, которые могут появиться на многократных уровнях    входа......................9

8.5    Элементы, которые встречаются только в    уровне термина или    ниже.......................9

8.6    Обработка текста................................................................10

8.7    Элементы метаданных............................................................12

8.8    Признаки.......................................................................13

8.9    Проблемы кодировки.............................................................14

8.10    Язык..........................................................................14

9    Ограничения категории данных по умолчанию............................................14

9.1    Введение.......................................................................14

9.2    Категории данных встроены в основную DTD структуры ТВХ............................15

9.3    Категории данных специализированные от категорий метаданных до файла XCS...........15

10    Примеры..........................................................................20

10.1    Пример типичного файла ТВХ.....................................................20

10.2    Примеры кодирования элементов ТВХ..............................................22

10.3    Примеры записей ТВХ...........................................................22

11    Ссылка на объекты.................................................................25

11.1    Общая информация о ссылке.....................................................25

11.2    Ссылка на файл, который включен в аппарат файла ТВХ..............................25

11.3    Ссылка на файл от аппарата......................................................26

11.4    Ссылка на файл непосредственно во входе.........................................26

11.5    Ссылка на внешний источник.....................................................26

11.6    Ссылка и документирование библиографического источника...........................27

11.7    Ссылка и документирование информации об ответственном человеке или организации.....28

11.8    Ссылка на внешнюю систему понятия, систему классификации или тезаурус..............29

11.9    Ссылка на вход ТВХ из корпуса....................................................29

12    Создание настроек ТВХ TMLs........................................................29

12.1 Общая информация о TMLs......................................................29

ГОСТ Р ИСО 30042-2016

указывает, какая категория метаданных используется для этой категории данных. Пятая колонка указывает на уровни в метамодели, в которой может появиться особая категория данных.

Если типом данных является разворачивающийся список, то содержание элемента ограничено предопределенным набором ценностей, иногда называемых областью стоимости. Элементы разворачивающегося списка определены в соответствующей метакатегории данных колонке, где они перечислены как допустимые признаки содержания элемента. Ценности разворачивающегося списка также определены в XCS. Группы пользователей могут выбрать свои собственные признаки показа для этих разворачивающихся списков, как описано в п. 12.3.

Примечание — Значения самих элементов разворачивающегося списка в настоящем стандарте не определены. Чтобы получить информацию о значении ценностей разворачивающегося списка, обратитесь к ИСО 12620.

По умолчанию <admin> элементы могут появиться на любом уровне, a <descrip> элементы могут появиться при входе, языке или названном уровне, если это не ограничено определенным уровнем в XCS. В файле XCS уровни выражены с помощью <levels> элемента с дополнительнными элементами termEntry (первый уровень термина), langSet (языковой уровень секции) или термин (уровень термина). Четвертый возможный уровень для отдельных компонентов термина выражен <fortermcompgrp> элементом. Элемент <termNote> может появиться только на уровне термина, если не разрешено (<fortermcompgrp> элементом) появление на уровне компонента термина.

Категории данных, которые не ограничены разворачивающимся списком в ТВХ XCS, могут быть ограничены разворачивающимся списком в подмножестве группы пользователей XCS (см. п. 12.1). Одним из очевидных вариантов на группу пользователей разворачивающегося списка является partOfSpeech.

9.2 Категории данных встроены в основную DTD структуры ТВХ

9.2.1 Элементы

Наименование

Тип данных

Цель

Элемент

Начните соединенный признак

Простой текст

Нет

<bpt>

Дата

Дата (ISO-формат)

Нет

<date>

Закончите соединенный признак

Простой текст

Нет

<ept>

Внешний

Текст примечания

Нет

<foreian>

Основной момент

Простой текст

Элемент

<ы>

Примечание

Текст примечания

Нет

<note>

Заполнитель

Простой текст

Нет

<ph>

Термин

Основной текст

Нет

<term>

9.2.2 Признаки

Наименование

Тип данных

Признак

Elementldentifier

C DATA

id

Lang

Языковые коды

xmtlang

Link

С DATA, IDREF

Цель

9.3 Категории данных, специализированные от категорий метаданных до файла XCS

9.3.1 Свойства и описания понятий

Эти категории данных описывают свойства понятий. Некоторым разрешают в термине уровень.

Наименование

Тип данных

Цель

Категория

метаданных

Уровень

Аудио

Обычный текст

binaryData

<descriD>

langSet, termEntry, term

15

ГОСТ Р ИСО 30042-2016

12.2    Пример файла XCS для определенного пользователями ТВХ TML......................30

12.3    Создание пользовательских имен списка выбора дисплея.............................31

Приложение А (обязательное) DTD для основного модуля структуры ..........................33

Приложение В (обязательное) DTD для ограничений категории данных (файл XCS)..............38

Приложение С (обязательное) Файл XCS по умолчанию.....................................40

Приложение D (обязательное) Описания основных элементов структуры и признаков

и категорий данных по умолчанию..........................................48

Приложение Е (обязательное) Описания элементов и признаков для файла XCS................69

Приложение F (справочное) Интегрированная схема и другие ресурсы ТВХ.....................74

Приложение G (справочное) ТВХ-основной................................................75

Приложение Н (справочное) Сумма изменений.............................................76

Приложение I (справочное) Индексы.....................................................80

Приложение ДА (справочное) Сведения о соответствии ссылочных международных стандартов

ссылочным национальным стандартам Российской Федерации.................84

Библиография........................................................................85

IV

ГОСТ Р ИСО 30042-2016

Введение

Настоящий стандарт определяет основанную на XML структуру представления структурированных терминологических данных, называемых обменом терминологическими базами [TermBase (ТВХ)]. В пределах этой структуры может быть определено множество терминологических языков разметки (TMLs). TML, определенный ТВХ, может облегчить обмен терминологическими данными между пользователями, переводчиками и писателями, использующими инструменты распознавания текста и компьютерного перевода, а также программное обеспечение для авторинга. TML может быть ориентирован как на пользователя, так и на машины — ориентирование на терминологические данные. Таким образом, это может позволить использовать поток терминологической информации всюду по информационному производственному циклу, как внутри организации, так и с внешними поставщиками услуг.

Целевая аудитория этого документа состоит из двух групп: 1) программисты и аналитики, которые хотят развить приложения и которые обрабатываютТВХ-послушные файлы сданными; 2)терминологи и другие языковые специалисты, которые хотят проанализировать терминологический сбор данных для представления в ТВХ или понять файл ТВХ.

Эта версия ТВХ представляет собой обновление версии, которая была издана Ассоциацией локализации отраслевых стандартов [Localization Industry Standards Association (LISA)] в 2002 г. Среди других улучшений текущая версия обеспечивает ссылку на интегрированную схему, которая включает модуль основной структуры и ограничения категории данных в объединенных декларациях, используя языки Relax NG и Schematron. Данная версия обеспечивает также ссылку на ТВХ, совместимый cTML, под названием TBX-Basic.

Пользователям настоящего стандарта необходимо сначала изучить его содержание (разделы 1—12). Предложенное использование приложений А—I описано ниже.

1)    Модуль основной структуры ТВХ

Все TMLs в рамках структуры ТВХ имеют одинаковую основную структуру. Модуль основной структуры описан в разделе 8. DTD для модуля основной структуры описаны в приложении А. Элементы, признаки и типы данных описаны в приложении D и перечислены в алфавитном порядке в приложении I.

2)    Модуль XCS

TMLs могут отличаться относительно того, какие категории данных разрешены и на каких уровнях терминологического входа эти категории данных могут произойти. Эти ограничения на основную структуру, которые определяют особый TML, формально представлены в файле XCS. DTD для модуля XCS описана в приложении В. Элементы и признаки описаны в приложении Е и перечислены в алфавитном порядке в приложении I.

3)    Принимаемый по умолчанию XCS ТВХ

ТВХ, принимаемый по умолчанию TML, ограничен принимаемым по умолчанию файлом XCS. Принимаемый по умолчанию ТВХ XCS описан в разделе 9. Принимаемый по умолчанию XCS представлен в приложении С. Категории данных описаны в приложении D и перечислены в алфавитном порядке в приложении I.

4)    Проверка соблюдения случаев документа ТВХ

После ТВХ TML определена с помощью XCS, экземпляр ТВХ-документа может быть проверен на соответствие этому TML. Требования для соблюдения находятся в разделе 7. Можно использовать множество методов и схемы определения языков, чтобы проверить соответствие. В частности, Relax NG, упомянутый в приложении F, может использоваться, чтобы проверить, совместим ли случай документа ТВХ с ТВХ, принимаемым по умолчанию TML. В приложении F также указано, где пользователь ТВХ может найти дополнительные ресурсы для проверки соблюдения. Другой ТВХ TML, названный ТВХ-основным, упомянут в приложении G.

5)    Изменения, которые были внесены в ТВХ, начиная с его представления ISO в феврале 2007 г., приведены в приложении Н.

Резюме приложений:

A: DTD для модуля основной структуры

V

ГОСТ Р ИСО 30042-2016

В: DTD для модуля XCS

С: XCS по умолчанию, который определяет ТВХ по умолчанию TML

D: Описания основных элементов структуры и ее признаков

Е: Описания элементов XCS и ее признаков

F: Relax NG и другие ресурсы для соблюдения соответствия

G: Ссылка на TBX-Basic

Н: Резюме изменений ТВХ

I: Индексы (алфавитные списки элементов и категорий данных)

VI

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ,

БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ

Обмен терминологическими базами [TermBase exchange (ТВХ)]

Systems to manage terminology, knowledge and content. TermBase exchange (TBX)

Дата введения — 2017—09—01

1    Область применения

Настоящий стандарт определяет структуру ТВХ, разработанную для поддержки различных типов обработки терминологических данных, включая анализ, описательное представление, распространение и обмен в различных информационных средах. Основная цель ТВХ — обмен терминологическими данными. Области применения по назначению включают перевод и создание.

ТВХ является модульный системой поддержки переменных типов терминологических данных или категорий данных, которые включены в различные терминологические базы данных (терминологические базы). ТВХ включает в себя два XML-модуля: основная структура и форма для идентификации ряда категорий данных и их ограничений. Термин в ТВХ относится к структуре, состоящей из этих двух взаимодействующих модулей.

ТВХ позволяет максимизировать совместимость фактических терминологических данных, а также обеспечить набор категорий данных, которые используются в терминологических базах данных. Подмножества или супернаборы категорий данных по умолчанию могут использоваться в пределах структуры ТВХ, чтобы поддержать определенные пользовательские требования.

2    Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие международные стандарты. Для датированных ссылок применяют только указанные издания. Для недатированных ссылок применяют самые последние издания (включая любые изменения и поправки).

ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of dates and times (Элементы данных и форматы для обмена информацией. Обмен информацией. Представление дат и времени)

ISO 12620, Language resource management — Morpho-syntactic annotation framework (MAF) (Терминология, другие языковые ресурсы и ресурсы содержания. Спецификация категорий данных и ведение реестра категорий данных для языковых ресурсов)

3    Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

3.1 анализ (analysis): Идентификация элементов и структура терминологического сбора данных.

Издание официальное

3.2    затемнение (blindness): Собственность формата данных, указывающего на степень, до которой данные достаточно определены, что делает ненужным для импортера устанавливать контакт с создателем данных для того, чтобы интерпретировать их.

Примечание — Термин «затемнение» возникает в технической фразе «передача без подтверждения приема», которая относится к передаче данных, где нет необходимости «видеть», кто отправитель данных, чтобы интерпретировать его. В терминологии понятие затемнения часто используется в контексте слепого обмена (3.3).

3.3    слепой обмен (blind interchange): Способность получить файл терминологии и объединить его в целевую систему, такую как машинный инструмент перевода [Computer-Assisted Translation (CAT)], не имея необходимости связываться с создателем файла, чтобы понять его содержание.

Примечание — Обмен, который является совершенно слепым, не требует никакой связи между отправителем и управляющим данными. Из-за различий между терминологическими сборами данных и форматами повышения совершенно слепой обмен редок. Как правило, некоторые данные в сборе данных слепые (может быть обмен без потери и без связи между сторонами), а некоторые данные требуют связи между сторонами, чтобы быть обмененными.

3.4    дополнительная информация; Cl (complementary information): Информация, дополнительная к изложенной в терминологических записях и разделенная через терминологический сбор данных.

[ИСО 16642:2003]

Примечание — В случае документа ТВХ дополнительная информация содержится в аппарате.

3.5    модуль основной структуры (core-structure module): Спецификация XML элементов и признаков, которые разрешены в файле ТВХ.

Примечание — Модуль основной структуры определен в DTD, которая используется в тандеме с файлом XCS, который применяет дополнительные ограничения категории данных. Это может также использоваться, чтобы произвести интегрированную схему, такую как «понижение схемы» NG [ИСО 19757-2], которая определяет и модуль основной структуры, и ограничения категории данных в одном файле. См. также ограничение категории данных (3.7).

3.6    категория данных (data-category): Результат спецификации данного поля данных.

[ИСО 1087-2:2000]

Пример — /частьречи/,/грамматическое число/.

Примечание 1 — Набор по умолчанию категорий данных для ТВХ был прежде всего отобран из ИСО 12620:1999.

Примечание 2—В бегущем тексте названия категории данных установлены от использования передовых разрезов и курсива. В случае документа ТВХ случай верблюда (например, <termNote type="partOfSpeech">noun</ termNote>) должен использоваться вместо того, чтобы использовать белое пространство между словами.

3.7    ограничение категории данных (data-category constraint): Спецификация ценности признака, содержания элемента одного или более структурных уровней, который ограничивает применение категории метаданных (3.16).

Примечание — Ограничения категории данных определены в файле XCS и используются в тандеме с DTD, который определяет модуль основной структуры. Они могут также быть включены в интегрированную схему, такую как «понижение схемы» NG, которая включает и модуль основной структуры, и ограничения категории данных в один файл. См. также модуль основной структуры (3.5).

3.8    файл данных (data file): Последовательность байтов, которая или сохранена на диске в традиционной файловой системе, или передана как поток данных по сети.

3.9    расширяемая ограничительная спецификация XCS (extensible Constraint Specification): Файл XML, который определяет категории данных и их ограничения для определенного ТВХ TML (3.21).

3.10    расширение (extension): Все количество объектов, которым соответствует понятие.

[ИСО 1087-1:2000]

3.11    глобальная информация; Gl (global information): Техническая информация и административная информация, относящаяся ко всему сбору данных.

[ИСО 16642:2003]

Примечание — В случае документа ТВХ глобальная информация содержится во вступительной части.

3.12    усилие (intension): Набор особенностей, который составляет понятие.

[ИСО 1087-1:2000]

ГОСТ Р ИСО 30042-2016

3.13    обмен (interchange): Операционные данные об экспорте вовлечения от одного терминологического сбора данных и импортирования его в другой терминологический сбор данных.

3.14    аннотация (lemma): Лексическая единица, выбранная согласно лексикографическим соглашениям представлять различные формы флективной парадигмы.

[ИСО 1951:2007]

3.15    лемматизировать (lemmatize): Преобразовать флективную форму слова к его аннотации (3.13).

3.16    преобразование без потерь (lossless roundtrip): Серия процедур манипулирования данными, посредством чего данные произведены от базы данных в формат обмена и затем повторно импортированы в ту же самую базу данных без потери информации.

3.17    категория метаданных (meta data-category): Группировка подобных категорий данных вместе.

Примечание — Категория метаданных эквивалентна напечатанному элементу по ИСО 16642. Категория метаданных иллюстрируется примерами в терминологическую категорию данных через ценность ее признака типа.

Пример — В признаке <descrip type="definition"> категория метаданных descrip и терминологическая категория данных /definition/.

3.18    регистр метаданных (metadata registry): Информационная система для регистрации метаданных.

Примечание — Связанный информационный запас или база данных.

3.19    язык объекта (object language): Язык, описываемый в <langSet>.

Пример — В элементе <langSet xml:lang='fr-FR> язык объекта французский.

Примечание — См. также рабочий язык (3.28).

3.20    структурный уровень (structural level): Уровень метамодели, к которой могут быть приложены информационные единицы.

[ИСО 16642:2003]

3.21    TML (ТВХ): TML (3.27), который придерживается ТВХ (3.26).

Примечание — Лица, осуществляющие внедрение ТВХ TML, могут использовать или не использовать файл XCS (вместе с DTD, представляющей основную структуру) в целях проверки. Некоторые могут использовать интегрированную схему вместо этого.

3.22    ТВХ по умолчанию TML (ТВХ-default TML): ТВХ (3.26) и его выбор по умолчанию категорий данных (3.6) и их ограничения в XCS (3.9) файл.

3.23    случай документа ТВХ (ТВХ document instance): Файл, содержащий терминологические записи в ТВХ TML (3.21) формате.

3.24    терминологическая база данных (terminological database): База данных, включающая информацию о специальных языковых понятиях и условиях, определяемых, чтобы представлять эти понятия наряду со связанной концептуальной и административной информацией.

3.25    компонент термина (term component): Одно из слов, включающих термин мультислова или компонент, таких как морфема, термина изолированного слова.

3.26    обмен базами данных ТВХ (TermBase exchange): Структура, состоящая из основной структуры и формализма [расширяемая ограничительная спецификация (3.9)], для идентификации ряда категорий данных (3.6) и их ограничения, выраженные в XML.

3.27    терминологический язык разметки; TML (terminological markup language): Заявление XML на описание терминологического сбора данных, соответствующего ограничениям, выражено в ИС016642 (Терминологическая структура повышения).

Примечание 1 —Адаптированное из ИСО 16642:2003.

Примечание 2 — TBXXCS включает TML под названием TBXTML (3.22). TBX-Basic является также TML.

3.28    рабочий язык (working language): язык, по умолчанию использующийся в терминологических записях.

Примечание — См. также язык объекта (3.19).

3

4    Отношение к другим стандартам

Основы для ТВХ были установлены следующими тремя международными стандартами:

-    ИСО 16642:2003 (TMF) определяет структурную метамодель для ТВХ и другого TML;

-    ИСО 12620 обеспечивает инвентарь категорий данных для терминологических данных;

-    ИСО 12200:1999 (MARTIF) обеспечивает основу для основной структуры ТВХ и XML, стилей его элементов и признаков.

Особый TML требует выбора стиля XML и выбора категорий данных. Большинство категорий данных из ТВХ-неплатежа TML были выбраны из ИСО 12620:1999, и стиль XMLTBX был принят от ИСО 12200. Таким образом, ТВХ основывается на стандартах ИСО 16642, ИСО 12620 и ИСО 12200.

5    Применение ТВХ

ТВХ разработан, чтобы облегчить следующие случаи использования:

Поддержка обмена:

-    поток терминологических данных между технологиями и системами;

-    интеграция терминологических данных из многократных источников;

-    преобразование данных, требуемое изменением в заявлениях или технологиях.

Распространение, включая:

-    сверку многократных терминологических баз данных через единственный пользовательский интерфейс и через общий промежуточный формат на партии или динамическом основании;

-    общий промежуточный формат на партии или динамическом основании;

-    размещение данных на интернет-сайте для загрузки заинтересованными сторонами;

-    создание записей, которые требуют общедоступной обработки путем обратной связи;

-    предоставление доступа к терминологии в электронном виде через веб-сервис.

Анализ и представление, включая:

-    сравнение содержания различных терминологических баз данных;

-    анализ возможных потерь данных при их преобразовании из одной терминологической базы в другую;

-    проектирование новой терминологической базы данных с минимальными потерями данных во время преобразования.

6    Основные принципы

6.1 Общая информация

Структура ТВХ основана на предположении, что в связи с разнообразием терминологических сборов данных и сценариев использования никакой терминологический язык повышения не удовлетворил бы все пользовательские требования.

Чтобы максимизировать совместимость, рекомендуется, чтобы лица, осуществляющие внедрение ТВХ, придерживались стандартов ISO, управляющих принципами и методологиями управления терминологией и содержанием и качеством терминологических ресурсов, таких как указанные в разделе 2 и библиографии. Рекомендуется выбирать и использовать для терминологических баз данных категории, которые определены в настоящем стандарте. Расширения вне тех категорий данных и ограничения должны быть взяты от ИСО 12620, если это возможно. Основные принципы терминологических данных, такие как степень детализации данных, данные elementarily, воспроизводимость данных и автономия термина, описаны в других стандартах ISO ТС 37.

Информация, представленная в случае документа ТВХ, должна быть ориентирована на понятие. Условия в единственном входе, как предполагается, синонимичны, если не указано иное.

ТВХ позволяет представлять различные виды информации об отдельных условиях, которые отличают их от других условий в одном понятии. Это встречается в ситуациях, когда термин на одном языке может быть таким же термином на другом языке, а обратное невозможно из-за частичной эквивалентности. Следует отметить, что один термин может быть почти идентичным понятию в отдельных связанных записях. ТВХ может отразить оба подхода.

4