ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ, БИБЛИОТЕЧНОМУ И ИЗДАТЕЛЬСКОМУ ДЕЛУ
КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ СЛОВАРЕЙ ИНФОРМАЦИОННЫХ ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ ДАННЫХ
СОДЕРЖАНИЕ ЗАПИСИ
ГОСТ 7.47-84
Издание официальное
ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР ГО СТАНДАРТАМ М о с и ■ а
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ, БИБЛИОТЕЧНОМУ И ИЗДАТЕЛЬСКОМУ ДЕЛУ
КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ СЛОВАРЕЙ ИНФОРМАЦИОННЫХ ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ ДАННЫХ
СОДЕРЖАНИЕ ЗАПИСИ
ГОСТ 7.47-84
Издание официальное
МОСКВА—1984
Государственным комитетом СССР по стандартам Государственным комитетом СССР по науке и технике Академией наук СССР
Государственным комитетом СССР по делам изобретений и открытий
Министерством авиационной промышленности Министерством судостроительной промышленности
ИСПОЛНИТЕЛИ
В. И. Федосимов, Г. Г. Белоногов, А. В. Веселовский, Ю. В. Сипапин,
A. А. Полтев, Л. Ю. Герасимов, Э. П. Зарубин (руководители темы),
B. А. Гарбарчик, В. Н. Бслоозеров, Л. П. Веряскина, Н. Д. Кравченко, Е. Н. Казаков, В. С. Горбаченко, А. Б. Антопольский, Ю. Ф. Протопопов, Ю. П. Венедиктов
ВНЕСЕН Государственным комитетом СССР по стандартам
Зам. председателя В. И. Кипаренко
УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Государственного комитета СССР по стандартам от 28 февраля 1984 г. № 707
© Издательство стандартов, 1984
УДК 001.4(038):025.4.036:006.354 Группа Т62
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
Система стандартов по информации, библиотечному и издательскому делу
КОММУНИКАТИВНЫЙ ФОРМАТ ДЛЯ С ПОВАРЕН ИНФОРМАЦИОННЫХ ЯЗЫКОВ И ТЕРМИНОЛОГИЧЕСКИХ ДАННЫХ
Содержание записи
System of standards on information, libraries and publishing. Communicative format for vocabularies of information retrieval languages and terminological data. Content of records
ОКСТУ 0007
Постановлением Государственного комитета СССР по стандартам от 28 февраля 1984 г. № 707 срок введения установлен
с 01.01.85
Настоящий стандарт устанавливает коммуникативный формат записи лексической информации на магнитной ленте, в том числе содержание записи, состав и идентификацию элементов данных.
Стандарт распространяется на представление на магнитной ленте лексики словарей информационных языков, терминологических и других лексикографических источников для обмена между автоматизированными информационными системами и обязателен для органов научно-технической информации.
Обозначение настоящего коммуникативного формата ФОЛИЯ — формат обмена лексикой информационных языков.
В части представления информационно-поисковых тезаурусов стандарт следует применять совместно с ГОСТ 7.25-80.
1. ОБЩИЕ ПОЛОЖЕНИЯ
1.1. Коммуникативный формат используют для записи на магнитной ленте информации из следующих лексикографических источников:
одноязычные информационно-поисковые тезаурусы;
многоязычные информационно-поисковые тезаурусы;
рубрикаторы (классификации) научно-технической информации (включая УДК и Рубрикатор ГАСНТИ);
Стр. 2 ГОСТ 7.47-84
списки (словари) предметных рубрик;
стандарты на термины и определения;
терминологические словари и справочники.
1.2. Коммуникативный формат предназначен только для обмена данными. Структура записей не ориентирована на информационный поиск и не обязательна к применению в качестве внутренней структуры данных в конкретных информационных системах.
1.3. Лексикографический источник представляется в формате ФОЛИЯ последовательностью записей, каждая из которых соответствует одной словарной статье источника. Основным элементом записи является заглавная лексическая единица (ЗЛЕ). Это элемент словника лексикографического источника, о котором в данной словарной статье содержится дополнительная информация.
1.4. Одна магнитная лента может содержать записи, относящиеся к одному и к нескольким источникам, причем каждый источник может быть представлен полностью или частично.
Применяя записи различного типа, можно отразить на магнитной ленте систематическую классификацию лексических единиц, вставляя между записями с терминами записи с рубриками систематического указателя источника, а также представить источники, содержащие различные виды указателей лексических единиц.
1.5. Для обеспечения синхронного ведения одинаковых или связанных источников в различных информационных системах в формате предусмотрены средства передачи изменений в лексическом составе источника.
1.6. Тип структуры данных, описываемых средствами коммуникативного формата — одноуровневое дерево с различными типами связей и возможностью группирования семантически связанных вершин. В каждой записи присутствует ЗЛЕ и другие элементы данных с указанием их роли или связи по отношению к ЗЛЕ с помощью меток элементов данных.
1.7. Если в процессе развития лексических и терминологических систем возникает потребность в установлении новых видов семантических отношений и связей, не представленных в настоящем стандарте, их добавляют регистрацией в Автоматизированной системе ведения информационных языков (АСВИЯ) ГАСНТИ.
1.8. Кодирование данных в коммуникативном формате должно соответствовать требованиям СТ СЭВ 358—76 (таблица КОИ-8), кодирование расширенного списка символов — ГОСТ 7.28-80, ГОСТ 7.29-80, ГОСТ 7.30-80. Структура элементов данных, требующих для своего представления расширения 8-битных кодов — по СТ СЭВ 360—76. Допускается применять код ДКОИ, если достаточно представления информации одними прописными буквами.
ГОСТ 7.47-84 Стр. 3
2. СПОСОБ ПРЕДСТАВЛЕНИЯ ЛЕКСИКОГРАФИЧЕСКОЙ ИНФОРМАЦИИ
2.1. Структура записи на магнитной ленте (МЛ) должна соответствовать требованиям ГОСТ 7.14—84.
Используют вариант структуры без индикаторов и идентификаторов.
Для представления информации Макротезауруса ГАСНТИ допускается использовать варианты структуры с индикаторами и идентификаторами.
Применяют блокированные записи переменной длины с максимальной длиной блока 16000 байт.
2.2. Значения компонентов маркера записи
2.2.1. Значения позиции 5 (статус записи)—см. табл. 1.
Таблица 1 |
Значение позиции 5 маркера |
Статус записи |
Пояснение |
1 |
Новая |
Словарная статья вводится в массиве впервые |
3 |
Изменяющая |
Словарная статья вводится взамен ранее введенной статьи, запись которой имеет тот же идентификатор |
5 |
Ликвидирующая |
Запись ликвидирует ранее введенную запись с тем же идентификатором записи |
|
2.2.2. Значение позиции 20 маркера (длина поля «Длина поля данных») — 4.
2.2.3. Значение позиции 21 маркера (длина поля «Длина позиции начального символа») — 5.
2.2.4. Значение позиции 22 (длина поля «Длина части, определяемой при применении») — 4.
2.3. Правила идентификации значения полей данных в статье справочника
2.3.1. Перечень устанавливаемых меток и их значения приведены в спецификации элементов данных (разд. 3). Различие семантических категорий полей данных определяет первый символ метки в соответствии с табл. 2.
2.3.2. В первых трех позициях части, определяемой при применении, помещают латинский код языка соответствующего поля данных СТ СЭВ 251—76. Если для элемента данных указание языка не имеет смысла, эти позиции заполняют пробелами.
Четвертая позиция используется для указания связи между отдельными полями данных в пределах одной записи. Поля, со-2—386
Op. 4 ГОСТ 7.47-84
Таблица 2 |
Первый символ метки |
Вид информации |
0* |
Идентификационные данные |
1 |
Заглавная лексическая единица словарной статьи |
2 |
Морфояогиче* кие данные |
3 |
Предметно-тематическая классификация |
4 |
Определения, примеры, контексты |
5 |
Отношения между лексическими единицами |
6 |
Иноязычные эквиваленты заглавной лексической единицы |
7 |
Прочая информация |
8 |
Описание источника |
9 |
Резерв |
|
держащие данные, которые следует рассматривать совместно, идентифицируют одинаковыми символами в указанной позиции. В этом случае символы выбирают последовательно из ряда 1,
9, Ау ...» Z. Если связь между элементами данных не установлена, в указанной позиции помещают пробел.
Пример. Антенны по диапазону подразделяются на широкополосные, УКВ и др., по форме — на параболические, сферические и др.
Метка |
Указатель
связи |
Лексическая единица |
Пояснение |
100 |
— |
антенны |
ЗЛЕ |
540 |
1 |
диапазон |
Аспект деления |
532 |
1 |
широкополосные
антенны |
Нижестоящее понятие в аспекте деления «диапазон» |
532 |
1 |
УКВ — антенны |
То же |
540 |
2 |
форма |
Аспект деления |
532 |
2 |
параболические
антенны |
Нижестоящее понятие в аспекте деления «форма» |
532 |
2 |
сферические
антенны |
То же |
2.4. Пр а |
вила записи информац |
ии в полях дан- |
н ы х
2.4.1. Каждому элементу данных соответствует статья справочника и поле данных. Семантика и значение элемента данных, а также его отношение к ЗЛЕ определяются меткой в статье справочника. Все поля имеют переменную длину.
2.4.2. Все элементы данных в записи рассматривают по отношению к ЗЛЕ. Сгруппированные указателями связи элементы дан-
* Здесь и далее для отличия от буквы О нуль ооозначается знаком 0.
ГОСТ 7.47—84 Стр. 5
пых также рассматривают как единое целое по отношению к ЗЛЕ. Если группирование элементов данных указателями связи может вызвать неоднозначность или неясность понимания, следует приводить пояснения в сопроводительной документации.
2.4.3. Элементы данных записывают по одному в поле данных.
2.4.4. При наличии нескольких экземпляров данных одной категории каждый из них записывают в отдельном поле данных с одной и той же меткой в соответствующей каждому полю статье справочника. Допустимость повторения элементов данных указана в табл. 3.
Если применение нескольких экземпляров элементов данных с одинаковой меткой может вызвать неоднозначность или неясность понимания, следует приводить пояснения в сопроводительной документации.
2.4.5. Обязательность и применимость элементов данных для источников различных типов указана в табл. 3.
Таблица 3
Применение элементов данных |
Метка |
Наименование элемента |
Повторяв- |
|
Обязательность и применимость по типам источников (см табл. 5) |
данных |
мость |
м |
В |
т |
к |
G |
р |
S |
к |
и |
D |
№ |
1
Идентификатор записи |
Нет |
О |
О |
О |
О |
О |
О |
О |
о |
о |
о |
014 |
Создатель записи |
Да |
О |
О |
о |
о |
о |
о |
о |
С) |
о |
о |
016 |
Дата создания записи |
Her |
О |
О |
о |
О |
о |
о |
о |
о |
о |
о |
S |
Комментарии |
Да |
Н |
Н |
н |
н |
н |
н |
н |
и |
и |
н |
Заглавная лексическая единица |
Да |
О |
О |
о |
о |
о |
О |
О |
о |
о |
о |
115 |
Форма лексической единицы во вспомогательном указателе |
Да |
Н |
н |
н |
н |
и |
н |
и |
н |
и |
н |
130 |
Краткая форма |
Да |
н |
н |
н |
н |
11 |
и |
4" |
4" |
— |
н |
131 |
Аббревиатура |
Да |
н |
н |
и |
и |
н |
н |
н |
и |
— |
н |
132 |
Краткая форма словосочетания |
Да |
н |
н |
и |
и |
н |
н |
н |
н |
|
н |
135 |
Полная форма |
Да |
н |
н |
н |
н |
и |
н |
4- |
4- |
— |
н |
150 |
Обозначение ЗЛЕ |
Да |
+ |
4- |
1
т |
4- |
4- |
4- |
4- |
4- |
О |
4“ |
ЗДО |
Индекс источника по Рубрикатору ГАСНТИ |
Да |
О |
О |
о |
о |
О |
о |
О |
О |
о |
о |
301 |
Индекс источника по Рубрикатору МСНТИ |
Да |
и |
и |
н |
и |
н |
н |
н |
н |
н |
н |
302 |
Наименование классификации |
Да |
н |
н |
н |
н |
и |
и |
н |
н |
н |
н |
303 |
Индекс тематики источника |
Да |
н |
и |
н |
н |
н |
н |
н |
н |
н |
н |
304 |
Индекс тематики источника по Рубрикатору, заре гистрированному в АСВИЯ |
Да |
+ |
4~ |
4- |
4- |
+ |
н |
н |
н |
н |
н |
|
2* |
Стр. 6 ГОСТ 7.47-64
Метка |
Наименование элемента данных. |
Повторяе
мость |
306 |
Индекс УДК для нсточнн- |
|
ка |
Нет |
m |
Индекс ББК для нсточии- |
|
|
кп |
Ист |
зп |
Индекс ЗЛЕ по Рубрика- |
|
|
тору МСНТИ |
Да |
312 |
Индекс ЗЛЕ ьо Рубрика- |
|
|
юру ГАСНТИ |
Да |
313 |
Индекс тематики ЗЛЕ |
Д«'- |
314 |
Индекс ЗЛЕ по Рубрикатору, зарегистрированному в |
|
|
лсвия |
Да |
316 |
Индекс УДК Для ЗЛЕ |
Да |
32# |
Тин статьи |
Ист |
№ |
Определение, толкование |
Да |
402 |
Определение |
Нет |
404 |
Толкование |
Да |
406 |
Релятор |
Да |
420 |
Контекст |
Да |
434 |
Примечание |
Да |
44# |
Наличие нетекстовой ин- |
|
формации |
Нет |
щ
502 |
Синонимичная ЛЕ |
Да |
Синоним |
Да |
504 |
Квазисиноннм |
Да |
506 |
Нерекомендуемый сино- |
Да |
|
ним |
511 |
Ссылка «смотри совмесг- |
|
|
но» |
Да |
513 |
Ссылка «используй» |
Нет |
517 |
Ссылка «эквивалентно» |
Да |
520 |
Вышестоящее понятие |
Да |
522 |
Родовое понятие |
Да |
524 |
Целое |
Да |
526 |
Прочие вышестоящие по- |
|
|
нятия |
Да |
530 |
Нижестоящее понятие |
Да |
532 |
Видовое понятие |
Да |
534 |
Часть |
Да |
536 |
Прочие нижестоящие по- |
|
|
нятия |
Да |
540 |
Аспект |
Да |
56# |
Ассоциативное понятие |
Да |
561 |
Ссылка «см также» |
Да |
576 |
Используй комбинацию |
Да |
577 |
Используй альтернативно |
Да |
58# |
Антоним |
Да |
Продолжение табл. 3
Обязательность и применимость по типам источников (см. табл. 5) |
м |
в |
т |
к |
О |
р |
S |
R |
и |
D |
+ |
4- |
4 |
4- |
4- |
+ |
4- |
+ |
4 |
4 |
+ |
4* |
4- |
4" |
4- |
4- |
4- |
4 |
+ |
4 |
Н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
|
4- |
4* |
4* |
4- |
н |
н |
н |
н |
н |
н |
н |
н |
Н |
н |
н |
н |
н |
н |
н |
4 |
4* |
4 |
4“ |
4- |
н |
н |
н |
н |
н |
4 |
4 |
4 |
4 |
4- |
4- |
4 |
4 |
4 |
4 |
о |
о |
О |
О |
о |
О |
О |
о |
о |
о |
н |
н |
н |
и |
н |
н |
4- |
4 |
н |
4 |
н |
н |
н |
н |
н |
н |
4 |
4 |
— |
4- |
н |
н |
н |
н |
н |
н |
4 |
4 |
— |
4 |
И |
н |
н |
н |
н |
н |
н |
и |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
4- |
+ |
4- |
4- |
4 |
4- |
4- |
4- |
4 |
4 |
4 |
н |
н |
н |
н |
н |
н |
4* |
+ |
— |
4 |
4- |
4* |
4- |
н |
н |
н |
н |
н |
— |
4 |
4" |
4- |
4- |
и |
н |
н |
н |
н |
— |
4 |
4- |
+ |
4- |
н |
н |
н |
н |
н |
— |
4 |
— |
— |
— |
н |
— |
н |
4- |
+ |
— |
4 |
_ |
|
_ |
_ |
4 |
н |
— |
— |
—. |
н |
_ |
_ |
— |
— |
4- |
н |
— |
— |
— |
н |
Г-.-Г |
_ |
— |
— |
4 |
н |
— |
— |
— |
н |
4- |
4- |
4- |
н |
н |
н |
н |
н |
— |
4 |
4 |
4- |
4* |
н |
н |
н |
н |
н |
— |
4 |
4- |
4- |
4- |
н |
н |
н |
н |
н |
— |
4 |
4- |
4 |
4- |
н |
н |
н |
н |
н |
— |
|
4- |
4- |
4 |
н |
н |
н |
н |
н |
— |
4 |
4- |
4" |
4- |
н |
н |
н |
н |
н |
— |
4 |
4 |
+ |
4 |
н |
н |
и |
н |
н |
— |
4 |
4- |
4- |
4- |
н |
н |
н |
н |
н |
— |
4 |
4- |
4- |
4- |
н |
4" |
н |
и |
н |
— |
4 |
4- |
4- |
4- |
н |
н |
н |
н |
н |
— |
4 |
|
|
|
— |
4 |
н |
— |
— |
4 |
н |
4- |
4- |
4 |
н |
н |
н |
н |
н |
— |
н |
4- |
4* |
4- |
н |
н |
н |
н |
н |
— |
н |
4- |
4- |
4- |
н |
н |
н |
н |
н |
|
|н |
|
Продолжение табл. 3 |
|
|
Повторяс- |
|
Обязательность и применимость по типам источников (см. табл. 5). |
Метка |
данных |
мость |
м |
В |
т |
к |
о |
р |
S |
R |
и |
D |
583 |
Ссылка «см » |
Да |
_ . |
_ |
_ |
— |
4 |
н |
- - |
|
4 |
н |
585 |
Ссылка «ост от» |
Да |
— |
— |
— |
— |
4- |
н |
— |
—■ |
4“ |
н |
589 |
Технологическая ссылка |
Да |
4 |
4 |
4 |
н |
н |
н |
н |
н |
н |
н |
60 |
Иноязычный эквивалент |
Да |
4- |
4- |
4- |
4 |
н |
н |
4 |
4 |
4 |
-Ц |
601 |
Официальный перевод |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
4- |
4* |
603 |
Близкий иноязычный термин |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
|
4 |
605 |
Частичный перевод |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
—. |
4™ |
607 |
Расширительный перевод |
Да |
Н |
н |
н |
н |
н |
н |
н |
н |
—. |
4 |
610 |
Пояснительная помета к переводу |
Да |
|
|
|
|
|
|
|
|
_ |
4 |
Т20 |
Библиографическая ссылка |
Да |
н |
н |
н |
н |
н |
н |
н |
н |
н |
н |
721 |
Номер ссылки |
Да |
и |
н |
н |
н |
н |
н |
н |
н |
11 |
н |
733 |
Наличие в друз их источниках ГАСНТИ |
Да |
О |
О |
н |
н |
н |
н |
н |
н |
|
к |
750 |
Поисковый массив |
Да |
+ |
4 |
4 |
4 |
4 |
4 |
— |
— |
н |
н |
751 |
Объем поискового массива |
Да |
4 |
4 |
4 |
4 |
4 |
4 |
|_ |
_ |
н |
н |
752 |
Статистические данные |
Да |
+ |
4 |
4- |
4- |
4 |
4" |
— |
— |
н |
и |
800 |
Тип источника |
Нет |
о |
о |
о |
о |
о |
о |
О |
О |
О |
о |
809 |
Обозначение передаваемого источника в МСНТИ |
Нет |
и |
н |
н |
н |
н |
н |
н |
и |
н |
н |
810 |
Обозначение передаваемого источника в ГАСНТИ |
Нет |
о |
о |
О |
о |
0 |
н |
н |
н |
н |
н |
811 |
Наименование источника |
Нет |
о |
о |
о |
о |
о |
о |
О |
О |
О |
о |
812 |
Дата создания источника |
Нет |
о |
О |
о |
о |
о |
о |
н |
н |
н |
о |
813 |
Дата утверждения |
Нет |
н |
н |
н |
н |
н |
н |
О |
О |
о |
н |
814 |
Номер версии |
Нет |
н |
н |
н |
н |
и |
н |
н |
н |
н |
11 |
820 |
Местонахождение в источнике |
Нет |
н |
н |
и |
н |
н |
н |
н |
н |
н |
н |
890 |
Авторское право |
Да |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
891 |
Ответственная организация |
Да |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
892 |
Поставщик источника |
Да |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
893 |
Хранитель источника |
Нет |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
|
Примечания:
J Условные обозначения:
О — обязательный элемент данных, который должен присутствовать в каждой записи (или в первой записи массива, при применении п 2 4 5),
+ —элемент данных, обязательный при наличии в источнике,
Н — элемент данных, который может присутствовать в записи, но его использование не является обязательным, даже если его значение указано в источнике;
--элемент данных, использование которого недопустимо или бессмысленно при представлении источника данного вида.
2. В каждой (или только в первой) передаваемой записи должен присутствовать, по крайней мере, один элемент данных с меткой 89# или 891.