Товары в корзине: 0 шт Оформить заказ
Стр. 1 

97 страниц

669.00 ₽

Купить ГОСТ Р 7.0.91-2015 — бумажный документ с голограммой и синими печатями. подробнее

Распространяем нормативную документацию с 1999 года. Пробиваем чеки, платим налоги, принимаем к оплате все законные формы платежей без дополнительных процентов. Наши клиенты защищены Законом. ООО "ЦНТИ Нормоконтроль"

Наши цены ниже, чем в других местах, потому что мы работаем напрямую с поставщиками документов.

Способы доставки

  • Срочная курьерская доставка (1-3 дня)
  • Курьерская доставка (7 дней)
  • Самовывоз из московского офиса
  • Почта РФ

В стандарте установлены рекомендации, касающиеся развития и ведения информационно-поисковых тезаурусов. Эти рекомендации могут быть применены и к другим словарям, используемым в процессе информационного поиска во всех типах информационных ресурсов. При этом возможность такого применения не зависит от типа средств, используемых при передаче информации (текст, звук, неподвижный или движущийся образ, физический или мультимедийный объект), включая базы знаний, порталы, базы библиографических данных, тексты, музейные или мультимедийные коллекции в целом и входящие в их состав самостоятельные единицы.

 Скачать PDF

Содержит требования ISO 25964-1:2011

Оглавление

1 Область применения

2 Термины и определения

3 Символы, сокращения и условные обозначения

4 Тезаурусы. Обзор и назначение

5 Понятия и объем их значения в тезаурусе

6 Термины тезауруса

7 Сложные понятия

8 Отношения эквивалентности в одноязычном контексте

9 Межъязыковая эквивалентность

10 Отношения понятий

11 Фасетный анализ

12 Представление и оформление тезауруса

13 Управление разработкой и ведением тезауруса

14 Указания по программному обеспечению для ведения тезауруса

15 Модель данных

16 Интеграция тезаурусов с приложениями

17 Обменные форматы

18 Протоколы

19 Библиография

 
Дата введения01.07.2016
Добавлен в базу01.02.2017
Актуализация01.01.2019

Этот ГОСТ находится в:

Организации:

15.12.2015УтвержденФедеральное агентство по техническому регулированию и метрологии2163-ст
ИзданСтандартинформ2016 г.
РазработанВИНИТИ РАН

System of standards for information, librarianship and publishing. Thesauri for information retrieval

Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

Й

<ш>


ГОСТР

7.0.91-

2015

(ИСО 25964-1:2011)

НАЦИОНАЛЬНЫ

СТАНДАРТ

РОССИЙСКОЙ

ФЕДЕРАЦИИ


Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУСЫ ДЛЯ ИНФОРМАЦИОННОГО

ПОИСКА

(ISO 25964-1:2011, MOD)

Издание официальное

Москва

Стандартинформ

2016

Предисловие

1    ПОДГОТОВЛЕН Федеральным государственным бюджетным учреждением науки Всероссийским институтом научной и технической информации Российской академии наук (ВИНИТИ РАН) на основе собственного аутентичного перевода на русский язык англоязычной версии международного стандарта, указанного в пункте 4

2    ВНЕСЕН Техническим комитетом по стандартизации ТК191 «Научно-техническая информация, библиотечное и издательское дело»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 15 декабря 2015 г. № 2163-ст

4    Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 25964-1:2011 «Информация и документация. Тезаурусы и их совместимость с другими словарями. Часть 1. Тезаурусы для информационного поиска» (ISO 25964-1:2011 «Information and documentation — Thesauri and interoperability with other vocabularies — Part 1. Thesauri for information retrieval», MOD). При этом дополнительные показатели и требования, включенные в текст стандарта для учета потребностей экономики Российской Федерации выделены подчеркиванием. В настоящий стандарт не включены графы таблицы 2, содержащие сокращения на немецком, датском, финском, норвежском, шведском и испанском языках, поскольку они не применяются в практике национальной стандартизации и информатики. Не включены также информационные приложения и предметный указатель. Поскольку вопросы построения многоязычных тезаурусов регулирует ГОСТ 7.24-2007, раздел 9 и подразделы 12.3 и 12.4 исключены из настоящего стандарта.

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2004 (пункт 3.5)

5    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

© Стандартинформ, 2016

Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

II

Пример — Outerwear (верхняя одежда) и underwear (нижняя одежда) являются дескрипторами, которые обозначают соподчиненные понятия, принадлежащие к одному и тому же классификационному ряду:

clothing    одежда

outerwear    верхняя одежда

overcoats    пальто

underwear    нижняя одежда.

2.53    соподчиненный термин (sibling term): Один из двух или более дескрипторов (2.45), имеющих один и тот же ближайший вышестоящий (родовой) термин (2.3).

Пример —Дескрипторы chairs (сидения) и tables (столы), являются соподчиненными терминами одного и того же классификационного ряда, в то время как дескрипторы «furniture (мебель), armchairs (кресла) и dining tables (обеденные столы») соподчиненными терминами не являются: furniture    мебель

chairs    сиденья

armchairs    кресла

tables    столы

dining tables    обеденные столы

2.54    исходный язык (source language): Язык, служащий в качестве отправной точки в процессе перевода или поиска эквивалентов для терминов (2.61).

2.55    специфичность словаря (specificity): Способность структурированного словаря (2.56) выразить предмет поиска углубленно и подробно.

Примечание — Более подробное объяснение см. обсуждение специфичности в 8.4 и других местах.

2.56    структурированный словарь (structured vocabulary): Организованный набор терминов

(2.61) , заголовков и кодов, представляющих понятия (2.11) и их взаимосвязи, которые могут быть использованы для поддержки информационного поиска (2.28).

Примечание — Структурированный словарь также может быть использован для других целей. В рамках поиска информации словарь нуждается в сопутствующих правилах, описывающих как следует применять термины. Вопросы различных типов структурированных словарей, в том числе классификационных схем, словарей предметных рубрик и др., будут переадресованы к настоящему стандарту.

2.57    словарь предметных рубрик, язык предметных рубрик (subject heading scheme, subject heading language, subject heading list, SHL): Структурированный словарь (2.56), состоящий из терминов

(2.61) , доступных для предметного индексирования (2.27), плюс правила для объединения их в пред-координированные цепочки терминов (2.61) для индексирования.

2.58    синоним (synonym): Один из двух или более терминов (2.61), обозначающих одно и то же понятие (2.11).

Примеры —

В английском языке:

guarantees, warranties

heart attack, myocardial infarction

HIV, human immunodeficiency virus

Во французском языке:

schiste, phyllade

VIH, virus de I’immunodeficience humaine crise cardiaque, infarctus du myocarde

В русском языке:

чахотка, туберкулез

ВИЧ, вирус иммунодефицита человека

кровоизлияние в мозг, инсульт.

Примечание — Сокращение и полная формы термина могут рассматриваться как синонимы.

2.59    синтагматические отношения, апостериорные отношения (syntagmatic relationship, a posteriori relationship): Такие отношения между понятиями (2.11), которые существуют только потому, что эти понятия встретились совместно в индексируемом документе (2.15).

8

ГОСТ P 7.0.91—2015

Примечание — Вне рамок индексируемого документа такие отношения, как правило, не действуют, поэтому они не входят в структуру тезауруса. Для ознакомления с более полным обсуждением синтагматических и парадигматических отношений см. 4.3.

2.60    целевой язык (target language): Язык, в котором находится перевод или эквивалент термина

(2.61) исходного языка (2.54).

2.61    термин (term): Слово или словосочетание, используемое для обозначения понятия (2.11).

Примеры —

Schools    школы

school uniform    школьная сЬормэ

costs of schooling    плата за школу

teaching    преподавание.

Примечание — Термины тезауруса могут быть либо дескрипторами, либо аскрипторами.

2.62    тезаурус (thesaurus): Контрольный (2.12) структурированный словарь (2.56), в котором понятия (2.11) представлены терминами (2.61), организованными таким образом, что отношения между понятиями (2.11) представлены эксплицитно, и дескрипторы (2.45) снабжены указателями перехода от синонимов (2.58) и квазисинонимов (2.47).

Примечание — Задачей, решаемой тезаурусом, является обеспечение того, чтобы как индексатор, так и пользователь выбирали для представления данного содержания (предмета) один и тот же дескриптор или комбинацию дескрипторов. По этой причине тезаурус оптимизирован так, чтобы стать средством навигации и терминологического покрытия предметной области для человека.

2.63    наивысший термин (top term, ТТ): Дескриптор (2.45), представляющий понятие (2.11), для которого в тезаурусе (2.62) не существует более широкого понятия.

2.64    управление словарем (vocabulary control): Словарная работа, проводимая для того, чтобы избежать многозначности и упорядочить форму представления терминов (2.61), а также лимитировать число понятий (2.11) и терминов (2.61), допустимых для использования в процессе индексирования (2.27).

Примечание — Цель управления достигается путем различения омографов так, чтобы каждый из них имел только одно значение, и путем выбора из ряда синонимов или квазисинонимов одного, рекомендуемого для использования при индексировании. Цель этих ограничений состоит в повышении вероятности того, что индексатор при индексировании и пользователь при поиске выберут для обозначения определенного понятия один и тот же термин.

3 Символы, сокращения и условные обозначения

3.1    В таблице 1 приведены сокращения, которые используются в англоязычных примерах теза-урусных записей в качестве меток к префиксным терминам и записям. Каждая метка указывает на отношение или функцию термина или записи, следующую за ними.

3.2    В тезаурусах на голландском языке без перевода используются те же метки, что и в тезаурусах на английском языке.

3.3    Сокращения, приведенные в таблице 2 в качестве меток, обрели статус общепризнанных соглашений и встречаются во многих опубликованных тезаурусах. Они имеют мнемоническое значение, но применяются только в отдельных языках.

В случае использования нейтральной системы аббревиатур рекомендуется использовать символы из левого столбца таблицы 1.

Таблица 1 — Символы и сокращения

Описание

Символ

Метка

Значение

Описательные

элементы

SN

Лексическое примечание

DEF

Определение

HN

Историческая справка

9

Окончание таблицы 1

Описание

Символ

Метка

Значение

Коды

SC

Предметная область. Классификационный код или индекс группы понятий, относящихся к данной теме

СС

Классификационный код или индекс понятия

Отношения

USE

«Используй». Термин, стоящий после этой метки, является дескриптором, которым надо заменить аскриптор, предшествующий этой метке

UF

«Используй вместо» или «Используется вместо». Термин, стоящий после этой метки, является аскриптором, для которого предшествующий этой метке термин является дескриптором, употребляемым вместо этого аскриптора

USE...+

Два или более дескриптора, стоящие после этой метки, следует использовать вместе для того, чтобы представить понятие, предшествующее этой метке

С

Т|

+

Аскриптор, стоящий после этой метки, должен быть представлен комбинацией дескрипторов, один из которых предшествует этой метке

тт

Наивысший термин. Предшествующий этой метке дескриптор является самым широким по объему понятием в иерархии, к которой принадлежит данное понятие

<

ВТ

Вышестоящий термин. Стоящий после этой метки термин представляет понятие с более широким значением

BTG

Выше — рол. Более широкий теомин. обозначающий класс (рол). в ко-

тсюый входит данное видовое понятие

BTI

Выше — множество. Более широкий термин, обозначающий множе-

ство. в которое входит данное понятие

ВТР

Выше — целое. Более широкий теомин. обозначающий целое, в кото-оое входит данное понятие в качестве составной части

NT

Нижестоящий термин. Стоящий после этой метки термин представляет понятие с более конкретным значением

NTG

Ниже — вид. Более узкий теомин. обозначающий подкласс (вид) данно-

ГО РОДОВОГО понятия

NTI

Ниже — элемент. Более узкий теомин. обозначающий элемент множе-

ства. представленного данным понятием

NTP

Ниже — часть. Более узкий термин, обозначающий составную часть

объекта, представленного данным понятием

RT

Ассоциативный термин. Следующий за этой меткой термин является ассоциативным термином, но не синонимом, не квазисинонимом, не вышестоящим и не нижестоящим термином

Таблица 2 — Метки на английском языке и их эквиваленты на других языках

Метка на английском языке

Метка на французском языке

Метка на китайском языке

Метка на русском языке

SN

NE

J

лп

Scope note

Note explicative b Note d’emploi

Mjie

Лексическое примечание

USE

EM

Y

см

Use

Employer

Д yong

Смотри

ГОСТ P 7.0.91—2015

Окончание таблицы 2

Метка на английском языке

Метка на французском языке

Метка на китайском языке

Метка на русском языке

UF

Use for Used for a

ЕР

Employer pour Employe pour a

D

ft dai

С

Синоним

ВТ

Broader term

TG

Terme generique

S

Ж shu

в

Выше

NT

Narrower term

TS

Terme specifique

F

ф4 fen

н

Р1иже

RT

Related term

TS

Terme associe

С

# сап

а

Ассоциация

BTG

Broader term (generic)

TG

Terme generique (generique)

вр

Выше — род

BTP

Broader term (partitive)

TG

Terme generique (partitif)

ВЦ

Выше — целое

BTI

Broader term (instantial)

TG

Terme generique (instance)

вм

Выше — множество

NT

Narrower term (generic)

TS

Terme specifique (generique)

нв

Р1иже — вид

NT

Narrower term (partitive)

TS

Terme specifique (partitif)

нч

Ниже — часть

NT

Narrower term (instantial)

TS

Terme specifique (instance)

нэ

Ниже — элемент

Примечание — могут включать дополнитег ключены языки, не являют

Fla6op языков в таблице 2 — открытый. Следующие издания этой части ИСО 25964 ьные метки. Лля использования в национальном стандарте России из таблицы 2 ис-

иеся официальными языками ИСО.

а Строки курсивом показывают варианты расшифровки меток. ь Французский стандарт AFNOR Z47-100 предлагает метку NA— Note d’application.

3.4 В настоящем стандарте следующие соглашения также используются. Следует обратить внимание, что эти соглашения не являются обязательными для всех тезаурусов.

а) Распределение заглавных и прописных букв в дескрипторах совпадает с тем, как это имеет место в полном печатном тексте. Как правило, это означает, что нижний регистр используется во всех случаях, кроме случая использования верхнего регистра в составе сокращений и начальных букв в собственных именах.

Примеры1)

animals    животные

cars    автомобили

World Health Organization    Всемирная организаиия здравоохранения

Ь) Аскрипторы набирают курсивом. Примеры —

animals

fauna

UF fauna

USE animals

cars

automobiles

UF automobiles

USE cars

^ В настоящих примерах прямой и курсивный шрифты терминов применяются в соответствии с рекоменда

циями настоящего стандарта по представлению дескрипторов и аскрипторов в тезаурусах.

11

World Health Organization

WHO

UFWHO

USE World Health Organization

животные

фауна

c cbavHa

см animals

автомобили

автомашины

с автомашины

см автомобили

Всемирная ооганизаиия здравоохранения

ВОЗ

сВОЗ

см Всемирная организаиия здравоохранения

4 Тезаурусы. Обзор и назначение

4.1    Общее назначение

Основным назначением тезауруса является обеспечение того, чтобы как при индексировании, так и при поиске были выбраны в качестве отражения одного и того же понятия одни и те же термины. Для достижения этой цели в тезаурусе, во-первых, должны быть заданы все понятия, которые могут быть полезны для обеспечения поиска в данной области. Понятия представляют с помощью терминов, и для каждого понятия одно из таких возможных представлений выбирают в качестве дескриптора (см. 4.2 и 6.6). Во-вторых, тезаурус должен представлять дескрипторы таким образом, чтобы пользователь мог легко идентифицировать тот дескриптор, который ему нужен. Это достигается путем задания отношений между терминами и/или понятиями (см. разделы с 8 по 10) и путем использования этих отношений при создании структурированных указателей терминов.

При включении в системы поиска или индексирования терминов и отношений тезауруса они могут быть использованы по-разному, в частности:

-    как средство расширения поиска;

-    для предложения альтернативных поисковых терминов;

-    для поддержки кластеризации результатов или других средств совершенствования поиска;

-    для выявления типичных орфографических ошибок;

-    для поддержки автоматического индексирования.

Взаимосвязь терминов, понятий и отношений иллюстрируется на модели данных в разделе 15. Из практических соображений в этой части ИСО 25964 обычно идет речь о «терминах». Но никогда не следует забывать, что целью манипулирования терминами является поддержка поиска обозначаемых ими понятий.

4.2    Словарный контроль и его назначение

Процесс принятия решения о предоставлении термину права представлять определенное понятие не всегда является однозначно простым, поскольку понятие часто может быть выражено не одним способом. Более того, в обычном словоупотреблении некоторые термины могут иметь более одного значения. Поэтому словарный контроль является существенным моментом, и тезаурусы применяют для обеспечения однозначности путем использования следующих двух принципиально важных приемов.

а)    Сфера применения понятий и терминов намеренно ограничивают предписанными значениями. В отличие от терминов таких словарей, в которых слова даются в сопровождении целого ряда различных определений, отражающих нормативное использование, каждый термин в тезаурусе, как правило, бывает привязан к тому или иному единственному значению, которое наиболее эффективно отражает потребности поисковой системы. Структура тезауруса, особенно представление в указателе иерархических отношений, часто указывает на нужное значение термина. Если это ограничение не достаточно очевидно, термин должен быть снабжен лексическим примечанием. Это примечание должно уточнить значение выбранного термина и может также указывать на другие значения, известные в естественном языке, которые были сознательно исключены для целей информационного поиска.

б)    Если в одном и том же языке одно и то же понятие может быть выражено двумя или более синонимами или квазисинонимами, то в качестве дескриптора, как правило, выбирают один из этих терминов, который затем последовательно используют в качестве дескриптора в процессе индексирования 12

ГОСТ P 7.0.91—2015

как главный или единственный термин, выражающий соответствующее понятие. При этом от любого синонима, который может понадобиться пользователю при обращении к тезаурусу, должна быть дана ссылка на заменяющий его дескриптор.

При осуществлении словарного контроля одним из последствий использования мер, описанных в перечислениях а) и Ь) является то, что полученные выражения могут не соответствовать. Тезаурус играет важную роль в посредничестве между терминами, используемыми в обычном словоупотреблении, и теми терминами, которые эффективно функционируют в процессе поиска информации. Для достижения эффективности поиска пользователи должны использовать с определенной степенью искусственности контрольного словаря (хотя в некоторых системах эта трудность может быть преодолена за счет автоматической замены термина пользователя дескриптором).

Для того чтобы тезаурус мог эффективно функционировать в многоязычном контексте, включаемые понятия должны быть представлены во всех используемых языках, обеспечивая доступ носителям этих языков. Если тезаурус является «симметричным», как описано в настоящем стандарте и смоделировано в разделе 15, то для каждого понятия должен существовать дескриптор в каждом из языков, и объем понятий должен быть одинаковым во всех языках. Это ограничение иногда вносит свой вклад в искусственность языка. Альтернативные подходы (например, использование метода сопоставления словарей) будут описаны в следующей версии стандарта [6].

4.3 Парадигматические и синтагматические отношения

Целью установления отношений и отображения их в указателе является указание пользователю (или специалисту, действующему от его имени) нужного направления для выбора наиболее подходящего термина, выражающего данное понятие. Это достигается путем демонстрации таких терминов, которые пользователь мог бы выбрать вместо или наряду с терминами, выбранными им изначально. Примеры приведены в разделе 12.

В любом языке между терминами индексирования, как правило, наблюдаются отношения следующих двух видов:

a)    отношения, называемые синтагматическими, фиксируются в том случае, когда понятия встречаются вместе в контексте конкретного документа. Иными словами, если два или более термина индексирования приписаны одному и тому же документу, то тем самым между ними установлено синтагматическое отношение. Однако включение синтагматических отношений в тезаурус не рекомендуется.

Пример — Индексатор работы о «компьютерах в амстердамских банках» может выделить три понятия, выражаемые, соответственно, терминами «банки (финансовые учреждения)», «компьютеры» и «Амстердам». Он присвоит их этому документу. В посткоординированной системе связь между этими терминами в метаданных эксплицитно не указывается, но документ, тем не менее, может быть найден, если любой или все эти термины были использованы в качестве поисковых ключей. В предкоординированном указателе любая комбинация этих трех терминов может быть приведена вместе со ссылкой на то место, где соответствующий документ может быть найден. Понятия из данного примера в рамках обыденных отношений, как правило, никак друг с другом не связаны, поэтому их взаимосвязь должна рассматриваться как зависящая от документа.

b)    парадигматическими называют отношения, которые значимы почти во всех контекстах, особенно если они внутренне присущи понятиям, которые представлены этими терминами. Наличие парадигматических отношений между тезаурусными понятиями продемонстрировать целесообразно, так как они часто ведут пользователей к понятиям, тесно связанным с теми терминами, которые пришли в голову первоначально.

Пример — Независимо от темы индексируемого документа понятия из предыдущего примера имеют такие сущностные связи: «банки (финансовые учреждения)» с более широким понятием «финансовые институты»; «компьютеры» устойчиво ассоциируют связь с понятием «обработка данных», а понятие «Амстердам» неразрывно связано с понятием «Нидерланды». Найдя в словаре любой из этих связанных между собой терминов, пользователь может быть заинтересован в информации, заиндексированной с помощью связанного термина. Такие парадигматические отношения не зависят от какого-либо конкретного документа. Они, как правило, распознаются и могут быть установлены благодаря ссылке на такие обычные издания как словари и энциклопедии.

Различие между этими двумя видами отношений может быть отображено так, как показано на рисунке 1.

13

Парадигматические f

Нидерланды

Финансовые

Обработка данных

отношения

институты

терминов/понятий в тезаурусе ^

1

Амстердам

Банки

Компьютеры

Синтагматические отношения между терминами/понятиями в документе

Рисунок 1

— Парадигматические и синтагматические отношения

4.4 Типы парадигматических отношений

Устанавливают и четко разграничивают три типа парадигматических отношений между терминами (а), либо между понятиями (Ь) и (с):

a)    отношения эквивалентности, которые применяются в случае как одноязычных, так и многоязычных ситуаций (см. разделы 8 и 9, соответственно);

b)    иерархические отношения (см. раздел 10.2);

c)    ассоциативные отношения (см. раздел 10.3).

Дальнейшее деление каждого из этих классов описано в разделах 8 — 10. Каждое из этих отношений должно быть охарактеризовано как симметричное (взаимное), и это должно быть обозначено с помощью системы меток, символов или сокращений, используемых для представления отношений в тезаурусе. В иллюстративных примерах ниже использованы метки, описанные в разделе 3.

5 Понятия и объем их значения в тезаурусе

5.1    Концептуальная основа

5.1.1    Главная прикладная задача тезауруса — это информационный поиск, целью которого является поиск понятий. Как было разъяснено в 4.1 и 4.2, понятия отображаются терминами. Каждый включенный в тезаурус термин должен отображать одно понятие (или единицу мысли). Понятия могут варьировать от простых (например, «кошки»), до очень сложных (например, «расовая дискриминация этнических меньшинств»). Для отображения более сложных понятий, как правило, требуются составные термины или фразы. Более полное обсуждение этих вопросов представлено в разделе 7.

5.1.2    Включенные в тезаурус понятия могут рассматриваться как принадлежащие к взаимоисключающим категориям, выявляемым на основе общих характеристик. Приводимый ниже набор примеров является иллюстративным и не является списком всех возможных категорий.

Примеры —

1    birds

2    birth certificates

3    limbs

4    microforms

5    monuments

6    mountain regions

а) Предметы и их физические части:

птицы

свидетельства о рождении части тела микроформы монументы горные массивы

Примечание — Физические части предметов также являются предметами и могут иметь свои собственные части.

b)    Материалы:

Примеры —

1    adhesives    клеи

2    rubber    резина

3    titanium    титан

c)    Действия и процессы:

Примеры —

1    dressmaking    шитье одежды

2    fertilization    оплодотворение

3    glaciation    обледенение

4    land management    землеустройство

14

ГОСТ P 7.0.91—2015


d) События и явления:

Примеры —

1    birthdays

2    civil wars

3    revolutions

дни рождения гражданские войны оеволюиии

e)    Свойства людей, предметов, материалов или действий: Примеры —

1    consciousness    сознательность

2    elasticity    эластичность

3 personality    индивидуальность

4 speed    скорость

f)    Дисциплины или предметные поля:

Примеры —

археология органическая химия богословие

1    archaeology

2    organic chemistry

3    theology

g)    Единицы измерения:

Примеры —

1    hertz    гео и

2    kilometers    километр

h)    Типы людей и организаций:

благотворительные учреждения дети

международные неправительственные

ооганизаиии

наиии

поэты

лииа с нарушениями зрения

Примеры —

1    charities

2    children

3    international nongovernmental organizations

4    nations

5    poets

6    visually impaired people

5.1.3 Уникальные сущности, обозначаемые с помощью имен собственных, также могут быть включены в тезаурус, при этом их следует использовать только для записей, в которых говорится о данном человеке, документе или предмете и т. п. Если обозначение некой сущности именем собственным не является темой (предметом) документа, а имеет к документу какое-то другое отношение, например, оно является автором (создателем) документа или входит в состав его названия, то такое имя собственное не должно стоять в одном ряду с предметными терминами, а должно быть приписано документу в другом месте.

Имена собственные также распределяются по категориям подобно понятиям в 5.1.2;

a)    место.

Примеры —

1    Australia    Австралия

2    Milky Way    Млечный Путь

3    South Kensington    Южный Кенсингтон

4    Sri Lanka    Шои Ланка

Примеры —

1    Magna Carta

2    Mona Lisa

3    Nelson’s Column

4    Romeo and Juliet

5    Skylab

b)    специфические объекты, топографические характеристики и другие сущности.

Великая хартия вольностей Мона Лиза Нельсонова колонна Ромео и Джульетта Скайлэб.

15

с) физические лица, должности и юридические лица (организации),

Бернс. Роберт Гэнеральный секретарь ООН Всемирная организаиия здравоохранения.

Примеры —

1    Bums, Robert

2    United Nations Secretary-General

3    World Health Organization

5.2 Лексические примечания

Объем понятия, предусмотренный в тезаурусе, не всегда совпадает со значением, ассоциируемым в обычном употреблении с соответствующим дескриптором (или каким-либо из аскрипторов, заменяющих этот дескриптор). В тезаурусе контекст, как правило, понимаемый как иерархия вышестоящих и нижестоящих понятий, имеющих связи с рассматриваемым дескриптором, помогает уточнить желаемый объем понятия. Часто удается осуществить подбор такого однозначного дескриптора для определенного понятия, который доносит правильный выбор желаемого объема понятия до любого пользователя (см. 6.2.2). Однако в тех случаях, когда это сделать не удается, или когда дополнительная информация может внести ясность в вопрос о выборе определенного значения и сделать использование дескриптора более последовательным, целесообразно использовать поясняющие лексические примечания.

Лексические примечания следует использовать для уточнения границ понятия, особенно в тех случаях, когда значение дескриптора в обычном употреблении трактуется как более широкое, или более узкое, или когда требуется разграничить такие дескрипторы, значения которых в естественном языке имеют общую часть значения. Лексическое примечание также может быть использовано и для того, чтобы снабдить как индексатора, так и пользователя-поисковика рекомендациями, обеспечивающими использование одной и той же терминологии. Лексические примечания не должны давать полное определение, а призваны служить лишь разъяснением предполагаемого в тезаурусе использования термина. В тезаурусе отдельно могут быть представлены другие виды примечаний, а именно — определения (см. 6.2.3) и исторические справки (см. 6.2.4).

В отличие от квалификаторов, рассматриваемых в 6.2.2, лексические примечания не трактуются как составная часть того термина, к которому это примечание относится.

Примеры —

1 microwave frequencies    сверхвысокие    частоты

SN 1 GHz to 300 GHz    лп    От    1    до    300    ГГи

2 illuminations SN Includes both the ornamental decoration and the illustrations in manuscripts, as well as in some early printed bucks, if done by hand

5.3 Взаимные лексические примечания


иллюминации

лп Включают как декоративные украшения, так и иллюстеаиии в рукописях, а также в некоторых ранних печатных книгах, если выполнены вручную.


Когда в примечании дается ссылка на другие понятия, то, как правило, каждое из этих понятий должно быть снабжено взаимным лексическим примечанием.

Примеры —

1 В английском языке: food products

SN Use only for products intended for human consumption. For products for animals, see petfoods or feeds (Использовать только для продуктов, предназначенных для потребления человеком. Продукты для животных, см. petfoods или feeds), petfoods

SN Food products for animals maintained as domestic pets. For products for human consumption, see food products. For products intended for non-domestic animals, see feeds (Продукты питания для животных, содержащихся в доме. Продукты для потребления человеком см. food products. Продукты, предназначенные для неодомашненных животных, см. feeds), feeds

SN Products intended for non-domestic animals. For products for domestic pets, see petfoods. For products for human consumption, see food products (Продукты, предназначенные для неодомашненных животных. Продукты для домашних животных, см. petfoods. Продукты, потребляемые человеком, см. food products).

16

ГОСТ P 7.0.91—2015

2    Во французском языке:

statistique

NE Designe la science statistique; pour les donnees statistiques empoyer “statistiques” statistiques (Обозначает статистику как науку; для статистических данных использовать statistiques). statistiques

NE Designe les donnees statistiques; pour la science statistique, empoyer “statistique” (Обозначает статистические данные. Для статистики как науки использовать statistique).

3    В русском языке:

пища

лп Средства питания человека. Средства кормления животных, см. корм, корм

лп Средства кормления животных. Средства питания человека, см. пища.

Даже если примечание требуется для уточнения только одного из понятий, все же полезно сделать редакционное примечание (см. 15.2.14) в записи каждого дополнительного понятия, где оно упомянуто. Взаимные ссылки употребляются для того, чтобы быть уверенным в том, что при изменении какого-либо понятия или при его удалении эти изменения отразятся и на других рассматриваемых понятиях.

6 Термины тезауруса

6.1    Форма термина

Термины, выбранные для представления понятий, могут быть как однословными, так и многословными (см. раздел 7).

6.2    Уточнение и устранение неоднозначности терминов тезауруса

6.2.1    Общие вопросы

В обычном языковом употреблении единичный термин может иметь более одного значения, и при этом самое востребованное общеязыковое значение не всегда соответствует тому понятию, которое востребовано в тезаурусе. Если контекст, обеспечиваемый иерархией вышестоящего и нижестоящего понятий, связанных с рассматриваемым понятием, недостаточен для выяснения предполагаемого объема понятия, то следует принять дополнительные меры. Поскольку все термины тезауруса должны быть выражены с наибольшей возможной степенью однозначности, особенно важно сформировать дескриптор для данного понятия таким образом, чтобы он делал понимание выбранного объема доступным для любого пользователя. Например, чтобы многозначный термин «депрессия» в зависимости от обстоятельств употребления можно было бы интерпретировать как «экономическая депрессия» или «метеорологическая депрессия». Для этого может быть использован квалификатор (см. 6.2.2). В тех случаях, когда это неудобно или недостаточно, или там, где дополнительная информация поможет разъяснить смысл и сделать использование более последовательным, следует сформулировать развернутое лексическое примечание (см. 5.2).

6.2.2    Омографы и реляторы (квалификаторы)

Омографы (иногда для них используют более широкий термин «омонимы») — это слова, имеющие одинаковое написание, но разные значения.

Пример — Cranes (Этот термин может относиться либо к птицам, либо к грузоподъемному оборудованию).

Если омографы используют в качестве терминов тезауруса, то значение каждого из терминов должно быть уточнено. При этом в качестве традиционного способа уточнения используется добавление заключенного в скобки релятора. Релятор должен быть как можно короче и в идеале состоять из одного слова. Часто, являясь более широким термином, релятор призван указывать на контекст или предметную область, к которой рассматриваемое понятие относится. Он не является лексическим примечанием, а входит в состав термина (см. п. 5.2).

Пример —

cranes (birds)    лебедки (птицы)

cranes (lifting equipment)    лебедки (подъемные устройства).

17

ГОСТ P 7.0.91—2015

Содержание

1    Область применения..................................................................1

2    Термины и определения...............................................................1

3    Символы, сокращения и условные обозначения...........................................9

4    Тезаурусы. Обзор и назначение........................................................12

5    Понятия и объем их значения в тезаурусе...............................................14

6    Термины тезауруса..................................................................17

7    Сложные понятия....................................................................30

8 Отношения эквивалентности в одноязычном контексте....................................37

9 Межъязыковая эквивалентность.......................................................42

10    Отношения понятий.................................................................42

11    Фасетный анализ...................................................................50

12    Представление и оформление тезауруса...............................................51

13    Управление разработкой и ведением тезауруса..........................................61

14    Указания по программному обеспечению для ведения тезауруса...........................70

15    Модель данных....................................................................74

16    Интеграция тезаурусов с приложениями................................................85

17    Обменные форматы................................................................88

18    Протоколы........................................................................89

19    Библиография.....................................................................91

III

Релятор следует добавлять к каждому омографу, даже если в предметной области тезауруса один из его смыслов в большей степени привычен, чем все другие. Например, в английском языке «beams (structures)» — это дескриптор, который принят в инженерном тезаурусе, в который кроме того включен еще и термин «beams (radiation)». Например, во французском языке, «eau (boisson)» —дескриптор в экологическом словаре, в состав которого входит еще и дескриптор «eau (environnement)». В русском тезаурусе могут одновременно присутствовать дескрипторы «замок (крепость)» и «замок (запор)».

Если же один из терминов-омографов используется в специализированном тезаурусе, и его значение понятно пользователю тезауруса, релятор может быть опущен. Однако следует предусмотреть возможность того, что объем тезауруса в будущем может быть расширен, или что станет необходимым взаимодействие с другими словарями, охватывающими другие области.

При применении реляторов термины становятся несколько громоздкими, и поскольку некоторые электронные системы испытывают трудности в их применении, то следует избегать их (особенно в качестве дескрипторов) в тех случаях, когда можно найти другой способ устранения неоднозначности. По этой причине, использование многословного термина (как скоро такая многословная форма существует в естественном языке) предпочтительнее, чем использование однословного термина с релятором.

Пример — Термин «industrial plants» следует предпочитать термину «plants (facilities)». Последний термин, однако, может быть введен в качестве аскоиптора. Аналогично русский термин «органы тела» предпочтительнее, чем «органы (анатомия)».

Заключенные в скобки реляторы не должны использоваться для образования инвертированных форм.

Пример — Неправильным является включение в тезаурус инвертированных форм «cookery (fish)» и «pens (fountain)». Вместо них следует использовать термины «fish cookery» (рыбные блюда) и «fountain pens» (авторучки). В последнем примере «fountain» используется для указания типа ручки, а не для устранения неоднозначности слова «реп». (См. также 7.7 о порядке слов в многословных терминах). Допустимым использованием реляторов с термином «реп» в английском языке являются термины «pens (enclosures)» — загоны и «pens (writing implements)» — средства письма. Правильное использование реляторов с термином «audition» во французском языке: «audition (physiologie)» и «audition (communication)». В русском языке: «корпус (тело)», «корпус (изделие)», «корпус (армейский)».

В случае сокращений и аббревиатур, которые часто являются омографами, релятором должна служить полная форма термина (см. также 6.6.8). Квалификаторы для акронимов и аббревиатур следует использовать только тогда, когда их значение пользователями тезауруса признается неоднозначным, т.е., когда у этих форм есть еще одно известное значение или в покрываемой тезаурусом области, или общем языковом употреблении.

6.2.3    Определения

Как правило, для уточнения того, как следует использовать дескриптор, не требуется наличия полного определения. Однако если по какой-то причине необходимо дать определение, то для него должно быть отведено отдельное поле, чтобы нельзя было спутать определение с лексическим примечанием. При каждом определении должен быть указан источник, из которого оно взято.

Пример —

Chiaroscuro

DEF The style of pictorial art in which only the light and shade are represented (OED)

кьяроскуро

Определение: Стиль живописи, использующий только свет и тень (OED).

Примечание — «OED» означает Oxford English Dictionary (www.oed.com). Любая подобная аббревиатура, встречающаяся в тезаурусном определении или лексическом примечании, должна быть объяснена во введении к тезаурусу (см. 13.4).

6.2.4    Исторические справки

Изменения терминов, возникающие во время обновления тезауруса, могут оказать влияние на эффективность поиска понятий. В таких случаях может помочь использование исторической справки.

Историческая справка должна относиться только к одному дескриптору, аскриптору или понятию. Ею следует пользоваться тогда, когда в тезаурус добавляется новый дескриптор или же существующий термин претерпел изменения, которые влияют на объем понятия в разные периоды использования тезауруса. Хотя подобную информацию можно включить в лексическое примечание, предпочтительнее создать историческую справку. Историческая справка может фиксировать дату введения термина или предоставлять более сложные рекомендации относительно того, как искать это же понятие на предшествующих и последующих этапах.

18

ГОСТ Р 7.0.91-2015 (ИСО 25964-1:2011)

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУСЫ ДЛЯ ИНФОРМАЦИОННОГО ПОИСКА

System of standards for information, librarianship and publishing.

Thesauri for information retrieval

Дата введения — 2016—07—01

1    Область применения

В настоящем стандарте установлены рекомендации, касающиеся развития и ведения информационно-поисковых тезаурусов. Эти рекомендации могут быть применены и к другим словарям, используемым в процессе информационного поиска во всех типах информационных ресурсов. При этом возможность такого применения не зависит от типа средств, используемых при передаче информации (текст, звук, неподвижный или движущийся образ, физический или мультимедийный объект), включая базы знаний, порталы, базы библиографических данных, тексты, музейные или мультимедийные коллекции в целом и входящие в их состав самостоятельные единицы.

В этом стандарте даются рекомендации, касающиеся развития и ведения информационно-поисковых тезаурусов. Эти рекомендации могут быть применены и к другим словарям, используемым в процессе информационного поиска во всех типах информационных ресурсов.

Сферой применения настоящего стандарта являются как одноязычные, так и многоязычные тезаурусы.

В сферу действия настоящего стандарта не входит подготовка указателей, помещаемых в конце изданий, однако некоторые из предлагаемых настоящим стандартом рекомендаций могут быть использованы и для этой цели.

Хотя рекомендации настоящего стандарта не предназначены для создания баз данных или программного обеспечения, используемого непосредственно в процессе поиска или индексирования, однако содержащиеся в данном стандарте рекомендации по вопросам тезаурусного менеджмента предполагают возможность разработки таких приложений.

2    Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:

2.1    классификационный ряд (array): Группа соподчиненных понятий (2.52).

Пример — Соподчиненные понятия «outerwear» (верхняя одежда) и «underwear» (нижняя одежда) вместе с понятием «clothing» (одежда) формируют классификационный ряд:

clothing    одежда

outerwear    верхняя одежда

overcoats    пальто

underwear    нижняя одежда

2.2    ассоциативные отношения (associative relationship): Отношения внутри пары понятий (2.11), которые не связаны иерархически, однако имеют сильную смысловую связь.

2.3    вышестоящий термин (broader term): Дескриптор (2.45), обозначающий более широкое понятие (2.11), чем обозначаемое данным дескриптором.

Примечание — Тематическая область более узкого понятия целиком находится внутри тематической области более широкого понятия. Отношения между этими двумя понятиями обычно обозначается меткой ВТ. Более подробные объяснения см. в 10.2.1.

Издание официальное

2.4    основание деления (characteristic of division): Признак, по которому понятие (2.11) может разделяться на ряд (2.1) более узких понятий (2.21), каждое из которых имеет значение этого признака, отличное от других.

Примечание — Ср. фасетный анализ (2.21), узловая метка (2.38).

Пример — Возрастная группа является основанием деления понятия «люди»:

люди

(по возрасту) дети молодежь взрослые.

2.5    классификация (classification), классифицирование (classifying): Деятельность, подразумевающая объединение сходных и родственных объектов вместе; разъединение несходных и не имеющих родства объектов; и представление результирующих групп в логической и удобной последовательности.

2.6    классификационная схема (classification scheme): Таблица (2.49) понятий (2.11) и предкоор-динированных комбинаций понятий (2.11), организованная классификацией (2.5).

Примечание — В состав классификационной схемы часто входят также указатели понятий.

2.7    термин-неологизм (coined term): Новый термин (2.61), созданный для выражения понятия

(2.11), для которого в соответствующем языке не существует подходящего термина (2.61).

Примечание — Более подробные объяснения см. в 6.6.5 и 8.3.3.3.

2.8    сложная эквивалентность (compound equivalence): Отношение или соответствие, в рамках которого один термин (2.61) или понятие (2.11) одного контекста представлено двумя или более терминами (2.61) или понятиями (2.11) в другом контексте.

2.9    составной термин (compound term): Термин (2.61), который в соответствие с морфологическими законами может быть разложен на самостоятельные отдельные компоненты.

Примеры —

1    В английском языке:

«Copper mine» можно расщепить на «сорре» и «mines»;

«lawnmowers» можно расщепить на «lawns» и «mower»

2    Во французском языке:

«mine de cuivre» можно расщепить на «mine» и «cuivre»;

«biodiversite» можно расщепить на «biologie» и «diversite».

3    В русском языке:

«медные шахты» можно расщепить на «медь» и «шахты»;

«биоразнообразие» можно расщепить на «биология» и «разнообразие».

Примечание — Составной термин может состоять как из нескольких слов, так и из одного слова.

2.10    компьютерное приложение (computer application): Компьютерная программа или набор компьютерных программ, с помощью которых осуществляется обработка данных высокого уровня в соответствии с определенными потребностями пользователя.

Примечание —Внастоящемстандартекомпьютерноеприложениечастоназываютпросто«приложение».

2.11    понятие (concept): Единица мысли.

Примечание — Понятия часто имеют несколько разных способов выражения. Они существуют в сознании в виде абстрактных единиц, которые независимы от терминов, используемых для их выражения. Они варьируют в широком диапазоне от очень простых понятий, например, «ребенок», до очень сложных, например, «законодательство о защите детей».

2.12    контрольный словарь (controlled vocabulary): Рекомендуемый список терминов (2.61), рубрик или кодов, каждый из которых представляет понятие (2.11).

Примечание — Контрольные словари проектируются для приложений, в которых полезно идентифицировать каждое понятие с помощью одной и той же (постоянной) рубрики, когда проводят классифицирование, индексирование и/или поиск документов.

2

ГОСТ P 7.0.91—2015

2.13    межъязыковая эквивалентность (cross-language equivalence): Отношение эквивалентности (2.18) между терминами (2.61), представляющими одно и то же понятие (2.11) в различных языках.

2.14    модель данных (data model): Абстрактная модель, описывающая то, как данные представляются и используются.

Примечание — Модель данных в настоящем стандарте обеспечивает общее определение структуры и семантики тезауруса. Она может быть использована в качестве основы для определения либо модели базы данных, либо обменного формата тезаурусов.

2.15    документ (document): Любой ресурс, который может быть классифицирован или индексирован для того, чтобы стал возможным поиск содержащихся в нем данных или информации.

Примечание — Это определение распространяется не только на материалы, написанные и отпечатанные на бумажном носителе или представленные в виде микрофильма (обычные книги, журналы, диаграммы, карты), но и на непечатные способы передачи информации. Например, такие как машиночитаемые носители и оцифрованные записи, ресурсы Интернета и интранета, фильмы, звукозаписи, люди и организации как носители научных знаний, здания (buildings), местности, монументы, трехмерные объекты действительности, а также собрания и составные части таких единиц.

2.16    входной термин, вводящий термин (entry term, lead-in term): Термин (2.61), представленный в контрольном словаре (2.12), но используемый не непосредственно в качестве метаданных (2.33), а для того, чтобы привести пользователя к другому термину (2.61), имеющему статус либо категориальной метки, либо предметного заголовка, либо дескриптора (2.45).

Примечание — Входной термин в составе тезауруса обычно трактуется как непредпочтительный термин, или аскриптор.

2.17    эквивалентное отображение (equivalence mapping): Соответствие, фиксирующее некоторое понятие (2.11) в целевом словаре (target vocabulary), которое признается идентичным по объему понятию (2.11) исходного словаря (source vocabulary).

Примечание — См. отношение эквивалентности (2.18).

2.18    отношение эквивалентности (equivalence relationship): Отношение между двумя терминами (2.61) в тезаурусе (2.62), показывающее, что оба эти термина обозначают одно и то же понятие (2.11).

Примечание — В обычном словоупотреблении это термины, являющиеся квазисинонимами и они могут представлять собой слегка различающиеся понятия. Однако включение в тезаурус устанавливаемого между ними отношения эквивалентности определяет, что оба эти термина рассматриваются как представители одного итого же понятия. Когда в одноязычный или многоязычный тезаурус включены два или более термина одного и того же языка, то один из них выбирается в качестве дескриптора, а другой в качестве аскриптора; а когда два или более таких терминов являются представителями разных языков в многоязычном тезаурусе, каждый из них может выступать как дескриптор в своем собственном языке, и эти отношения принято называть межъязыковой эквивалентностью.

2.19    обменный формат (exchange format): Машиночитаемый формат для представления информации, предназначенный для облегчения обмена информацией между различными приложениями.

Примечание — Обменный формат для тезауруса часто использует язык разметки, например, на основе стандарта XML (Extensible Markup Language) [63, 64, 65, 66] и основывается на модели данных тезауруса. Если модель данных представляет собой общее описание структуры и семантики тезауруса, то обменный формат выражает это на формальном языке для задачи обмена тезаурусами.

2.20    фасет (facet): Группа однородных понятий (2.11) одной и той же природной категории.

Примеры —

1    Животные, мыши, нарциссы и бактерии могут рассматриваться как члены фасета живых организмов.

2    Копание, писание и кипячение могут рассматриваться как члены фасета действий.

3    Париж, Великобритания и Альпы могут рассматриваться как члены фасета территорий.

Примечания

1    Примерами таких категорий высокого уровня, которые могут быть использованы для группировки понятий в фасеты, являются следующие категории: предмет, материал, действующий агент, действие, место и время.

2    Ср. узловая метка (2.38).

3

2.21    фасетный анализ (facet analysis): Выявление в предметной области входящих в ее состав понятий (2.11), сгруппированных в фасеты (2.20), и подразделение понятий (2.11) на более узкие понятия (2.11) на основе специальных оснований деления (2.4).

2.22    фасетный индикатор (facet indicator): Элемент классификационного индекса, который указывает начало нового фасета (2.20) внутри синтезированного сложного классификационного индекса (2.40).

Примечание — Примерами фасетного индикатора могут служить 0 в десятичной классификации Дьюи, скобки и кавычки в УДК. В прошлом термин «фасетный индикатор» использовался как синоним для термина «узловая метка», но во избежание путаницы в настоящем стандарте такое использование запрещено.

2.23    иерархические отношения (hierarchical relationship): Отношение между двумя понятиями

(2.11), при котором объем одного из них полностью находится внутри объема другого.

Примечание — Существует несколько разных типов иерархических отношений. Более подробно об этом см. в 10.2. См. также вышестоящий (родовой) дескриптор (2.3), нижестоящий (видовой) дескриптор (2.37).

2.24    омограф (homograph): Одно, два или более слов, которые пишутся одинаково, но имеют разное значение.

Примеры —

1    В английском языке:

Слово «bank» может означать и «финансовый институт», и «берег реки».

2    Во французском языке:

Слово «avocat» может означать либо юриста, либо фрукт.

3    В русском языке:

Слово «лук» может означать либо растение, либо оружие.

Примечание — Омографы иногда называют омонимами, хотя последний термин имеет более широкое значение, поскольку включает амофоны, т.е. такие пары терминов как «weights» и «waits» в английском, «тег» и «теге» во французском или «код» и «кот» в русском языке, которые пишутся по-разному, а читаются одинаково.

2.25    идентификатор (identifier): Набор знаков, обычно алфавитно-цифровых, обозначающий понятие (2.11), термин (2.61) или какую-то другую сущность, используемый, особенно в компьютерных системах или сетях, для достижения однозначной идентификации внутри определенного контекста или ресурса.

Примечание — Иногда в качестве идентификатора используется классификационный индекс.

2.26    индексный термин (index term): Термин (2.61) приписанный документу (2.15) в процессе индексирования (2.27).

Примечание — Иногда индексные термины называют терминами индексирования, ключевыми словами или метками. Но два последних термина являются многозначными. В качестве индексных терминов часто используют дескрипторы тезаурусов.

2.27    индексирование (indexing): Интеллектуальный анализ предметного содержания документа (2.15) для идентификации представленных в нем понятий (2.11) и предоставление соответствующих индексных терминов (2.26) для обеспечения поиска информации.

Примечание —Для обозначения этого понятия используется термин «предметное индексирование (предметизация)», но поскольку в настоящем стандарте индексирование таких элементов как имена авторов, даты не рассматриваются, достаточно использовать термин «индексирование». Индексирование может осуществляться как пользователями-лкадьми, так и в автоматическом режиме.

2.28    информационный поиск (information retrieval): Все методы и процессы, используемые для того, чтобы выбрать из документной коллекции или сети информационных ресурсов документы (2.15), релевантные информационным потребностям.

Примечание — Это определение включает подбор и исключение документов из выборки, а также их просмотр и другие формы отыскания информации.

2.29    совместимость (interoperability): Способность двух или более систем или компьютеров обмениваться информацией и использовать информацию, полученную в результате такого обмена.

Примечание — Словари могут поддерживать совместимость путем включения связей с другими словарями, представления информации в стандартных форматах и путем использования систем, которые поддерживают общие компьютерные протоколы.

4

ГОСТ P 7.0.91—2015

2.30    заимствованный термин (loan term): Термин (2.61), взятый из другого языка и принятый заимствующим языком.

Примеры —

1    «glasnost» — русский термин, который принят в английском языке;

2    «gourmet» — французский термин, который принят в английском языке;

3    «компьютер» — английский термин, который принят а русском языке.

2.31    разметка (markup): Примечания или какой-либо другой вид кодов, включенных в текст в соответствии с правилами языка разметки (2.32).

2.32    язык разметки (markup language): Набор правил кодирования, которые могут быть использованы для составления инструкций по интерпретации текста за счет использования примечаний, включенных непосредственно в сам текст.

Примечание — Интерпретация касается таких вопросов, как содержание, структура и представление текста. Широко используемые примеры включают HTML (Hipertext Markup Language) [59], который в основном касается представления, и XML (Extensible Markup Language) [61, 62, 63, 64] и указывает структуру текста.

2.33    метаданные (metadata): Данные, которые идентифицируют атрибуты документа (2.15), для которых типичным является поддержка функций размещения, доступа, документирования, оценки и/ или выбора.

Примечание — Дескрипторы и классификационные индексы, выбранные в процессе индексирования, применяют в качестве значений метаданных.

2.34    моноиерархическая структура (monohierarchical structure): Иерархическая организация понятий (2.11) в тезаурусе (2.62) или классификационной схеме (2.6), в которой каждое понятие (2.11) может иметь непосредственно над собой только одно вышестоящее понятие (2.11).

Примечание — Ср. полииерархическая структура (2.42).

Пример — В моноиерархи ческой структуре понятие «пианино» не может одновременно причисляться и к клавишным инструментам, и к струнным инструментам; чтобы определить его место в структуре следует выбрать одну из этих возможностей.

2.35    многоязычный тезаурус (multilingual thesaurus): Тезаурус (2.62), в котором термины (2.61) и структура отношений представлены на двух или более естественных языках.

2.36    многословный термин (multi-word term): Термин (2.61), состоящий более чем из одного слова.

Примечание — Ср. расщепляемый термин (2.9).

Пример — Cost benefit analysis, анализ иен и прибыли.

2.37    нижестоящий (видовой) дескриптор (narrower term): Дескриптор (2.45), представляющий понятие (2.11), которое по значению уже, чем рассматриваемое понятие.

Примечание — Объем видового дескриптора полностью располагается внутри объема родового дескриптора. Отношение видового дескриптора к родовому обозначается меткой NT, а статус родового меткой ВТ. Более подробно см. 10.2.1.

2.38    узловая метка, метка узла (node label): Обозначение, проставляемое в иерархическом или классификационном указателе для того, чтобы показать, как упорядочены термины.

Примечание — Узловая метка не является ни дескриптором, ни аскриптором. Она включает один из двух видов информации:

a)    имя фасета, к которому принадлежат следующие за ней термины;

b)    атрибут или основание деления, с помощью которого отсортирован или сгруппирован классификационный ряд близкородственных терминов.

См. примеры в разделе 11.

2.39    аскриптор (non-preferred term, non-descriptor): Термин (2.61), который не приписывают документу (2.15), а используют лишь в качестве входа в тезаурус (2.62) или как указатель для нахождения заменяющего дескриптора.

Примечание — Ср. входной термин (2.16)

5

Пример —

hounds    пес

USE dogs    см. собака1 >

Примечание — В этом примере «hound» и «пес»— аскрипторы, a «dogs» и «собака» — те дескрипторы, которые следует употреблять вместо них.

2.40 классификационный код (индекс) (notation, class code, class number, classmark): Набор знаков, представляющий понятие (2.11) в структурированном словаре (2.56), особенно в классификационной схеме (2.6).

Примеры —

Классификационный

код

Словарь-источник

Понятие

07.04.4

Тезаурус Международной организации труда (ILO)

Политика и развитие рыболовства

622.342 2

Десятичная классификация Дьюи

Добыча золота

373.3.016:51

Универсальная десятичная классификация

Курс математики в начальной школе

SBSXEJ В

Библиографическая классификация Блисса

Закон об охране исчезающих видов

Н40-Н42

Международная статистическая классификация болезней и сходных состояний здоровья

Глаукома

Примечание — Классификационный индекс иногда используется для того, чтобы отсортировать или разместить понятия в предопределенном порядке и, по желанию, показать в указателе, каким образом структурированы и сгруппированы компоненты сложных понятий. Классификационный индекс может осуществлять связь между алфавитной и систематической частью тезауруса. В контексте классификационной схемы «понятия» часто именуют «темами», особенно, если они подобно приведенным выше примерам отличаются сложностью.

2.41    парадигматические отношения (paradigmatic relationship), априорные отношения (a priori relationship): Отношения между понятиями (2.11), которые им внутренне присущи.

Примечание — Такие отношения приводятся в структурированном словаре вне связи с каким-либо индексированным документом. Более подробное обсуждение вопроса о парадигматических и синтагматических отношениях приведено в 4.3.

2.42    полииерархическая структура (polyhierarchical structure): Такая иерархическая организация понятий (2.11) в тезаурусе (2.62) или классификационной схеме (2.6), при которой каждое понятие

(2.11) может иметь более одного вышестоящего (родового) понятия (2.11).

Пример — В полииерархической структуре понятие «органы (музыкальные инструменты)» может одновременно причисляться и к клавишным инструментам, и к духовым инструментам.

Примечания

1    Ср. моноиерархическая структура (2.35).

2    В полииерархической структуре единичное понятие может появляться более чем в одном месте иерархической структуры тезауруса. Его атрибуты и связи и особенно нижестоящие и вышестоящие термины остаются неизменными вне зависимости оттого, где термин встретился.

2.43    посткоординация (post-coordination): Комбинирование дескрипторов (2.45) из контрольного словаря (2.12), осуществляемое во время поиска.

Примечание — Ср. предкоординация (2.44).

Пример — Посткоординированное поисковое предписание «микроволны AND излучения» может использоваться, чтобы получить документы о микроволновом излучении, когда они были проиндексированы с помощью отдельных терминов «микроволны» и «излучения», а нес помощью объединенного термина.

^ Различие шрифтов дескриптора и аскриптора в этом примере соответствует рекомендациям по представлению их в тезаурусе.

ГОСТ P 7.0.91—2015

2.44    предкоординация (pre-coordination): Комбинирование понятий (2.11), классов или терминов

(2.61) из контрольного словаря (2.12) во время создания этого словаря или во время использования его для индексирования (2.27) или классифицирования (2.5).

Примечание — Ср. посткоординация (2.43).

Примеры —

1    Класс «Общая теория», когда он находится в составе более широкого класса «музыка», соотносится только с предкоординированной темой «теория музыки», а нес теорией вообще.

2    Предкоординированная цепочка «картон — переработка» может появиться в словаре предметных рубрик или, если она не была туда включена, то она может быть синтезирована индексатором, если окажется необходимой для индексирования конкретного документа.

2.45    дескриптор (preferred term, descriptor): Термин (2.61), используемый в тезаурусе для представления понятия (2.11) при индексировании (2.27)1).

Примечания

1    Ср. аскриптор (2.39).

2    Дескриптор — это, как правило, существительное или субстантивное словосочетание.

2.46    протокол (protocol): Соглашение, которое определяет синтаксис, семантику и синхронизацию процесса коммуникации между двумя компьютерами для обеспечения информационного поиска.

2.47    квазисиноним, неполный синоним (quasi-synonym, near-synonym): Один из двух или более терминов (2.61), значения которых в рамках обычного использования, как правило, рассматриваются как различные, но которые в данном контрольном словаре (2.12) могут рассматриваться в качестве меток для одного и того же понятия (2.11).

Примеры —

diseases, disorders    болезни, недомогания

earthquakes, earth tremors    землетрясения, сейсмические события

2.48    ассоциативный термин (related term): Дескриптор (2.45), обозначающий такое понятие

(2.11), которое имеет ассоциативную связь (2.2) с рассматриваемым термином.

Примечание — Отношения между ассоциативными терминами обычно обозначаются меткой RT. Более подробные объяснения см. в 10.3.

2.49    классификационная таблица (schedule): Совокупность терминов (2.61), классификационных кодов (2.40), заголовков, перекрестных ссылок и лексических примечаний (2.50), которая служит для представления содержания и структуры структурированного словаря (2.56).

2.50    лексическое примечание (scope note): Запись, которая определяет или уточняет семантические границы понятия (2.11) в рамках его использования в структурированном словаре (2.56).

Примечание —Термин, используемый как метка для обозначения понятия, при обычном использовании имеет несколько значений. Лексическое примечание используют для закрепления за ним только одного из таких значений и, где это необходимо, оно отсылает к другим понятиям, которые включены или исключены из объема уточняемого понятия.

2.51    поисковый термин (search term): Термин (2.61), формирующий поисковый запрос или его часть.

Примечание — В контексте настоящего стандарта поисковые термины обычно выбираются из контролируемого словаря.

2.52    соподчиненное понятие (sibling concept): Одно из двух или более понятий (2.11) с одним и тем же ближайшим вышестоящим понятием (2.11), каждое из которых представлено дескриптором (2.45).

^ Более точное определение дано в [5] «Дескриптор: Лексическая единица, выраженная информативным словом (вербально) или кодом и являющийся именем класса синонимичных или близких по смыслу ключевых слов.» В контексте данного стандарта дескриптор отличается от индексного термина тем, что дескриптор рассматривается как компонент тезауруса.

7