Товары в корзине: 0 шт Оформить заказ
Стр. 1 

138 страниц

1710.00 ₽

Купить ГОСТ Р 57773-2017 — бумажный документ с голограммой и синими печатями. подробнее

Распространяем нормативную документацию с 1999 года. Пробиваем чеки, платим налоги, принимаем к оплате все законные формы платежей без дополнительных процентов. Наши клиенты защищены Законом. ООО "ЦНТИ Нормоконтроль"

Наши цены ниже, чем в других местах, потому что мы работаем напрямую с поставщиками документов.

Способы доставки

  • Срочная курьерская доставка (1-3 дня)
  • Курьерская доставка (7 дней)
  • Самовывоз из московского офиса
  • Почта РФ

Устанавливает принципы описания качества пространственных данных, в том числе: - определяет компоненты для описания качества данных; - устанавливает компоненты и структуру содержания реестра для мер качества данных; - описывает общие процедуры оценки качества пространственных данных; - устанавливает принципы составления отчетности о качестве данных. Стандарт также определяет меры качества данных для использования при оценке и составлении отчетности об их качестве. Он предназначен для разработчиков данных, обеспечивающих информацию о качестве, для описания и оценки того, насколько набор данных соответствует спецификации продукта, а также для пользователей данных, пытающихся определить, обладают ли конкретные пространственные данные достаточным качеством, необходимым для их частного применения. Стандарт не преследует цель определения минимально приемлемых уровней качества пространственных данных.

 Скачать PDF

Содержит требования ISO 19157:2013

Оглавление

1 Область применения

2 Соответствие

3 Нормативные ссылки

4 Термины и определения

5 Сокращенные термины

6 Обзор качества данных

7 Компоненты качества данных

     7.1 Обзор компонентов

     7.2 Единица качества данных (data quality unit)

     7.3 Элементы качества данных (data quality elements)

     7.4 Дескрипторы элементов качества (descriptors of data quality elements)

     7.5 Элементы метакачества (metaquality elements)

     7.6 Дескрипторы элемента метакачества (descriptors of a metaquality element)

8 Меры качества данных (data quality measures)

     8.1 Общие положения

     8.2 Стандартизированные меры качества данных

     8.3 Создание определяемых пользователем мер качества данных

     8.4 Каталог мер качества данных

     8.5 Список компонентов

     8.6 Подробное описание компонентов

9 Оценка качества данных (data quality evaluation)

     9.1 Процесс оценки качества данных

     9.2 Методы оценки качества данных (data quality evaluation methods)

     9.3 Обобщение и преобразование (aggregation and derivation)

10 Отчетность о качестве данных (data quality reporting)

     10.1 Общие положения

     10.2 Частные случаи

Приложение А (обязательное) Комплекс проверок

Приложение В (справочное) Концепции оценки качества данных и их применение

Приложение С (обязательное) Словарь данных для оценки качества

Приложение D (обязательное) Перечень стандартизированных мер качества данных

Приложение Е (справочное) Оценка и выдача информации о качестве данных

Приложение F (справочное) Методы выборочной оценки

Приложение G (обязательное) Базовые меры качества данных

Приложение Н (справочное) Управление мерами качества данных

Приложение I (справочное) Руководство по использованию элементов качества

Приложение J (справочное) Обобщение результатов оценки качества

Приложение ДА (справочное) Сопоставление структуры настоящего стандарта со структурой примененного в нем международного стандарта

Приложение ДБ (справочное) Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандарте

Библиография

Нормативные ссылки:
Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

^^

НАЦИОНАЛЬНЫЙ

ГОСТР

57773—

СТАНДАРТ

2017

РОССИЙСКОЙ

ФЕДЕРАЦИИ

(ИСО 19157:

2013)

ПРОСТРАНСТВЕННЫЕ ДАННЫЕ

Качество данных

(ISO 19157:2013,

Geographic information — Data quality, MOD)

Издание официальное

Москва

Стандартинформ

2017

Предисловие

1    ПОДГОТОВЛЕН Федеральным государственным бюджетным учреждением «Федеральный научно-технический центр геодезии, картографии и инфраструктуры пространственных данных» (ФГБУ «Центр геодезии, картографии и ИПД») на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4

2    ВНЕСЕН Техническим комитетом по стандартизации ТК 394 «Географическая информация/гео-матика»

3    УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 6 октября 2017 г. № 1367-ст

4    Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 19157:2013 «Географическая информация — Качество данных» (ISO 19157:2013 «Geographic information — Data quality, MOD») путем включения дополнительных фраз, слов, ссылок и внесения изменений по отношению к тексту применяемого международного стандарта, которые выделены курсивом, подчеркиванием сплошной горизонтальной линией, а также невключения отдельных структурных элементов, ссылок и дополнительных элементов. Объяснения причин внесения этих технических отклонений приведены во введении.

Сопоставление структуры настоящего стандарта со структурой указанного международного стандарта приведено в дополнительном приложении ДА.

Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5).

Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандарте, приведены в дополнительном приложении ДБ

5    ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. № 162-ФЗ «О стандартизации в Российской Федерации». Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

© Стандартинформ, 2017

В Российской Федерации настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

ГОСТ P 57773—2017
7.3.2    Полнота (completeness)

Полнота определяется наличием и отсутствием объектов, их атрибутов и отношений. Она состоит из двух элементов качества данных:

-    присутствие (commission): избыточность данных в наборе данных;

-    отсутствие (omission): отсутствие данных в наборе данных.

7.3.3    Логическая согласованность (logical consistency)

Под логической согласованностью понимают степень соответствия логических правил структуры данных, атрибутов и отношений (структура данных может быть концептуальной, логической или физической). Если эти логические правила документально оформлены в другом источнике (например, в спецификации на информационный продукт), то необходимо ссылаться на этот источник (например, при оценке качества данных). Логическая согласованность состоит из четырех элементов качества данных:

-    концептуальная согласованность (conceptual consistency): соответствие правилам концептуальной схемы;

-    доменная согласованность (domain consistency): соответствие значений атрибутов области допустимых значений;

-    согласованность по формату (format consistency): степень, с которой данные хранятся в соответствии с физической структурой набора данных;

-    топологическая согласованность (topological consistency): корректность представления закодированных топологических характеристик набора данных.

7.3.4    Позиционная точность (positional accuracy)

Под позиционной точностью понимают точность положения объектов внутри пространственной системы координат. Она состоит из трех элементов качества:

-    абсолютная или внешняя точность (absolute or external accuracy): степень соответствия заявленных значений координат значениям координат, принятым в качестве правильных или являющимся правильными;

-    относительная или внутренняя точность (relative or internal accuracy): степень соответствия относительного положения объектов в наборе данных их соответствующим исходным положениям, принятым в качестве правильных или являющимся правильными;

-    позиционная точность матричных данных (gridded data positional accuracy): соответствие значений пространственного позиционирования матричных данных значениям, принятым в качестве правильных или являющимся правильными.

7.3.5    Тематическая точность (thematic accuracy)

Под тематической точностью понимают точность количественных атрибутов и корректность неколичественных атрибутов, классификаций объектов и их отношений. Она состоит из трех элементов качества:

-    правильность классификации (classification correctness): соответствие классов объектов или их атрибутов предметной области (например, реальной ситуации или эталонному набору данных);

-    правильность неколичественных атрибутов (non-quantitative attribute correctness): определение, является ли неколичественный атрибут правильным или неправильным;

-    точность количественных атрибутов (quantitative attribute accuracy): степень соответствия значения количественного атрибута значению, принятому в качестве правильного или являющемуся правильным.

7.3.6    Временное качество (temporal quality)

Под временным качеством понимают качество временных атрибутов и временных отношений объектов. Оно состоит из трех элементов качества:

-    точность измерения времени (accuracy of a time measurement): степень соответствия заявленных временных измерений значениям, принятым в качестве правильных или являющимся правильными;

-    согласованность по времени (temporal consistency): правильность временного порядка событий;

-    временная достоверность (temporal validity): достоверность данных по отношению ко времени.

Примечание — В качестве измерения времени может выступать определенный момент времени или период.

Пример — 33 марта — пример неверных данных.

7.3.7    Элемент применимости (usability element)

Применимость основана на требованиях пользователя. Все элементы качества могут быть использованы для оценки применимости. Оценка применимости может основываться на конкретных

7

требованиях пользователей, которые не могут быть описаны с использованием элементов качества, описанных выше. В этом случае должен использоваться элемент применимости с целью предоставления конкретной информации о качестве в отношении пригодности определенного набора данных для конкретного приложения или удовлетворения набору требований.

При использовании элемента применимости рекомендуется использовать все приемлемые дескрипторы элементов качества (см. 7.4) и определять меры качества в соответствии с разделом 8 или приложением D в целях предоставления детальной информации по оценке.

Пример — С помощью данного элемента производитель данных может продемонстрировать, насколько набор данных пригоден для различных указанных способов использования. Данный элемент может быть применен для подтверждения соответствия набора данных конкретной спецификации.

7.4 Дескрипторы элементов качества (descriptors of data quality elements)
7.4.1 Общие положения

Оценка элемента качества данных осуществляется с помощью:

-    меры (measure): тип оценки;

-    метода оценки (evaluation method): процедура, используемая для оценки меры;

-    результата (result): итог оценки.

Рисунок 5 — Дескрипторы элементов качества


Данные дескрипторы представлены на рисунке 5 и описаны в 7.4.2, 7.4.3 и 7.4.4.

7.4.2 Мера (measure)

Элемент качества данных должен ссылаться только на одну меру посредством ссылки (см. рисунок 6), указывая идентификатор меры, полностью описанный в другом месте (DQM_Measure. measureldentifier, см. 8.6.1), и/или указывая имя и краткое описание меры.

Примечание — Полное описание можно найти в реестре или каталоге мер, которые могут образовывать часть спецификации информационного продукта или самостоятельного отчета по качеству.

Рисунок 6 — Ссылки на меры качества данных


From ISO 19115-1:2014


«Data Туре» MD_Identifier


+ authority :CI_Citation [0..1]

+ code :CharacterString + codeSpace :CharacterString [0..1] + version :CharacterString [0..1]

+ description :CharacterString [0..1]


ГОСТ P 57773—2017

Меры качества данных более подробно описаны в разделе 8 настоящего стандарта. В приложении D приведен список стандартизированных мер качества данных.

Пример — Процент значений атрибутов, которые являются верными.

Настоящий стандарт устанавливает, что для измерения качества набора данных используются различные методы. Одной меры качества данных может быть недостаточно для полной оценки качества данных, задаваемых областью определения качества данных, а также для предоставления мер качества для всевозможных вариантов использования набора данных. Комбинация мер качества данных может давать полезную информацию. Несколько мер качества данных могут быть описаны для данных, заданных одной областью определения качества данных. В этом случае отчет о качестве данных должен включать один экземпляр DQ_Element для каждой примененной меры.

7.4.3 Метод оценки (evaluation method)

Метод оценки качества данных описывает те процедуры и методы, которые применяются к пространственным данным для получения результата оценки качества данных (см. рисунок 7). Для различных элементов качества данных часто используются различные методы оценки.

Для каждой примененной меры качества должен быть включен метод оценки качества. Метод оценки качества данных используется для описания методологии, используемой для применения меры качества данных для данных, задаваемых некоторой областью их определения, или для описания документации, в которой такая методология описывается.

Примечание — Оценка качества данных подробнее описана в разделе 9.

Пример — Примерами такой документации являются спецификации на информационный продукт, опубликованные статьи или утвержденные отраслевые стандарты.

Для каждой оценки следует указывать дату или диапазон дат. Если оценка проводилась в непоследовательном временном порядке, то следует указывать каждую отдельную дату. Даты изложены в соответствии с требованиями [2].


Data quality::DQ_Element

+ standaloneQualityReportDetails :CharacterString [0..1]

+ derivedElement 0..*


+ evaluationM ethod    0..1


DQ_EvaluationMethod


+ dateTime :DateT im e [0..*]

+ evaluationM ethodDescription :CharacterString [0..1]

+ evaluationProcedure :CI_Citation [0..1]

+ referenceDoc :CI_Citation [0..*]

+ evaluationM ethodType :DQ_E valuationM ethodTypeCode [0..1]


« С о d e L i st»

DQ_E v aluationM ethodTypeCode


+ directlnternal + directExternal + indirect


Рисунок 7 — Метод оценки качества данных


7.4.4 Результат (result)

7.4.4.1 Общие положения

Для каждого элемента качества данных должно быть обеспечено не менее одной результирующей оценки качества. Это может быть количественный результат, результат соответствия, описательный результат или результат покрытия (см. также рисунок 8).

Примечание — Для одного элемента качества данных могут применяться различные типы результатов.

Для различных частей набора данных качество часто различается. Поэтому несколько оценок могут быть применены для одного элемента качества данных для более полного и более детального описания количественной информации о качестве. Чтобы избежать повторных описаний мер и проце-


9


Рисунок 8 — Результат оценки качества

дур оценки для нескольких экземпляров элемента качества данных (DQ_Element), можно использовать несколько результатов с областью применения индивидуальных результатов.

Примечание — Результирующая область — это подгруппа области определения качества данных (см. 7.2).

Пример — Набор данных содержит объекты идентичного типа, положение которых было установлено с помощью отличающихся методов и с различной точностью определения местоположения. Однако для всего набора данных применяются одни и те же процедура и мера оценки качества, которые дают различные результаты в зависимости от метода сбора данных. В этом случае может быть желательно иметь несколько результатов с отдельными результирующими областями (зона, охватываемая каждым методом сбора данных) и одной областью определения качества данных (набор данных).

7.4.4.2 Количественный результат (quantitative result)

Количественным результатом может быть одно или несколько значений, в зависимости от значений атрибутов valueType и valueStructure, определенных в описании применяемой меры.

Атрибут valueRecordType используется для описания того, как valueType и valueStructure, определенные данной мерой, реализованы для получения значения количественного результата.

Примечание — Атрибут valueRecordType принадлежит к типу RecordType, который является универсальным типом данных согласно [3]. Его значение меняется в зависимости оттого, какое решение по реализации используется для получения количественного результата. Пример реализации XML для RecordType дан в [4].

Пример 1 — Использование XML: простой пример: value = 5, valueRecordType = gco.lnteger, valueUnit = «metre.»

Пример 2 — В рамках описания меры, valueType — целочисленная переменная, a valueStructure: матрица (пхп). Значение атрибута количественного результата обеспечивает результат самой матрицы в пределах числового кодирования, использующего определенный тип XML, называемый MatrixType (например). В XML атрибут valueRecordType обеспечивает описание типа MatrixType. Если применяется другая кодировка, то атрибут valueRecordType изменяется для обеспечения описания

10

ГОСТ P 57773—2017

типа Matrix в другой кодировке, и, соответственно, изменяется реализация вычисления значения атрибута, но само значение остается прежним.

Для каждого результата должна быть установлена отдельная единица значения в соответствующих случаях.

Пример 3 — Возможные единицы расстояния: метр, сантиметр, миллиметр.

Пример 4 — Мера «уровень избыточных элементов» (см. таблицу D.3) используется для оценки количества избыточных элементов в наборе данных по отношению к количеству элементов, которые должны быть представлены. Результат количественного значения имеет тип значения Real. В этом случае единица значения указывается в процентах, значение умножается на 100. В этом примере единицей значения является «процент», «%».

7.4.4.3    Результат соответствия (conformance result)

Результат соответствия — это результат сравнения значения или набора значений, полученных в результате применения некоторой меры качества к данным, заданным областью определения качества, с учетом установленного приемлемого уровня соответствия качества.

Когда уровень соответствия качества определен, его сравнивают с полученным результатом с целью выявления того факта, что качество данных удовлетворяет заданному уровню качества.

Результат соответствия может быть установлен для каждой меры. Уровень соответствия качества определяется в соответствующей документации, такой как спецификация к информационному продукту или спецификация требований, определенных пользователем. При определении соответствия необходимо ссылаться на соответствующую нормативно-техническую документацию и указывать примененный уровень соответствия качества.

Для одной меры предусмотрено более одного результата соответствия качества данных, если процедура оценки противоречит уровню соответствия, установленного в различных источниках.

7.4.4.4    Описательный результат (descriptive result)

В некоторых случаях (например, при тематических и геонаучных исследованиях) проведение количественной результирующей оценки для элемента качества данных не представляется возможным. Тогда субъективная оценка элемента может быть выражена в текстовом формате в качестве описательного результата качества данных.

Пример — Относительная точность положения выше между геологическим объектом и соседним объектом на топографической карте (дороги, реки, озера и т. д.), чем абсолютная точность положения самого геологического объекта.

Данный описательный результат также может быть использован для проведения короткого синтетического описания результата оценки качества данных, сопровождения полного количественного результата или полной его замены в случае, если количественные значения не могут быть предоставлены.

7.4.4.5    Результат покрытия (coverage result)

Результат покрытия — это результат оценки качества данных, формализованных в виде покрытия. Он описан в ГОСТ Р 57656.

7.5    Элементы метакачества (metaquality elements)

Элементы метакачества представляют собой набор количественных и качественных отчетных данных об оценке качества и его результате. Знания о качестве и пригодности метода оценки, примененных мерах и данном результате могут иметь такое же значение, как и сам результат.

Пример оценки метакачества см. в Е.5.3 приложения Е.

Метакачество может быть описано с использованием следующих элементов, представленных на рисунке 9:

- достоверность (confidence): надежность результата качества данных.

Примечание — Количественные показатели достоверности могут быть получены посредством статистических параметров, таких как стандартное отклонение или доверительный интервал с заданным уровнем достоверности.

Пример — Достоверность зависит в первую очередь от используемого метода и его надежности, а также в меньшей мере от соответствующей генеральной совокупности;

11

-    репрезентативность (representativity): степень репрезентативности данных в пределах области определения качества данных в соответствии с результатом выборки.

Примечание — Статистический метод, основанный на выборке, может считаться таким же надежным, как и глобальный метод, когда охвачены все географические зоны и рассматриваемые временные диапазоны, а генеральная совокупность достаточно велика. Важен не только объем выборки, который имеет решающее значение, но и тот факт, насколько точно отражается текущее состояние данных. См. также 9.2.2 и приложение F;

-    гомогенность (homogeneity): ожидаемая или тестируемая однородность результатов, полученных для оценки качества данных.

Примечание — Однородность заключается в сравнении результатов оценки нескольких сегментов глобального набора данных. Это сравнение может быть выражено, например, посредством среднеквадратических ошибок. Гомогенность невозможно оценить в случае общего процесса, так как результат носит глобальный характер.

Примечание — Такие тесты часто проводятся при сборе данных различными операторами в зависимости от зоны или времени сбора данных.

Рисунок 9 — Элементы метакачества

7.6 Дескрипторы элемента метакачества (descriptors of a metaquality element)

Для описания элемента метакачества используются те же дескрипторы, что и для элемента качества [мера, метод оценки и результат (см. 7.4 и рисунок 10)]. Дополнительно должен применяться следующий дескриптор:

- связанный элемент качества.

Примечание — Связанный элемент качества — это элемент, к которому применяется элемент метакачества.

Пример оценки метакачества см. в Е.5.3 приложения Е.

Рисунок 10 — Дескрипторы метакачества

ГОСТ P 57773—2017

8 Меры качества данных (data quality measures)

8.1    Общие положения

Для облегчения сравнения набора данных необходимо, чтобы результаты в отчетах по качеству данных представлялись в сравнительном виде, а также чтобы имелось общее представление об использованных мерах качества данных. Чтобы сделать оценки качества данных и отчеты о качестве данных (в виде метаданных или самостоятельного отчета по оценке качества) из различных источников сопоставимыми, должны использоваться по возможности стандартизированные меры качества данных, описанные в приложении D.

8.2    Стандартизированные меры качества данных

Перечень стандартизированных мер качества данных приведен в приложении D. Каждая мера качества данных этого списка содержит все необходимые компоненты, указанные в разделе 8. Для каждого элемента качества данных предусмотрено применение нескольких мер. Какие из них использовать, зависит от типа данных и их предполагаемого назначения. Меры из этого перечня должны быть использованы в рамках реализации данного стандарта.

Любой реестр, установленный для управления стандартизированными мерами качества данных, приведен в [5].

8.3    Создание определяемых пользователем мер качества данных

Вследствие природы качества и пространственных данных перечень стандартизированных мер качества данных не может быть полным. Возможны случаи, когда пользователь настоящего стандарта вынужден разрабатывать другие меры качества данных. По возможности эти меры должны быть определены с помощью базовых мер качества данных, описанных в приложении G, а сама мера — в соответствии со структурой, приведенной в разделе 8.

8.4    Каталог мер качества данных

Для более полного описания мер, указанных в отчете по оценке качества данных, каталоги мер качества данных могут быть предоставлены совместно с метаданными или в онлайн-режиме.

Каталог может содержать набор мер, применяемых в одном или нескольких отчетах со всеми необходимыми компонентами для мер качества данных, указанных в настоящем стандарте.

Каталог (как и реестр) позволяет пользователю описывать меру и хранить информацию для того, чтобы иметь возможность ссылаться на него при каждой необходимости, вместо повторного описания меры в отчете по качеству данных.

Приложение Н описывает структуру каталога мер. В [4] представлен XML-механизм для ассоциирования каталога с набором метаданных.

8.5    Список компонентов

Каждая мера качества данных описывается следующими компонентами:

-    идентификатор меры (8.6.1);

-    название (8.6.2);

-    краткое название (8.6.3);

-    название элемента (8.6.4);

-    базовая мера (8.6.5);

-    определение (8.6.6);

-    описание (8.6.7);

-    параметр (8.6.8);

-    тип значения (8.6.9);

-    структура значения (8.6.10);

-    ссылка на источник (8.6.11);

-    пример (8.6.12).

На рисунке 11 представлены компоненты меры качества данных.

13

DQM_SourceReference


+ citation :CI Citation


+ source Re fere nee

0..*


DQM_BasicMeasure


-    name :CharacterString

-    definition :CharacterString

-    example :DQM_Description [0..1]

-    valueType TypeName

Ограничения {valueType должен быть одним из типов, определенных в ISO/TS 19103}


DQM_Measure


■basicM е a sure


m easureldentifier :M D_Identifier name :CharacterString alias :CharacterString [0..*] elementName :TypeName [1..*] definition :CharacterString description :DQM_Description [0..1] valueType :TypeName

valueStructure :DQM _ValueStructure [0..1] example :DQM_Description [0..*]


1..*


0..1


Ограничения

{elementName должен иметь значение TypeName данных} {valueType должен быть одним из типов, определенных в ISCyTS 19103}

{valueStructure включается, если результат включает более чем одно значение}


DQM_Parameter


param eter


+ name :CharacterString + definition :CharacterString + description :DQM_Description [0..1]

+ valueType TypeName

+ valueStructure :DQM_ValueStructure [0..1

Ограничения {valueType должен быть одним из типов, определенных в ISCyTS 19103}


1..*


0..’


« С о d е L i st» DQM_ValueStructure


«Datatype»

DQM_Description


bag

set

sequence table m atrix coverage


textDescription :CharacterString extendedDescription :M D_BrowseGraphic [0..1]


Рисунок 11 — Меры качества данных

8.6 Подробное описание компонентов

8.6.1    Идентификатор меры (measure identifier)

Идентификатор — это значение, уникально идентифицирующее меру в пространстве имен.

Примечание — Данный идентификатор устанавливает ссылки на меру качества данных в элементах качества данных (см. 7.4.2).

8.6.2    Название (name)

Название — это название меры.

Примечание — Если мера уже имеет общепринятое название, то должно использоваться это название. Если же такого названия не существует, то следует выбрать такое название, которое отражает характер этой меры.

8.6.3    Условное название (alias)

Условное название — это другое отличительное наименование для той же меры качества данных. Им может быть иное общепринятое наименование либо аббревиатура или же краткое имя. Возможно использование более одного условного названия.

8.6.4    Название элемента (element name)

Название элемента — это название элемента качества данных (см. 7.3 и 7.5), к которым применяется некая мера. Возможно использование более одного имени элемента.

8.6.5    Базовая мера (basic measure)

Если какая-либо мера основана на одной из базовых мер, то она должна быть описана его именем, определением и типом значения. Базовые меры идентифицируются по своим именам.

Множество мер основано на подсчете ошибочных элементов. Существуют также некоторые меры, связанные с неопределенностью числовых значений. Для того чтобы избежать повторений, наиболее

14

ГОСТ P 57773—2017

распространенные методы построения расчетных мер, а также общие статистические показатели для одно- и двумерных случайных величин должны быть установлены в виде базовых мер.

При необходимости создания новых мер необходимо также использовать базовые меры. Например, для выдачи информации по незамкнутой мозаичной поверхности или других мер в зависимости от приложения.

Примечание — В приложении G приведены базовые меры.

8.6.6    Определение (definition)

Определение является фундаментальным понятием меры.

Примечание — Если мера является производной от базовой меры, то такое определение основывается на определении базовой меры и специфицируется для этой меры.

8.6.7    Описание (description)

Описание — это описание меры, включающее методы подсчета с учетом всех формул и/или иллюстрации, необходимые для получения результата применения этой меры.

Если мера использует концепцию ошибок, то должно быть указано, каким образом элемент классифицируется как некорректный. В этом случае качество может быть описано только как корректное или некорректное.

8.6.8    Параметр (parameter)

Параметр — это вспомогательная переменная, используемая мерой. Она должна включать в себя имя, определение и тип значения. Может использоваться более одного параметра.

Примечание — Пример параметра см. в таблице D.66 приложения D.

8.6.9    Тип значения (value type)

Тип значения — это тип данных, используемый для представления результата меры. Должны использоваться типы данных, определенные в [3].

8.6.10    Структура значения (value structure)

Результат может состоять из множества значений. В таких случаях результат должен быть структурирован с использованием структуры значения, как указано в С.3.3 приложения С.

8.6.11    Ссылка на источник (source reference)

Ссылка на источник — это ссылка на документацию с описанием меры.

Когда мера, для которой предоставляется дополнительная информация из внешнего источника, добавляется в перечень стандартизированных мер, то здесь может быть указана ссылка на этот источник.

8.6.12    Пример (example)

Пример — это пример применения меры или результата, полученного при использовании этой меры. Может быть приведено более одного примера.

9 Оценка качества данных (data quality evaluation)

9.1    Процесс оценки качества данных
9.1.1    Введение

Процессы оценки качества используются на различных фазах жизненного цикла продукта, при этом в каждой фазе их задачи различаются. Здесь рассматриваются следующие фазы жизненного цикла: спецификация, производство, поставка, использование и обновление.

Процесс оценки качества данных представляет собой последовательность этапов для получения результата качества данных.

9.1.2    Последовательность выполнения процесса

Процесс оценки качества представляет собой последовательность шагов, выполняемых для получения результата оценки качества. Рисунок 12 иллюстрирует возможную последовательность действий для оценки качества данных. См. также приложение Е, в котором дано описание концепции оценки и составления отчетности по качеству данных.

Когда оцениваемые пространственные данные неоднородны и разные части имеют разное качество, то тесты должны быть выполнены соответственно для различных частей.

15

Начало процесса оценки

9.1.3 Этапы процесса (process steps)

В таблице 1 представлены этапы процесса.

Таблица 1—Этапы процесса

Этап

процесса

Процесс

Описание

1

Указать единицу(ы) качества данных

Единица качества данных состоит из области определения и элемента (элементов) качества (см. 7.2). Следует использовать все элементы качества, релевантные данным, для которых будет описываться качество.

Примечание — Тестируемые элементы качества данных описаны в 7.3, в приложении 1 приведены рекомендации по использованию элементов качества

2

Указать меры качества данных

В случае применимости для каждого элемента качества данных следует определять меру. В приложении D приведен список мер качества данных

3

Указать процедуры оценки качества данных

Процедура оценки качества данных заключается в применении одного или более методов оценки

4

Определить итог оценки качества данных

Результатом является итог применения оценки

В случае невозможности определения мер возможно использование описательного результата

Оценка метакачества может осуществляться после получения итога оценки качества. Последовательность, описанная выше, также применима к оценке метакачества с учетом следующих этапов процесса: указать элемент метакачества и оценку качества, для которых оценивается метакачество, затем указать меру и метод оценки и определить итог оценки метакачества.

16

ГОСТ P 57773—2017

Содержание

1    Область применения.................................................................1

2    Соответствие........................................................................1

3    Нормативные ссылки.................................................................1

4    Термины и определения..............................................................2

5    Сокращенные термины...............................................................3

6    Обзор качества данных...............................................................3

7    Компоненты качества данных..........................................................5

7.1    Обзор компонентов...............................................................5

7.2    Единица качества данных (data quality unit)...........................................5

7.3    Элементы качества данных (data quality elements)......................................6

7.4    Дескрипторы элементов качества (descriptors of data quality elements).....................8

7.5    Элементы метакачества (metaquality elements).......................................11

7.6    Дескрипторы элемента метакачества (descriptors of a metaquality element).................12

8    Меры качества данных (data quality measures)...........................................13

8.1    Общие положения...............................................................13

8.2    Стандартизированные меры качества данных........................................13

8.3    Создание определяемых пользователем мер качества данных..........................13

8.4    Каталог мер качества данных......................................................13

8.5    Список компонентов.............................................................13

8.6    Подробное описание компонентов..................................................14

9    Оценка качества данных (data quality evaluation)..........................................15

9.1    Процесс оценки качества данных...................................................15

9.2    Методы оценки качества данных (data quality evaluation methods)........................17

9.3    Обобщение и преобразование (aggregation and derivation)..............................18

10    Отчетность о качестве данных (data quality reporting).....................................18

10.1    Общие положения.............................................................18

10.2    Частные случаи...............................................................19

Приложение А (обязательное) Комплекс проверок..........................................20

Приложение В    (справочное) Концепции оценки качества данных и их применение...............21

Приложение С    (обязательное) Словарь данных для оценки качества..........................25

Приложение D    (обязательное) Перечень стандартизированных мер качества данных............38

Приложение Е    (справочное) Оценка и выдача информации о качестве данных..................86

Приложение F    (справочное) Методы выборочной оценки...................................108

Приложение G    (обязательное) Базовые меры качества данных..............................115

Приложение Н    (справочное) Управление мерами качества данных...........................119

Приложение I (справочное) Руководство по использованию элементов качества...............122

Приложение J (справочное) Обобщение результатов оценки качества........................129

Приложение ДА (справочное) Сопоставление структуры настоящего стандарта со структурой

примененного в нем международного стандарта............................131

Приложение ДБ (справочное) Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных

в примененном международном стандарте.................................132

Библиография.......................................................................133

III

ГОСТ P 57773—2017
9.2 Методы оценки качества данных (data quality evaluation methods)
9.2.1 Классификация методов оценки качества данных

Процедура оценки качества данных включает один или более методов оценки качества данных. Методы оценки качества данных можно разделить на два основных класса: прямая (direct) оценка и косвенная (indirect) оценка. Методы прямой оценки определяют качество данных путем сравнения данных с внутренней и/или внешней информацией. Методы косвенной оценки выводят или оценивают качество данных, используя информацию о данных, такую как происхождение. Применение методов прямой оценки предпочтительнее косвенной оценки. Методы прямой оценки, в свою очередь, классифицируются по источнику информации, необходимой для выполнения оценки внутренней или внешней.

На рисунке 13 представлены классы описываемых методов оценки.

Примечание — Происхождение описано в ГОСТ Р 57668.

Рисунок 13 — Методы оценки качества данных

9.2.2 Прямая оценка (direct evaluation)

Метод прямой оценки — это метод оценки качества набора данных, основанный на проверке элементов в наборе данных.

Методы прямой оценки могут быть классифицированы на внутренние и внешние. Внутренняя прямая (internal direct) оценка качества данных использует только те данные, которые содержатся в оцениваемом наборе данных. Внешняя прямая (external direct) оценка качества требует применения эталонных данных, внешних по отношению к тестируемому набору данных.

Примечание — Эталонные данные — это данные, принятые как представляющие предметную область.

Как для внешних, так и для внутренних методов оценки может использоваться один из следующих методов проверки:

-    полный контроль (full inspection);

-    выборочный контроль (sampling).

При полном контроле тестируется каждый элемент в генеральной совокупности, определенной областью качества данных.

Примечание — Полный контроль больше всего подходит для небольших генеральных совокупностей или для тестов, которые могут быть выполнены в автоматическом режиме.

17

Введение

Пространственные данные все чаще распространяют, обменивают и используют для целей, отличных от тех, которые предусматривались разработчиком. Информация о качестве доступных данных имеет важнейшее значение для процесса отбора наборов данных, в которых ценность данных напрямую связана с их качеством. Пользователям пространственных данных представляется множество наборов данных на выбор. В связи с этим возникает необходимость сравнения качества наборов данных с целью определения тех, которые наилучшим образом отвечают потребностям пользователя.

Цель описания качества пространственных данных состоит в облегчении сравнения и выбора набора данных, которые наилучшим образом удовлетворяют потребностям или требованиям приложений. Полные описания качества наборов данных будут способствовать распространению, обмену и использованию соответствующих наборов данных. Информация о качестве пространственных данных позволяет их разработчику оценить, насколько точно данный набор отвечает критериям, изложенным в спецификации продукта, и помогает пользователям данных оценить способность продукта удовлетворять требованиям его конкретного приложения. Для осуществления такой оценки используется ряд четко определенных процедур в последовательном порядке.

С целью облегчения сравнения важно, чтобы результаты в отчетах информации о качестве данных были выражены в сопоставимом виде, а также чтобы было общее понимание использованных мер качества данных. Эти меры качества обеспечивают дескрипторы качества пространственных данных путем сравнения сданными предметной области. Использование несовместимых мер делает сравнение качества данных невозможным. Настоящий стандарт устанавливает требования к компонентам и структуре мер качества данных и определяет общие базовые меры качества данных.

В настоящем стандарте отмечается, что мнение производителя и мнение пользователя о качестве данных могут не совпадать. Уровень соответствия качеству может быть установлен с помощью спецификации на продукт производителя данных или требований к качеству пользователя данных. Если пользователю данных требуется больше информации о качестве данных, чем предусмотрено их производителем, то пользователь данных может ознакомиться с ходом процесса оценки качества данных у производителя, чтобы получить дополнительную информацию. В этом случае требования пользователя данных рассматриваются как спецификация продукта с целью использования в процессе производства данных.

Цель настоящего стандарта — установить принципы описания качества пространственных данных и концепций обработки информации о качестве пространственных данных, а также последовательные и стандартные методы определения и выдачи информации о качестве наборов данных. Задачей стандарта также является обеспечение руководящими принципами процедур оценки количественной информации о качестве пространственных данных.

Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО 19157:2013 «Географическая информация — Качество данных» (ISO 19157:2013 «Geographic information — Data quality»). В настоящий стандарт внесены изменения, необходимые для приведения его в соответствие современным международным и национальным стандартам, в частности изменен раздел нормативных ссылок, уточнена библиография, в тексте стандарта приведены ссылки на национальные стандарты.

IV

ГОСТ Р 57773-2017 (ИСО 19157:2013)

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

ПРОСТРАНСТВЕННЫЕ ДАННЫЕ Качество данных

Spatial data. Data quality

Дата введения — 2018—06—01

1    Область применения

Настоящий стандарт устанавливает принципы описания качества пространственных данных, в том числе:

-    определяет компоненты для описания качества данных;

-    устанавливает компоненты и структуру содержания реестра для мер качества данных;

-    описывает общие процедуры оценки качества пространственных данных;

-    устанавливает принципы составления отчетности о качестве данных.

Настоящий стандарт также определяет меры качества данных для использования при оценке и составлении отчетности об их качестве. Он предназначен для разработчиков данных, обеспечивающих информацию о качестве, для описания и оценки того, насколько набор данных соответствует спецификации продукта, а также для пользователей данных, пытающихся определить, обладают ли конкретные пространственные данные достаточным качеством, необходимым для их частного применения.

Настоящий стандарт не преследует цель определения минимально приемлемых уровней качества пространственных данных.

2    Соответствие

Любой продукт, заявляющий о соответствии настоящему стандарту, должен отвечать всем требованиям, описанным в комплексе проверок, который приведен в приложении А, а именно:

-    процесс оценки качества данных должен пройти проверку, изложенную в разделе А.1 приложения А;

-    метаданные о качестве данных должны пройти проверку, изложенную в разделах А.2 и А.З приложения А;

-    независимый отчет о качестве должен пройти проверку, изложенную в разделе А.4 приложения А;

-    меры качества данных должны пройти проверку, изложенную в разделе А.5 приложения А.

3    Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты:

ГОСТ Р 50779.72-99 Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 2. Планы выборочного контроля отдельных партий на основе предельного качества LC

ГОСТ Р 57668-2017 Пространственные данные. Метаданные. Часть 1. Основные положения

ГОСТ Р 57656-2017 Пространственные данные. Метаданные. Часть 2. Расширения для изображений и матричных данных

ГОСТ Р 57657-2017 Пространственные данные. Спецификация информационного продукта

ГОСТ Р ИСО 2859-3—2009 Статистические методы. Процедуры выборочного контроля по альтернативному признаку. Часть 3. Контроль с пропуском партий

Издание официальное

ГОСТ Р ИСО 3951-1-2015 Статистические методы. Процедуры выборочного контроля по количественному признаку Часть 1. Требования к одноступенчатым планам на основе ACL при контроле последовательных партий по единственной характеристике и единственной ACL

Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю «Национальные стандарты», который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячно издаваемого информационного указателя «Национальные стандарты» за текущий год. Если заменен ссылочный документ, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого документа с учетом всех внесенных в данную версию изменений. Если заменен ссылочный документ, на который дана датированная ссылка, то рекомендуется использовать версию этого документа с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный документ, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

4 Термины и определения

4.1    точность (accuracy): Степень соответствия результата проверки или измерений принятому истинному значению.

Примечание — В настоящем стандарте истинным значением может выступать эталонное значение, принятое за истинное.

4.2    каталог (catalogue): Набор элементов (4.18) либо электронный или бумажный документ, который содержит информацию о наборе элементов.

4.3    соответствие (conformance): Выполнение заданных требований.

4.4    уровень соответствия качества (conformance quality level): Пороговое значение или набор пороговых значений для результирующих оценок качества данных (4.21), по которым определяют степень соответствия набора данных (4.8) спецификации информационного продукта (4.6) или потребностям пользователя.

4.5    корректность (correctness): Соответствие предметной области (4.24).

4.6    спецификация информационного продукта (data product specification): Детальное описание набора данных (4.8) или ряда наборов данных, а также дополнительная информация, которая обеспечивает его (их) создание, поставку и использование другой стороной.

4.7    базовая мера качества данных (data quality basic measure): Универсальная мера качества данных (4.21), используемая как основа для специализированных мер качества данных.

Примечание — Базовые меры качества данных — абстрактные типы данных. Непосредственное их использование при составлении отчета о качестве данных не представляется возможным.

4.8    набор данных (dataset): Идентифицируемая совокупность данных.

Примечание — Набором данных может быть также малая группа данных, которая, хотя и имеет некоторые ограничения в виде пространственной протяженности или типа объекта (4.15), физически расположена в пределах более крупного набора данных. Теоретически набором данных могут быть отдельный объект (4.11) или атрибут объекта (4.12), расположенные в пределах большого набора данных. Печатная копия топографической или морской карты может рассматриваться как набор данных.

4.9    комплект наборов данных (dataset series): Совокупность наборов данных (4.8), обладающих одинаковыми характеристиками.

4.10    метод прямой оценки (direct evaluation method): Метод оценки качества (4.21) набора данных (4.8), основанный на проверке элементов (4.18) набора данных.

4.11    пространственный объект, объект (feature): Абстракция явления реального мира.

Примечание — Объект может быть представлен как тип или экземпляр. Тип объекта (4.15) или экземпляр объекта (4.13) используются в зависимости от назначения.

4.12    атрибут пространственного объекта (feature attribute): Характеристика объекта (4.11).

Примечание — Атрибут объекта имеет имя, характеризуется определенным типом данных и имеет область допустимых значений. Атрибут экземпляра объекта (4.13) также имеет значение атрибута, принадлежащее области допустимых значений.

4.13    экземпляр объекта (feature instance): Объект данного типа (4.15), имеющий определенные значения атрибутов объекта (4.12).

2

ГОСТ P 57773—2017

4.14    операция с объектом (feature operation): Операция, которую может выполнить любой экземпляр некоторого типа пространственного объекта.

4.15    тип объекта (feature type): Класс объектов (4.11), имеющих общие характеристики.

4.16    пространственные данные (spatial data): Данные о пространственных объектах, включающие сведения об их форме, местоположении и свойствах, в том числе представленные с использованием координат.

4.17    метод косвенной оценки (indirect evaluation method): Метод оценки качества (4.21) набора данных (4.8), основанный на дополнительных знаниях.

Примечание — Примером дополнительных знаний служит происхождение набора данных, таких как метод производства или исходные данные.

4.18    элемент (item): То, что может быть описано и рассмотрено отдельно.

Примечание — Элемент может являться любой частью набора данных (4.8), такой как объект (4.11), отношения объектов, атрибут объекта (4.12) или их комбинация.

4.19    метаданные (metadata): Данные о данных.

4.20    метакачество (metaquality): Информация, описывающая качество (4.21) оценки качества данных.

4.21    качество (quality): Степень соответствия совокупности собственных характеристик заявленным требованиям.

4.22    реестр (register): Набор файлов, содержащий идентификаторы элементов (4.18) с описанием соответствующих элементов.

4.23    самостоятельный отчет о качестве (standalone quality report): Свободный текстовый документ, содержащий подробную информацию о примененных методах оценки качества данных (4.21), результатах и мерах.

4.24    предметная область (universe of discourse): Отображение реального или гипотетического мира, которое включает все, что представляет интерес.

5 Сокращенные термины

5.1 Аббревиатуры

агрегированные результаты качества данных; допустимый уровень качества; среднеквадратическая ошибка; унифицированный язык моделирования; расширяемый язык разметки.

ADQR (aggregated data quality results) AQL (acceptance quality limit)

RMSE (root mean square error)

UML (Unified Modeling Language) XML (Extensible Markup Language)

5.2 Пакетные аббревиатуры

CI

(Citation) —

ссылки;

ст

(Catalogues) —

каталоги;

DQ

(Data Quality) —

качество данных;

DQM

(Data Quality Measure) —

мера качества данных;

ЕХ

(Extent) —

пространственно-временная протяженность;

GF

(General Feature) —

основной объект;

MD

(Metadata) —

метаданные;

QE

(Quality Extended) —

расширенное качество данных;

RE

(Registration) —

регистрация.


Для обозначения пакета, содержащего класс, предусмотрено использование аббревиатур. Те сокращения, которые предшествуют именам класса, соединяются символом Ниже приводится перечень таких аббревиатур:

6 Обзор качества данных

Работа с качеством данных включает:

- изучение концепций качества в отношении пространственных данных. В приложении В представлено описание концепций качества данных, применяемых при определении компонентов для описания качества пространственных данных;

3

-    определение уровней соответствия качества данных спецификации информационного продукта или потребностям пользователя. Разработка спецификации информационного продукта описана в ГОСТ Р 57657;

-    определение аспектов качества в схемах приложения;

-    оценку качества данных;

-    составление отчетности о качестве данных.

Примечание — Создание схем приложения описано в [1].

Оценка качества данных может быть применена к комплекту наборов данных, набору данных или поднабору данных в наборе данных, обладающих общими характеристиками, так что их качество может быть оценено.

Качество данных должно быть описано с помощью элементов качества данных. Элементы качества данных и их дескрипторы применяются для описания степени соответствия набора данных критериям, изложенным в спецификации информационного продукта или требованиях пользователя, и предоставляют количественную информацию о качестве.

Если информация о качестве описывает данные, которые были созданы без детальной спецификации информационного продукта или с наличием спецификации, но при отсутствии в ней количественных мер и дескрипторов, то оценка элемента данных может быть осуществлена посредством неколичественного субъективного подхода в виде описательного результата для каждого элемента.

Некоторая информация о качестве данных может быть получена на основе элементов назначения, использования и происхождения. Такая информация выдается в виде метаданных согласно ГОСТ Р 57668.

Примечание — Назначение описывает обоснование создания набора данных и содержит информацию о его предполагаемом использовании, которое может не совпадать с фактическим использованием набора данных. Использование описывает приложения, в которых использовался набор данных как разработчиком данных, так и другими пользователями данных. Происхождение описывает историю набора данных и производит подсчет жизненного цикла набора данных, начиная со сбора и приобретения, включая составление и преобразование к их текущему виду. Эта общая, неколичественная информация является наглядной для пользователей и может помочь в оценке качества набора данных, особенно в случаях особого применения, отличного от предполагаемого (см. также 9.2.3).

Примечание — Концепция метакачества описана в 7.5.

Рисунок 1 — Концептуальная модель качества пространственных данных


Настоящий стандарт определяет, что количественные элементы качества данных могут иметь ассоциативное качество, которое называется метакачеством. Метакачество описывает качество результатов оценки качества данных по определенным характеристикам.

На рисунке 1 представлен обзор информации по качеству данных.

4

ГОСТ P 57773—2017


7 Компоненты качества данных

7.1 Обзор компонентов

Компоненты качества данных описаны в разделе 7. На рисунке 2 представлен обзор компонентов и связей между ними. Подробнее о компонентах и их атрибутах см. в словаре данных в приложении С.


DQ_Fulllnspection


DQ_SampleBasedlnspection


DQ IndirectEvaluation


DQ_DataEvaluation


DQ_Aggregation Derivation


DQ ConformanceResult

DQ QuantitativeResult

DQ DescriptiveResult


DQ MeasureReference


DQ EvaluationMethod


DQ_Result


(-measure 0..1    +evaluationMethod    0..1    +result    1.


DQ_StandaloneQualityReportlnformation


DQ_Metaquality


+relatedElement

+derivedElement

o.*:


-O DQ_Element


+elementReport (-report

1


+standaloneQualityReportI 0..1


О DQ_DataQuality


DQ Confidence


DQ_Representativity


DQ_Homogeneity


DQ_LogicalConsistency


DQ_UsabilityElement


DQ_ConceptualConsistency


DQ_PositionalAccuracy


DQ_Completeness


DQ_DomainConsistency


DQ_AbsoluteExternalPositionalAccuracy


DQ_CompletenessCommission


DQ_FormatConsistency


DQ_RelativelnternalPositionalAccuracy


DQ_CompletenessOmission


DQ_TopologicalConsistency


DQ_GriddedDataPositionalAccuracy


DQ_ ThematicAccuracy


DQ_ TemporalQuality


DQ_ThematicClassificationCorrectness


DQ_AccuracyOfA7imeMeasurement


DQ NonQuantitativeAttributeCorrectness


DQ_TemporalConsistency


DQ_QuantitativeAttributeAccuracy


DQ_Tempora IValidity


Рисунок 2 — Обзор компонентов качества данных


7.2 Единица качества данных (data quality unit)

Для описания качества пространственных данных могут рассматриваться различные элементы качества и различные поднаборы данных, с целью описания которых используются единицы качества данных. Единица качества данных — это совокупность области определения и элементов качества данных (см. рисунок 3).


5


DQ_DataQuality

+ report

DQ_Element

+ scope :М D_Scope

° i *

Рисунок 3 — Единица качества данных

Область определения единиц(ы) качества данных задает протяженность, пространственные, и/или временные, и/или общие характеристики, идентифицирующие данные, качество которых должно быть оценено.

Одна область определения качества данных должна быть предусмотрена для каждой единицы качества данных. Один отчет о качестве данных (метаданные или самостоятельный отчет по оценке качества) может включать несколько единиц качества данных, так как часто области для отдельных элементов качества данных различны. Эти различные области могут быть, например, пространственно разделены, перекрываться или даже совпадать.

Ниже приведены примеры того, что определяет область определения качества данных (см. также MD_Scope в ГОСТ Р 57656):

а)    комплект наборов данных;

б)    набор данных;

в)    поднабор данных, определяемый одной или несколькими из следующих характеристик:

1)    типы элементов (наборы типов объектов, атрибутов объектов, операций с объектами или отношений объектов);

2)    конкретные элементы (наборы экземпляров объектов, значения атрибутов или экземпляры отношений объектов);

3)    географическая протяженность;

4)    временная протяженность (заданные временные рамки и точность временных рамок).

7.3 Элементы качества данных (data quality elements)

7.3.1 Общие положения

Элемент качества данных — это компонент, описывающий определенный аспект качества пространственных данных, организованный по различным категориям. Данные категории представлены на рисунке 4.

Рисунок 4 — Обзор элементов качества данных

6