Товары в корзине: 0 шт Оформить заказ
Стр. 1 

34 страницы

319.00 ₽

Купить Р 50.1.061-2007 — бумажный документ с голограммой и синими печатями. подробнее

Распространяем нормативную документацию с 1999 года. Пробиваем чеки, платим налоги, принимаем к оплате все законные формы платежей без дополнительных процентов. Наши клиенты защищены Законом. ООО "ЦНТИ Нормоконтроль"

Наши цены ниже, чем в других местах, потому что мы работаем напрямую с поставщиками документов.

Способы доставки

  • Срочная курьерская доставка (1-3 дня)
  • Курьерская доставка (7 дней)
  • Самовывоз из московского офиса
  • Почта РФ

Рекомендации являются руководством по использованию ИСО 5725-2 и содержат упрощенные последовательные процедуры для планирования, выполнения и статистического анализа межлабораторных исследований для оценки изменчивости стандартного метода измерений и определения повторяемости и воспроизводимости данных, полученных при межлабораторных испытаниях.

 Скачать PDF

Оглавление

1 Область применения

2 Организация межлабораотрной программы

3 Критическая экспертиза данных

4 Оценка стандартных отклонений повторяемости и воспроизводимости

5 Примеры использования статистического программного обеспечения

Приложение А Обозначения и сокращения

Приложение В Сведения о соответствии международных стандартов ссылочным национальным стандартам Российской Федерации

Библиография

 
Дата введения01.11.2007
Добавлен в базу01.09.2013
Актуализация01.01.2021

Этот документ находится в:

Организации:

07.06.2007УтвержденФедеральное агентство по техническому регулированию и метрологии120-ст
РазработанОАО НИЦ КД
ИзданСтандартинформ2007 г.

Statistical methods. Practical guidance for the use of GOST R ISO 5725-2-2002 in designing, implementing and statistically analysing interlaboratory repeatability and reproducibility results

Нормативные ссылки:
Стр. 1
стр. 1
Стр. 2
стр. 2
Стр. 3
стр. 3
Стр. 4
стр. 4
Стр. 5
стр. 5
Стр. 6
стр. 6
Стр. 7
стр. 7
Стр. 8
стр. 8
Стр. 9
стр. 9
Стр. 10
стр. 10
Стр. 11
стр. 11
Стр. 12
стр. 12
Стр. 13
стр. 13
Стр. 14
стр. 14
Стр. 15
стр. 15
Стр. 16
стр. 16
Стр. 17
стр. 17
Стр. 18
стр. 18
Стр. 19
стр. 19
Стр. 20
стр. 20
Стр. 21
стр. 21
Стр. 22
стр. 22
Стр. 23
стр. 23
Стр. 24
стр. 24
Стр. 25
стр. 25
Стр. 26
стр. 26
Стр. 27
стр. 27
Стр. 28
стр. 28
Стр. 29
стр. 29
Стр. 30
стр. 30

Р 50.1.061-2007


РЕКОМЕНДАЦИИ ПО СТАНДАРТИЗАЦИИ


ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

Статистические методы

ПРАКТИЧЕСКОЕ РУКОВОДСТВО ПО ИСПОЛЬЗОВАНИЮ ГОСТ Р ИСО 5725-2-2002 ПРИ ПЛАНИРОВАНИИ, ВЫПОЛНЕНИИ И СТАТИСТИЧЕСКОМ АНАЛИЗЕ МЕЖЛАБОРАТОРНОЙ ПОВТОРЯЕМОСТИ И ВОСПРОИЗВОДИМОСТИ РЕЗУЛЬТАТОВ

ISO/TR 22971: 2005 Accuracy (trueness and precision) of measurement methods and results — Practical guidance for the use of ISO 5725-2:1994 in designing, implementing and statistically analysing interlaboratory repeatability and reproducibility results

(IDT)

Издание официальное

Москва

Стандартинформ

2007


Предисловие

Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. № 184-ФЗ «О техническом регулировании», а правила применения национальных стандартов Российской Федерации — ГОСТ Р 1.0-2004 «Стандартизация в Российской Федерации. Основные положения»

Сведения о рекомендациях

1    ПОДГОТОВЛЕНЫ Открытым акционерным обществом «Научно-исследовательский центр контроля и диагностики технических систем» (ОАО НИЦ КД) и Техническим комитетом по стандартизации ТК125 «Статистические методы в управлении качеством продукции» на основе собственного аутентичного перевода стандарта, указанного в пункте 4

2    ВНЕСЕНЫ Управлением развития, информационного обеспечения и аккредитации Федерального агентства по техническому регулированию и метрологии

3    УТВЕРЖДЕНЫ И ВВЕДЕНЫ В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 7 июня 2007 г. № 120-ст

4    Настоящие рекомендации являются идентичными по отношению к документу ИСО/ТО 22971:2005 «Точность, правильность и прецизионность методов и результатов измерений. Практическое руководство по использованию ИСО 5725-2:1994 при планировании, выполнении и статистическом анализе межлабораторной повторяемости и воспроизводимости результатов» (ISO/TR 22971:2005 «Accuracy (trueness and precision) of measurement methods and results — Practical guidance for the use of ISO 5725-2:1994 in designing, implementing and statistically analysing interlaboratory repeatability and reproducibility results»).

Наименование настоящих рекомендаций изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2004 (подраздел 3.5).

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении А

5    ВВЕДЕНЫ ВПЕРВЫЕ

Информация об изменениях к настоящим рекомендациям и текст изменений и поправок публикуются в ежемесячно издаваемых информационных указателях «Национальные стандарты». В случае пересмотра (замены) или отмены настоящих рекомендаций соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте национального органа в сети Интернет

©Стандартинформ, 2007

Настоящие рекомендации не могут быть полностью или частично воспроизведены, тиражированы и распространены в качестве официального издания без разрешения Федерального агентства по техническому регулированию и метрологии

II

Обозначения:

X — номер лаборатории;

У — /с-статистика Манделя; а — уровень доверия 99 %; Ь — уровень доверия 95 %

Рисунок6 — График/с-статистики Манделя

Кроме того, график/с-статистики для конкретных исследуемыхуровней каждой лаборатории может приближаться или превышать значение /с-статистики Манделя, вычисленной для 95 %-го или 99 %-го уровня доверия, если критерий Кохрена показывает наличие выбросов.

3.2 Тест на выбросы

3.2.1    Общие точки

3.2.1.1    Уровень доверия

Обработка выбросов описана в ИСО 5725-2 [2], пункты 7.1—7.3. В качестве выброса рассматривают результат, который достаточно сильно отличается от всех других результатов, используемых для дальнейших исследований. В зависимости от типа распределения, которому принадлежат результаты наблюдений, результат, который кажется выбросом, в действительности может им не быть (ИСО 5725-2 [2], пункты 7.3.2.1 и 7.3.3.2, рекомендует уровни доверия 95% для выбросов, которые называют «квазивыбросами», и 99 % для выбросов, которые называют «статистическими выбросами»). Для конкретных обстоятельств выбор 95 %-ных и 99 %-ных уровней доверия означает, что один результат из 20 и один результат из 100, соответственно, могут быть ошибочно истолкованы. Следовательно, этот единственный результат может произойти случайно, а уровень доверия, установленный в ИСО 5725-2 [2], может не соответствовать конкретным требованиям. Он может представлять степень приемлемости, которая недостаточна для некоторых целей. Поэтому предполагается, что в конкретных обстоятельствах необходимо рассматривать вопрос о применении ИСО 5725-2 [2] с используемыми уровнями доверия.

3.2.1.2    Основные предположения

В тестах, используемых для определения наличия или отсутствия выбросов, предполагается, что результаты распределены в соответствии с распределением Гаусса (нормальное распределение, ИСО 5725-2 [2], пункт 1.4) или, по крайней мере, в соответствии с унимодальным распределением (ИСО 5725-2 [2], пункт 7.3.1.7). Следовательно, перед выполнением любого теста, особенно теста, который требует использования большого количества результатов, должна быть сделана проверка этого предположения. Предполагается также (ИСО 5725-2 [2], пункты 1.3 и 5.1.1), что количество результатов в каждом наборе данных (от каждой лаборатории) одинаково и что количество результатов для каждого исследуемого уровня или количество различных образцов является одинаковым. Таким образом, результаты являются «сбалансированными». Если результаты «не сбалансированы», рекомендуется (ИСО 5725-2 [2], пункт 7.2.2) результаты из соответствующих наборов данных отбрасывать случайным образом до достижения «сбалансированной» ситуации. Хотя «сбалансированная» ситуация предпочтительна, признано (даже в пределах примеров, иллюстрированных в ИСО 5725-2 [2]), что «несбалансированные» ситуации могут быть приемлемыми. Далее предполагается (ИСО 5725-1 [1], пункт 4.4, и ИСО 5725-2 [2], пункт 7.3.3.3), что результаты получены в условиях повторяемости. Следовательно, можно предполагать, что образцы для определенного исследуемого уровня являются гомогенными, идентичными во всех отношениях и анализируются в пределах короткого периода времени с использованием одинаковых реактивов и результатов калибровки. Теоретически эти предположения должны быть проведены и удовлетворены до использования любых тестов для проверки наличия или отсутствия выбросов.

6

P 50.1.061—2007

3.2.1.3    Декларация о выбросах

При выполнении тестов на выбросы следует понимать, что выбросы не должны отклоняться только по статистическим соображениям. Для каждой выборки причину, по которой результат отличается от всех других, следует исследовать и идентифицировать. Тесты на выбросы, основанные на используемых предположениях, указывают на наличие достаточной статистической причины выбросов, но они не указывают, почему это произошло. Только после проведения полного исследования для идентификации вероятной причины данные могут быть объявлены выбросами и отброшены.

Если конкретный исследуемый уровень проанализирован по критерию Кохрена, Граббса или некоторым другим критериям и никаких выбросов не обнаружено или они идентифицированы, проводят проверку других исследуемых уровней. Если несколько выбросов идентифицировано в различных исследуемых уровнях для данного набора данных, полученных единственной лабораторией, необходимо рассмотреть вопрос о тестировании всех наборов данных для всех исследуемых уровней.

Кроме того, следует решать — надо исключать только выбросы, идентифицированные для этой лаборатории, или надоотклонять весь набор данныхэтой лаборатории. Необходимые действия определяют индивидуально на основе опыта и знания исследований, выполняемых для идентификации возможных причин.

Контроль выбросов по графикам может получить дополнительное обоснование по результатам тестов на выбросы (количества выбросов). Следовательно, графики h- и /с-статистик Манделя допускается использовать для облегчения этих решений. Рассмотрение должно дать отклонение всех результатов лаборатории, если конкретный набор данных (например, для лаборатории 9 на рисунке 5 или для лаборатории 3 на рисунке 6) показывает, что все расчетные значения положительны и близки или превышают приведенные в таблице значения для 95 %-ного и 99 %-ного уровня доверия. Может быть, что все выборочные средние одной лаборатории больше, чем соответствующие значения всех других лабораторий. Этот факт может быть причиной для беспокойства. Как прежде, решение об отклонении данных следует принимать только на основе соответствующих исследований для выявления вероятной причины выбросов.

3.2.1.4    Выбор теста

Для каждой лаборатории или исследуемого уровня, или конкретной выборки большинство тестов на выбросы сравнивает некоторую меру относительного отклонения подозрительного результата от среднего всех результатов и оценивает, возможно ли считать происхождение этого результата случайным. Существует много доступных тестов для практических целей, но не все они полностью описаны в ИСО 5725-2 [2]. Таким образом, в дополнение к тестам, упомянутым в ИСО 5725-2 [2], пункты 7.1—7.3, необходимо понимать, что для определения выбросов допускается использовать другие тесты. Следовательно, необходимость использования тестов на выбросы, описанных в ИСО 5725-2 [2], определяет статистик. Все детали используемого теста должны быть зафиксированы вместе с его результатами.

3.2.2 Критерий Кохрена

3.2.2.1    Основные принципы

Критерий Кохрена используют для проверки, есть ли слишком большие стандартные отклонения базовых элементов в таблице 3, которые увеличивают оценку стандартного отклонения повторяемости, если их сохранять. Статистика, используемая в критерии Кохрена, тесно связана с /с-статистикой Манделя.

3.2.2.2    Интерпретация

Критерий Кохрена по таблице 3 допускается использовать для определения совместимости небольшой дисперсии для конкретного набора данных с дисперсиями всех наборов данных для исследуемого уровня. Этот критерий определяет отношение наибольшей дисперсии, полученной для конкретной лаборатории, к сумме всех дисперсий, полученных для всех лабораторий. Это подсчитанное значение сравнивают с вычисленным или табличным (критическим) значением отношения и оценивают наличие выбросов.

Критерий Кохрена идентифицирует дисперсии, которые больше средних дисперсий для этого уровня. В этом отношении критерий является односторонним, поскольку лаборатория с наименьшей дисперсией (относительно других лабораторий) не подвергается контролю поэтому критерию. Решение о повторении критерия Кохрена зависит от того, идентифицированы ли выбросы, и от количества тестируемых наборов данных на конкретном исследуемом уровне. Если выбросы не обнаружены, то критерий не повторяют. Если выбросы обнаружены, то для проверки повторяют критерий Кохрена на оставшихся наборах данных рассматриваемого уровня. Эта осторожность особенно уместна для небольшого количества данных, особенно если приблизительно 20 % данных отклонены как выбросы.

7

3.2.2.3    Альтернативные критерии

Альтернативой критерию Кохрена являются критерии Бартлетта, Левина и Хартлея. Однако могут быть случаи, когда выбросы идентифицированы с использованием одного критерия, но не идентифицированы при использовании другого критерия. Следовательно, важно чтобы статистик зафиксировал, какие критерии использовались и какие сделаны заключения.

3.2.3    Критерий Граббса

3.2.3.1    Принцип

Критерий Граббса используют для проверки наличия базовых элементов в таблице 2, которые являются слишком большими или слишком маленькими и могут дать большую оценку стандартного отклонения воспроизводимости. Статистика, используемая в критерии Граббса, тесно связана с /7-статистикой Манделя.

3.2.3.2    Интерпретация

После применения критерия Кохрена сведенные в таблицу средние для каждого конкретного исследуемого уровня, показанного в таблице 2, располагают в неубывающем порядке. Затем выполняют несколько критериев Г раббса. Сначала выполняют критерий для определения, являются ли наибольшее или наименьшее среднее единственным выбросом. Если выброс идентифицирован, его отбрасывают и повторяют критерии для следующего подозрительного значения. Для конкретного исследуемого уровня критерий Г раббса для одного выброса позволяет вычислять отношение разности подозреваемого значения и среднего всех значений уровня к стандартному отклонению всех значений. Это отношение затем сравнивают с вычисленным или табличным критическим значением отношения с 95 %-ным и 99 %-ным уровнем доверия.

Если единичный выброс не обнаружен, выполняют критерий Граббса для определения присутствия (или отсутствия) двух выбросов. Например, тестируют два наименьших средних и, если выбросы не обнаружены, тестируют два наибольших средних. В этом критерии, если вычисленное отношение больше расчетного (или табличного) для заданного уровня доверия, среднее расценивают как удовлетворительное.

3.2.3.3    Альтернативные критерии

Альтернативой критерию Г раббса является критерий Диксона. Однако возможны ситуации, когда выброс идентифицирован по одному критерию, но не идентифицирован по другому критерию. Следовательно, важно, чтобы статистик фиксировал, какие критерии использовались.

3.3    Заключение

В схеме процесса, приведенной на рисунке 7, указаны основные процедуры, которые должны быть выполнены.

Данные, идентифицированные как статистические выбросы, сообщают ответственному исполнителю. Ответственный исполнитель должен провести необходимые исследования, чтобы принять решение о сохранении, отклонении или изменении этих данных. Когда это исследование завершено, в зависимости от его результата статистик получает пересмотренный набор данных в соответствии с таблицей 1. При необходимости повторно рассчитывают дополнительные таблицы, аналогичные таблицам 2 и 3. Затем статистик оценивает для каждого исследуемого уровня стандартные отклонения повторяемости и воспроизводимости.

4 Оценка стандартных отклонений повторяемости и воспроизводимости

4.1 Дисперсионный анализ

В межлабораторной программе большое количество лабораторий выполняет повторные испытания на одном и том же образце материала. Этот процесс изображен на рисунке 8.

P 50.1.061—2007

Рисунок 7 — Схема процедуры статистической обработки выбросов

Если образец испытан один раз в различных лабораториях, дисперсия полученных значений характеристики /отразит некоторую комбинацию изменчивости, являющейся результатом внутрилабо-раторной и межлабораторной изменчивости. Для объяснения генерации отдельных результатов у используется модель, описанная в 4.2.

9

Лаборатория 1

А

Лаборатория 2

А

Лаборатория j

А

о о ■■■о

о о ■■■ о

о о ■■■о

л1 повторений

/?2 повторений ■■

Рисунок 8 — Схема межлабораторной программы

4.2 Описание модели

Прецизионность (повторяемость и воспроизводимость) метода измерений может быть оценена на основе анализа данных группы лабораторий, отобранных из совокупности лабораторий, использующих один и тот же метод. Каждая лаборатория поставляет набор результатов, который статистически сравнивают с другими наборами результатов.

Примечание — Описанные процедуры допускается также использовать для оценки параметров группы аналитиков или операторов вместо группы лабораторий.

Статистическая обработка основана на следующих предположениях:

-    несколько выборок результатов или действий различных уровней анализируются несколькими лабораториями;

-    каждая лаборатория выполняет метод испытаний и фиксирует результаты повторений;

-    на каждом уровне общее рассеивание результатов формируется за счет случайных изменений.

Этот процессописан в ИСО 5725-2 [2], пункт4.1, уравнением:

у = т + В + е,

где /л — среднее (математическое ожидание) результатов;

В — лабораторная составляющая смещения в условиях повторяемости; е — случайное отклонение, имеющее место при любом измерении в условиях повторяемости.

Наилучшая оценка истинного значения исследуемой характеристики — общее среднее всех результатов т. Единственное фиксируемое значение у в общем случае не будет равно т.

Общая погрешность у — т содержит две части: е и В (е — отклонение у от среднего из большого количества результатов, полученных в конкретной лаборатории, в которой значение у было измерено, а В — отклонение (или разность) между этим концептуальным, средним и общим средним). Это разбиение у = т + В + е изображено на рисунке 9.

ю

P 50.1.061—2007




Обозначения:

1    — лаборатория № 1;

2    — лаборатория № 2;

3    — лаборатория № j\

4    — среднее лаборатории № 2;

а — дисперсия лабораторной составляющей смещения;

Ь — внутрилабораторная дисперсия результатов испытаний

Рисунок 9 — Разбиение общей погрешности

Ожидается, что ей В близки к нулю. Целью ИСО 5725-2 [2] является оценка их дисперсий. Дисперсия е — внутрилабораторная дисперсия а2, а дисперсия В — межлабораторная дисперсия af.

Внутрилабораторная дисперсия — дисперсия повторяемости.

Сумма межлабораторной дисперсии и внутрилабораторной дисперсии = <з2 + а2 представляет собой дисперсию результатов, полученных в условиях, которые значительно различаются (например, замена лабораторий), и является дисперсией воспроизводимости

Структуру, изображенную на рисунке 8, называют вложенной или иерархической схемой. Для оценки дисперсийеиВ необходимо оценить а2 и af.

На языке статистики лабораторное воздействие В является случайным. Это означает также, что набор лабораторий, которые участвуют в межлабораторной программе, является случайной выборкой из теоретически бесконечного набора лабораторий, которые могли бы использовать данный метод испытаний. Необходимо оценить, насколько эти лаборатории подобны друг другу.

4.3 Примеры

4.3.1 Пример 1

Поясним, как следует оценивать два компонента дисперсии и ъ\, на примере четырех лабораторий, каждая из которых выполняет три повторения измерений одного и того же образца. Потерянные данные и выбросы отсутствуют. Например, зафиксированные данные являются данными, показанными на рисунке 10.

11

P 50.1.061—2007

Обозначения:

1    — лаборатория Ns 1;

2    — лаборатория Ns 2;

3    — лаборатория Ns 3;

4    — лаборатория Ns 4

Рисунок 10 — План эксперимента для примера 1

Оценка су по данным лаборатории 1 — s^(Lab1) определяется как дисперсия трех результатов: sr (Labi) = var(15,16,17) = 1,00. Она имеет <Эве степени свободы.

Оценка су по данным лаборатории 2 — s^Lab2) определяется как дисперсия трех результатов: sr (Lab2) = var(16,13,15) = 2,33. Она имеет <Эве степени свободы.

Оценка су по данным лаборатории 3 s,(Lab3) определяется как дисперсия трех результатов: sr(Lab3) = var(13,15,15) = 1,33.Она имеет <Эве степени свободы.

Оценка s^Lab4) по данным лаборатории 4 s^LaM^ определяется как дисперсия трех результатов: sr (Lab4) = var(15,14,16) = 1,00. Она имеет <Эве степени свободы.

Более хорошую оценку s* истинной неизвестной дисперсии повторяемости су получают усреднением Sr(Lab1),s^(Lab2), s^(Lab3) и s,(Lab4) в соответствии с гипотезой о равенстве четырех дисперсий. Эта

гипотеза может быть проверена по критерию Кохрена (см. раздел 2). Для максимальной дисперсии 2,33 и суммы всех дисперсий 5,66 статистика Кохрена равна 2,33/5,66 = 0,41. Сравнение с критическим значением 0,768 для 5 % четырех лабораторий и трех повторений показывает, что равенство дисперсий не может быть отклонено. Следовательно, s* = 1,42 и имеет восемь степеней свободы.

Имеется четыре выборочных средних (16,00,14,67,14,33 и 15,00) по одному для каждой лаборатории. Каждое среднее является оценкой измеряемого параметра. Общее среднее т равно 15,00, а дисперсия равна 0,52 и имеет три степени свободы. Поскольку в этом случае каждое лабораторное среднее является выборочным средним трех отдельных результатов, дисперсия этих средних не является оценкой только , но содержит также часть дисперсии повторяемости (одна треть в этом примере). Эту информацию представляют в виде таблицы 4.

Таблица 4 — Оценка компонентов дисперсии

Оцениваемая величина

Значение оценки

о? + tf)/3

0,52

о?

1,42

Приравнивая оценки к соответствующим оцениваемым величинам, можно получать оценки sf и sf для Of и а£.

Здесь s? равна 1,42;

sf равно 0,05 (т.е. 0,52—1,42/3).

12

P 50.1.061—2007

Оценка s| дисперсии повторяемости определяется как sf+s* и равна 1,47 (т. е. 0,05 +1,42). Обычно результаты представлены в виде таблицы 5.

Таблица5 — Оценка компонентов дисперсии

Оцениваемая величина

Значение оценки

3 of +

1,56 (=3 х 0,52)

О?

1,42

Вычисления становятся более сложными, когда количество результатов в лабораториях не равное, и в этом случае рекомендуется использовать соответствующий пакет программ. Однако принцип остается тем же самым.

4.3.2 Пример 2

В таблице 6 приведены необработанные данные, соответствующие средние и дисперсии для различных лабораторий.

Таблица 6 — Пример 1, средние и дисперсии

Параметр

Лаборатория 1

Лаборатория 2

Лаборатория 3

Лаборатория 4

Результаты

63

44

50

53

57

51

40

57

54

43

42

46

Среднее

58

46

44

52

°г,/

21

19

28

31

Число степеней свободы

2

2

2

2

Примечание — Индекс / указывает i-ю лабораторию.

Из этих результатов, следует:

-    общее среднее т...................... 50,00, т. е. (58 + 46 + 44 + 52)/4;

-    дисперсия средних..................... 40,00;

-    дисперсия повторяемости s,.............. 24,75, т. е. (21 + 19 + 28 + 31)/4.

Следовательно,

- межлабораторная дисперсия sf.............31,75, т. е. 40 — 24,75 / 3;

- дисперсия воспроизводимости    = sf+ s*...... 56,50, т. е. 31,75 + 24,75.

4.4 Использование пределов повторяемости и воспроизводимости

Оценку стандартных отклонений повторяемости и воспроизводимости допускается использовать для определения пределов повторяемости и воспроизводимости. Эти пределы используются на практике для принятия решения о выполнении метода измерений без существенных неблагоприятных воздействий и/или значимых отличиях двух видов продукции.

Пределы повторяемости и воспроизводимости представляют собой абсолютную разность между двумя единственными результатами, полученными в условиях повторяемости и воспроизводимости соответственно, которая не будет превышена в 95 % случаев. Г рубая оценка пределов повторяемости и воспроизводимости может быть получена перемножением стандартных отклонений повторяемости и воспроизводимости на 2,8 в соответствии с ИСО 5725-6 [6] (пункт 4.1), а также с помощью применения следующих правил:

а) если два результата измерений одной и той же продукции в условиях повторяемости (или условиях воспроизводимости) отличаются больше, чем на предел повторяемости (или воспроизводимости), вероятно, что причина скрыта в неправильном применении метода и/или осуществлении отбора выборки. Рекомендуется дальнейшее исследование. Возможно, будет необходимо большее количество результатов;

13

b) если два результата измерений двух различных изделий в условиях повторяемости (или условиях воспроизводимости) отличаются больше, чем на предел повторяемости (или воспроизводимости), разумно задать вопрос, имеют ли эти два изделия одинаковое качество.

Примечание — Стандартные отклонения повторяемости и воспроизводимости являются оценками прецизионности, и поэтому их используют для оценки ошибок (погрешностей). Они предназначены для руководства при оценке законности или уместности результатов, полученных методом измерений, а не в качестве жестких числовых критериев для отклонения или утверждения результатов. В частности, значение параметра 2,8, используемых для получения пределов повторяемости и воспроизводимости, основано на предположении о нормальном распределении. Справедливость этого предположения должна быть проверена до измерений, что редко случается на практике. Многие специалисты используют значение три для этого значения параметра без потери информации. Здравый смысл должен преобладать во всех случаях.

Результаты применения этой оценки в примере 2 следующие:

-    предел повторяемости г = 2,8 х sr = 13,93;

-    предел воспроизводимости R = 2,8 х sR =21,05.

Разность двух результатов, полученных для одного изделия в условиях повторяемости (или воспроизводимости), не будет превышать 13,93 (или 21,05) в 95 случаях из 100.

5 Примеры использования статистического программного обеспечения

5.1    Общие положения

Настоящий раздел иллюстрирует, как графики и статистики могут быть получены с использованием статистических программ. Цель — показать главные преимущества автоматизированных расчетов (точность, скорость и возможность использовать процедуры, которые являются слишком усложненными для расчетов на калькуляторе).

Есть некоторые ограничения для использования пакетов программ. Не все пакеты обладают способностью вычислять все необходимые статистические параметры, например /7-и к -статистики Манде-ля или статистику Граббса.

Два примера из ИСО 5725-2 [2] (приложение В) представлены ниже:

-    пример 1. ИСО 5725-2 [2], В. 1 «Определение содержания серы в угле»;

-    пример 3. ИСО 5725-2[2], В.З «Термометрическое титрование креозотового масла».

По возможности ссылки на пункты этих приложений будут указаны.

5.2    Определение содержания серы в угле

5.2.1 Исходные данные

Данные могут быть введены из таблицы В.1 ИСО 5725-2 [2]. Первая колонка содержит номер лаборатории, а остальные четыре колонки одного уровня содержат данные (см. таблицу 7).

Таблица 7 — Представление данных (содержание серы в угле3, ь)

Лаборатория

Уровень

1

2

3

4

1

0,71

1,20

1,68

3,26

1

0,71

1,18

1,70

3,26

1

0,70

1,23

1,68

3,20

1

0,71

1,21

1,69

3,24

2

0,69

1,22

1,64

3,20

2

0,67

1,21

1,64

3,20

2

0,68

1,22

1,65

3,20

3

0,66

1,28

1,61

3,37

3

0,65

1,31

1,61

3,36

3

0,69

1,30

1,62

3,38

4

0,67

1,23

1,68

3,16

4

0,65

1,18

1,66

3,22

4

0,66

1,20

1,66

3,23

Окончание таблицы 7

Лаборатория

Уровень

1

2

3

4

5

0,70

1,31

1,64

3,20

5

0,69

1,22

1,67

3,19

5

0,66

1,22

1,60

3,18

5

0,71

1,24

1,66

3,27

5

0,69

1,68

3,24

6

0,73

1,39

1,70

3,27

6

0,74

1,36

1,73

3,31

6

0,73

1,37

1,73

3,29

7

0,71

1,20

1,69

3,27

7

0,71

1,26

1,70

3,24

7

0,69

1,26

1,68

3,23

8

0,70

1,24

1,67

3,25

8

0,65

1,22

1,68

3,26

8

0,68

1,30

1,67

3,26

а Исходные данные — по ИСО 5725-2 [2], пункт В.1.2. ь Единицы концентрации — процент массы.

Альтернативно данные могут быть также введены из трех колонок одной лаборатории по одному из каждого уровня. В этом случае содержание серы выражается в процентах массы. Пример такого расположения данных приведен в таблице 8 для лабораторий 1 и 2. Весь файл в этом случае включает также данные лабораторий 3—8.

Таблица 8 — Альтернативное представление данных (содержание серы в угле3, ь) лабораторий 1 и 2

Лаборатория

Уровень

Содержание серы

Лаборатория

Уровень

Содержание серы

1

1

0,71

1

4

3,20

1

1

0,71

1

4

3,24

1

1

0,70

2

1

0,69

1

1

0,71

2

1

0,67

1

2

1,20

2

1

0,68

1

2

1,18

2

2

1,22

1

2

1,23

2

2

1,21

1

2

1,21

2

2

1,22

1

3

1,68

2

3

1,64

1

3

1,70

2

3

1,64

1

3

1,68

2

3

1,65

1

3

1,69

2

4

3,20

1

4

3,26

2

4

3,20

1

4

3,26

2

4

3,20

3 Исходные данные по ИСО 5725-2 ([2]), пункт В.1.2. ь Единицы концентрации — процент массы.

P 50.1.061—2007

Содержание

1    Область применения..................................................1

2    Организация межлабораторной программы....................................1

3    Критическая экспертиза данных............................................2

4    Оценка стандартных отклонений повторяемости и воспроизводимости...................8

5    Примеры использования статистического программного обеспечения..................14

Приложение А (обязательное) Обозначения и сокращения..........................25

Приложение В (справочное) Сведения о соответствии международных стандартов ссылочным

национальным стандартам Российской Федерации.....................26

Библиография........................................................27

III

Как уже было отмечено, для выявления потенциальных выбросов рекомендуется данные изображать графически. Ниже приведены два примера таких графических представлений. Разброс необработанных данных уровня 1 показан на рисунке 11, аналогичном рисункам В.1—В.4 по ИСО 5725-2 [2]. Эти графики показывают расположение результатов лабораторий вдоль горизонтальной линии, соответствующей значению общего среднего. График «квадратики и усики», представленный на рисунке 12, состоит из квадратиков и выбросов, включающих все результаты лабораторий уровня 1, и полезен при проведении начальной оценки потенциальных выбросов. Это очень информативный способ исследования данных.

Выборочное среднее и медиана для каждой лаборатории изображены соответственно крестиком и более жирной линией. Основание квадратика является первой квартилью (Q1), а вершина— третьей квартилью (Q3). Приближенный диапазон изменения данных изображен линиями, называемыми усиками, которые идут от вершины и основания квадратика до наибольшего и наименьшего значений данных соответственно. Эти значения все еще находятся в области, ограниченной следующими пределами:

-    нижний предел = [Q1 — 1,5(Q3 — Q1)];

-    верхний предел = [Q3 + 1,5 (Q3 — Q1)].

Для нормального распределения (распределение Гаусса) это соответствует интервалу, включающему приблизительно 99,30 % значений случайной величины. Джон Такей изобретатель графика «квадратики и усики» назвал эти пределы «внутренними барьерами». Далее он определил «внешние барьеры», полученные с использованием множителя 3 вместо 1,5. Точки данных между «внутренними» и «внешними» барьерами определяют как возможные выбросы. Данные, лежащие вне «внешнего» барьера, являются очень подозрительными, поскольку внутренняя область внешних барьеров охватывает 99,99 % интервала значений переменной. Некоторые статистические пакеты программ используют различные символы для этих двух типов выбросов, например «*» для данных, попадающих между внутренними и внешними барьерами, и «0» для данных, лежащих вне внешних барьеров.

Оба графика показывают, что все результаты для лаборатории 6 находятся выше, чем соответствующие значения для других лабораторий. Кроме того, имеются значения для лаборатории 5, легко идентифицируемые на рисунке 12, которые требуют дальнейших исследований.

У I!

В

0,75

0,73

0,71-    |    1    в

□    1    ш

0,69--5-■-1-□-

0,67-    °    ,

°    ■ .

0,65-1_°_

12345678    X

Обозначения:

X— номер лаборатории;

У — концентрация, процент массы;

-    общее среднее mt, равное 0,69

Рисунок 11 — Г рафик разброса данных уровня 1

Введение

Серия стандартов ИСО 5725 состоит из шести частей, общая структура которых показана на рисунке 1.

ИСО 5725-2 [2] был разработан как руководство для технических комитетов и других организаций, ответственных за проведение межлабораторных исследований для оценки изменчивости, соответствующей стандартным методам измерений. Такие меры изменчивости, как повторяемость и воспроизводимость, приняты во многих дисциплинах как характеристики данных, с которыми сталкиваются при измерениях.

Повторяемость характеризует изменчивость измерений, выполняемых на идентичных образцах или материалах в идентичных условиях. Очевидно, что из-за неизвестных или не поддающихся контролю факторов, которые влияют на процесс измерений, повторные измерения обычно не совпадают с первоначальными. Степень этой изменчивости может быть выражена стандартным отклонением, названным внутрилабораторным стандартным отклонением повторяемости результатов.

Воспроизводимость характеризует изменчивость измерений, сделанных на идентичных образцах или материалах в отличающихся условиях различными лабораториями одним и тем же стандартным методом измерений. Воспроизводимость включает в себя воздействия, вызванные различиями инструментов, реактивов, операторов, лабораторий и экологических условий. Изменчивость результатов в этих условиях может быть описана стандартным отклонением, названным стандартным отклонением воспроизводимости.

Настоящее руководство включает в себя четыре основных раздела.

Раздел 2 включает в себя описание организации межлабораторной программы, относится к организации межлабораторных испытаний и касается роли ответственного исполнителя, лабораторного персонала и статистика при подготовке и управлении испытаниями, выбора материалов и уровней исследования для испытаний и выбора лабораторий. Руководство также описывает, какое количество повторных измерений (выполняемых на каждом образце) необходимо статистически обработать, и способ регистрации результатов.

Раздел 3 описывает экспертизу с помощью графических и вычислительных процедур. Даются рекомендации по выделению аномальных данных, то есть данных, противоречащих другим данным, и для независимых тестов для идентификации наличия и отсутствия аномальных данных.

Раздел 4 включает в себя методы оценки повторяемости и стандартного отклонения повторяемости, описывает интерпретацию повторяемости и стандартного отклонения повторяемости. Раздел также включает в себя сравнение относительных вкладов стандартных отклонений повторяемости и воспроизводимости в полную изменчивость метода испытаний.

Раздел 5 включает в себя примеры обработки, использующие программное обеспечение по статистическим методам, и обработанные примеры, в которых рассмотрены различные методы.

Рекомендуется изучать настоящее руководство вместе с ИСО 5725-2 [2], но не использовать его вместо ИСО 5725-2.

IV

ИСО 5725-1 - Основные положения и определения Определение стандартного отклонения повторяемости, стандартного отклонения воспроизводимости и смещения для лаборатории


ИСО 5725-2 - Основной метод определения

ИСО 5725-5 - Альтернативные методы

повторяемости и воспроизводимости

для определения прецизионности стандартного

стандартного метода измерений

метода измерений

Постулированная основная модель:

у = т + В + е,

где у- результат испытаний, т - общее значение среднего (математическое ожидание),

В - лабораторная составляющая смещения в условиях повторяемости, е - случайная ошибка1 * в условиях повторяемости.

Эта модель позволяет получать оценки повторяемости и воспроизводимости


Рисунок 1 — Структура серии стандартов ИСО 5725


1)


Случайную ошибку можно рассматривать как случайную погрешность.


V


РЕКОМЕНДАЦИИ ПО СТАНДАРТИЗАЦИИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Статистические методы

ПРАКТИЧЕСКОЕ РУКОВОДСТВО ПО ИСПОЛЬЗОВАНИЮ ГОСТ Р ИСО 5725-2-2002 ПРИ ПЛАНИРОВАНИИ, ВЫПОЛНЕНИИ И СТАТИСТИЧЕСКОМ АНАЛИЗЕ МЕЖЛАБОРАТОРНОЙ ПОВТОРЯЕМОСТИ И ВОСПРОИЗВОДИМОСТИ РЕЗУЛЬТАТОВ

Statistical methods.

Practical guidance for the use of GOST R ISO 5725-2—2002 in designing, implementing and statistically analysing

interlaboratory repeatability and reproducibility results

Дата введения — 2007—11—01

1 Область применения

Настоящие рекомендации являются руководством по использованию ИСО 5725-2 (см. [2]) и содержат упрощенные последовательные процедуры для планирования, выполнения и статистического анализа межлабораторных исследований для оценки изменчивости стандартного метода измерений и определения повторяемости и воспроизводимости данных, полученных при межлабораторных испытаниях.

2 Организация межлабораторной программы

2.1    Требования к прецизионности эксперимента

Эксперимент проводят чтобы:

a)    обеспечить полный набор результатов для:

-    определения количества лабораторий pLab, необходимых для демонстрации того, что их процедура испытаний хорошо контролируется, и для определения количественной оценки наблюдаемых рассеяний, характеризуемых воспроизводимостью;

Примечание — Символ pia ь, используемый в настоящих рекомендациях, имеет тот же смысл, что и символ р, используемый в ИСО 5725-2 (см. [2]). Замена символа была сделана, чтобы четко отличать этот символ от символа Р, используемого для обозначения вероятности.

-    определения количества образцов или продукции q, необходимых для представления различных уровней результатов или параметра. Минимальное значение q — два, но для демонстрации того, что процедура испытаний способна правильно различать уровни, более подходящими являются значения от пяти до десяти;

-    определения количества базовых элементов п, демонстрирующих, что процедура испытаний хорошо контролируется в пределах единственной лаборатории. Когда количество лабораторий и уровней является достаточным, требуется по крайней мере два определения;

b)    статистически анализировать (см. разделы 2 и 3) таблицу результатов, зафиксированных pLab лабораториями, анализирующими q образцов, испытанных п раз в условиях повторяемости.

Таблица результатов, предоставляемых ответственному исполнителю, показана в таблице 1 (см. ИСО 5725-2 [2], 7.2.8).

2.2    Обязанности персонала, вовлеченного в эксперимент на прецизионность

2.2.1 Общие положения

Межлабораторная программа является очень дорогой как в отношении ее координации, так и в отношении участия в этой программе. Следовательно, выполнение испытаний должно быть хорошо скоординировано и спланировано. В любой межлабораторной программе необходимо рассмотреть три типа деятельности, показанных на рисунке 2.

Издание официальное

ОТВЕТСТВЕННЫЙ ИСПОЛНИТЕЛЬ



-    готовит эксперимент;

-    координирует работу;

-    готовит заключения



ЛАБОРАТОРИЯ


Использует стандартный метод измерений для получения зафиксированных результатов


СТАТИСТИК

Выполняет статистический анализ


Рисунок2 — Обязанности и функции исполнителей


2.2.2    Ответственный исполнитель

Главные задачи ответственного исполнителя:

-    организация межлабораторной программы с участием статистика при разработке плана эксперимента;

-    координация выполнения программы;

-    формирование заключений.

Обязанности ответственного исполнителя могут выполнять несколько человек. Однако только одинчеловекдолжен нести ответственность за программу в целом. Ответственный исполнитель должен быть знаком со стандартным методом, но не должен участвовать в процессе измерений.

2.2.3    Лаборатория

Лабораторный персонал должен быть хорошо знаком с исследуемым методом измерений.

Лаборатория должна выполнять анализ, придерживаясь процедуры испытаний, полученной от ответственного исполнителя. Любые комментарии лаборатории по использованию исследуемого метода необходимо сообщать ответственному исполнителю. Однако процедуры, выполненные лабораторией, должны быть обеспечены ответственным исполнителем.

Лаборатория должна выполнять любые требования, предписанные ответственным исполнителем, включая:

-    хранение образцов;

-    время и порядок выполнения анализа.

Лаборатория должна обеспечивать ответственного исполнителя результатами анализа в соответствии с установленным им способом.

2.2.4    Статистик

Статистикдолжен получать от ответственного исполнителя необработанные данные, полученные с использованием заявленного метода и представленные в соответствии с таблицей 1.

Статистикдолжен исследовать данные и применять любой статистический критерий, предпочтительно критерий, описанный в ИСО 5725-2 [2], для идентификации потенциальных выбросов. Статистические выбросы должны быть представлены ответственному исполнителю. Ответственный исполнитель должен предпринимать необходимые исследования и принимать решение о сохранении, отклонении или изменении каких-либо данных.

Статистик должен выполнять статистический анализ, подготавливать графики и рассчитывать оценки среднего и дисперсий (ИСО 5725-2 [2], 7.1.2). Статистикдолжен суммировать все результаты статистического анализа в отчете, который направляют ответственному исполнителю.

3 Критическая экспертиза данных

3.1    Описание данных

3.1.1    Необработанные данные

Данные представляют в соответствии с таблицей 1. Таблицы 2 и 3 получают из таблицы 1. Некоторые статистические пакеты программ обеспечивают другое представление той же самой информации.


2


Р 50.1.061—2007

Таблица 1 — Сопоставление всех необработанных данных

Лаборатория

Уровень

1

2

j

я— 1

я

1

2

У»1

УН2

Ут

Pl_ab

Таблица 2 — Сопоставление выборочных средних для каждого базового элемента таблицы 1

Лаборатория

Уровень

1

2

j

я— 1

Я

1

2

Hlj

pLab

Таблица 3 — Сопоставление величин, характеризующих разброс3 для каждого базового элемента таблицы 1

Лаборатория

Уровень

1

2

j

Я-1

Я

1

2

pLab

Наиболее общая мера разброса — стандартное отклонение.

3.1.2 Графическое представление данных

3.1.2.1 График данных лаборатории (необработанные данные)

Перед выполнением любых тестов для определения потенциальных выбросов рекомендуется делать графическое отображение необработанных данных. Этот способ позволяет получать наглядную картину результатов, например, как показано на рисунке 3 (который основан на рисунках В.1—В.4 ИСО 5725-2 [2]). В результате визуального анализа графического отображения необработанныхданных

3

можно получать много информации и устанавливать мгновенную оценку разброса данных. Следовательно, можно сделать предположения о наличии выбросов или можно выявлять необычные различия в конкретных уровнях исследования простым визуальным осмотром соответствующего графического отображения данных. Например, на рисунке 3 поотображениюданныхлаборатории 3 можно предположить больший, чем ожидалось, разброс результатов по сравнению со всеми другими лабораториями. Следовательно, это может влиять на полную повторяемость. Эти предположения можно проверить с помощью критерия Кохрена. Кроме того, по результатам лаборатории 9 можно предположить существенное отклонение выборочного среднего лаборатории по сравнению с выборочными средними других лабораторий. Следовательно, это может влиять на воспроизводимость и это можно подтвердить критерием Граббса.

Обозначения:

X— номер лаборатории;

Y — результаты лаборатории

Рисунок 3 — Графическое представление необработанных данных для конкретного уровня исследований

3.1.2.2 График «квадратики и усики»

Когда известно много результатов, особенно для конкретного уровня исследований, график «квадратики и усики» может показывать информацию аналогично 3.1.2.1, например см. рисунок4. Однако этот тип графика, основанный на робастных методах статистики, включая определение значения медианы, не описан в ИСО 5725-2 [2]. Он определен и иллюстрирован в примерах раздела 4, так как эти графики имеются в большинстве статистических пакетов программ.

Обозначения:

X— номер лаборатории;

Y — результаты лаборатории;

«+» — обозначение выборочного среднего

Рисунок 4 — Г рафик «квадратики и усики»

4

P 50.1.061—2007

3.1.2.3 Графики h и к тестовых статистик Манделя

3.1.2.3.1 График/7-статистики Манделя

Для конкретного исследуемого уровня выборочные средние, полученные для всех лабораторий, используют для вычисления единственного общего выборочного среднего. Это значение затем используют для вычисления/7-статистики Манделя всех лабораторий этого уровня. Эта статистика определена в ИСО 5725-2 [2], уравнение (6), и представляет собой отношение разности среднего для конкретного набора данных и среднего всех наборов данных и стандартного отклонения средних по всем наборам данных. Это значение затем наносят на график и сравнивают с вычисленными или табулированными значениями отношения для 95 % и 99 % уровней доверия. Затем ту же процедуру используют для вычисления /7-статистики Манделя для всех лабораторий всех других уровней (см. рисунок 5). Необходимо отметить, что могут быть получены положительные и отрицательные значения.

Обозначения:

X — номер лаборатории;

У — ft-статистика Манделя; а —уровень доверия 99%; Ь — уровень доверия 95 %

Рисунок 5 — График/7-статистик Манделя

3.1.2.3.2    График/с-статистики Манделя

Для конкретного исследуемого уровня стандартные отклонения, полученные для всех лабораторий, используют для вычисления среднего стандартного отклонения или объединенного единственного стандартного отклонения. Это значение затем используют для вычисления /f-статистики Манделя для всех лабораторий этого уровня. Эта статистика определена в ИСО 5725-2 [2], уравнение (7), и представляет собой отношение стандартного отклонения результатов к среднему или объединенному стандартному отклонению. Это значение отношения затем наносят на график и сравнивают с вычисленными или табличными значениями отношения, полученными для 95 % и 99 % уровней доверия. Затем туже процедуру используют для вычисления /с-статистики Манделя для всех лабораторий всех других исследуемых уровней (см. рисунок 6). Необходимо отметить, что могут быть получены только положительные значения.

3.1.2.3.3    Графический контроль

По графику можно идентифицировать результаты каждой лаборатории, которые можно рассматривать отличными от ожидаемого распределения результатов. Например, график h для конкретных исследуемых уровней каждой лаборатории мог бы приближать или превышать значение /7-статистики Манделя, вычисленной для 95 %-го или 99 %-го уровня доверия, если критерий Граббса показывает наличие выбросов.

5