ФЕДЕРАЛЬНОЕ
АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ
|
НАЦИОНАЛЬНЫЙ
СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
|
ГОСТ
Р
50779.23-2005
(ИСО
3301:1975)
|
СТАТИСТИЧЕСКИЕ
МЕТОДЫ
СТАТИСТИЧЕСКОЕ
ПРЕДСТАВЛЕНИЕ ДАННЫХ
СРАВНЕНИЕ
ДВУХ СРЕДНИХ В ПАРНЫХ НАБЛЮДЕНИЯХ
ISO 3301:1975
Statistical interpretation of data - Comparison
of two means
in the case of paired observations
(MOD)
Москва
Стандартинформ
2005
Предисловие
Задачи,
основные принципы и правила проведения работ по государственной стандартизации
в Российской Федерации установлены ГОСТ Р 1.0-92 «Государственная система
стандартизации Российской Федерации. Основные положения» и ГОСТ Р 1.2-92
«Государственная система стандартизации Российской Федерации. Порядок
разработки государственных стандартов»
Сведения
о стандарте
1 ПОДГОТОВЛЕН Техническим комитетом по
стандартизации ТК 125 «Статистические методы в управлении качеством продукции»
и Научно-исследовательским центром контроля и диагностики технических систем на
основе собственного аутентичного перевода стандарта, указанного в пункте 4
2 ВНЕСЕН Управлением технического регулирования и стандартизации
Федерального агентства по техническому регулированию и метрологии
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом
Федерального агентства по техническому регулированию и метрологии от 31 мая
2005 г. № 112-ст
4 Настоящий стандарт
является модифицированным по отношению к международному стандарту ИСО 3301:1975
«Статистическое представление данных. Сравнение двух средних в парных
наблюдениях» (ISO 3301:1975 «Statistical interpretation of data - Comparison of two means in the case of paired observations», MOD) путем включения отдельных фраз, которые выделены
в тексте курсивом, с целью гармонизации с национальными стандартами.
Наименование
настоящего стандарта изменено относительно наименования указанного
международного стандарта для приведения в соответствие с ГОСТ
1.5 (подраздел 3.6)
5 ВВЕДЕН ВПЕРВЫЕ
Информация
об изменениях к настоящему стандарту публикуется в указателе «Национальные
стандарты», а текст изменений - в информационных
указателях «Национальные стандарты». В случае пересмотра или отмены настоящего
стандарта соответствующая информация будет опубликована в информационном
указателе «Национальные стандарты»
ГОСТ Р 50779.23-2005
(ИСО 3301:1975)
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статистические
методы
СТАТИСТИЧЕСКОЕ
ПРЕДСТАВЛЕНИЕ ДАННЫХ
Сравнение
двух средних в парных наблюдениях
Statistical methods. Statistical interpretation of data. Comparison of
two means
in the case of paired observations
Дата введения -
2005-07-01
1
Область применения
Настоящий
стандарт устанавливает метод проверки статистической гипотезы о равенстве
среднего распределения (далее - среднее) разностей парных наблюдений нулю
(предположение о несущественности расхождения между рядами наблюдений) или
какому-либо другому заданному значению.
2
Нормативные ссылки
В
настоящем стандарте использована нормативная ссылка на следующий стандарт:
ГОСТ
Р 50779.10-2000 (ИСО 3534-1-93) Статистические
методы. Вероятность и основы статистики. Термины и определения (ИСО
3534-1:1993, IDТ)
Примечания
1 Настоящий раздел является дополнительным по отношению к содержанию
международного стандарта ИСО 3301:1975 (ISO 3301:1975) и включен
для учета основополагающих национальных стандартов в области статистических
методов.
2 При пользовании настоящим стандартом
целесообразно проверить действие ссылочных стандартов по указателю
«Национальные стандарты», составленному по состоянию на 1 января текущего года,
и по соответствующим информационным указателям, опубликованным в текущем году.
Если ссылочный стандарт заменен (изменен), то при пользовании настоящим
стандартом следует руководствоваться замененным (измененным) стандартом. Если
ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на
него, применяют в части, не затрагивающей эту ссылку.
3
Термины и определения
В
настоящем стандарте применены термины по ГОСТ
Р 50779.10, а также следующий термин с соответствующим определением:
парные
наблюдения (paired
observations):
Два результата наблюдений определенных свойств или характеристик объекта хi и уi называются парными,
если они получены:
- как результаты наблюдений над одним и тем же
объектом i (из совокупности),
причем данные наблюдения относятся к различным условиям получения этих
наблюдений (например, сравнение двух методов анализа свойств одного и того же
объекта);
- как результаты наблюдений над объектами,
идентичными во всех отношениях, кроме предполагаемого систематического различия
в некотором интересующем аспекте; в отношении значимости этого различия
проводят проверку статистической гипотезы (например, сравнение урожайности двух
соседних участков, засеянных семенами различных сортов).
Во
втором случае эффективность проверки гипотез зависит от степени уверенности в
отсутствии каких-либо других систематических различий между объектами, кроме
некоторого возможного различия, в отношении которого проверяют гипотезу.
4
Применение метода для сравнения двух способов обработки экспериментальных
данных
Установленный
в настоящем стандарте метод проверки статистической гипотезы может быть
применен с целью подтвердить различие двух способов обработки. В этом случае
можно считать, что результаты наблюдений хi получены одним
способом обработки, а результаты наблюдений yi - некоторым другим
способом. Две серии результатов наблюдений не являются независимыми, поскольку
каждому хi
первой серии (первый способ обработки) ставится в соответствие вполне
определенное yi
второй серии (второй способ обработки). Термин «способ обработки» понимают в
широком смысле. При выявлении возможного систематического расхождения два
сравниваемых способа обработки могут относиться к двум методам испытаний, к
двум измерительным устройствам или к двум лабораториям. Два способа обработки,
выполненные над одним и тем же экспериментальным материалом, могут влиять друг
на друга, и полученное значение может зависеть от последовательности обработки.
Оптимальный план эксперимента должен устранять возможные систематические
смещения. В качестве альтернативы сравнению способов обработки можно
рассмотреть воздействие одного способа обработки по сравнению со случаем
полного отсутствия обработки.
5
Условия применения метода
Для
корректного применения метода необходимо выполнение следующих двух условий:
- последовательность разностей di = xi - yi является
выборкой независимой случайной величины;
- распределение величин di = xi - yi является
нормальным или близким к нормальному.
Если
распределение разностей отклоняется от нормального, метод проверки гипотез
применим при условии, что объем выборки достаточно велик. При больших
отклонениях от нормальности требуется соответственно большая выборка. Однако
даже в предельных случаях отклонения от нормальности выборки объемом 100 могут
быть достаточными для корректного применения метода в большинстве прикладных
задач.
6
Расчетные формулы и правила принятия решения
Изучаемая
проблема
_______________________________________________________
|
Условия проведения
эксперимента __________________________________________
|
Статистические данные
|
Расчетные формулы
|
Объем выборки
|
|
п =
|
Суммы результатов наблюдений:
|
|
|
Сумма разностей:
|
|
Сумма квадратов разностей:
|
|
|
Заданное значение (среднее случайных
разностей парных наблюдений):
|
|
d0 =
|
|
Число степеней свободы:
|
|
|
Выбранный уровень значимости:
|
|
a =
|
|
Правило
принятия решения
1 Двусторонняя критическая область:
Гипотезу о
том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0),
отвергают, если
2 Односторонняя критическая область:
а) Гипотезу о том,
что среднее совокупности разностей равно d0 (нулевая гипотеза Н0),
отвергают, если
б) Гипотезу о
том, что среднее совокупности разностей равно d0 (нулевая гипотеза Н0),
отвергают, если
|
Примечание - t1-a(n) - квантиль
уровня 1 - a статистики
Стьюдента с (n) степенями
свободы. Значения t1-a(n) / приведены в таблице 1.
Таблица 1 - Значения отношения t1-a(n) / для n = n - 1
|
Двусторонняя гипотеза
|
Односторонняя гипотеза
|
|
Двусторонняя гипотеза
|
Односторонняя гипотеза
|
|
|
|
|
|
|
|
|
1
|
8,985
|
45,013
|
4,465
|
22,501
|
21
|
0,443
|
0,604
|
0,367
|
0,537
|
2
|
2,434
|
5,730
|
1,686
|
4,021
|
22
|
0,432
|
0,588
|
0,358
|
0,523
|
3
|
1,591
|
2,920
|
1,177
|
2,270
|
23
|
0,422
|
0,573
|
0,350
|
0,510
|
4
|
1,242
|
2,059
|
0,953
|
1,676
|
24
|
0,413
|
0,559
|
0,342
|
0,498
|
5
|
1,049
|
1,646
|
0,823
|
1,374
|
25
|
0,404
|
0,547
|
0,335
|
0,487
|
6
|
0,925
|
1,401
|
0,734
|
1,188
|
26
|
0,396
|
0,535
|
0,328
|
0,477
|
7
|
0,836
|
1,237
|
0,670
|
1,060
|
27
|
0,388
|
0,524
|
0,322
|
0,467
|
8
|
0,769
|
1,118
|
0,620
|
0,966
|
28
|
0,380
|
0,513
|
0,316
|
0,458
|
9
|
0,715
|
1,028
|
0,580
|
0,892
|
29
|
0,373
|
0,503
|
0,310
|
0,449
|
10
|
0,672
|
0,956
|
0,546
|
0,833
|
30
|
0,367
|
0,494
|
0,305
|
0,441
|
11
|
0,635
|
0,897
|
0,518
|
0,785
|
40
|
0,316
|
0,422
|
0,263
|
0,378
|
12
|
0,604
|
0,847
|
0,494
|
0,744
|
50
|
0,281
|
0,375
|
0,235
|
0,337
|
13
|
0,577
|
0,805
|
0,473
|
0,708
|
60
|
0,256
|
0,341
|
0,214
|
0,306
|
14
|
0,554
|
0,769
|
0,455
|
0,678
|
70
|
0,237
|
0,314
|
0,198
|
0,283
|
15
|
0,533
|
0,737
|
0,438
|
0,651
|
80
|
0,221
|
0,293
|
0,185
|
0,264
|
16
|
0,514
|
0,708
|
0,423
|
0,626
|
90
|
0,208
|
0,276
|
0,174
|
0,248
|
17
|
0,497
|
0,683
|
0,410
|
0,605
|
100
|
0,197
|
0,261
|
0,165
|
0,235
|
18
|
0,482
|
0,660
|
0,398
|
0,586
|
200
|
0,139
|
0,183
|
0,117
|
0,165
|
19
|
0,468
|
0,640
|
0,387
|
0,568
|
500
|
0,088
|
0,116
|
0,074
|
0,104
|
20
|
0,455
|
0,621
|
0,376
|
0,552
|
¥
|
0
|
0
|
0
|
0
|
Пример
- Приведенные в таблице 2 данные
собраны в процессе исследований, спланированных с целью определить, зависит ли
скорость изнашивания шеек коленчатого вала двигателя внутреннего сгорания от
типа материала металлических вкладышей подшипников скольжения этого вала.
Таблица
2 - Износ шеек коленчатых валов в течение
заданной наработки, измеренный в стотысячных долях дюйма
Номер вала i
|
Износ вала
|
Разность di = xi - уi
|
Медно-свинцовые
вкладыши хi
|
Алюминиевые
вкладыши уi
|
1
|
3,5
|
1,5
|
2,0
|
2
|
2,0
|
1,3
|
0,7
|
3
|
4,7
|
4,5
|
0,2
|
4
|
2,8
|
2,5
|
0,3
|
5
|
6,5
|
4,5
|
2,0
|
6
|
2,2
|
1,7
|
0,5
|
7
|
2,5
|
1,8
|
0,7
|
8
|
5,8
|
3,3
|
2,5
|
9
|
4,2
|
2,3
|
1,9
|
Сумма
|
34,2
|
23,4
|
10,8
|
Технические
характеристики _______________________________________________
|
Статистические данные
|
Вычисления
|
Объем выборки
|
|
п = 9
|
Суммы результатов наблюдений:
|
|
|
Сумма разностей:
|
|
Сумма квадратов разностей:
|
|
|
Заданное значение:
|
t0,995 / = 1,118
|
d0 = 0
|
Число степеней свободы:
|
A2 =
1,118´0,8846
= 0,99
|
|
Выбранный уровень значимости:
|
|
a = 0,01
|
|
Выводы
Сравнение
среднего совокупности с заданным значением 0:
Проверка
двусторонней гипотезы:
Гипотезу
равенства скоростей изнашивания шеек коленчатого вала двигателя в случае
подшипников с различными вкладышами (медно-свинцовые и алюминиевые) отвергают
на 1 %-м уровне значимости.
|
7
Ошибка второго рода
Вероятность
отклонения нулевой гипотезы, когда она верна, равна уровню значимости a.
Отклонение нулевой гипотезы, когда она верна, называется ошибкой первого рода,
и поэтому выбор значения a ограничивает риск такой ошибки.
С
другой стороны, можно совершить ошибку второго рода, то есть проверить нулевую
гипотезу, когда она неверна. Вероятность 1 - b отклонения
нулевой гипотезы, когда она неверна, называется мощностью критерия
статистической проверки гипотезы. Вероятность ошибки второго рода в таком
случае равна b.
Для
заданной выборки п и ошибки первого рода вероятность b
зависит не только от истинного среднего D наблюдаемых разностей di = xi - yi,
для которых устанавливают различные альтернативные гипотезы, но также и от
стандартного отклонения sd
этих разностей. Это стандартное отклонение неизвестно, и,
если п мало, выборка может обеспечить только плохую оценку. В результате
невозможно устанавливать верхний предел вероятности ошибки второго рода.
На
графиках (рисунки 1 и 2) показаны зависимости между мощностью 1 - b
критерия проверки гипотез и истинным средним совокупности, деленным на
соответствующее стандартное отклонение (D/sd) для случая
односторонней гипотезы Н0: D £
0, различных значений n
и уровней значимости 0,05 и 0,01
соответственно.
На
основании этих графиков можно сделать следующие заключения:
1) Мощность критерия проверки гипотез однозначно
определяется истинным средним D совокупности
разностей, измеренных в единицах стандартного отклонения sd, уровнем значимости a и объемом выборки.
2) Функция мощности является монотонно возрастающей
функцией истинного среднего совокупности разностей. Она также монотонно
возрастает с ростом объема выборки и уровня значимости a при условии, что D > 0 и a отличается от 0 и 1.
3) Для уровня значимости 0,05 и при объеме выборки
50 достигается мощность 0,95, если истинное среднее разностей превышает
половину стандартного отклонения разностей. Для n = 20 такая мощность достигается для D/sd = 0,78 и больших значений.
Рисунок
1 - Мощность критерия для одной выборки (односторонний критерий), a = 0,01
Рисунок 2 -
Мощность критерия для одной выборки (односторонний критерий), a
= 0,05
СОДЕРЖАНИЕ
1 Область применения. 2
2 Нормативные ссылки. 2
3 Термины и определения. 2
4 Применение метода для сравнения двух способов
обработки экспериментальных данных. 3
5 Условия применения метода. 3
6 Расчетные формулы и правила принятия решения. 3
7 Ошибка второго рода. 5
|
Ключевые
слова: проверка статистической гипотезы, результаты
наблюдений, ошибка второго рода, стандартное отклонение, мощность критерия, случайный
отбор, выборочное среднее