ГОСУДАРСТВЕННЫЙ КОМИТЕТ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО СТАНДАРТИЗАЦИИ И МЕТРОЛОГИИ |
Ч НАЦИОНАЛЬНЫЙ |
ГОСТ Р |
( |рТт ) СТАНДАРТ |
50779.21 — |
У РОССИЙСКОЙ |
2004 |
------^ ФЕДЕРАЦИИ |
|
Статистические методы
ПРАВИЛА ОПРЕДЕЛЕНИЯ И МЕТОДЫ РАСЧЕТА СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ПО ВЫБОРОЧНЫМ ДАННЫМ
Ч а с т ь 1 Нормальное распределение
Издание официальное
Москва ИПК Издательство стандартов
Предисловие
1 РАЗРАБОТАН Техническим комитетом по стандартизации ТК 125 «Статистические методы в управлении качеством продукции»
2 ВНЕСЕН Научно-техническим управлением Госстандарта России
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Госстандарта России от 12 января 2004 г. № 3-ст
4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО 2854:1976 «Статистическое представление данных. Методы оценки и проверки гипотез о средних значениях и дисперсиях» (ISO 2854:76 «Statistical interpretation of data — Techniques of estimation and tests relating to means and vanance». NEQ)
5 ВЗАМЕН ГОСТ P 50779.21—96
Информация об изменениях к настоящему стандарту публикуется в указателе «Национальные стандарты», а текст этих изменений — в информационных указателях «Национальные стандарты». В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»
© ИПК Издательство стандартов. 2004
Настоящий стандарт не может быть полностью или частично воспроизведен, тиражирован и распространен в качестве официального издания без разрешения Госстандарта России
ГОСТ Р 50779.21-2004
Содержание
1 Область применения............................................................... 1
2 Нормативные ссылки............................................................... 1
3 Термины и определения............................................................ 2
4 Обозначения...................................................................... 2
5 Общие требования................................................................. 3
6 Точечное и интервальное оценивание математического ожидания генеральной совокупности .. 4
7 Точечное и интервальное оценивание дисперсии генеральной совокупности................ 13
8 Точечное и интервальное оценивание доли распределения случайной величины в заданном
интервале........................................................................ 16
Приложение А (справочное) Таблица значений функции стандартного нормального закона распределения ........................................................... 25
Приложение Б (справочное) Таблица значений квантилей распределения Стьюдента......... 27
Приложение В (справочное) Таблица значений квантилей х распределения................ 28
Приложение Г (справочное) Таблицы значений квантилей распределения Фишера............ 30
Введение
Стандарт устанавливает процедуры и методы решения ряда практических задач статистики в случае, когда наблюдаемые величины являются случайными и распределены по нормальному закону.
В стандарте изложены методы решения следующих задач:
а) точечного оценивания параметров нормального распределения случайной величины;
б) точечного оценивания вероятности попадания (доли распределения) случайной величины в заданный интервал и вне его:
в) интервального (доверительного) оценивания параметров нормального распределения и доли распределения;
г) проверки гипотез об этих же величинах.
Все процедуры, приведенные в стандарте, используют ограниченный ряд статистически независимых наблюдений, полученных в производстве, в лабораторных условиях, при контроле, измерении, оценке и т. п.
IV
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статистические методы
ПРАВИЛА ОПРЕДЕЛЕНИЯ И МЕТОДЫ РАСЧЕТА СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК
ПО ВЫБОРОЧНЫМ ДАННЫМ
Ч а с т ь 1 Нормальное распределение
Statistical methods. Determination rules and methods for calculation of statistical characteristics based on sample data.
Part 1. Normal distribution
Дата введения — 2004—06—01
1 Область применения
Настоящий стандарт устанавливает методы, применяемые для:
- оценки математического ожидания и дисперсии генеральной совокупности:
- проверки гипотез относительно значений этих параметров;
- оценки вероятности попадания (доли распределения) случайной величины в заданный интервал.
Примечание — Вероятность попадания случайной величины в интервал равна доле распределения случайной воличины в этом интервале. В большинстве практических задач физический смысл имоот понятие «доля распределения случайной величины в интервале», которое далее применено в настоящем стандарте.
Методы, изложенные в настоящем стандарте, применимы в том случае, если выполнены следующие условия:
- элементы выборки получены путем независимых повторений эксперимента. В случае конечной генеральной совокупности объем выборки должен составлять не более 10 % объема генеральной совокупности;
- наблюдаемые переменные распределены по нормальному закону. Однако если распределение вероятностей несильно отличается от нормального, то описанные в стандарте методы остаются применимыми для большинства практических приложений. В этом случае объем выборки должен быть не менее 10 единиц, причем достоверность получаемых статистических выводов возрастает при увеличении объемов выборок.
2 Нормативные ссылки
В настоящем стандарте использованы ссылки на следующие стандарты:
ГОСТ Р 50779.10-2000 (ИСО 3534-1—93) Статистические методы. Вероятность и основы статистики. Термины и определения
ГОСТ Р 50779.11-2000 (ИСО 3534-2—93) Статистические методы. Статистическое управление качеством. Термины и определения
Примечание — При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю «Национальные стандарты», составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный документ заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться замененным (измененным) стандартом. Если ссылочный документ отменен без замены, то положение, в котором дана ссыпка на него, применяется в части, не затрагивающей эту ссылку.
Издание официальное
3 Термины и определения
В настоящем стандарте применены термины по ГОСТ Р 50779.10 и ГОСТ Р 50779.11, а также следующие термины с соответствующими определениями:
3.1 точечное оценивание параметра: Получение оценки параметра в виде одного численного значения;
3.2 интервальное (доверительное) оценивание параметра: Получение оценки параметра в виде доверительного интервала;
3.3 доверительный интервал: Интервал, границы которого являются функциями от выборочных данных и который накрывает истинное значение оцениваемого параметра с вероятностью не менее 1 —а (где 1 — а — доверительная вероятность).
Примечание — Доверительный интервал может быть двусторонним или односторонним;
3.4 нулевая гипотеза: Предположение о распределении генеральной совокупности, которое проверяют по статистическим данным.
Примечание — В частности, в настоящем стандарте рассмотрены предположения о значениях параметров распределения.
4 Обозначения
В настоящем стандарте применены следующие обозначения:
М — математическое ожидание нормального закона распределения (среднее значение генеральной совокупности, далее — среднее значение); ц0 — известное значение параметра р;
Mi. Мг — математические ожидания для двух различных генеральных совокупностей;
jT — точечная оценка параметра р; р = х; рм, pt — верхняя и нижняя доверительные границы параметра р;
(Mi — Мг)д — точечная оценка разности значений параметров р, и р2:
о —стандартное (среднеквадратичное) отклонение нормально распределенной случайной величины;
D — дисперсия генеральной совокупности; D = а 2;
D0 — известное значение дисперсии генеральной совокупности. О0 = о * ; о0 — известное численное значение параметра а; а01. °02 — известные значения параметров о, и о2 для двух генеральных совокупностей;
o' — точечная оценка параметра о. о = S;
°l — верхняя и нижняя доверительные границы параметра о;
D — точечная оценка дисперсии;
х — выборочное значение наблюдаемой случайной величины; х, — выборочное значение случайной величины из первой генеральной совокупности;
х2 — то же. из второй генеральной совокупности; п, л,. п2 — объемы выборок;
х. х,. х2 — среднеарифметические значения (выборочные средние); с = (х~ х >г — выборочное стандартное (среднеквадратичное)отклонение:
V (Л - 1)
S,. S2 — то же для двух выборок соответственно;
« — риск первого рода (вероятность отвергнуть гипотезу, когда она верна); (1 —а) —уровень значимости при проверке гипотез, а также доверительная вероятность 0 < « < 1;
2
ГОСТ Р 50779.21-2004
v — число степеней свободы;
щ_а, Uy_af2 — квантили стандартного нормального закона распределения уровней
1 — а и 1 — «/2 соответственно;
*i «(v). *i а/г(у) — квантили распределения Стьюдента с v степенями свободы уровней 1 — а и 1 — «/2 соответственно;
F,_a(v1.v2) —квантиль распределения Фишера с v, и v2 степенями свободы уровня 1 — а;
X 1 (у). X 1 „ 2 X 2 2 <у> — квантили х 2 распределения с v степенями свободы уровней 1 — а.
1 — а/2 и а/2 соответственно;
L. М — нижняя и верхняя границы интервала соответственно;
р —доля распределения (вероятность попадания) случайной величины в заданный интервал [L. М].
q — доля распределения (вероятность попадания) случайной величины вне интервала [L. М]. причем q + р = 1;
'p.'q — точечные оценкир и q.
pL, qL — нижние односторонние доверительные границы для р и р;
Рм- Ям — верхние односторонние доверительные границы для р и р;
С — случайное событие; например, попадание случайной величины в заданный интервал;
Prob{C} — вероятность случайного события С;
1х — сумма выборочных значений.
5 Общие требования
5.1 Настоящий стандарт содержит описание типовых статистических задач, а также процедур, при помощи которых они решаются. Представленные задачи могут быть разбиты на три класса;
- точечное и интервальное оценивание среднего значения генеральной совокупности;
- точечное и интервальное оценивание дисперсии генеральной совокупности;
- точечное и интервальное оценивание доли распределения (вероятность попадания) случайной величины в заданном интервале и вне его.
5.2 Для решения каждой из перечисленных задач по 5.1 приведены процедуры их решения (разделы 6. 7. 8). включающие в себя;
1) статистические и исходные данные:
2) определение стандартных табличных данных, которые необходимы для проведения вычислений (приложения А. Б. В. Г), а также проведение вычислений параметров и коэффициентов по приведенным формулам;
3) результаты, полученные в итоге проведенных вычислений.
5.3 Для задач каждого класса приведены примеры их применения на практике (в производстве, медицине, химии). Спектр возможных применений этих задач не ограничивается приведенными в разделах 6. 7. 8 примерами.
5.4 Во всех приведенных задачах предполагается, что статистические и исходные данные подчиняются нормальному закону распределения. В тех случаях, когда изначально в этом нет достаточной уверенности, должны быть проведены предварительные исследования соответствия исходных данных нормальному закону.
5.5 Процедуры решения перечисленных в 5.1 задач представлены в таблицах, соответствующих этим задачам (разделы 6. 7. 8).
Номера таблиц разделов 6. 7.8 для решения соответствующих задач перечислены в обобщенных таблицах 5.1. 5.2, 5.3. 5.4.
3
Задача оценки среднего значения |
Номер таблицы |
D известна |
D неизвестна |
Оценка среднего |
6.1 |
6.2 |
Сравнение среднего значения с заданным значением |
6.3 |
6.4 |
Сравнение двух средних |
6.5 |
6.6 |
Оценка разности двух средних |
6.7 |
6.8 |
Таблица 5.2 — Номера таблиц для решения задач по оценке дисперсии (раздел 7) |
Задача оценки дисперсии |
Номер таблицы |
Оценка дисперсии |
7.1 |
Сравнение дисперсии или стандартного отклонения с заданным значением |
7.2 |
Сравнение двух дисперсий или двух стандартных отклонений |
7.3 |
|
Таблица 5.4 — Номера таблиц для решения задач по интервальной оценке доли распределения случайной величины при неизвестной дисперсии в заданном интервале (раздел 8) |
Заданные границы интервала |
Искомая вегинииа |
Номер таблицы |
L |
Pi- Рм |
8.4 |
М |
Pi - Рм |
8.5 |
L. М |
Pl- Pm |
8.6 |
L |
Pm- Pt |
8.7 |
М |
Pm-Pi |
88 |
L.M |
Pm-Pt |
8.9 |
|
5.6 Процедуры интервального оценивания доли распределения случайной величины в заданном интервале, изложенные в разделе 8 настоящего стандарта, являются простыми для применения, но не самыми эффективными. Более эффективными являются процедуры с использованием таблиц нецентрального распределения Стьюдента или таблиц толерантных множителей, которые в настоящем стандарте не приведены.
Таблица 5.3 — Номера таблиц для решения задач по точечной оценке доли распределения случайной величины в заданном интервале (раздел 8) |
Номер таблицы |
О известна |
Dнеизвестна |
8.2 |
8.3 |
|
6 Точечное и интервальное оценивание математического ожидания генеральной совокупности
6.1 Алгоритм точечного и интервального оценивания среднего значения при известной дисперсии приведен в таблице 6.1.
ГОСТ Р 50779.21-2004
Статистические и исходные данные |
Табличные данные и вычисления |
1 Объем выборки:
п =
2 Сумма значений наблюдаемых величии:
Хх =
3 Известное значение дисперсии:
«г- |
1 Квантиль стандартного нормального закона распределения уровня (1 —о):
"1-а =
2 Квантиль стандартного нормального закона распределения уровня (1 — о/2):
и\ <Л ~
3 Вычисляем: |
4 Выбранная доверительная вероятность:
1 — а = |
ЧЬ-
4 Вычисляем:
' V л
5 Вычисляем:
* V л |
Результаты
1 Точечная оценка параметра ц:
М = х =
2 Двусторонний симметричный доверительный интервал для ц:
х - К2 о0 й ц <, х ♦ К2 я0 .
3 Односторонние доверительные интервалы для ц:
Ц < X ♦ КуОф или ц г х — К,о0. |
Примечание — Квантили стандартного нормального закона распределения определяют по таблице А 1 приложения А. |
Примеры
1 Определение настроенности станка-автомата при механической обработке (например, токарного. шлифовального). Точность станка, определяемая разбросом получаемых размеров деталей без изменения настройки, считается известной, а центр настройки р требуется определить. Возможны оценки в виде точечного значения р или в виде интервала, который с известной степенью доверия (доверительной вероятностью) включает неизвестное значение р. Интервал может быть:
■ двусторонним, если необходима уверенность с заданной доверительной вероятностью, в каких пределах может лежать р;
• односторонним с верхней границей, если необходима уверенность, что р не выше какого-то значения;
- односторонним с нижней границей, если необходима уверенность, что р не ниже какого-то значения.
2 Оценка настройки автоматического оборудования для розлива жидкости в тару. Условие и возможные типы оценок — как в примере 1.
3 Многие другие технологические процессы с известной или оцененной заранее точностью (т. о. известным параметром о2^. в которых выходной контролируемый параметр имеет равновозможные отклонения в большую или меньшую стороны от центра настройки р. Условие и возможные типы оценок — как в примере 1.
6.2 Алгоритм точечного и интервального оценивания среднего значения при неизвестной дисперсии приведен в таблице 6.2.
5
Статистические и исходные данные |
Табличные данные и вычисления |
1 Объем выборки:
п =
2 Сумма значений наблюдаемых величин:
1х =
3 Сумма квадратов значений наблюдаемых величин:
1x2 =
4 Степени свободы:
V = п — 1 =
5 Выбранная доверительная вероятность:
1 — а = |
1 Квантиль распределения Стьюдента уровня (1 —«) с v степенями свободы:
'l-aM =
2 Квантиль распределения Стьюдента уровня (1 —aJ2) с v степенями свободы:
*i =
3 Вычисляем:
4 Вычисляем:
I < X - X >2 I х 2 - <£ х)2/л л- 1 л-1
5 Вычисляем:
6 Вычисляем:
/ .*-2.
1 “ 7л
7 Вычисляем:
/2.I,-r2<V)«
\ л |
Результаты
1 Точечная оценка параметра р:
р = х =
2 Точечная оценка параметра D:
0 = S2 =
3 Двусторонний симметричный доверительный интервал для параметра р:
х — l2S й р £ х ♦ /2 S.
4 Односторонние доверительные интервалы для параметра р:
р £ x*/,S или (1) P*x-/,S. (2) |
Примечание — Квантили распределения Стьюдента определяют по таблице Б.1 приложения Б. |
Примеры— Примеры те же. что в 6.1, но точность, определяемая разбросом контролируемых значений, заранее неизвестна.
6.3 Алгоритм решения задачи сравнения неизвестного среднего значения с заданным значением р0 при известной дисперсии приведен в таблице 6.3.