grad-green grad-gray grad-blue grad-red grad-pink grad-purple grad-yellow
Нести помощь людям

Вход на сайт

Проверка выборки на нормальность распределения, хи-квадрат

Краткое описание: 
Пример проверки выборки на нормальность распределения по критерию согласия Пирсона хи-квадрат.

Проверка нормальности распределения по критерию согласия Пирсона хи-квадрат

Итак, мы имеем некую выборку из данных, полученных в результате наших измерений.

Если закон распределения генеральной совокупности, из которой взята наша выборка, неизвестен, то первое, что надо сделать - это проверить распределение в выборке на нормальность, т.е. соответствие закону нормального распределения (смотри: нормальное распределение).

У нас есть теоретически основания предполагать, что закон распределения есть и имеет какой-то определенный вид: назовем его А.

Проверяем нулевую гипотезу: генеральная совокупность распределена по закону А.

Проверка этой гипотезы производится при помощи специально подобранной случайной величины – критерия согласия.

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия. Наиболее часто используется критерий согласия К.Пирсона («хи-квадрат»). Здесь мы ограничимся применением критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности.

Пусть по выборке объёма n получено следующее эмпирическое распределение:

Варианты……………………

Эмпирические частоты…….

Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты . При уровне значимости требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.

В качестве критерия проверки нулевой гипотезы примем случайную величину:

                       (А)

Естественно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия, и, следовательно, он характеризует близость эмпирического и теоретического распределений.

Доказано, что при n→∞ закон распределения случайной величины (А) стремится к закону распределения с степенями свободы независимо от того, какому закону распределения подчинена генеральная совокупность. Поэтому сам критерий называют критерием согласия .

Число степеней свободы определяется из равенства , где s – число групп (частичных интервалов) выборки,
r – число параметров предполагаемого распределения. В частности, если предполагаемое распределение – нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому число степеней свободы .

Построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости :

.

Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы – соответственно неравенством . Обозначим значение критерия, вычисленного по данным наблюдений, через и сформулируем правило проверки нулевой гипотезы:

Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу H0: генеральная совокупность распределена нормально, необходимо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия и по таблице критических точек распределения , по заданному уровню значимости α и числу степеней свободы k=n–3 найти критическую точку .

Если – то нет оснований отвергать нулевую гипотезу. В противном случае нулевую гипотезу отвергают, считая, что генеральная совокупность не распределена по нормальному закону.

Отметим два обстоятельства.

Объём выборки должен быть достаточно велик (не менее 50). Каждая группа должна содержать не менее 5–8 вариант, а малочисленные группы следует объединять в одну, суммируя частоты.

Поскольку возможны ошибки первого и второго рода, следует проявлять осторожность. Например, можно повторить опыт, увеличить число наблюдений, построить предварительно график распределения и т.п.

Пример

При уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:

Эмпирические частоты: 6 13 38 74 106 85 30 14

Теоретические частоты: 3 14 42 82 99 76 37 13

Рассчитаем =7,19, число степеней свободы определим по соотношению k= –3=5 (в нашем случае s=8). Используя рассчитанные значения и k, по таблице критических точек распределения хи-квадрат при уровне значимости находим .

Так как , то нет оснований отвергать нулевую гипотезу. Данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

Внешние ресурсы:

http://www.studfiles.ru/preview/5610482/page:3/

http://excel2.ru/articles/proverka-raspredeleniya-na-normalnost-v-ms-excel

http://www.manastart.ru/masts-421-1.html

http://textarchive.ru/c-2324547-p5.html

http://lektsii.org/15-70570.html

http://www.nntu.ru/RUS/fakyl/VECH/metod/metrology/4_7.htm

 

Ваша оценка: 
2.595745
Средняя: 2.6 (47 проголосовавших)

Комментарии

Вот чтобы я сам по вашему гайду мог проверить свою выборку на нормальность распределения? Можно так дать этот материал?

Присоединяюсь. Хотелось бы попонятнее, как для чайников или идиотов.

А можно как-то попонятнее объяснить? И с примерами?