Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Что такое критерий Стьюдента и для чего его применяют на практике?

ПрограммированиеМатематика+3
Анонимный вопрос
  ·   · 17,7 K
кандидат физико-математических наук, математик, ис...  · 8 авг 2021  · novikovlabs.ru

t-критерий Стьюдента - это критерий проверки гипотезы о том, что

в определенной генеральной совокупности среднее можно считать равным mu (одновыборочный критерий),или же что средние двух генеральных совокупностей равны между собой (двухвыборочный критерий) и при этом не получить существенных противоречий с данными. При этом критерий подразумевается использовать тогда, когда неизвестна точность измерений.

---------------------------------------------------------------------------------

t-критерий Cтьюдента придуман "статистиком, химиком и пововаром" Вильямом Госсетом и опубликован в журнале "Биометрика" в 1908 году под всевдонимом "Student" (рус. Студент/Обучающийся) для того, чтобы обойти запрет на разглашение коммерческой тайны, налогаемый на Госсета пивоваренной компаний Гинесс, в которой он тогда работал.

В целом критерий изначально применялся в первую очередь для контроля качества при наличии прибора с неоткалиброванной погрешностью измерений. Например, для контроля крепости пива с спиртовым рефрактометром с неизвестной погрешнстью измерений.

При хорошо известной погрешности измерений следует использовать Z-критерий Фишера вместо критерия Стьюдента.

Собственно, при увеличении выборок (при количестве элементов выборок стремящемся к бесконечности) можно сказать, что t-критерий Стьюдента сходится к Z-критерию Фишера.

------------------------------------------------------------------------------------

Критерий базируется на значениях функции распределения t-распределения, которое вывел Госсет, а до него вывел Пирсон.

t-распределение - это распределение величины соответствующей

стандартной нормальной величине N(0,1) (со средним 0 и дисперсией 1) деленой на корень из случайной величины, распределенной по Хи-квадрат распределению. Поскольку у Хи-квадрат распределений есть такой параметр как степени свододы, то и у t-распределения есть степени свободы.

Сам критерий (двухсторонний одновыборочный выглядит так):

Пусть генеральная совокупность G имеет нормальное распределение,

H0: EG=mu

H1: EG!=mu

Основная гипотеза в том что среднее генеральной совокупности на самом деле равно мю (если мы, например, не нарушили технологического процесса, то так и должно быть - это теоретически то, что должно получиться в результате измерений) и альтернатива (двухсторонняя), что среднее генеральной совокупности не равно этому числу.

Мы считаем что гипотеза H0 верна до тех пор пока не будет выполнено следующее неравенство

sqrt(n)*(mean(X)-mu)/std(X) > t(n-1, alpha),

где

sqrt(n) - корень из количества измерений (размера выборки)

mean(X) - выборочное (эмпирическое) среднее выборки X

mu - теоретическое значение из нулевой гипотезы

std(X) - несмещенная оценка стандартного отклонения по выборке X

t(n-1, alpha) - квантиль уровня alpha t-распределения с n-1 степенью свободы.

NOTE: выборка - конечное количество представителей генеральной совокупности.

Если это неравенство выполняется - мы уверенно отвергаем гипотезу H0 и бракуем генеральную совокупность (с вероятностью ошибки не больше alpha)

t(n-1, alpha) - это теоретическое значение, которое на практике вычислено с большой точностью и обычно либо попросту загнано в таблицы, либо интерполируется по таблице.

Все остальные выражения таблицы довольно легко считаются из выборки.

-----------------------------------------------------------------------------------------------

Из предыдущего абзаца должно быть видно, что, как обычно, критерий позволяет достаточно быстро отвергнуть гипотезу, но никак не помогает подвтердить нулевую гипотезу. В целом следует фиксировать количество предполагаемых исследований каким-нибудь числом и последовательно измеряя значения и проверяя критерий для разных меньших объемов делать количество проб до этого числа. Критерий позволяет экономить измерения для объектов, которые следует отбраковать.

----------------------------------------------------------------------------------------------

NOTE:

t-критерий Стьюдента объязывает нас, чтобы генеральная совокупность была нормально распределена, однако поскольку речь идет о средних значениях, то при большом количестве измерений, в принципе, во-первых критерий будет вырождаться в Z-критерий, а во-вторых начинать быть примененимым для других распределений в силу центральной предельной теоремы.

ЗАМЕЧАНИЕ ИСПОЛЬЗОВАТЬ С ОСТОРОЖНОСТЬЮ, ПОНИМАЯ, ЧТО ВЫ ДЕЛАЕТЕ

---------------------------------------------------------------------------------------------

t-критерий имеет как минимум шесть разных подвидов, помимо изложенного выше:

1) односторонний одновыборочный

(H0: EG=mu;

H1: EG<mu или H1: EG>mu)

2) двухсторонний одновыборочный

(H0: EG=mu;

H!; EG!=mu)

3) односторонний двухвыборочный с независимыми выборками

(H0: EG1=EG2;

H1; EG1<EG2 или H2: EG1>EG2)

4) односторонний двухвыборочный с зависимыми выборками

(H0: EG1=EG2;

H1; EG1<EG2 или H2: EG1>EG2)

5) двухсторонний двухвыборочный с независимыми выборками

(H0: EG1=EG2;

H1; EG1!=EG2)

6) двухсторонний двухвыборочный с зависимыми выборками

(H0: EG1=EG2;

H1; EG1!=EG2)

У всех у них будет примерно один стиль построения критерия, но будут и разые формулы и разные критические значения - будьте внимательны.

---------------------------------------------------------------------------------------

t-критерий Стьюдента является параметрическим, в первую очередь потому что исследует параметр mu, истинное значение среднего генеральной совокупности, а также использует этот параметр, его оценку, а также оценку дисперсии при выводе окончательного вида неравенства критерия.

Все почти верно, только, для большей ясности, вместо неоткалиброванной генеральной совокупности, лучше применить... Читать дальше
Data Science. Meditation. Surrealism.  · 8 авг 2021
Давайте немного подумаем для чего вообще нужны критерии? Ответ прост - для проверки гипотез. Вот и критерий Стьюдента-такой критерий. Он уже стал именем нарицательным и многие вспоминают его только при проверке гипотез о... Читать далее
Кандидат медицинских наук, микробиолог, биоинформа...  · 29 июл 2021
Отвечу максимально упрощëнно и без использования терминологии, если нужны строгие определения, можете начать с Википедии. Вот допустим, у нас есть две популяции. Люди, приниающие препарат А, и люди, не принимающие его. И мы... Читать далее
1 эксперт согласен
Ох, уж это нормальное распределение... В нем действительно должно быть что-то магическое: физики считают его... Читать дальше
преподавание математики, высшей математики, data...  · 8 авг 2021
1. С уважением к другим ответам добавлю свои 5 копеек с другой стороны. 2. Конечно все помнят, что доверительный интервал для мат.ожидания нормальной случайной величины при гипотезе, что она =0 есть 0 плюс минус 1,96 *... Читать далее