t-критерий Стьюдента - это критерий проверки гипотезы о том, что
в определенной генеральной совокупности среднее можно считать равным mu (одновыборочный критерий),или же что средние двух генеральных совокупностей равны между собой (двухвыборочный критерий) и при этом не получить существенных противоречий с данными. При этом критерий подразумевается использовать тогда, когда неизвестна точность измерений.
---------------------------------------------------------------------------------
t-критерий Cтьюдента придуман "статистиком, химиком и пововаром" Вильямом Госсетом и опубликован в журнале "Биометрика" в 1908 году под всевдонимом "Student" (рус. Студент/Обучающийся) для того, чтобы обойти запрет на разглашение коммерческой тайны, налогаемый на Госсета пивоваренной компаний Гинесс, в которой он тогда работал.
В целом критерий изначально применялся в первую очередь для контроля качества при наличии прибора с неоткалиброванной погрешностью измерений. Например, для контроля крепости пива с спиртовым рефрактометром с неизвестной погрешнстью измерений.
При хорошо известной погрешности измерений следует использовать Z-критерий Фишера вместо критерия Стьюдента.
Собственно, при увеличении выборок (при количестве элементов выборок стремящемся к бесконечности) можно сказать, что t-критерий Стьюдента сходится к Z-критерию Фишера.
------------------------------------------------------------------------------------
Критерий базируется на значениях функции распределения t-распределения, которое вывел Госсет, а до него вывел Пирсон.
t-распределение - это распределение величины соответствующей
стандартной нормальной величине N(0,1) (со средним 0 и дисперсией 1) деленой на корень из случайной величины, распределенной по Хи-квадрат распределению. Поскольку у Хи-квадрат распределений есть такой параметр как степени свододы, то и у t-распределения есть степени свободы.
Сам критерий (двухсторонний одновыборочный выглядит так):
Пусть генеральная совокупность G имеет нормальное распределение,
H0: EG=mu
H1: EG!=mu
Основная гипотеза в том что среднее генеральной совокупности на самом деле равно мю (если мы, например, не нарушили технологического процесса, то так и должно быть - это теоретически то, что должно получиться в результате измерений) и альтернатива (двухсторонняя), что среднее генеральной совокупности не равно этому числу.
Мы считаем что гипотеза H0 верна до тех пор пока не будет выполнено следующее неравенство
sqrt(n)*(mean(X)-mu)/std(X) > t(n-1, alpha),
где
sqrt(n) - корень из количества измерений (размера выборки)
mean(X) - выборочное (эмпирическое) среднее выборки X
mu - теоретическое значение из нулевой гипотезы
std(X) - несмещенная оценка стандартного отклонения по выборке X
t(n-1, alpha) - квантиль уровня alpha t-распределения с n-1 степенью свободы.
NOTE: выборка - конечное количество представителей генеральной совокупности.
Если это неравенство выполняется - мы уверенно отвергаем гипотезу H0 и бракуем генеральную совокупность (с вероятностью ошибки не больше alpha)
t(n-1, alpha) - это теоретическое значение, которое на практике вычислено с большой точностью и обычно либо попросту загнано в таблицы, либо интерполируется по таблице.
Все остальные выражения таблицы довольно легко считаются из выборки.
-----------------------------------------------------------------------------------------------
Из предыдущего абзаца должно быть видно, что, как обычно, критерий позволяет достаточно быстро отвергнуть гипотезу, но никак не помогает подвтердить нулевую гипотезу. В целом следует фиксировать количество предполагаемых исследований каким-нибудь числом и последовательно измеряя значения и проверяя критерий для разных меньших объемов делать количество проб до этого числа. Критерий позволяет экономить измерения для объектов, которые следует отбраковать.
----------------------------------------------------------------------------------------------
NOTE:
t-критерий Стьюдента объязывает нас, чтобы генеральная совокупность была нормально распределена, однако поскольку речь идет о средних значениях, то при большом количестве измерений, в принципе, во-первых критерий будет вырождаться в Z-критерий, а во-вторых начинать быть примененимым для других распределений в силу центральной предельной теоремы.
ЗАМЕЧАНИЕ ИСПОЛЬЗОВАТЬ С ОСТОРОЖНОСТЬЮ, ПОНИМАЯ, ЧТО ВЫ ДЕЛАЕТЕ
---------------------------------------------------------------------------------------------
t-критерий имеет как минимум шесть разных подвидов, помимо изложенного выше:
1) односторонний одновыборочный
(H0: EG=mu;
H1: EG<mu или H1: EG>mu)
2) двухсторонний одновыборочный
(H0: EG=mu;
H!; EG!=mu)
3) односторонний двухвыборочный с независимыми выборками
(H0: EG1=EG2;
H1; EG1<EG2 или H2: EG1>EG2)
4) односторонний двухвыборочный с зависимыми выборками
(H0: EG1=EG2;
H1; EG1<EG2 или H2: EG1>EG2)
5) двухсторонний двухвыборочный с независимыми выборками
(H0: EG1=EG2;
H1; EG1!=EG2)
6) двухсторонний двухвыборочный с зависимыми выборками
(H0: EG1=EG2;
H1; EG1!=EG2)
У всех у них будет примерно один стиль построения критерия, но будут и разые формулы и разные критические значения - будьте внимательны.
---------------------------------------------------------------------------------------
t-критерий Стьюдента является параметрическим, в первую очередь потому что исследует параметр mu, истинное значение среднего генеральной совокупности, а также использует этот параметр, его оценку, а также оценку дисперсии при выводе окончательного вида неравенства критерия.