Openstack DevOps and IBM/Informix Certified DBA... · 21 февр 2022
Типы не-нормального распределения
Бета-распределение.
Экспоненциальное распределение.
Гамма-распределение.
Обратное гамма-распределение.
Лог нормального распределения.
Логистическая дистрибуция.
Распределение Максвелла-Больцмана.
Распределение Пуассона.
Перекошенное распределение.
Симметричное распределение.
Равномерное распределение.
Унимодальное распределение.
Распределение Вейбулла
====================================
Причины не-нормального распределения
====================================
Многие наборы данных естественным образом соответствуют
не-нормальной модели. Например, количество несчастных случаев имеет тенденцию соответствовать распределению Пуассона, а срок службы продуктов обычно соответствует распределению Вейбулла.
Выбросы могут привести к искажению данных. Среднее значение особенно чувствительно к выбросам. Попробуйте удалить все экстремально высокие или низкие значения и снова проверьте свои данные.Несколько распределений могут быть объединены в ваших данных, создавая впечатление бимодального или мультимодального распределения. Например, два набора нормально распределенных результатов теста объединены на следующем изображении, чтобы создать вид бимодальных данных.
Недостаток данных может привести к тому, что нормальное распределение будет выглядеть полностью разбросанным. Например, результаты тестов в классе обычно имеют нормальное распределение. Крайний пример: если вы выберете трех случайных студентов и нанесете результаты на график, вы не получите нормального распределения. Вы можете получить равномерное распределение (например, 62 62 63) или асимметричное распределение (80 92 99). Если вы сомневаетесь в достаточности размера выборки, соберите больше данных.
========================================
Работа с не-нормальными распределениями
У вас есть несколько вариантов обработки ваших не-нормальных данных. Многие тесты, в том числе тест Z для одной выборки, тест T и ANOVA предполагают нормальность. Вы все равно сможете запустить эти тесты, если размер вашей выборки достаточно велик (обычно более 20 элементов). Вы также можете преобразовать данные с помощью функции, заставив их соответствовать нормальной модели.
=======================================
Однако, если у вас очень маленькая выборка, выборка с асимметрией
или выборка, которая естественным образом соответствует другому типу распределения,
Вы можете провести непараметрический тест. Непараметрический тест — это тест, который не предполагает, что данные соответствуют определенному типу распределения.
Непараметрические тесты включают критерий знакового ранга Уилкоксона, U-критерий Манна-Уитни и критерий Крускала-Уоллиса.