kolmogorovSmirnovTest
Проводит статистический тест Колмогорова-Смирнова для двух независимых выборок.
Синтаксис
Значения выборок берутся из столбца sample_data
. Если sample_index
равно 0, то значение из этой строки принадлежит первой выборке. Во всех остальных случаях значение принадлежит второй выборке.
Выборки должны принадлежать непрерывным одномерным распределениям.
Аргументы
Параметры
alternative
— альтернативная гипотеза (Необязательный параметр, по умолчанию:'two-sided'
.) String. ПустьF(x) и G(x)
- функции распределения первой и второй выборки соотвественно.'two-sided'
Нулевая гипотеза состоит в том, что выборки происходит из одного и того же распределение, то естьF(x) = G(x)
для любого x. Альтернатива - выборки принадлежат разным распределениям.'greater'
Нулевая гипотеза состоит в том, что элементы первой выборки в асимптотически почти наверное меньше элементов из второй выборки, то есть функция распределения первой выборки лежит выше и соотвественно левее, чем функция распределения второй выборки. Таким образом это означает, чтоF(x) >= G(x)
for любого x, а альтернатива в этом случае состоит в том, чтоF(x) < G(x)
хотя бы для одного x.'less'
. Нулевая гипотеза состоит в том, что элементы первой выборки в асимптотически почти наверное больше элементов из второй выборки, то есть функция распределения первой выборки лежит ниже и соотвественно правее, чем функция распределения второй выборки. Таким образом это означает, чтоF(x) <= G(x)
for любого x, а альтернатива в этом случае состоит в том, чтоF(x) > G(x)
хотя бы для одного x.
computation_method
— метод, используемый для вычисления p-value. (Необязательный параметр, по умолчанию:'auto'
.) String.'exact'
- вычисление производится с помощью вычисления точного распределения статистики. Требует большого количества вычислительных ресурсов и расточительно для больших выборок.'asymp'
('asymptotic'
) - используется приближенное вычисление. Для больших выборок приближенный результат и точный почти идентичны.'auto'
- значение вычисляется точно (с помощью метода'exact'
), если максимальный размер двух выборок не превышает 10'000.
Возвращаемые значения
Кортеж с двумя элементами:
Пример
Запрос:
Результат:
Заметки: P-value больше чем 0.05 (для уровня значимости 95%), то есть нулевая гипотеза не отвергается.
Запрос:
Результат:
Заметки: P-value меньше чем 0.05 (для уровня значимости 95%), то есть нулевая гипотеза отвергается.
Смотрите также