Квантиль




Главная
Новости
Статьи
Строительство
Ремонт
Дизайн и интерьер
Строительная теплофизика
Прочность сплавов
Основания и фундаменты
Осадочные породы
Прочность дорог
Минералогия глин
Краны башенные
Справочник токаря
Цементный бетон




06.03.2021


06.03.2021


05.03.2021


03.03.2021


01.03.2021


27.02.2021


27.02.2021





Яндекс.Метрика
         » » Квантиль

Квантиль

31.01.2021


Квантиль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).

Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг» означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим 4 кг.

Определение

Рассмотрим вероятностное пространство ( Ω , F , P ) {displaystyle (Omega ,;{mathcal {F}},;mathbb {P} )} и P X {displaystyle mathbb {P} ^{X}} — вероятностная мера, задающая распределение некоторой случайной величины X {displaystyle X} . Пусть фиксировано α ∈ ( 0 , 1 ) {displaystyle alpha in (0,;1)} . Тогда α {displaystyle alpha } -квантилем (или квантилем уровня α {displaystyle alpha } ) распределения P X {displaystyle mathbb {P} ^{X}} называется число x α ∈ R {displaystyle x_{alpha }in mathbb {R} } , такое что

P ( X ⩽ x α ) ⩾ α {displaystyle mathbb {P} (Xleqslant x_{alpha })geqslant alpha } , P ( X ⩾ x α ) ⩾ 1 − α . {displaystyle mathbb {P} (Xgeqslant x_{alpha })geqslant 1-alpha .}

В некоторых источниках (например, в англоязычной литературе) k {displaystyle k} -м q {displaystyle q} -квантилем называется квантиль уровня k / q {displaystyle k/q} , то есть ( k / q ) {displaystyle (k/q)} -квантиль в предыдущих обозначениях.

Замечания

  • Если распределение непрерывно, то α {displaystyle alpha } -квантиль однозначно задаётся уравнением
F X ( x α ) = α , {displaystyle F_{X}(x_{alpha })=alpha ,}

где F X {displaystyle F_{X}} — функция распределения P X {displaystyle mathbb {P} ^{X}} .

  • Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
P ( x 1 − α 2 ⩽ X ⩽ x 1 + α 2 ) = α . {displaystyle mathbb {P} left(x_{frac {1-alpha }{2}}leqslant Xleqslant x_{frac {1+alpha }{2}} ight)=alpha .}
  • Для эмпирического распределения α {displaystyle alpha } -квантиль можно задать следующим способом:
  • составляем вариационный ряд значений V 0 ⩽ V 1 ⩽ ⋯ ⩽ V N − 1 {displaystyle V_{0}leqslant V_{1}leqslant dots leqslant V_{N-1}} (выборка имеет объём N {displaystyle N} ), а также считаем, что V N = V N − 1 {displaystyle V_{N}=V_{N-1}} (это необходимо при вычислении 100% квантили по приводимым ниже формулам);
  • находим величину K = ⌊ α ⋅ ( N − 1 ) ⌋ {displaystyle K=lfloor alpha cdot (N-1) floor } ;
  • сравниваем K {displaystyle K} и α ⋅ N {displaystyle alpha cdot N} :
  • a) если K + 1 < α N {displaystyle K+1<alpha N} , то полагаем x α = V K + 1 {displaystyle x_{alpha }=V_{K+1}} ; б) если K + 1 = α N {displaystyle K+1=alpha N} , то полагаем x α = ( V K + V K + 1 ) / 2 {displaystyle x_{alpha }=(V_{K}+V_{K+1})/2} ; в) если K + 1 > α N {displaystyle K+1>alpha N} , то полагаем x α = V K {displaystyle x_{alpha }=V_{K}} .

    Заданный таким образом α {displaystyle alpha } -квантиль удовлетворяет приведенному выше определению.

    В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства K + 1 = α N {displaystyle K+1=alpha N} можно использовать приближённое сравнение | K + 1 − α N | < 1 / N {displaystyle |K+1-alpha N|<1/N} (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).

    Медиана и квартили

    • 0,25-квантиль называется первым (или нижним) квартилем (от лат. quarta — четверть);
    • 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым квартилем;
    • 0,75-квантиль называется третьим (или верхним) квартилем.

    Интерквартильным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть x 0 , 75 − x 0 , 25 {displaystyle x_{0{,}75}-x_{0{,}25}} . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.

    Дециль

    Дециль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.

    Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение.

    Процентиль

    p {displaystyle p} -м процентилем называют квантиль уровня α = p / 100 {displaystyle alpha =p/100} . Соответственно, медиана является 50-м процентилем, а первый и третий квартиль — 25-м и 75-м процентилями соответственно.

    В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.

    Процентили также называются перцентилями или центилями.

    Квантили стандартного нормального распределения