Statistica d'ordine

Questa voce è da wikificare
Questa voce o sezione sull'argomento statistica non è ancora formattata secondo gli standard.
Abbozzo statistica
Questa voce sull'argomento statistica è solo un abbozzo.
Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento.

Sia ( X 1 , X 2 , , X n ) {\displaystyle (X_{1},X_{2},\dots ,X_{n})} una distribuzione di un carattere X {\displaystyle X} quantitativo oppure qualitativo ordinabile (ossia le cui modalità possano essere ordinate in base a qualche criterio), rilevato su n {\displaystyle n} unità statistiche. Indichiamo con X ( 1 ) {\displaystyle X_{(1)}} la modalità minima secondo l'ordine dato, con X ( 2 ) {\displaystyle X_{(2)}} quella che descrive la modalità successiva in ordine crescente rispetto all'ordine dato e così via. Ciascun indice X ( 1 ) , X ( 2 ) , , X ( n ) {\displaystyle X_{(1)},X_{(2)},\ldots ,X_{(n)}} viene detto statistica d'ordine.

In probabilità

In teoria delle probabilità, date n {\displaystyle n} variabili aleatorie X 1 , X 2 , , X n , {\displaystyle X_{1},X_{2},\dots ,X_{n},} si possono definire le statistiche d'ordine X ( 1 ) , X ( 2 ) , , X ( n ) , {\displaystyle X_{(1)},X_{(2)},\ldots ,X_{(n)},} che sono ancora variabili aleatorie, ordinando le realizzazioni delle variabili X 1 , X 2 , , X n , {\displaystyle X_{1},X_{2},\dots ,X_{n},} in ordine crescente.

Se le variabili X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\dots ,X_{n}} sono indipendenti ed identicamente distribuite, è possibile determinare esplicitamente la funzione di ripartizione di una statistica d'ordine come funzione delle funzioni di ripartizione delle variabili non ordinate.

La statistica d'ordine la cui funzione di ripartizione è la più intuitiva è quella che identifica la variabile aleatoria dell'insieme la cui determinazione avrà il valore massimo tra tutte le determinazioni, in formule

X ( n ) = max { X 1 , , X n } . {\displaystyle X_{(n)}=\max\{X_{1},\ldots ,X_{n}\}.}

Infatti si ha che

X ( n ) x X 1 x , , X n x {\displaystyle X_{(n)}\leq x\Leftrightarrow X_{1}\leq x,\ldots ,X_{n}\leq x}

e di conseguenza

F X ( n ) = P ( X ( n ) x ) = P ( X 1 x , , X n x ) {\displaystyle F_{X_{(n)}}=P(X_{(n)}\leq x)=P(X_{1}\leq x,\ldots ,X_{n}\leq x)}

e visto che le variabili sono indipendenti ed identicamente distribuite si ha:

F X ( n ) = P ( X ( n ) x ) = P ( X 1 x , , X n x ) = P ( X 1 x ) P ( X n x ) = i = 1 n F ( x ) = F ( x ) n , {\displaystyle F_{X_{(n)}}=P(X_{(n)}\leq x)=P(X_{1}\leq x,\ldots ,X_{n}\leq x)=P(X_{1}\leq x)\cdots P(X_{n}\leq x)=\prod _{i=1}^{n}{F(x)}=F(x)^{n},}

dove F ( x ) {\displaystyle F(x)} è l'identica funzione di ripartizione di ogni variabile dell'insieme. Analogamente si può determinare la funzione di ripartizione di F X ( 1 ) {\displaystyle F_{X_{(1)}}} , notando che l'evento complementare è che tutte le variabili aleatorie abbiano valore maggiore di x {\displaystyle x} :

F X ( 1 ) = 1 P ( X 1 > x , , X n > x ) = 1 P ( X 1 > x ) P ( X n > x ) = 1 i = 1 n P ( X i > x ) = 1 i = 1 n [ 1 F ( x ) ] = 1 [ 1 F ( x ) ] n . {\displaystyle F_{X_{(1)}}=1-P(X_{1}>x,\ldots ,X_{n}>x)=1-P(X_{1}>x)\cdots P(X_{n}>x)=1-\prod _{i=1}^{n}{P(X_{i}>x)}=1-\prod _{i=1}^{n}{[1-F(x)]}=1-[1-F(x)]^{n}.}

Per determinare invece la funzione di ripartizione di statistiche d'ordine differenti dal minimo e dal massimo, bisogna ricorrere sempre a delle elaborazioni di carattere logico-insiemistico sugli eventi, per esempio X ( 3 ) x {\displaystyle X_{(3)}\leq x} se e solo se il numero di variabili aleatorie la cui determinare è minore o uguale a x {\displaystyle x} è almeno 3.

Se volessimo calcolare le probabilità che il numero di variabili aleatorie la cui determinazione sarà minore o uguale a x {\displaystyle x} sia esattamente 3, si dovrebbe far ricorso ad una variabile aleatoria binomiale B {\displaystyle B} di parametri n {\displaystyle n} e p = F ( x ) {\displaystyle p=F(x)} , dove n {\displaystyle n} è il numero di variabili aleatorie dell'insieme. Quindi si avrebbe che questa probabilità coincide con

P ( B = 3 ) = ( n 3 ) F ( x ) 3 [ 1 F ( x ) ] n 3 . {\displaystyle P(B=3)={\binom {n}{3}}F(x)^{3}[1-F(x)]^{n-3}.}

Tuttavia, si vuole la probabilità P ( B 3 ) {\displaystyle P(B\geq 3)} , che in generale ha la seguente espressione:

P ( B 3 ) = i = 3 n P ( B = i ) . {\displaystyle P(B\geq 3)=\sum _{i=3}^{n}P(B=i).}

Di conseguenza, per una generica statistica d'ordine:

F X ( r ) ( x ) = P ( B r ) = i = r n P ( B = i ) = i = r n ( n i ) F ( x ) i [ 1 F ( x ) ] n i . {\displaystyle F_{X_{(r)}}(x)=P(B\geq r)=\sum _{i=r}^{n}P(B=i)=\sum _{i=r}^{n}{\binom {n}{i}}F(x)^{i}[1-F(x)]^{n-i}.}

Bibliografia

  • G. Leti (1983): Statistica descrittiva, Bologna, Il Mulino, ISBN 88-15-00278-2.

Voci correlate

  • Mediana (statistica)
  • Quartile
  • Quantile
  • Box-plot
  • Statistica
  • Statistica descrittiva

Collegamenti esterni

  • (EN) Eric W. Weisstein, Statistica d'ordine, su MathWorld, Wolfram Research. Modifica su Wikidata
Controllo di autoritàThesaurus BNCF 45876 · LCCN (EN) sh85095364 · GND (DE) 4212486-4 · BNF (FR) cb119782494 (data) · J9U (ENHE) 987007550947005171
  Portale Statistica: accedi alle voci di Wikipedia che trattano di statistica