- Messaggi: 628
- Iscritto il: 22/10/2011, 1:32
- Località: Roma
Il coefficiente di correlazione di Bravais-Pearson
Karl Pearson (1857-1936), nel 1901, pubblicò un articolo sulla rivista Philosophical Magazine, dal titolo On lines and planes of closest fit to systems of points in space divenuto poi un caposaldo della correlazione. Pearson, nell'articolo, fa riferimento al metodo per il calcolo del best fit mediante varie formule ed esempi. E' bene precisare, comunque, che qualche tempo prima, Auguste Bravais (1811-1863), aveva gia' evidenziato matematicamente la correlazione partendo da lavori precedenti di Francis Galton.
Cominciamo col definirlo, quest'indice, da un punto di vista analitico:
Al numeratore abbiamo la covarianza e, al denominatore, vi è il prodotto tra le varianze della variabile x e della variabile y. Osserviamo subito che:
a. il segno algebrico di questo coefficiente coincide col segno algebrico della covarianza: la deviazione standard, infatti, può solo essere positiva (in realtà potrebbe anche essere nulla, ma ciò significherebbe che tutte le variabili sono eguali tra loro! Un caso degenere!
b. Così definito, inoltre, questo coefficiente è un numero puro: le dimensioni del numeratore, infatti, coincidono con quelle del denominatore.
Ora, queste due osservazioni sono ovvie, si tratta solo di pensarci un momento. Ve ne è però una terza:
c. il coefficiente di correlazione è un numero sempre compreso tra -1 e +1
che deve invece essere dimostrata.
Prima di passare alla dimostrazione dell'asserto c vorrei spendere altre due parole sull'utilità di questo coefficiente. Prima cosa: averlo definito in questo modo, significa averlo normalizzato. Senza addentrarci molto nei meandri di questo concetto - lo faremo, magari, quando avremo l'occasione di discutere delle variabili standardizzate - possiamo dire che, con la normalizzazione, limitiamo l'escursione dei valori entro un certo intervallo definito (in questo caso tra -1 e +1).
Seconda cosa (ed è, a mio avviso, la più importante): con questa definizione possiamo eseguire i confronti tra gradi di associazione lineare di fenomeni diversi e con unità di misura differenti. Cosa che, come il lettore ricorderà, non era possibile fare con la covarianza.