Oggi è 22/12/2024, 11:54


Interpolazione, regressione e correlazione

In questo spazio vengono discussi argomenti semplici che riguardano soprattutto chi è alle prime armi
  • Autore
  • Messaggio
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Interpolazione, regressione e correlazione

Messaggio15/02/2012, 16:57

Apro questo thread a supporto di alcuni indicatori che AZ13 ha deciso di investigare a beneficio degli utenti di questo forum. Si tratta di indicatori non convenzionali (se per convenzionali intendiamo gli indicatori messi a disposizione dalla disciplina dell'analisi tecnica), di derivazione statistica, che rivestono un'importanza operativa notevole quali strumenti di supporto alle decisioni che un trader in opzioni deve assumere all'interno di una sessione di lavoro.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 17:05

L'interpolazione

Quando indaghiamo sull'esistenza di una relazione sperimentale tra due o più variabili siamo alla ricerca di un'equazione che stabilisca un legame tra tali variabili.

La prima operazione che dobbiamo compiere è quella di raccogliere i dati che sono di nostro interesse. Ad esempio, potremmo essere interessati a stabilire se vi è una qualche relazione tra il peso dei padri e quello dei propri figli. Costruiremo, allora, un campione di n individui padri e, corrispondentemente, il campione degli n individui figli (supponiamo, per ragioni di semplicità, che i figli siano tutti unici).

Diciamo che:

x_1, x_2, x_3, ..., x_n

siano i pesi degli n padri e:

y_1, y_2, y_3, ..., y_n

siano i pesi dei rispettivi figli.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 17:11

L'interpolazione

La seconda operazione è quella di rappresentare graficamente i dati raccolti. Nell'esempio che stiamo esaminando si ricorrerà ad un grafico cartesiano bidimensionale, essendo due le variabili coinvolte (peso dei padri versus peso dei figli) nel quale si andranno a riportare tanti punti, ognuno di coordinate:

(x_i, y_i)

quant'è la numerosità del campione (nel nostro caso, pari ad n).

Si ottiene un diagramma che, nella letteratura del settore, è denominato diagramma a dispersione (scatter plot).

DiagDisp1.png


La nuvola di punti ottenuta, come nell'esempio qui riportato (si tratta del tempo di attesa tra le eruzioni e la durata delle eruzioni dell'Old Faithful Geyser nel Yellowstone National Park, Wyoming, USA. Fonte: wikipedia), dovrebbe suggerire al ricercatore il tipo di relazione analitica tra le due variabili. Nel caso del grafico di figura, una prima analisi dei dati suggerisce due tipi di eruzioni: corta attesa e corta durata e lunga attesa e lunga durata.
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 17:42

L'interpolazione

Analizzando il diagramma a dispersione il ricercatore dovrà farsi un'idea del tipo di curva che meglio riesce a rappresentare quei dati; dovrà cercare di individuare, diciamo, la curva che più gli passa vicino (ai punti geometrici che rappresentano i dati in esame). La curva cercata si chiama curva interpolatrice.

Facciamo qualche esempio.

Nel caso della figura qui riportata, ad esempio, i dati sembrerebbero ben interpolati da una curva del primo ordine (ossia una retta). Affermeremo, conseguentemente, che tra le due variabili vi è una relazione lineare.

DiagDispPrimOrdine.png


Nella figura successiva, invece, sembra che la miglior curva interpolatrice sia quella di una parabola: tra le variabili y ed x, allora, diremo che vi è una relazione del secondo ordine (più in particolare, una relazione di tipo parabolico).

DiagDispSecondOrdine.png


Il caso della prossima figura, questa volta, sembra dirci che tra le due variabili non sussista alcuna relazione: ognuna delle due, pertanto, varia in modo del tutto casuale rispetto al variare dell'altra.

DiagDispCasuale.png
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 17:56

L'interpolazione

Il problema dell'interpolazione, quindi, è quello di trovare i parametri che particolarizzano il tipo di curva ipotizzata. Così, nell'esempio della relazione lineare, la curva generale ipotizzata è quella della retta:

y=mx+q

e quella particolare, oggetto di indagine del problema dell'interpolazione, è quella in cui sono noti i valori di m e q (parametri della retta). Ad esempio:

y=3x-2

Allo stesso modo, se la relazione generale cercata è quella di una parabola descrivibile, ad esempio, per mezzo del trinomio di secondo grado:

y=ax^2+bx+c

il problema dell'interpolazione avrà, quale suo scopo, quello di individuare il valore assunto dai parametri a, b e c. Ad esempio:

y=5x^2-2x+1
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 18:06

La regressione

Lo scopo principale dell'interpolazione, come a questo punto credo sia chiaro al lettore, è quello di stimare la variabile dipendente (ad esempio, peso del figlio) per mezzo della variabile indipendente (peso del padre). Questo processo di stima è denominato regressione.

Se, pertanto, dobbiamo stimare y mediante x per mezzo di una certa equazione, tale equazione verrà indicata equazione di regressione di y in x. E, la corrispondente rappresentazione grafica, assumerà la denominazione di curva di regressione di y in x.

Se l'equazione cercata è un'equazione di primo grado, allora siamo di fronte alla regressione lineare o del primo ordine. Diversamente si tratterà di una regressione di ordine superiore al primo (secondo ordine, come nell'esempio dell'equazione parabolica esaminata in precedenza).
Non connesso

Norby

  • Messaggi: 50
  • Iscritto il: 09/10/2011, 18:18

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 21:10

Bravo, bravo e bravo ancora.

Chiaro e semplice, proprio come Antonio

Norby
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 21:55

Una precisazione linguistica

Ringrazio Norby (davvero troppo buono) e, con l'occasione, vorrei precisare l'origine linguistica del termine "regressione". Chi si occupa di statistica sa bene che in questo ambito disciplinare il termine regressione è impiegato molto diffusamente ma, a differenza della nostra lingua, l'accezione (significato) con cui questo termine è usato è profondamente diversa da quella, appunto, con cui lo si usa nella nostra lingua. E a cosa si deve, allora, questa differenza semantica così marcata?

Il termine, in ambito statistico, è stato introdotto dal Francis Galton (1822-1911), genetista, esploratore, antropologo e climatologo (http://it.wikipedia.org/wiki/Francis_Galton), in occasione dei suoi studi sul carattere ereditario della statura nella specie umana.

Egli osservò che la statura dei figli di padri, la cui altezza deviava di una quantità x dalla media generale dei padri, si discostava dalla media della statura dei figli di una quantità minore di x. Egli definì tale fenomeno come "regressione alla mediocrità"; si originò, così, un termine il cui attuale significato non fa più riferimento al contesto in cui venne per la prima volta impiegato.

Oggi, infatti, con tale termine si intende il processo di interpolazione di osservazioni quantitative, generalmente con una retta, ma anche con funzioni di ordine superiore al primo.
Non connesso
Avatar utente

AZ13

  • Messaggi: 42818
  • Iscritto il: 28/09/2011, 22:27

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 22:37

Bravo Mauro, :13
ne approfitto per mettere in condivisione un programma fatto in Excel della macchina di Galton.

2.jpg

Un dispositivo inventato da Sir Francis Galton per fornire una dimostrazione pratica del teorema del limite centrale e della distribuzione normale.
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Meno si rischia più si guadagna ...
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio15/02/2012, 22:56

Notevole, questo foglio excel, grazie Antonio: un'occasione ed uno spunto per riflettere su questo importante teorema: quando il numero delle osservazioni aumenta, la frequenza relativa tende alla probabilità: frequenza relativa che diviene eguale alla probabilità teorica per n (numero delle osservazioni) che tende all'infinito.
:)
Prossimo

Torna a Concetti di base



Chi c’è in linea

Visitano il forum: Nessuno e 70 ospiti

cron