Oggi è 22/12/2024, 18:39


Interpolazione, regressione e correlazione

In questo spazio vengono discussi argomenti semplici che riguardano soprattutto chi è alle prime armi
  • Autore
  • Messaggio
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio20/02/2012, 20:29

Calcolo della regressione lineare con excel

Riprendiamo il nostro foglio di lavoro e posizioniamoci, ad esempio, sulla cella H14. Richiamiamo la funzione PREVISIONE ed inseriamo i dati che essa ci richiede:

PadriFigli9.png


- nel campo X dovremo inserire il valore dell'osservazione x per la quale si desidera la previsone
- nel campo Y_nota, invece, inseriremo i valori delle y osservate (nel nostro caso i pesi dei figli, contenuti nel vettore B2:B13)
- nel campo X_nota, successivamente, inseriremo i valori delle x osservate (nel nostro caso i pesi dei padri, contenuti nel vettore A2:A13).

Premiamo ok e...

PadriFigli8.png


Si noti che il risultato ottenuto, in H14, coincide con il contenuto della cella F14, che corrisponde al valore della y, in corrispondenza della x=82, calcolato in precedenza con i modelli di a e b precedentemente illustrati.
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Non connesso
Avatar utente

Enrico

  • Messaggi: 90
  • Iscritto il: 15/10/2011, 21:11

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 10:58

Mauro, visto che non ti voglio sporcare il thread, te lo chiedo prima: pensi che sia utile per il forum un excel che fa l'estrapolazione delle curve di volatilità con le spline cubiche?
Magari con un minimo di trattazione sull'interpolazione spline cubica (che se vuoi lascio a te visto che esponi in modo chiaro e professionale) .... :27
TEORIA è quando si sa tutto ma non funziona niente, PRATICA è quando funziona tutto ma non si sa perchè:
per me TEORIA e PRATICA si fondono in un unico concetto: NON MI FUNZIONA NIENTE E NON SO NEANCHE PERCHE'!!
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 16:15

Enrico ha scritto:Mauro, visto che non ti voglio sporcare il thread, te lo chiedo prima: pensi che sia utile per il forum un excel che fa l'estrapolazione delle curve di volatilità con le spline cubiche?
Magari con un minimo di trattazione sull'interpolazione spline cubica (che se vuoi lascio a te visto che esponi in modo chiaro e professionale) .... :27


Ciao Enrico,
la tua è un'idea grandiosa, come grandioso è il progetto di AZ13, che sta cercando di mettere su un sito dove davvero, chi vuole - naturalmente -, ha la possibilità di imparare.

Vai pure avanti, perfettamente d'accordo, e spendici sopra qualche parola di didattica. Poi, se necessario, integreremo.

Ancora grazie.
:)
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 18:00

L'errore standard della stima

Per analizzare la bontà di una retta di regressione sono utili due operazioni:
a. rappresentare la retta sul diagramma a dispersione;
b. calcolare la variabilità attorno a tale retta.

La prima operazione ci permette di eseguire un controllo grafico certamente non superfluo: dovendo la retta passare fra i punti-osservazione, ci attenderemo che ve ne siano, grosso modo, tanti al di sopra di questa e tanti al di sotto della stessa. Se la retta non avrà una posizione adeguata, potremmo accorgersi di eventuali grossolani errori commessi nel calcolo dei parametri della retta stessa.

Passiamo ora alla seconda operazione. Notiamo, innanzitutto, che se tutti i punti giacciono sulla retta non vi è affatto variabilità rispetto ad essa. Se, come invece accadrà nei casi reali, i punti non giacciono (tutti) sulla retta, allora procederemo con il calcolo della varianza dei residui.

Ma cosa intendiamo con il termine residuo? Si tratta della differenza tra il valore osservato e quello stimato dalla retta. In sostanza è lo scarto, o errore che, in riferimento all'i-esima osservazione, abbiamo anche indicato con:

d_i=y-y_i

Tanto maggiore risulterà questa varianza e tanto meno "buona" sarà la nostra interpolazione. Naturalmente, occorrerà anche che questa varianza sia commisurata a qualcosa, in modo che assumano senso le espressioni varianza grande o varianza piccola.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 18:27

L'errore standard della stima

Per il calcolo della varianza, dunque, si procederà allo stesso modo di come già illustrato in altro thread. Sostanzialmente:

S^2_{y/x}={\sum_{i=1}^n (y-y_i)^2\over n}

che si legge, varianza intorno alla retta di regressione della y sulla x (o varianza della stima di y in x).

L'errore standard della stima di y in x, conseguentemente, sarà la radice quadrata della suddetta varianza.

S_{y/x}=\sqrt{\sum_{i=1}^n (y-y_i)^2\over n}}

Questo, però, se abbiamo a che fare con l'intera popolazione del carattere da noi osservato. Quando invece, come nella stragrande maggioranza dei casi (e così, anche, nell'analisi deim dati di borsa), ci troviamo di fronte ad un campione, ovvero ad un insieme di individui che rappresentano solo una parte dell'intera popolazione (spesso una piccolissima parte), allora occorre usare lo stimatore dell'errore standard. Si dimostra che tale stimatore vale:

\hat{S}_{y/x}=\sqrt{\sum_{i=1}^n (y-y_i)^2\over n-2}}

(per distinguere graficamente i due simboli, è uso porre un "cappelletto" - o, accento circonflesso - sopra il simbolo dello stimatore).
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 19:14

L'errore standard della stima

Ora, si può dimostrare che l'errore standard della stima di y in x, può essere scritto anche come:

\hat{S}_{y/x}=\sqrt{{1\over n-2}\[\Bigg[ \sum_{i=1}^n (y_i-\bar{y})-{[\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})]^2 \over \sum_{i=1}^n (x_i-\bar{x})^2}}\[\Bigg]

ed è proprio questo il metodo di calcolo usato da excel, come si può da un estratto della guida illustrato in figura.

PadriFigli10.png


La funzione è:

ERR.STD.YX

ed ora cercheremo di usarla nell'esempio che stiamo portando avanti dall'inizio del thread.
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 20:16

Uso di excel per il calcolo dell'errore standard della stima

Riprendiamo il nostro foglio di lavoro, puntiamo nella cella B19, richiamiamo la funzione per il calcolo dell'errore standard, selezioniamo i vettori dei dati, x ed y, A2:A13 e B2:B13, e il gioco è fatto.

PadriFigli11.png


Troviamo 1.47, o meglio, 1.47 kg. Si, sono kg, in quanto si tratta di differenze tra grandezze espresse in kg: il peso dei figli osservato ed il peso dei figli stimato.
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Non connesso
Avatar utente

Enrico

  • Messaggi: 90
  • Iscritto il: 15/10/2011, 21:11

Re: Interpolazione, regressione e correlazione

Messaggio21/02/2012, 21:52

Mauro ha scritto:Ciao Enrico,
la tua è un'idea grandiosa, come grandioso è il progetto di AZ13, che sta cercando di mettere su un sito dove davvero, chi vuole - naturalmente -, ha la possibilità di imparare.

Vai pure avanti, perfettamente d'accordo, e spendici sopra qualche parola di didattica. Poi, se necessario, integreremo.

Ancora grazie.
:)


Ok, attendo che tu esaurisca la trattazione sulla regressione lineare e poi continuo il thread io (naturalmente sotto la tua supervisione...anche perchè non sono molto bravo nell'esporre la teoria :opps ) ...fammi un cenno :23
TEORIA è quando si sa tutto ma non funziona niente, PRATICA è quando funziona tutto ma non si sa perchè:
per me TEORIA e PRATICA si fondono in un unico concetto: NON MI FUNZIONA NIENTE E NON SO NEANCHE PERCHE'!!
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio22/02/2012, 17:19

Uso di excel per il calcolo dell'errore standard della stima

Prima di passare oltre, vorrei spendere ancora una parola sul calcolo dell'errore standard con excel. Abbiamo visto, in un post precedente, qual'è la formula impiegata dal foglio di calcolo per la valutazione dell'errore standard della stima. Ma, se ben ricordate, lo stimatore dell'errore standard della stima che avevamo introdotto era:

\hat{S}_{y/x}=\sqrt{\sum_{i=1}^n (y-y_i)^2\over n-2}}

Ebbene, applicando questa di formula, che sembra (ma dico solo sembra) abbastanza diversa da quella usata da excel, otterremmo lo stesso risultato? Vediamo.

Usiamo il foglio dell'esempio che stiamo portando avanti nel quale, come ricorderete, nelle colonne E3:E14 e F3:F14 avevamo posto una serie di ipotetici valori della x ed i corrispondenti valori della y calcolati sulla base dei parametri della retta di regressione (contenuti nelle caselle B17 e B18). Ciò per poter disegnare una parte della retta di regressione nel diagramma a dispersione (e farne un confronto visivo con la nuvola di punti rappresentante i dati osservati).

PadriFigli12.png



Ora, per poter applicare questa formula, dobbiamo disporre, per ogni valore della x, delle y stimate e delle y osservate. Le y osservate le abbiamo in colonna B. Le y stimate le faremo porre ad excel in colonna F.

Procediamo in questo modo. Prendiamo le x osservate, poste nel vettore colonna A2:A13, e le spostiamo nel vettore colonna E3:E14 in modo che excel calcoli, sulla base dei parametri della retta di regressione le y stimate, e le ponga, appunto, nel vettore colonna G3:G14.
Al termine di ciò il foglio si presenterà in questo modo:

PadriFigli13.png


Ora, nella cella G3, andiamo a porre la differenza:

(y-y_i)^2

ovvero, (F3-B2)^2. Poi copiamo e replichiamo questa formula nelle celle successive G4:G14. Avremo:

PadriFigli14.png


A questo punto sommiamo tutte le celle G3:G14, ponendo il risultato in G15, e dividiamo per la numerosità del campione diminuita di 2: nel nostro caso 10. E non dimentichiamo di estrarre la radice quadrata di tale somma.
Perchè diminuita di 2? Perchè qui abbiamo a che fare con un campione e non con l'intera popolazione: pertanto dobbiamo usare, in luogo dell'errore standard, un suo stimatore. Otteniamo:

PadriFigli15.png


Come si può osservare, il risultato coincide con quello ottenuto con la formula di excel per il calcolo della stima dell'errore standard (posto nella cella B19).
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
Non connesso

Mauro

  • Messaggi: 628
  • Iscritto il: 22/10/2011, 1:32
  • Località: Roma

Re: Interpolazione, regressione e correlazione

Messaggio22/02/2012, 17:21

Uso di excel per il calcolo dell'errore standard della stima

Un'ultima annotazione.

Qualcuno, forse un po' pignolo (caratteristica che, nell'ambito della ricerca scientifica, non è mai - a mio avviso - un difetto!) potrebbe obiettare che tale eguaglianza è verificata a meno di 3 millesimi! In effetti così sembrerebbe! Ma poi, riflettendoci un momento, ci ricordiamo che il risultato in B19 era stato ottenuto chiedendo ad excel di visualizzare solo le prime due cifre decimali. Ed allora, "scopriamo" le altre cifre e ...

PadriFigli16.png


... si, sembra che sia tutto a posto.
;)
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.
PrecedenteProssimo

Torna a Concetti di base



Chi c’è in linea

Visitano il forum: Nessuno e 3 ospiti

cron