6. Correlazione lineare

N 40 N.2 APPENDICE - STATISTICA 6. Correlazione lineare L analisi della correlazione si utilizza per quantificare il grado di associazione lineare tra due variabili quantitative (X1 e X2) che si ipotizzano variare congiuntamente, nel caso in cui non sia possibile stabilire tra esse una relazione di causa-effetto. L indice statistico che viene utilizzato è r, detto coefficiente di correlazione. Si indica con r se riferito alla popolazione. Tale coefficiente può assumere valori compresi tra 21 e 11. Il segno positivo indica relazione diretta tra i valori delle due variabili, il segno meno indica esistenza di una relazione di proporzionalità inversa. Tanto più il valore assoluto di r è vicino a 1, tanto più è stretta l associazione tra le due variabili. Il valore di r è calcolabile con la seguente formula: s la 7 m v p A i a 1 x1i 2 x1 2 . 1 x2i 2 x2 2 n r5 i51 1 x 2 x1 2 2. a 1 x2i 2 x2 2 2 a 1i n n i51 i51 Il coefficiente r ha anche il significato di media geometrica dei coefficienti angolari della regressione di X1 su X2 e di X2 su X1. L ipotesi nulla relativa alla correlazione è H0: r 5 0 (ovvero l assenza di correlazione nella popolazione da cui sono stati tratti i campioni), ed è possibile saggiare questa ipotesi con apposite tavole statistiche basate direttamente sul valore di r, in funzione dei gradi di libertà (numero di coppie 22), oppure con un test t, strutturato nel seguente modo: tn22 5 r"n 2 2 "1 2 r 2 dove n è il numero di coppie. Per verificare la presenza di relazioni di tipo non lineare si può procedere al calcolo del coefficiente di correlazione su dati trasformati (es. i logaritmi) al posto di quelli naturali. N.2 7. Regressione La regressione è una procedura statistica che consente di analizzare la relazione che si instaura tra una variabile dipendente (y) e una o più variabili indipendenti (x1, x2, x3, ..., xp ). Tramite il metodo dei minimi quadrati ordinari (la procedura più diffusa)3, si può pervenire alla stima di modelli statistici del tipo: (regressione lineare semplice) y 5 b0 1 b1 x oppure y 5 b0 1 b1 x1 1 b2 x2 1 b3 x3 1 ... 1 bp xp (regressione multipla) dove: b0 costituisce l intercetta e b1, b2, b3, ..., bp sono i coefficienti di regressione. 3 Il metodo dei minimi quadrati, pur essendo ampiamente utilizzato, presenta limiti applicativi, la cui analisi esula dagli obiettivi di questa breve trattazione. Tra essi ricordiamo la necessità che i residui abbiano distribuzione normale, l assenza di eteroschedasticità e di correlazione nei residui. Nel caso della regressione multipla, è importante anche che tra le variabili indipendenti non vi sia collinearità. N02_1_Statistica_Applicata.indd 40 5/31/18 11:37 AM Fi

SEZIONE N
SEZIONE N
MATEMATICA, STATISTICA, SPERIMENTAZIONE, MODELLISTICA, MISURAZIONI
La razionalizzazione degli interventi agronomici richiede conoscenze su suolo, clima, colture e sistema biologico (microrganismi, parassiti, malattie, malerbe...), sulle loro interazioni ed evoluzione a seguito degli interventi agronomici. Per quanto possibile, all’approccio descrittivo (qualitativo) dovrebbe seguire quello quantitativo che, coinvolgendo dati numerici, richiede misurazioni o esperimenti che trovano la loro naturale elaborazione con l’ausilio di strumenti matematici, statistici e modellistici, al fine di ottenere conoscenze utili a scopo decisionale.L’aspetto quantitativo può determinare anche differenze qualitative: in base all’andamento economico (aspetto quantitativo), si può avere il fallimento dell’azienda (aspetto qualitativo).Le oscillazioni continue di contenuto idrico del suolo possono comportare sia variazioni quantitative (diminuzione di resa colturale per siccità) sia qualitative (la coltura muore per carenza idrica e la resa si annulla).Per trattare gli aspetti quantitativi, abbiamo bisogno di strumenti matematici che permettano di descrivere le relazioni tra variabili e di prevedere fenomeni e comportamenti semplici. Quando la complessità dei fenomeni da trattare aumenta, cresce anche l’incertezza, cui è legato il rischio. A questo punto possiamo scegliere la strada della descrizione statistica o quella dell’approccio di sistema, con l’applicazione dei modelli di simulazione. L’approccio statistico risulta inoltre fondamentale per trattare errori e variabilità nelle informazioni (compresi i rischi che ne derivano), sia nella sperimentazione di campo sia con i modelli.Nella presente Sezione N del Manuale dell’Agronomo vengono illustrati sinteticamente gli Strumenti matematico-statistici, nonché gli elementi per una corretta applicazione della Sperimentazione e della Modellistica in agricoltura. Completano la trattazione gli elementi relativi ai Sistemi di misura. Spetta all’Agronomo la scelta dello strumento di volta in volta più idoneo allo scopo, per qualità e utilità delle informazioni, ma anche per semplicità e rapidità con le quali si ottengono le informazioni richieste.Nell’attività professionale, l’uso di strumenti di supporto decisionale (modelli, GIS) o di procedure di elaborazione numerica è, oltre che utile, sempre più spesso richiesto dalle normative o dagli enti pubblici con cui il professionista si deve rapportare. Rimane all’Agronomo la responsabilità di verifica normativa e di un uso corretto e consapevole di questi strumenti.Coordinamento di SezioneFrancesco DanusoRealizzazione e collaborazioniMarco Acutis, Pierluigi Bonfanti, Gian Carlo Calamelli, Francesco Danuso, Massimo Lazzari, Tiziano Tempesta