7.2 Regressione lineare

N 42 APPENDICE - STATISTICA La relazione può essere di tipo lineare diretto e inverso quando i punti tendono ad addensarsi lungo una linea retta inclinata positivamente o negativamente (a e c). A seconda della prossimità dei punti alla retta interpolante, si possono individuare relazioni di tipo forte (a) o debole (b); in certi casi, inoltre, può non emergere alcuna relazione precisa tra le variabili (d ). Infine, non sempre la relazione può essere di tipo lineare: talvolta possono sussistere relazioni di tipo tendenzialmente parabolico (e) o iperbolico ( f ). L analisi del diagramma di dispersione è inoltre molto utile per individuare i cosiddetti outliers, cioè quei punti che si differenziano nettamente dalle rimanenti unità statistiche rilevate (Fig. 2.3 c). Gli outliers possono avere una influenza molto rilevante sulla stima della funzione di regressione ed è perciò necessario cercare di comprendere il perché di un comportamento anomalo. Qualora non si rinvengano giustificazioni plausibili del comportamento anomalo, può rendersi opportuno eliminare dall analisi gli outliers (ovviamente motivando adeguatamente la scelta)4. 7.2 Regressione lineare. La regressione lineare presuppone che le variabili in esame siano due e che tra esse vi sia una relazione di tipo lineare (Y 5 a 1 bX ). L obiettivo della regressione lineare è, in base a un campione, determinare i coefficienti a e b, verificare se essi siano o meno statisticamente diversi da 0 (in particolare il coefficiente angolare della retta b deve essere diverso da zero perché esista una relazione di dipendenza tra le variabili casuali X e Y ), stabilire i limiti fiduciali dei coefficienti stessi e la gamma d incertezza della previsione di un valore incognito di Y dato un valore di X. I coefficienti a e b sono definiti anche parametri della funzione di regressione. 7.2.1 Il metodo dei minimi quadrati. Per trovare le relazioni funzionali tra X e Y, abitualmente si impiega il criterio dei minimi quadrati, consistente nel trovare i valori dei parametri della funzione di regressione che rendono minima la somma degli scarti quadratici tra i valori di y osservati e quelli stimati dalla regressione y^ . yn21 yn24 yn25 y n25 6 y n24 y n23 6 y n22 6 yn22 6 y n21 yn 6 yn23 2 2 a 1 yi 2 y^i 2 5 min; a 3 yi 2 1 a 1 bxi 2 4 5 min n i51 i51 Considerando a e b le incognite, è facile ottenerne il valore ponendo a sistema l eguaglianza a zero delle derivate parziali rispetto ad a e b. La risoluzione del sistema porta alle usuali formule per ottenere a e b : è inoltre dimostrabile che la retta dei minimi quadrati passa sempre per il punto di coordinate Y e X , il che consente di ottenere facilmente il valore dell intercetta a quando sia noto il valore di b. 4 Il trattamento degli outliers (definiti anche anomali o aberranti) nell ambito dell analisi statistica è un problema assai complesso, il cui approfondimento esula dagli scopi di questo Manuale. N02_1_Statistica_Applicata.indd 42 7 z tu d d m s u In l q q q p la c c p d c c p y n Si tratta quindi di risolvere un problema di minimizzazione: n d 5/31/18 11:38 AM v d lo 3 b d s n s g fi

SEZIONE N
SEZIONE N
MATEMATICA, STATISTICA, SPERIMENTAZIONE, MODELLISTICA, MISURAZIONI
La razionalizzazione degli interventi agronomici richiede conoscenze su suolo, clima, colture e sistema biologico (microrganismi, parassiti, malattie, malerbe...), sulle loro interazioni ed evoluzione a seguito degli interventi agronomici. Per quanto possibile, all’approccio descrittivo (qualitativo) dovrebbe seguire quello quantitativo che, coinvolgendo dati numerici, richiede misurazioni o esperimenti che trovano la loro naturale elaborazione con l’ausilio di strumenti matematici, statistici e modellistici, al fine di ottenere conoscenze utili a scopo decisionale.L’aspetto quantitativo può determinare anche differenze qualitative: in base all’andamento economico (aspetto quantitativo), si può avere il fallimento dell’azienda (aspetto qualitativo).Le oscillazioni continue di contenuto idrico del suolo possono comportare sia variazioni quantitative (diminuzione di resa colturale per siccità) sia qualitative (la coltura muore per carenza idrica e la resa si annulla).Per trattare gli aspetti quantitativi, abbiamo bisogno di strumenti matematici che permettano di descrivere le relazioni tra variabili e di prevedere fenomeni e comportamenti semplici. Quando la complessità dei fenomeni da trattare aumenta, cresce anche l’incertezza, cui è legato il rischio. A questo punto possiamo scegliere la strada della descrizione statistica o quella dell’approccio di sistema, con l’applicazione dei modelli di simulazione. L’approccio statistico risulta inoltre fondamentale per trattare errori e variabilità nelle informazioni (compresi i rischi che ne derivano), sia nella sperimentazione di campo sia con i modelli.Nella presente Sezione N del Manuale dell’Agronomo vengono illustrati sinteticamente gli Strumenti matematico-statistici, nonché gli elementi per una corretta applicazione della Sperimentazione e della Modellistica in agricoltura. Completano la trattazione gli elementi relativi ai Sistemi di misura. Spetta all’Agronomo la scelta dello strumento di volta in volta più idoneo allo scopo, per qualità e utilità delle informazioni, ma anche per semplicità e rapidità con le quali si ottengono le informazioni richieste.Nell’attività professionale, l’uso di strumenti di supporto decisionale (modelli, GIS) o di procedure di elaborazione numerica è, oltre che utile, sempre più spesso richiesto dalle normative o dagli enti pubblici con cui il professionista si deve rapportare. Rimane all’Agronomo la responsabilità di verifica normativa e di un uso corretto e consapevole di questi strumenti.Coordinamento di SezioneFrancesco DanusoRealizzazione e collaborazioniMarco Acutis, Pierluigi Bonfanti, Gian Carlo Calamelli, Francesco Danuso, Massimo Lazzari, Tiziano Tempesta