7.3.2 Limiti fiduciali delle previsioni

si e, o ti e è o, a oo. e ms- si m- REGRESSIONE N 45 7.3.2 Limiti fiduciali delle previsioni. Uno degli usi più comuni della regressione è la predizione di un valore incognito di Y dato un valore della X. La stima del valore incognito è ottenuta semplicemente utilizzando l equazione di regressione, mentre per i limiti fiduciali di tale previsione si hanno due situazioni: una relativa all incertezza della posizione della retta di regressione, e una che a questa incertezza somma anche quella relativa alla stima di un singolo punto. Gli intervalli fiduciali di una predizione sono minimi in corrispondenza del baricentro dei punti sperimentali e aumentano allontanandosi da esso, con andamento iperbolico. L intervallo fiduciale per la posizione della retta in Xk è calcolabile con: s e2 1 1 °n 1 Xk 2X 2 2 ¢ 2 a 1 Xi 2 X 2 i51 mentre l intervallo fiduciale relativo alla stima di un singolo punto è dato da: Y^k 6 t 1n22, a/22 Y^k 6 t 1n22, a/22 s e2 ° 1 1 n 1 1 n 1 Xk 2 X 2 2 2 a 1 Xi 2 X 2 n i51 ¢ Si fa rilevare che l incertezza relativa alla stima diminuisce all aumentare della dimensione campionaria e al ridursi dell errore, mentre cresce all aumentare della distanza del punto X, per il quale si vuole la stima dal punto Xmedio. 7.3.3 Coefficiente di determinazione. L errore standard della stima di regressione fornisce una misura dello scostamento dei valori stimati da quelli osservati, ma la sua interpretazione risulta complessa. Per ovviare al problema viene generalmente impiegato il coefficiente di determinazione, o R 2. Tale coefficiente, che è dato dal rapporto tra la devianza esplicata dalla funzione di regressione e la devianza totale della Y, nel caso della regressione lineare è il quadrato del coefficiente di correlazione che assume valori compresi tra 0 e 1, dove 1 sta a indicare la presenza di una relazione di tipo matematico mentre 0 indica l assenza di correlazione. Ovviamente, dovendo scegliere tra modelli interpretativi alternativi (ottenuti utilizzando valori naturali, trasformazioni logaritmiche o altro), si dovrà preferire il modello con un valore più alto di R 2 e di F e con valori più bassi di Se. Poiché il valore di R 2 è condizionato dal numero di variabili indipendenti inserite nel modello e dalla numerosità delle unità statistiche considerate, sono state introdotte alcune possibili correzioni del coefficiente di determinazione che offrono una visione più realistica della bontà del modello. In genere, i programmi statistici stimano anche il cosiddetto r 2 corretto che, specie nei piccoli campioni, può assumere valori sensibilmente inferiori a quelli del coefficiente di determinazione. Il valore di R 2 tende a sovrastimare il vero valore della popolazione, molto gravemente quando il numero di dati del campione è ridotto. Converrebbe utilizzare il cosiddetto R 2 corretto: p11 2 R22 2 Rcorretto 5 R2 2 n2p21 dove: n è il numero di coppie di dati utilizzati per il calcolo della regressione, e p il numero di variabili indipendenti (1 nel caso della regressione lineare), che riduce notevolmente questo problema. N02_1_Statistica_Applicata.indd 45 N 5/31/18 11:38 AM

SEZIONE N
SEZIONE N
MATEMATICA, STATISTICA, SPERIMENTAZIONE, MODELLISTICA, MISURAZIONI
La razionalizzazione degli interventi agronomici richiede conoscenze su suolo, clima, colture e sistema biologico (microrganismi, parassiti, malattie, malerbe...), sulle loro interazioni ed evoluzione a seguito degli interventi agronomici. Per quanto possibile, all’approccio descrittivo (qualitativo) dovrebbe seguire quello quantitativo che, coinvolgendo dati numerici, richiede misurazioni o esperimenti che trovano la loro naturale elaborazione con l’ausilio di strumenti matematici, statistici e modellistici, al fine di ottenere conoscenze utili a scopo decisionale.L’aspetto quantitativo può determinare anche differenze qualitative: in base all’andamento economico (aspetto quantitativo), si può avere il fallimento dell’azienda (aspetto qualitativo).Le oscillazioni continue di contenuto idrico del suolo possono comportare sia variazioni quantitative (diminuzione di resa colturale per siccità) sia qualitative (la coltura muore per carenza idrica e la resa si annulla).Per trattare gli aspetti quantitativi, abbiamo bisogno di strumenti matematici che permettano di descrivere le relazioni tra variabili e di prevedere fenomeni e comportamenti semplici. Quando la complessità dei fenomeni da trattare aumenta, cresce anche l’incertezza, cui è legato il rischio. A questo punto possiamo scegliere la strada della descrizione statistica o quella dell’approccio di sistema, con l’applicazione dei modelli di simulazione. L’approccio statistico risulta inoltre fondamentale per trattare errori e variabilità nelle informazioni (compresi i rischi che ne derivano), sia nella sperimentazione di campo sia con i modelli.Nella presente Sezione N del Manuale dell’Agronomo vengono illustrati sinteticamente gli Strumenti matematico-statistici, nonché gli elementi per una corretta applicazione della Sperimentazione e della Modellistica in agricoltura. Completano la trattazione gli elementi relativi ai Sistemi di misura. Spetta all’Agronomo la scelta dello strumento di volta in volta più idoneo allo scopo, per qualità e utilità delle informazioni, ma anche per semplicità e rapidità con le quali si ottengono le informazioni richieste.Nell’attività professionale, l’uso di strumenti di supporto decisionale (modelli, GIS) o di procedure di elaborazione numerica è, oltre che utile, sempre più spesso richiesto dalle normative o dagli enti pubblici con cui il professionista si deve rapportare. Rimane all’Agronomo la responsabilità di verifica normativa e di un uso corretto e consapevole di questi strumenti.Coordinamento di SezioneFrancesco DanusoRealizzazione e collaborazioniMarco Acutis, Pierluigi Bonfanti, Gian Carlo Calamelli, Francesco Danuso, Massimo Lazzari, Tiziano Tempesta