Revizija koncepta simetričnog indeksa slaganja za kontinuirane skupove podataka | znanstvena izvješća

Revizija koncepta simetričnog indeksa slaganja za kontinuirane skupove podataka | znanstvena izvješća

Anonim

teme

  • Primjena matematike
  • biogeokemiju
  • Znanosti o okolišu
  • Znanstveni podaci
  • statistika

Sažetak

Kvantifikacija koliko su dvije skupove podataka međusobno bliske čest je i potreban posao u znanstvenim istraživanjima. Pearsonov koeficijent korelacije proizvoda-trenutka r široko je korištena mjera stupnja linearne ovisnosti između dviju podataka, ali ne daje naznake koliko su slične vrijednosti ovih nizova. Iako je predloženo nekoliko indeksa za usporedbu skupa podataka s referentnom, samo je nekoliko dostupnih za usporedbu dva skupa podataka jednake (ili nepoznate) pouzdanosti. Nakon kratkog pregleda i numeričkih ispitivanja mjernih podataka dizajniranih za postizanje ovog zadatka, ovaj rad pokazuje kako indeks koji je predložio Mielke može uz malu izmjenu zadovoljiti niz željenih svojstava, a to su da budu dimenzionalni, ograničeni, simetrični i lako ih je izračunati i izravno interpretirati s obzirom na r . Tako pokazujemo da se ovaj indeks može smatrati prirodnim proširenjem na r koje smanjuje vrijednost r prema pristranosti između analiziranih skupova podataka. U radu se također predlaže djelotvoran način raščlanjivanja sustavnog i nesistematičnog doprinosa ovom sporazumu temeljenom na vlastitim raspadima. Upotreba i vrijednost indeksa ilustrirana je i na sintetičkim i stvarnim skupovima podataka.

Uvod

Mnoge aplikacije u većini grana znanosti zahtijevaju od istraživača, analitičara i donositelja odluka da uspoređuju različite skupove podataka jedni s drugima i da presude koliko su međusobno bliski. Cilj može biti usporedba simulacija koje dolaze iz različitih modela koji pokušavaju prikazati određenu pojavu, usporedba iste fizičke veličine izmjerene različitim instrumentima ili procjena jesu li promjene u određenom lancu obrade podataka dovele do znatno različitih rezultata.

Pojam bliskosti (ili "sporazum") pojam je koji mnogi matematički oblici pokušavaju uhvatiti. Primjeri uključuju uobičajeno korištene pokazatelje poput koeficijenta korelacije Pearsonova proizvoda i trenutka ( r ), koeficijenta određivanja ( R2 ) i srednje korijenske pogreške (RMSE). Intuitivno se može klasificirati kao neslaganje između dva skupa podataka bilo koje razlike od jednakosti. Grafički prikaz, svako odstupanje eksperimentalnih točaka podataka od retka 1: 1 u skupu podataka rasipa. Skup indikatora može stoga biti dovoljan da izrazi "udaljenost" dostupnih podatkovnih točaka od retka 1: 1. Na primjer, nagib i pomak linearnog modela koji odgovara podacima i mjera disperzije oko ove crte mogu dovoljno precizno prikazati sporazum između dviju skupova podataka. Razvoj numeričkih modela nadalje je potaknuo potrebu za mjernim podacima koji bi mogli poslužiti za njihovo umjeravanje 1 ili za ocjenu njihove izvedbe 2 . Neugodnost je u tome što se većina pokazatelja mora razmatrati istovremeno, što komplicira usporedbu sporazuma između više skupova podataka. Taylor 3 predložio je elegantno grafičko rješenje za vizualizaciju istodobno različitih mjernih podataka koji sadrže komplementarne informacije, ali to još uvijek ne uspijeva kvantificirati slaganje u jednom indeksu. Neki autori 4 predložili su nejasni logički okvir da se različite metrike kombiniraju u jedan indikator koji bi trebao odražavati kako stručnjak doživljava kvalitetu izvedbe modela, ali to zahtijeva određenu subjektivnost u definiranju funkcija članstva. Jedinstvena metrika koja karakterizira obrasce poput r , ali uključuje i podatke o veličini odstupanja, od velikog je interesa za mnoge korisnike, što se odražava na različite prijedloge namjenskih indeksa suglasnosti u različitim područjima kao što su hidrologija, klimatologija i daljinsko istraživanje 5, 6, 7, 8, 9 .

Simetrija indeksa važno je svojstvo kad se razmatra procjena sporazuma podataka. Za razliku od vježbi validacije ili umjeravanja, gdje se neke procjene modela uspoređuju s referentnim vrijednostima koje se smatraju pogreškama (obično promatranje količine od interesa), u studijama za usporedbu možda neće biti reference. Kako dvije skupine podataka koje se uspoređuju imaju određenu, često nepoznatu ili slabo karakteriziranu nesigurnost, a priori ne postoji jedan skup podataka koji je "bolji" od drugog. Kao posljedica toga, indeks za procjenu slaganja između X i Y skupova podataka trebao bi biti jednak onome izračunatoj između Y i X , što je uvjet za simetriju koji često nije zadovoljen validacijskim metrikama. Daljnji aspekti koje bi trebalo razmotriti uključuju mogućnost: (1) preoblikovanja indeksa kako bi se pokazala njihova povezanost s poznatijim metrikama, poput r ili RMSE 10, 11 ; i (2) sustavno odvajanje od nesustavne slučajne razlike u sporazumu podataka 6 . Sustavna komponenta može se protumačiti kao regulirana pristranost zbog poznatih ili otkritih čimbenika, dok je nesustavni element slučajna komponenta uzrokovana bukom ili nepoznatim čimbenicima. Razlikovanje između njih dvoje zanimljivo je jer se sistematska razlika u principu može otkloniti regresijskom analizom.

U ovoj studiji pregledavamo različite metrike predložene u literaturi koje mogu poslužiti za ocjenu slaganja podataka. Zatim testiramo i uspoređujemo njihove izvedbe na sintetičkim skupovima podataka i tako ukazujemo na neke njihove nedostatke. Opravdavamo zašto se indeks temeljen na permutaciji koji je prvotno predložio Mielke 7 može, nakon male izmjene, smatrati najprikladnijim jer zadovoljava sva željena svojstva takvog indeksa, uključujući i mogućnost interpretacije s obzirom na koeficijent korelacije r . Također predlažemo rafinirani pristup da se odvojeno ispita nesistematični i sustavni doprinosi nesuglasju s skupa podataka. Konačno, primjenjujemo dostupne metrike i predloženi indeks na dva stvarna slučaja međusobne usporedbe: jedan se odnosi na vremensku seriju Normaliziranog indeksa vegetacijske razlike (NDVI) stečene u istom vremenskom razdoblju od strane dvije različite satelitske misije, a drugi srodne do dvije vremenske serije bruto primarne proizvodnje (GPP) procijenjene različitim pristupima modeliranja.

Željena svojstva indeksa slaganja

Najprije ćemo generalizirati problem navodeći da tražimo indeks kvantificirajući sporazume između skupova podataka X i Y. Skupovi podataka mjere se u istim jedinicama i s istom potporom. U slučaju većine geospatijaliziranih rasterskih skupa podataka, to bi značilo da obje imaju iste prostorne i vremenske rezolucije. Optimalni indeks dogovora trebao bi biti:

  • Bez dimenzija . To ga čini neovisnim o mjernoj jedinici. Omogućuje usporedbu slaganja između različitih parova skupova podataka (ako svaki par ima, na primjer, različite jedinice) ili unutar različitog prostora parametara ( npr. Za više varijabilne skupove podataka).

  • Ograničena između donje granice (kao što je 0) koja ne odgovara sporazumu i gornje granice (poput 1) koja odgovara savršenom sporazumu. Zaključak je da veće vrijednosti uvijek trebaju upućivati ​​na veći slaganje.

  • Simetrično, to jest, treba imati istu brojčanu vrijednost ako su vrijednosti

    Image

    i

    Image
    prebacuju se u jednadžbu. To je potrebno zbog pretpostavke da za procjenu suglasnosti nema reference za usporedbu.

  • Lako je izračunati, tako da se može koristiti u velikim skupovima podataka.

  • Tumačiti s obzirom na općeprihvaćenu i poznatu mjeru takav koeficijent korelacije r .

Pozadina postojećih mjernih podataka

Možda je najjednostavnija metrika koja se koristi za usporedbu dva različita skupa podataka Pearsonov koeficijent korelacije proizvoda i trenutka ( r ). On mjeri stupanj linearne ovisnosti između dvije varijable i izražava se kao:

Image

gdje

Image
i
Image
označavaju srednje vrijednosti X i Y , i
Image
i
Image
predstavljaju njihova standardna odstupanja. Metrika r je bezdimenzijska i ograničena je između -1 i 1. Vrijednost nule ukazuje da ne postoji linearna ovisnost između dvije varijable, dok vrijednost 1 ili -1 označava savršenu linearnu ovisnost (potonju s negativnom ovisnošću).

Drugi je uobičajeni pristup razmatranje da se statistički model može ugraditi u podatke. U ovom se slučaju mjera koeficijenta može izvesti iz koeficijenta određivanja

Image
, što ukazuje koliko se podaci dobro uklapaju u odabrani model. U slučaju linearnih modela, koeficijent određivanja ekvivalentan je kvadratu r , a kreće se od 0 do 1. Još jedno zanimljivo svojstvo je da taj broj predstavlja udio varijance objasnjen modelom. Nedostatak i r i R2 je što oni samo mjere snagu odnosa između podataka, ali ne daju naznake ako serija podataka ima sličnu veličinu.

Da bi se procijenilo podudaraju li se vrijednosti dviju serija, može se izračunati metrika koja sažima odstupanja između svih parova vrijednosti. Generički oblik za izražavanje takvih mjernih podataka je sljedeći 12 :

Image

gdje

Image
i
Image
je težina dana svakom odstupanju. Ako koristimo jednake utege za pojednostavljenje zapisa, kada
Image
izraz postaje izraz korijenskog srednjeg kvadratnog odstupanja (RMSD) i kada
Image
, dobivamo srednje apsolutno odstupanje (MAD). Imajte na umu da u ovom kontekstu radije nazivamo ove metrike odstupanjima umjesto pogreškama ( tj. RMSE i MAE), jer jedan skup podataka ne smatramo ispravnijim od drugog. U odnosu na r i R2 , RMSD i MAD imaju prednost u tome što pružaju informaciju o apsolutnim razlikama, ili pristranosti, između X i Y. Nedostatak je što su dimenzijski. Da bi se prevazišao ovaj problem, oni se ponekad izražavaju u postocima dijeljenjem odstupanja s jednom od dvije srednje vrijednosti
Image
ili
Image
, Međutim, to čini metričke asimetrične vrijednosti i one postaju nestabilne kad su nazivnici male vrijednosti.

Različiti indeksi dizajnirani su za procjenu sposobnosti modela koristeći sljedeću formulaciju:

Image

gdje je δ metrička mjerenja odstupanja između procjene modela i referentnih opažanja (poput MAD ili srednjeg kvadratnog odstupanja, MSD), a μ je skup odstupanja. Logika koja stoji iza takve formulacije je da μ nikada ne smije biti manji od δ , čime se fiksira gornja granica od ρ do 1. Primjer koji se mnogo koristi u hidrologiji je poznat koeficijent učinkovitosti 5 koji je kasnije generaliziran 13 kao:

Image

gdje X predstavlja zapažanja, a Y predviđanja modela. Takvi koeficijenti učinkovitosti u rasponu su

Image
do 1. Iako se nedostatak negativne granice može činiti neugodnošću, takvi indeksi imaju još jednu praktičnu referentnu točku u tom trenutku
Image
to znači da model ne djeluje bolje nego samo uzimanjem srednje vrijednosti 14 . Izvorna verzija 5, za koju
Image
, mogu se dodatno povezati s
Image
10, 11, 14 . Međutim, takvi indeksi nisu simetrični, jer zamjena X s Y ne dovodi do istih rezultata.

Willmott 6 predložio je još jedan indeks za ocjenu performansi modela prema mjerenim opažanjima koji se može generalizirati kao:

Image

U ovom je slučaju nazivnik μ definiran zbrajanjem razlika svih točaka u X i Y u odnosu na

Image
, srednja vrijednost X. Izvorna verzija temeljila se na kvadratnim odstupanjima
Image
, ali je kasnije promijenjena 15 korištenjem apsolutnih odstupanja tvrdeći da je MAD (ili u ovom slučaju MAE budući da se odnose na pogreške između predviđanja i opažanja umjesto odstupanja) prirodnije mjerilo prosječne pogreške i manje je dvosmisleno od RMSD (ili RMSE) 12 . Drugo preciziranje indeksa 16 nastojalo je ukloniti predviđanja
Image
iz nazivnika, ali kako tvrde drugi 14, to znači ponovno prilagođavanje izraza koeficijenta učinkovitosti
Image
dok je izgubio zanimljivu referentnu točku
Image
, Opet, ovi indeksi ne uvažavaju zahtjev za simetrijom.

Mielke 7, 17 je predložio drugu definiciju nazivnika μ na temelju neparametarskog pristupa koristeći slučajne permutacije. U ovom se slučaju osnovna linija sastoji od zbroja razlika između svake točke i svake druge točke. Takav se indeks može generički izraziti za različite γ vrijednosti kao takve:

Image

Za razliku od prethodnih indeksa, ovi su simetrični. Nedostatak je to što je računanje µ računanje skupo, posebno kada je n velik. Međutim, za

Image
nazivnik
Image
može se izraziti i u jednostavnijem obliku 7 (matematička demonstracija navedena je u Dodatnim informacijama) koja se lako izračuna:

Image

Watterson 8 predložio je da se izgradi indeks za procjenu performansi klimatskog modela primjenom Arcsine transformacije na Mielkeove

Image
indeks:

Image

Watterson je opravdao transformaciju aršinske funkcije jer omogućava linearnu konvergenciju jedinstvu uz očuvanje izvornih svojstava Mielkeovog indeksa 8 .

Za razliku od prethodnih studija, Ji i Gallo 9 izričito su dizajnirali indeks koji bi zadovoljio kriterije simetrije. Ovaj indeks, predložen za međusobno upoređivanje slika s daljinskog spajanja, definira se kako slijedi:

Image

U ovom je slučaju osnovna vrijednost nazivnika μ definirana na temelju oba

Image
i
Image
, Međutim, ovaj posljednji indeks ima neke ozbiljne nedostatke koji su ilustrirani u sljedećoj analizi.

Metrička usporedba

Ovdje se predlaže inter-usporedba metričkih performansi za indekse spomenute u odjeljku 0 koji zadovoljavaju kriterije simetrije: Mielke-ove

Image

i

Image
permutacijski utemeljeni indeksi, Watterson-ov M indeks i Ji & Gallo-ov koeficijent dogovora AC . Da bi se to postiglo, proizvodi se umjetni skup podataka. Dva neovisna slučajna vektora
Image
uzorci sa srednjom vrijednosti 0 i standardnom devijacijom 1 prvo se generiraju i potpuno dekorreliraju primjenom Choleskyjeve dekompozicije 18, 19 . Ova dva vektora,
Image
i
Image
, zatim se zajedno kombiniraju kako bi se stvorila dva nova vektora,
Image
i
Image
, koji imaju zadanu korelaciju (detalji kako to učiniti objašnjeni su u odjeljku Dodatne informacije). X i Y skupovi podataka generiraju se međusobno usklađivanjem
Image
i
Image
vektori generirani za korelacije u rasponu od -1 do 1 (prikazani su nekim korelacijskim vrijednostima na slici 1). Pomoću X i Y , metrike sporazuma mogu se izračunati i usporediti za parove vektora s jednakim sredstvima i odstupanjima, ali s korelacijom u rasponu od -1 do 1. Da bi se procijenilo kako se metrički ponašaju kada postoji pristranost u podacima, Y skup podataka dodatno je poremećena uvođenjem različitih sustavnih aditivnih pristranosti (u praksi dodavanjem b podacima) i sustavnim proporcionalnim pristranostima (množenjem podataka s m ), kao što je prikazano na slici 1. Ovi sustavni aditivni i proporcionalni učinci mogu također međusobno djelovati bilo nadoknađivanje ili usporavanje neslaganja.

Image

Slika pune veličine

Slika 2 prikazuje kako četiri analizirane metrike djeluju na generiranim skupovima podataka kao funkcija nametnute aditivne i multiplikativne pristranosti i izvorne korelacije između X i Y. Prva napomena koja se odnosi na crteže u stupovima (a) i (b) na slici 2 jest da za sve metrike postoji sjecište izo-linija. Pretpostavlja se da mjerni podaci pravilno prikazuju smanjenje slaganja u slučaju kada postoji povećana sustavna poremećaja za sve vrste korelacija. Prelaz ovih izo-perturbacijskih linija znači da je ta pretpostavka narušena. Za izmjeničnu struju u blagim pomacima b ili mjerenje veličine s m , nenormalno ponašanje može se vidjeti čak i pri umjerenim korelacijskim vrijednostima (kao što je s r između 0, 5 i 0, 7). Za

Image
,
Image
a M sve linije prelaze samo na
Image
, To se može smatrati manje neugodnim, jer bi se negativne vrijednosti indeksa mogle koristiti za procjenu koliko se skupovi podataka slažu po veličini usprkos neslaganju u znaku. Ipak, to dodaje dvosmislenost u interpretaciji indeksa što nije poželjno. Druga poanta je da izmjenični napon Ji & Galla nije negativno ograničen nulom kao što je to zamišljeno. To se događa čak i kada se podacima ne dodaje sustavna uznemirenost (tj. Kada
Image
i
Image
pa čak i za prilično visoku pozitivnu povezanost. Ovo su uvjeti koje se može lako očekivati ​​za većinu podataka usporedbe podataka, sugerirajući kako treba izbjegavati izmjeničnu struju Ji & Galloa.

Image

Ilustracija kako različite simetrične metrike dogovora o kojima se govori u ovom radu djeluju na skupove podataka sa: ( a ) promjenjivom korelacijom i sustavnim aditivnim pristranostima; ( b ) različite korelacijske i sustavne multiplikativne pristranosti; i ( c ) promjenu sustavnih aditivnih i multiplikativnih pristranosti s korelacijom koja je fiksirana na

Image
, Za stupac ( c ) vrijednosti se sastoje od razlike između mjernih podataka izračunatih na skupu podataka s danom aditivom i / ili proporcionalnom sustavnom pristranosti umanjenom za vrijednosti izračunate na istim skupovima podataka, ali bez pristranosti.

Slika pune veličine

Sustavne aditivne i proporcionalne pristranosti mogu djelovati. Da bi se to ilustriralo, stupac (c) sa slike 2 prikazuje vrijednost između indeksa izračunatog za 2 vektora s danom kombinacijom pristranosti umanjenom za vrijednost indeksa izračunata iz istih vektora bez ikakve pristranosti. Ovo je prikazano samo za datu korelaciju

Image
, Ovaj grafički prikaz može pomoći u prikazu osjetljivosti indeksa na male promjene u b i m . Većina indeksa reagira na sličan način, s izuzetkom AC . Ji & Gallo AC indeks može biti viši ( tj. Više slaganja) s kombinacijom malih pristranosti nego bez ikakve pristranosti.

Da biste saželi ishod ove analize, može se reći da sve metrike imaju barem jedan nedostatak: u nekom ili drugom trenutku, manje vrijednosti indeksa protu-intuitivno predstavljaju veći slaganje. Za sve njih također je nejasno kako se mogu povezati s koeficijentom korelacije. Uz to, Ji & Gallo AC je izrazito neželjenog ponašanja u prisutnosti (ali iu odsutnosti) pristranosti. Dok je Mielkeova

Image
indeks računato skupo,
Image
indeks, sa svojim pojednostavljenim izrazom, čini se prikladnim kandidatom za usporedbu podataka kada je korelacija jednaka nuli ili pozitivna. Međutim, iz matematičke formulacije koju je autor predložio nije jasno kako
Image
vezan je za koeficijent korelacije. Vjerujemo da ova posljednja točka zaslužuje daljnju istragu jer korisnik indeksa obično ima jasno razumijevanje što znači vrijednost korelacije, ali neće biti upoznati s vrijednostima koje uzima sam indeks sporazuma.

Obrazloženje odabira prave metrike

Ako možemo prihvatiti indeks uporabe temeljen na MSE, a ne na MAE, mislimo da je ispravna metrika koja treba odabrati biti pomalo modificirana verzija Mielkeovog

Image

indeks. Ta argumentacija proizlazi iz ideje da bi za indeks izgrađen na osnovu strukture jednadžbe (3) trebao biti cilj da se nazivnik µ definira kao maksimalna vrijednost koju može uzeti brojnik δ . Pronalaženje najmanje vrijednosti koja maksimizira brojač (tj. Njegov supremum) važno je kako bi se osiguralo da indeks ima najveću moguću osjetljivost. Za indekse koji se temelje na MSE, može se pokazati (vidi dodatne informacije) da se brojnik može prepisati kao:

Image
Image

pri čemu je posljednji izraz proporcionalan kovarijanci između X i Y. Jedan način da se osigura

Image
jest stvoriti indeks
Image
koji u nazivniku sadrže izričito kovarijanciju i ograničavaju ga uvijek pozitivnim:

Image

Četiri pojma u nazivniku mogu se prikazati geometrijski, kako je prikazano u odjeljku Dodatne informacije. Kao rezultat eksplicitnog dodavanja kovarijantnog pojma, indeksa

Image
osigurava da kad su X i Y negativno povezani,
Image
, što rezultira indeksom jednakim nuli kada
Image
kao što se vidi na slici 3. Međutim, kada
Image
nazivnik je bespotrebno napuhan ovim terminom kovarijancije, jer će numerator uvijek biti manji zbog negativnog predznaka ispred kovarijantnog termina u jednadžbi (10). Da bismo riješili taj problem, predlažemo da indeks, koji nazivamo jednostavno kao λ , definiramo na sljedeći način:

Image

Slika pune veličine

Image

gdje

Image

Prepoznavanjem izraza varijacija u jednadžbi (13), ona se može sažeti ukratko kao:

Image

otkrivajući sličnost s jednadžbom (7) i pojednostavljenim Mielkeovim izrazom

Image
permutacijski indeks. Kao što je prikazano na slici 3, rezultirajući indeks je identičan
Image
za pozitivno korelirane vektore ostajući pri 0 kad
Image
,

Indeks ima dodatno poželjno svojstvo koje, kada

Image
a kad nema aditivne niti multiplikativne pristranosti uzima se vrijednost koeficijenta korelacije. Ako postoji pristranost, indeks će uzeti nižu vrijednost od r prema multiplikativnom koeficijentu α koji može uzeti samo vrijednost između 0 i 1. Korištenjem jednadžbe (10), može se učinkovito pokazati (vidi dodatne informacije) da:

Image

Prednost ovog svojstva je u tome što se vrijednost indeksa može odmah usporediti s r , što je metrika s kojom su mnogi stručnjaci upoznati. Svako odstupanje od r ukazuje na povećanje pristranosti proporcionalno α .

Odvajanje nesistematičnog od doprinosa sustavima

Willmott 6, 20 predložio je da njegovi indeksi slaganja mogu pružiti daljnji uvid razdvajanjem učinaka zbog sustavnih od nesustavnih komponenti odstupanja. Ova se ideja može generalizirati na bilo koji indeks formuliran jednadžbom (3) dekompozicijom odstupanja na njihove sustavne i nesistematične komponente kao

Image

a zatim definiranje novih sustavnih i nesistematičnih indeksa, odnosno

Image
i
Image
, Nesistematski indeks,
Image
, može se protumačiti kao vrijednost koju bi standardni indeks uzeo ako se zanemaruju sve pristranosti, što se, dakle, odnosi na buku oko linije koja prolazi kroz podatke. Sustavni indeks,
Image
, teže je shvatiti. Bolji način za razumijevanje informacija koje sadrže je predstavljanje kao omjer odstupanja sastavljenih od sustavne buke
Image
,

Da bi se izračunali ovi novi izvedeni indeksi, najprije treba okarakterizirati odnos između X i Y , koji zatim omogućuje izračunavanje

Image
, i konačno ono od
Image
oduzimanjem
Image
od δ . Teoretski odnos između X i Y pretpostavlja se linearnim:
Image
, Willmott 6 koristi običnu regresiju najmanjeg kvadrata za procjenu a i b . To može biti prihvatljivo kad se X skup podataka smatra referentnim, ali ne i kada se pokušava uspostaviti saglasnost bez pretpostavljanja reference zbog kršenja simetrije između X i Y , tj . Regresija X na Y nije ekvivalentna toj od Y na X. Da bi se riješilo ovo pitanje, Ji & Gallo 9 predlažu korištenje geometrijskog srednjeg funkcionalnog odnosa (GMFR) modela 21, 22, za koji su b i a izvedeni kako slijedi:

Image
Image

znak b je jedan od koeficijenta korelacije. Iako rješava problem simetrije, ovaj je pristup daleko od optimalnog zbog načina definiranja b . Problem je prikazan u slučaju kada će dva potpuno neusklađena skupa podataka s varijacijama 2 i 4 i dalje imati pozitivan nagib

Image
umjesto ravne linije.

Jednom kada je karakteriziran odnos između X i Y , drugo pitanje je kako predstaviti odstupanja od te crte. Willmott 6 koristi zbroj kvadratnih odstupanja u osi Y :

Image

gdje

Image
dobiva se iz regresije
Image
, Ji & Gallo 9 koriste zbroj razlike u proizvodima:

Image

gdje oboje

Image
i
Image
moraju se dobiti iz GMFR regresije. Oba ova pristupa imaju istu manu. Da bi bila koherentna definiciji ukupnih odstupanja, nesistematična odstupanja treba izračunati pravokutno od
Image
crta tj. kao da je
Image
crta bi bila linija 1: 1.

Predlažemo rješenje za rješavanje oba problema ( tj . Definiranje crte i izračunavanje pravokutnih odstupanja) radom s glavnim ravninama oblaka X - Y. Primjenom svojstvene dekompozicije na kovarijantnu matricu X i Y , dobivamo dva svojstvena vektora koji opisuju glavne osi oblaka točaka. Prvi svojstveni vektor može služiti za definiranje crte glavne osi u prostoru X - Y ( tj. The

Image
crta). Drugi svojstveni vektor može se koristiti za izračunavanje vektora h koji sadrži udaljenosti svih X - Y točaka pravokotno od ove glavne osi (za više detalja o izračunavanju vlastitih vektora, rezultirajući
Image
liniju glavne osi i vektor h , vidi Dodatne informacije). Nesustavno srednje odstupanje u kvadratu tada se može izračunati na temelju h udaljenosti kako slijedi:

Image

Slika 4 prikazuje geometrijski prikaz kako se ti nesistematski kvadrati razlikuju od ukupnih kvadrata izračunatih u odnosu na liniju 1: 1. Slika 4 također geometrijski prikazuje kako se ti nesistematski kvadrati razlikuju po površini od onoga što predlažu Willmott 6 i Ji & Gallo 9 koristeći formulacije jednadžbi (19) i (20).

Image

( a ) ukupna odstupanja u kvadratima za odabir točaka (predstavljeni površinom crvenih kvadrata); ( b ) nesustavna kvadratna odstupanja za iste točke izračunata pravokotno na glavnu os točke oblaka kako je predloženo u ovom radu; ( c ) usporedba (samo za jednu točku kako bi se osigurala jasnoća) kako se takvo odstupanje (crveni prazni kvadrat) razlikuje od onoga što predlaže Willmott 6 (tamni kruti kvadrat); i ( d ) slična usporedba s razlikom proizvoda koja je predložila Ji & Gallo 9 (tamni čvrsti pravokutnik).

Slika pune veličine

Važna napomena u vezi s nesistematičnim indeksom

Image
je da, iako zanemaruje bilo kakvu pristranost, to ne znači da je jednaka korelaciji. Niti je
Image
ekvivalentna α u slučaju λ . Razlika se može uočiti ako se razmotri oblak točaka i zakreće ga. To mijenja njihovu povezanost, ali zahvaljujući raspadu svojstva,
Image
ostat će isti. U slučaju λ , to također rezultira pozitivnim vrijednostima za
Image
kada
Image
, što se može protumačiti kao mjera buke u podacima.

U slučaju da bi odstupanja δ trebala biti karakterizirana apsolutnim razlikama umjesto kvadratnih razlika (za indekse poput

Image
, ekvivalentno nesistematsko srednje apsolutno odstupanje se također može izračunati iz h na sljedeći način:

Image

Još jedna mogućnost mogla bi biti izravno korištenje vrijednosti udaljenosti h kao mjera odstupanja.

Demonstracija za stvarne aplikacije

Kako bi se ilustriralo kako se predloženi indeks može upotrijebiti u stvarnim studijama slučaja i kako se uspoređuje s drugim mjernim podacima, daju se neki primjeri korištenja stvarnih podataka. Geofizički skupovi podataka obično se strukturiraju na temelju poznate 2 ili 3 prostorne dimenzije, plus vremenske dimenzije, što rezultira vremenskom serijom geoprostornih podataka. Često je zanimljivo zasebno procijeniti evoluciju prostornog sporazuma i prostorne obrasce vremenskog slaganja s namjenskim protokolima 23 . Radi sažetosti ovdje je data ograničena analiza u kojoj se prvi primjer fokusira na vremenski dogovor vremenskih serija satelitskih snimaka, dok drugi primjer ilustrira prostorni sporazum različite modelirane bruto primarne produktivnosti (GPP) za jedan trenutak u vremenu,

Vremenska usporedba dva skupa podataka promatranja satelita

Prvi studijski slučaj sastoji se od satelitskih mjerenja Normalized Digerence Vegetation Index (NDVI) dobivenih od 1. listopada 2013. do 31. svibnja 2014. nad sjeverozapadnom Afrikom. Prostorna rezolucija je 1 km, a vremenska rezolucija je dekad (dekad je razdoblje koje je rezultat dijeljenja svakog kalendarskog mjeseca na 3 dijela, što može prihvatiti vrijednosti 8, 9, 10 ili 11 dana). Podaci se dobivaju pomoću dva različita instrumenta na brodu dvije različite satelitske platforme: SPOT-VEGETATION i PROBA-V (koji će se zbog jednostavnosti nazivati ​​VT i PV). Podaci o PV dostupni su na portalu Copernicus Global Land Service 24, dok se podaci o arhivi VT pružaju iz JRC MARSOP projekta 25 . Iako su geometrijske i spektralne karakteristike satelita i procesnih lanaca podataka oblikovane što je moguće bliže, razlike između proizvoda i dalje se očekuju jer instrumenti nisu isti. Ovdje je interes kvantificirati gdje se vremenske serije u regiji ne slažu. Budući da nema razloga da se tvrdi da bi jedna trebala biti bolja referenca od druge, na svaki par vremenskih serija potrebno je primijeniti simetrični indeks slaganja, što rezultira vrijednostima koje se mogu prostorno preslikati.

Rezultati su prikazani na kartama na slici 5. Sve karte pokazuju očekivane obrasce vremenskog dogovora: područja s jakim dinamičkim NDVI signalom, poput sjevernih kultiviranih područja, imaju veći dogovor od pustinjskih područja gdje je signal većinom sastavljen buka. Međutim, velika je razlika gdje svaka metrika daje negativne vrijednosti: karta λ ne pokazuje negativne vrijednosti, mapa Watterson-ove M metrike uzima negativne vrijednosti samo u slučaju da je korelacija negativna, ali karta indeksa izmjenične struje Ji & Gallo pokazuje veliku područja negativnih vrijednosti na cijelom području. Usporedba između λ i r odražava dodanu vrijednost u korištenju prvog, koji uključuje pristranosti koji nisu prisutni u drugom. Veličine ovih pristranosti u odnosu na ukupna odstupanja mogu se prostorno primijeniti u polje

Image

karte, dok se slaganje skupova podataka bez obzira na ove pristranosti prikazuje u

Image
karta.

Image

Križevi predstavljaju prostorni položaj vremenskog niza prikazanog na slici 6.

Slika pune veličine

Iz odabranih vremenskih serija prikazanih na slici 6, bolje se mogu uočiti razlike u brojčanoj vrijednosti različitih mjernih podataka u odnosu na analizirane podatke (vremenski profili i rasipanje). Usredotočenjem na profile sa slike 6c, d prikupljeni na vrlo sušnim područjima, jasnije su bolje izvedbe λ u usporedbi s izmjeničnom strujom . Oba profila pokazuju ograničenu vremensku varijabilnost i smanjenu povezanost. AC pokazuje negativnu (i izvan granica) vrijednost −1.668 za profil c i pozitivnu i veću vrijednost (0.227) za profil d koji ima nižu korelaciju i jasnu pristranost. λ umjesto toga pokazuje vrijednost manju od dvije korelacije i smanjenje za profil d u odnosu na c. Zanimljivo je da

Image
za profil d nas obavještava da bi se primjenom linearne transformacije sporazum znatno poboljšao.

Image

Položaj svake vremenske serije u studijskoj zoni može se vidjeti na slici 5.

Slika pune veličine

Prostorna usporedba dvaju geofizičkih proizvoda

Druga studija slučaja sastoji se od procjena bruto primarne produktivnosti (GPP) na globalnoj razini za određeni vremenski trenutak: lipanj 2007. Prvi skup podataka je NASA MOD17 proizvod 26, proizveden kombiniranjem biofizičkih podataka nadstrešnice dobivenih od satelitskih proizvoda na daljinsko istraživanje meteorološke i kopnene informacije s nekim podešavanjima na temelju lokaliziranih opažanja in situ toka-toka. Korišteni proizvod je inačica koja je sakupljena s prostornom razlučivošću od 0, 05 ° i mjesečnom vremenskom razlučivosti (dostupno ovdje: 27 ). Drugi skup podataka je MPI MTE-GPP proizvod 28, konstruiran korištenjem statističkog pristupa stabla odluka za povećavanje podataka s tornjeva fluksa do mreže od 0, 5 °, potpomognutih umreženim meteorološkim i daljinskim senzorima (dostupnim ovdje: 29 ). Oba pristupa koriste slične skupove informacija, ali koristeći znatno različite metodologije, i opet, nema razloga da se smatra da je jedan bolji od drugog.

Proizvodi se moraju usporediti prostorno za skupove jednakih područja obrazloženja. Ta su područja definirana kombinacijom klimatskih zona 30 i vrsta pokrivača kopna (na temelju MODIS 2007 MCD12C1 proizvod pokrivača kopna 31 ). Svi pikseli unutar određenog područja u jednom proizvodu uspoređuju se s odgovarajućim pikselima drugog proizvoda. Rezultati su sažeti kao dvodimenzionalni histogrami na slici 7 i tablici 1. Prikazani primjeri uključuju 6 ​​slučajeva u kojima je izmjenična vrijednost ispod nule. Kao što se može shvatiti iz definicije indeksa (uv. (9)) i iz crteža na slici 7, to se obično događa kada su sredstva vrlo slična, a varijance su jako različite. The examples also show how M is systematically lower than λ (as expected due to its arcsine transformation), which makes the result less comparable to r . Good examples include evergreen needleleaf forest (case a) and shrublands (case l) which are very close to having no bias, and thus α close to 1, but M considerably lower than r . Three cases (g, h and j) also illustrate how the proposed index takes a value of 0 when

Image

, but

Image
does not. Finally, high values of
Image
(such as case j) help to quickly identify when the scatter clouds are not on the 1:1 line.

Image

ENF, EBF and DBF stand respectively for evergreen needleleaf, evergreen broadleaf and deciduous broadleaf forests.

Slika pune veličine

Tablica pune veličine

Zaključne napomene

Through numerical evaluation of different proposed metrics, this paper shows that a modified version of the index of Mielke is preferable to others. This index, named here λ , is adimensional, bounded, symmetric, easy to compute and directly interpretable with respect to the commonly used Pearson coefficient of correlation r . This index can basically be considered as a natural extension to r that downregulates the value of r according to the bias encountered in the data.

The logic behind the original conception of the index by Mielke 7, based on all the possible permutations between the elements within the two datasets, intuitively suggests how its denominator is indeed the maximum possible value that the mean sum of squares can attain. Because of the mathematical properties of these squared deviations, it is possible to rewrite this index in an expression based on variances instead of permutations, making it much simpler to compute. Unfortunately, we have not succeeded to generalize the structure of the (easily computable) index to be used with other metrics of deviations, such as the mean absolute deviations. However, the demonstration of how to disentangle the unsystematic from the systematic contribution in the agreement using an eigen decomposition could be applied to any other type of metric.

The scope of the index remains to be a pragmatic extension of r and thus used in a context where a linear functional agreement is wanted. It is not intended as a tool to explore new functional associations in the data (such as the maximum information coefficient 32 ). However, its use could go beyond comparing dataset agreement symmetrically, and join the collection of existing methods 2 to characterize model performance with respect to a reference. Also, the index was demonstrated here with case studies of spatio-temporal gridded data, but it should also be usable for any pair of vectors of any kind of data, just as r .

dodatne informacije

How to cite this article : Duveiller, G. et al. Revisiting the concept of a symmetric index of agreement for continuous datasets. Sci. Rep. 6, 19401; doi: 10.1038/srep19401 (2016).

Dodatna informacija

PDF datoteke

  1. 1.

    Dodatna informacija

komentari

Slanjem komentara slažete se s našim Uvjetima i smjernicama zajednice. Ako ustanovite da je nešto zloupotrebno ili nije u skladu s našim uvjetima ili smjernicama, označite to kao neprimjereno.