Teimme aiemman keskustelun pohjalta pienen kokeilusivuston, jolla voidaan testata uusia tilastoja, yms. Laji.fi:n havaintotiedosta.
Kyseessä on Lajitietokeskuksen muista palveluista erillinen testisivusto, ei varsinainen tuotantopalvelu. Tavoitteena on kokeilla nopeasti erilaisia ideoita: mitä ominaisuuksia olisi hyödyllistä tehdä, miten ne kannattaa esittää, ja millaisia kokemuksia tai palautetta niistä syntyy. Tämän perusteella voimme myöhemmin arvioida paremmin, mitä varsinaisiin tuotantopalveluihin kannattaa toteuttaa ja millä tavalla.
Ensimmäisenä sivustolla on tilastoja havainnoijien lajimääristä.
Testipalvelun luonteeseen kuuluu, että se ei välttämättä ole pysyvä. Ominaisuuksia voidaan muuttaa, lisätä tai poistaa ilman ennakkovaroitusta. Koska on kesä ja henkilökunta on lomilla vaihtelevasti, myös palvelun kehittäminen ja palautteisiin reagoiminen voi olla ajoittaista.
Alle voi kirjata kommentteja, huomioita ja kehitysehdotuksia näistä ensimmäisistä tilastoista.
Ihan kiva ja kiinnostava tilastointi. Hieman miinusta tulee nimiongelmasta eli esim omista laji.fistä löytyvistä havainnoistani useampi aineisto jää pois, esim. kasviatlas. Osa niistä tulee mukaan lukuihini kun haen havaintojani kirjautuneena.
Onkohan omaan tunnariin liitetyt aineistot mahdollista saada mukaan laskuihin vai liekö teknisesti hankalaa.
Tästä huolimatta ilman muuta kiinnostavaa dataa.
Henk.koht puutelistat olisivat myös kiva ominaisuus.
Ihan jees. Ensimmäisenä tulee mieleen se, että tuossa ei varmaaan lasketa mukaan sensitivisiä havaintoja, jonka vuoksi esitetyt lajimäärät ovat pienempiä kuin todellisuudessa. Tämä on ongelma, jos nyt oikeasti haluaa ottaa mittaa esim. lintujen vuosipinnoissa.
Havainnoijan nimi voi olla kirjoitettu monella eri tavalla. Itsekkin olen havannoinut/ kerännyt useiden eri henkilöiden kanssa, jolloin nimikombinaatioita on ties kuinka paljon.
Jos pinnoja halutaan laskea tarkasti kilpailumielessä, eteen tulisi useampikin ongelma ja poikkeustilanne:
Sensitiiviset lajit eivät näy.
Poikkeukset, kun joku ei halua julkaista osaa havainnoistaan omalla nimellään.
Poikkeukset, kun joku haluaa julkaista havaintonsa omalla nimellään, mutta ei osallistua pinnavertailuun.
Jos useampi henkilö havainnoi ja kirjaa havaintonsa yhdessä, mutta havaitsee hieman eri lajeja ja/tai on eri mieltä määrityksistä.
Järjestelmät, joissa havainnoilla voi olla vain yksi havainnoija. Tehdäänkö duplikaatteja?
Dokumentoimattomat taksonomian ja nimistön erot, kuten Mali kirjoittaa.
Kirjoitusvirheet, jotka sattumalta ovat muiden taksonien nimiä.
Joidenkin aineistojen karenssit.
Järjestelmät, jotka käsittelevät nimiä (eikä käyttäjätunnuksia), ja joissa nimen kirjoitusasu vaihtelee (museokokoelmat, LajiGIS, jne…)
Muut virheet ja erikoiset kirjoitusasut tyyliin “Matti Meikäläinen ym.”
Ekopinnat, pihapinnat, havainnoijan sijainti yms. itse havainnon kohteeseen liittymättömät kommervenkit ovat vielä erikseen. Siksi kai kaikki tietämäni vakavamielisemmät pinnalaskurit on toteutettu itsenäisinä sovelluksina eikä havaintotietokantojen yhteyteen.
Kaikissa julkisissa henkilönimien tilastoissa on siis aina vähintään pientä epävarmuutta. Mutta kepeämmässä seurannassa ja itseä vastaan kilpailemisessa ne toiminevat riittävän hyvin?
Mikko / Lajitietokeskus
joka sai täyteen tavoitteensa 500 lajia ennen kesäkuuta
Yhtenä detaljina mietin vielä tuota epävarmojen listausta. Nythän käsittääkseni iNatista lasketaan kaikki? mutta Lajista vain varmoina ilmoitetut. Minusta nuo voisivat olla samalla viivalla eli listattaisiin ilmoitetut lajit ilman mitään laatuarvioita. Jos lajin epävarmoja ei lasketa voi olla houkuttelevampaa kirjata havaintoja varmoina että saa pinnoja. Jos epävarmatkin lasketaan ei tämmöistä houkutusta ole. Samalla laji ja iNat olisivat käsittääkseni samalla viivalla pinnojen osalta.
Tämä nyt on aika marginaalinen juttu ja listat ovat joka tapauksessa monin tavoin vajaita. Silti ehkä turha luoda tarpeettomia insentiivejä kirjata hieman epävarmoja varmoina. Minullakin on paljon epävarmoina ilmoitettuja havaintoja ja teki heti mieli mennä katsomaan olisiko siellä havaintoja jotka voisi muuttaa varmoiksi. Pinnanhimo voi olla joskus aika kova. Kompromissina vois ehkä laskea kaikki ilmoitetut pinnoiksi ja laittaa perään sulkuihin varmojen/varmistettujen määrät tms.
iNaturalistissa ei ole epävarman määrityksen käsitettä, vaan epävarmuus pitäisi siellä ilmaista taksonomisen tason kautta esim. määrittämällä sukutasolle. iNaturalistin havainnot tulkitaan Laji.fi:ssa neutraaleiksi tai yhteisön vahvistamiksi, ellei niissä ole muita laatuongelmia.
Epävarma-merkintä iNaturalistin havainnoille tulee näiden muiden laatuongelmien kautta, esimerkiksi jos joku lisää siellä merkinnän virheellisestä paikasta, että kuva ei vaikuta aidolta, tai että havainnossa on kuvia useista eri lajeista: Selaa havaintoja | Suomen Lajitietokeskus
Mutta teknisesti olisi helppo ottaa epävarmat havainnot myös mukaan.
Kirjautuneelle käyttäjälle pitäisi näkyä Laji.fi:ssä omat lajilistat, joista näkyy kuinka monta lajia on saanut vuositasolla/kaikkina aikoina. Jos siellä olevat lajipisteet eivät täysin vastaa todellisuutta johtuen toisten järjestelmien taksonomia ym. eroista niin sille ei voi mitään, eikä sillä kannata vaivata päätänsä tässä yhteydessä. Laji.fi:ssä näkyvät pisteet olisivat source of truth.
Tämän lisäksi olisi julkiset 100-lajia-haaste tyyliset pinnalistat (kasvit/linnut/hyönteiset/sienet/kaikki). Niissä näkyvät omat lajipisteet olisivat samat kuin mitä kirjautuneena näkyy. Käyttäjien nimet listalla pysyvät salattuina jos ei ole opt-in sekä saavuttanut 100 pisteen rajaa. Tässä ei juuri ole mitään vaaraa, että sensitiivinen data vuotaa.
That’s it. Ei tätä kannata ajatella liian monimutkaisesti ja ongelmalähtöisesti.
Edit. Ja tietenkään pinnalistojen julkaisu missään muodossa ei ole neutraali vaihtoehto. Jos pinnalistat julkaistaisiin tuossa testikäytössä olevassa formaatissa ja niistä tulisi suositut, niin kilpailuhenkiset rupeaisivat joka tapauksessa kilpailemaan sijoituksista. Tämä voisi aiheuttaa esim. sen, että Natura-alueella karkeistettuja havaintoja ruvetaan siirtämään just sen alueen ulkopuolelle, jotta havainto tulisi näkyviin pinnalistalla. Tässä tapauksessa sensitiivinen data vuotaisi paljon pahemmin ulos, kuin tapauksessa jossa joku rupeaa tekemään salapoliisityötä ja yrittää yhdistellä tietoja, joissa yhtenä lähteenä toimii pinnalista, joka näyttää todellisen pinnalukumäärän.
Itse näen, että kannattaa tehdä mielummin niitä mahdollisimman hyvin toteutettuja ominaisuuksia, kuin ihan kivoja ja harmittomia. Ainoa tapa jolla voidaan täysin välttyä väärinkäytöksiltä on tehdä palvelusta niin huono, ettei kukaan jaksa lähettää havaintoja.
Testikäytössä ollut tilasto täytti tarkoituksensa ja tuotti palautetta sekä täällä foorumilla että yksityisemmin. Kiitos kaikille! Merkittävä osa palautteen antajista ei halunnut nimeään tilastoihin, joten suljimme ne tältä erää. Virallinen toteutus vaatii ainakin mahdollisuutta kontrolloida oman nimen näkyvyyttä (opt-in tai opt-out) sekä pohdintaa miten epätarkkuuksista viestitään.
Foorumi on osaksi toteutettu VieKas LIFE -hankkeen osana (Finvasive LIFE, LIFE17 NAT/FI/000528).
Viekas on haitallisten vieraslajien kartoitukseen, torjuntaan ja tietoisuuden kasvattamiseen
keskittyvä hanke, joka on osittain rahoitettu EU Life-ympäristöohjelman tuella. Life
on Euroopan unionin rahoitusjärjestelmä, jonka tarkoituksena on kehittää yhteistä
ympäristöpolitiikkaa ja lainsäädäntöä
tukemalla luonnonsuojelu- ja ympäristöhankkeita eri puolilla Eurooppaa.