REST/JSON-hakurajapinta?

Nyt sain tehtyä oheisen kartan. Voisi ajatella, että näillä korvattaisiin esim. vikisivujen pelkästään Hyönteistietokantaan perustuvat kartat. Levinneisyyspisteiden ajanjaksojen valinnasta voisi keskustella. Herää kysymys myös siitä, millaiseksi voidaan olettaa koko havaintoaineiston laatu? Toisaalta laadunvarmistukseenhan kannattaa sitten panostaa, sen sijaan että systeemin tuottama tieto jätettäisiin käyttämättä.

1 tykkäys

Koska laadunvarmistukseen tarkoitettu väline on vielä suunnittelupöydällä, toistaiseksi voit halutessasi esimerkiksi rajoittaa kartan kattamaan tiedot vain tietyistä tietolähteistä, esim hyönteistietokanta + museoiden luonnontieteelliset kokoelmat.
Jos pistää collectionId-rajauksen, kyseinen rajaus ottaa mukaan vain havainnot ko. kokoelmasta ja kaikista sen alakokoelmista. collectionId:tä voi antaa useita.

collectionId rajaus voi heikentää suorituskykyä enemmän kuin mikään muu rajaus…

Apissa /collection

Itse asiassa collectionId:tä kätevämpi voi olla sourceId joka rajaa varsinaisella tietojärjestelmällä (Kotka = KE.3, Hyönteistietokanta = KE.423)

Apissa /source

Niinpä, pläräsin liudan perhoskuvia ja esim. kaikki kuusamaperhosena (Limenitis camilla) ilmoitetut olivat karttaperhosen kakkospolvea. Myös muita määritysvirheitä löytyi.

Toivottavasti havaintoihin tulee kommentointi mahdollisuus.

Karttoihin kannattaisi joko (1) piirtää havainnoinnin intensiteetti eli “ruudun selvitysaste” mukaan esim. Lintuatlas-tyyliin, tai (2) mallintaa lajin todennäköinen esiintyminen niin että havainnointi-intensiteettti on otettu huomioon.

Esim. Jodis putata esiintynee koko maassa Utsjoen Lappia ja tuntureita lukuunottamatta, kuvassa mallinnettu levinneisyys (sama kartta on Silvosen kirjassa).

(Mustat viivat voisi ottaa pois.)

Itse en oikein pidä noista mallinnetuista kartoista, mieluummin sellaiset kartat joista näkee, mistä laji on oikeasti havaittu. Tulee aina mieleen kovakuoriaistyöryhmän argumentointi eräästä jokseenkin harvinaisesta maakiitäjäisestä, jota on löydetty tietynlaiselta suolta (minä en ole koskaan löytänyt). Koska havaittua suotyyppiä löytyy melkein koko maasta, laji luulemma esiintyy sitten melkein koko maassa. Vähänkin harvinaisempien lajien kohdalla havaintopisteidenkin välissä on varmasti alueita, joissa lajia ei esiinny.

Tarkemmin ottaen tuo maakiitäjäiskysymys ei koskenut levinneisyysaluetta sinänsä, vaan sitä, kuinka yleisenä lajia voidaan pitää. Jos lajin pistearvon tulkitaan kuvaavan lajin yleisyyttä, niin silloin vaikeasti havaittavien lajien pistearvoja joudutaan jossain määrin arvioimaan ilman, että sitä voitaisiin perustella havantopisteiden määrän avulla. Tuossa levinneisyysalueen mallintamisessa on vähän samankaltainen ongelma. Jos esim. todetaan, että ‘laji esiintyy harvalukuisena Etelä-Suomessa’, niin haluaisin kyllä mielelläni tietää, missä…

Ajallinen aspekti on myös usein kartassa hyödyllinen.

Ajallinen aspekti on tärkeä, mutta sen voi tuoda myös mallinnettuihin karttoihin, ehkä perustellummin kuin ei-mallinnettuihin — taas koska havaintoaktiviteetti voi muuttua.

Tiesin kyllä ettet pidä mallinnetuista kartoista. :slight_smile: Kannattaa siis harkita selvitysasteen ottamista jotenkin karttoihin mukaan.

Raakadata kartoissa sopii ehkä suhteellisesti paremmin eksperteille, jotka ymmärtävät tai tietävät missä perhosia tai muita hyönteisiä on havainnoitu ja missä ei.

Jokseenkin helposti voitaneen tulostaa havaintotiedosto, jossa on lajihavainnot pelkistettynä tyyliin laji, vuosi, 10x10km ruutu. Näiden perusteella on sitten mahdollista tehdä halutunlaisia karttoja. Selvitysasteen voi kuvata esim. ruudun taustavärinä. Se tosin peittää sitten varsinaisen karttapohjan, mutta lieneekö tuo kovinkaan suuri ongelma.

Lajimäärän perusteellahan tein aikoinaan tuontyyppisiä karttoja, mutta siinä oli sen verran manuaalistakin työtä, että viime aikoina on työ jäänyt tekemättä.

Laji.fi-apin avulla tutkittuna esim. ruudusta 664:328 on 117 015 perhoshavaintoa, mutta rajoitettuna lähteisiin KE.3, KE.423 vain 79 947 havaintoa. Ehkä jälkimmäinen on käyttökelpoisempi. Lisäksi pitää ottaa huomioon, että havaittu lajimäärä nousee nopeammin kun havaintoja on vähemmän, joten havaintointensiteettiä ei kannattane jakaa ihan tasavälisesti.

https://en.wikipedia.org/wiki/Species_discovery_curve

http://insects.fi/hyonteistietokanta/plugins-html/SquareMaps/SquareMaps.html

Ei tuo intensiteetin mukaanottaminen ihan yksinkertaista ole. Jos käyttää koko kartan peittäviä 10x10km ruutuja, kartta menee aika lailla sekaisin. Taustapisteitä käytettäessä pisteet eivät saa olla liian suuria, koska tällöin varsinaisen levinneisyysalueen hahmottaminen vaikeutuu. Ainakin näiden esimerkkikokeilujen perusteella pelkkä levinneisyyskartta vaikuttaisi paremalta vaihtoehdolta.

Jos levinneisyyskarttoja voi tulostaa automaattisesti havaintodatasta, voisi olla jopa järkevää tulostaa 2-3 erilaista karttaa; vähän Kasviatlaksen tapaan hieman eri painotuksilla. Mutta jos niiden ylläpito vaatii käsityötä, se kannattaa unohtaa, kun riskinä ovat kartat, jotka eivät päivity “käsityöläisten” vähyyden vuoksi.

Lintu- ja kasviatlaksista voi yrittää ottaa mallia.

Minulla on R-skriptejä karttojen tulostamiseen Hyönteistietokannasta (JSON-haut plus plottaus). Ne voin antaa jos joku haluaa. Itse en ota lisätöitä, pitäis saada Juhalle mm. karttoja tehtyä, ja oikeita töitäkin joskus.

1 tykkäys

Juu ruudun lajimäärä pitäisi ottaa logaritmisena, ja ovat nuo visuaalisesti vaikeita saada kohdilleen. Voi olla ettei aikajaksojen kanssa yhtaikaa onnistukaan. Ja vielä jos karttapohjan pitäisi näkyä.

Suomen lintuatlas | Suomen Lajitietokeskus on minusta kohtuullisen selkeä, mutta karttapohja ei näy ja värit voisivat olla paremmat. Tai en tiije onko sekavuus väreistä kiinni, ehkä ympyrämuoto tuo turhaa visuaalista kohinaa.

Kartan voisi ehkä piirtää levinneisyystiedon päälle. Tämä onnistuisi, jos kartta olisi pääosin läpinäkyvä.

Perhosista: Paljon lisää dataa saisi ottamalla mukaan Suomen suurperhosatlaksen (KE.xxx), mutta sitten toisaalta Hatikan avulla (KE.xxx) kerätään NAFI-tutkimuksen tietoja (kokoelma HR.xxx). Ja sitten osa NAFI-datasta tulee toisesta tietolähteestä “Vanha NAFI data” (KE.xxx)…

Joten ei ole kovin helppoa poimia vain “luotettuja havaintoja”… Kokoelmien (/collection) luetteleminen itse asiassa ainut toimiva lähestymistapa jos Hatikan NAFI-data halutaan mukaan.

Havaintojen luotettavuus tulee varmaan olemaan seikka, joka tulee jatkossa aiheuttamaan keskustelua. Jonkinlaista painostusta voisi esittää myös eri hyönteistyöryhmien suhteen. Missä ovat hämähäkkityöryhmän, ludetyöryhmän, vesihyönteistyöryhmän, pistiäistyöryhmän ja kovakuoriaistyöryhmän kokoamat laajat aineistot? Olen lievästi sanottuna pettynyt näiden työryhmien osoittamiin asenteisiin.