Ero on kyllä merkittävä, ja mielenkiintoista onkin pohtia mahdollisia syitä eroon.
Onko tässä Laji.fi-havainnot vai ainoastaan Hyönteistietokannan havainnot?
Yksi syy voi olla siinä, että ollaan epätietoisia havaintojen tallennusjärjestelmän tulevaisuudesta; vanhan jatko on loppumassa, ja uuden ominaisuudet ovat olleet vielä karsitut laajempaa käyttöä ajatellen, joten sitä ei ole vielä omaksuttu.
Toinen syy voi olla siinä, että maastohavainnot tallennetaan vasta talven aikana, ja talvihan on vasta alkanut. Minultakin on tulossa vielä yli 10000 havaintoa, kunhan ehdin työn aloittaa, mutta pyydysmateriaalin läpikäyntikin on vielä kesken.
Luvut on laskettu seuraavista lähteistä:
KE.3=Kotka, KE.8=Hatikka,KE.423=Hyönteistietokanta, KE.388=Vihko
Sinällään ‘positiivista’ on, että useiden pienempien ryhmien kohdalla pääsisi helposti Suomen johtavaksi havaintojen tekijäksi
Valitettavasti tallennusajankohdan mukaan ei laji.fi:stä vielä pysty tekemään hakua laji.fi:n portaalissa. Mutta ehkä API:n kautta(?), silloin saisi vertailukelpoisemmat luvut. Varmaan perhoshavaintoja tältä kesältä tallennetaan talven aikana niin, ettei isoa eroa ole.Jotain pitäisi keksiä muiden hyönteisryhmien aktivoimiseksi.
Niin, nuo luvut liittyvät vuosina 2016/2017 tehtyihin havaintoihin. Niissä ei näy se, jos joku on esimerkiksi tänä vuonna tallentanut paljon vanhoja havaintojaan.
Hieno, visuaalinen tilasto! Tämä sisältänee vain havaintojen lukumäärän, ei yksilöiden lukumäärää?
Yksilömääriä ei ole taulukoitu. Mielenkiintoista on, että maakunnasta Lkor ei ole vuosilta 1980-2017 yhtään havaintoa. Muutenkin näyttäisi olevan Suomen vähiten tutkittu maakunta…
Lkor: Lepidoptera, haku Hyönteistietokannasta 1980-2017: 2394 havaintoa, 15003 yksilöä
Kun on omia havaintoja (muistaakseni) kaikista Itä-Lapin maakunnista, niin eihän toi voinut pitää paikkansa.
Onko tähän liittyen jokin bugi tietovarastossa?
Hakukoodissa oli liian pieni pageSize (500). Onko sille muuten jokin yläraja? Yleensä haen tulokset sivu kerrallaan, mutta tässä tapauksessa oletin virheellisesti, että tulokset mahtuvat yhdelle sivulle…
Tulossivun koolla on merkitystä esim. levinneisyyskartan tulostamisessa. Joillakin lajeilla voi olla lähemmäs 10 000 havaintoa. Jos sivuhakuja joutuu API:n kautta tekemään useita, niin tulosten saaminen kestää. Jos samalla haetaan myös muita lajiin liittyviä tietoja, niin kokonaisaika voi olla jo parin-kolmen sekunnin luokkaa. Tämä on vähän hidasta, jos käyttäjä haluaa selailla eri lajien tietoja. Olen nyt joutunut tekemään niin, että haetut tiedot talletetaan lajikohtaisesti paikalliseen tilapäistiedostoon, jolloin ko. lajin tiedot saadaan seuraavilla kerroilla nopeammin paikallisesta tiedostosta.
Moi,
Sivun maksimikoko on 10000.
Näiden lukujen tuottamiseen ei kyllä kannattaisi käyttää /list kyselyä, vaan /aggregate -kyselyjä, jotka palauttaisivat halutut luvut suoraan.
Esim jonkin taksonin havaintojen jakauma vuosittain ja maakunnittain:
https://apitest.laji.fi/v0/warehouse/query/aggregate?aggregateBy=gathering.conversions.year,gathering.interpretations.biogeographicalProvince&onlyCount=false&pageSize=10000&page=1&cache=true&taxonId=MX.1
Vastausaika on alta sekunnin ja kaupan päälle saa yksilömäärätkin havaintomäärien lisäksi.
Huomattavaa on, että vuodella aggregoitaessa kuinkin ne joiden ajan tarkkuus on huonompi kuin vuosi (esim salatut havainnot) jäävät kokonaan pois, ts year on null.
Olen käyttänyt aggregointia aina, kun se on mahdollista. Esimerkiksi lajitietojen hakemiseen tarvitaan kuitenkin tiedot ykj-ruuduista, maakunnista ja havainnoijista, joten kolme aggregoitua hakua joutuu joka tapauksessa tekemään. Kyllä noilla nyt toimeen tulee, varsinkin kun taidan olla tällä hetkellä ohjelman ainoa käyttäjä…