Kuvapankki ja Perhoswiki lopetetaan!

Niin on, mutta kun jotain pitäisi tehdä…

No, samaa mieltä: tekisin, jos joku pyytäisi…

Pahoittelen, että saatan kysyä nyt tyhmiä, mutta onko niin, että tämän uuden systeemin käyttö tulee vaatimaan erityisiä latailuja? Jos näin, niin tuon lataamisen pitää olla kyllä äärimmäisen simppeliä eli onnistua klikkaamalla “lataa”, “seuraava”, “seuraava”, …, “valmis”. Toisekseen tämän pitäisi toimia kännykässä (tai tabletissa), joka maastossa yleensä on mukana ja jossa näistä nettijutuista on monasti kullan arvoinen hyöty.

Ainakin minun kohdalla Myinsects jäi, kun en koskaan onnistunut saamaan sitä koneelleni niin, että toimisi. Oli aivan liian iso haaste monista yrityksistä huolimatta minulle sen lataaminen. Ja niin oli monelle muullekin Tämä, että ei edes pystynyt käytännössä kokeilemaan, oli varmasti yksi keskeisimpiä ellei keskeisin syy siihen, miksei sitä suosittu…

Kuvapankin ja Hyönteiswikin hyvä puoli ja iso vahvuus on ollut, että niitä on pystynyt käyttämään ilman mitään erityisiä latailuja ja uusien ohjelmien opetteluja. Todelle monelle tämä uusien ohjelmien opettelu on sellaista “myrkkyä”, että jää monelta tekemättä. Tästä hyvä esimerkki on ihan se, että tämän Vihkon ja Tietovaraston kohdallakin on ollut iso työ saada “vanhat jäärät” sen käyttäjiksi ja yhä edelleenkin on monia, jolla tämä prosessi Hyönteistietokannasta näihin Lajitietokeskuksen juttuihin on kesken.


Tuo Harrin esiin nostama lähdeluettelo on minusta äärimmäisen olennainen juttu. Varsinkin sellaiset lähteet, jotka ovat netissä (ja jonne voisi klikkaamalla suoraan päästä). Esim. Lepiforum, SPS:n makrolajisivu, Bold, jne…


Lisäksi “vertaa lähilajit” osio olisi olennainen. Ja tässä ehdottomasti pitäisi olla mukana myös lajistoa, jota ei vielä Suomesta ole tavattu. Siksi taustalle kannattaisi esim. perhosten kohdalla rakentaa yhteys Lepiforum-sivuston nimistöön, niin, että kaikki sieltä löytyvät lajinimet olisivat mahdollisia “lähilajeja”. (Sivuhuomautuksena, että tämä yhteys Euroopan lajilistaan pitäisi kyllä olla myös “Vihkossa”, sillä on tosi turhauttavaa ja hidasta syöttää esim. Sardinian haviksia, kun liki kaikki lajinimet ovat “tuntemattomia” eikä niitä saa kannasta tulostettua millään lailla systemaattisessa järkestyksessä edes heimotasolla. Näin, vaikka näiden lajien taksonomiassa ei ole sen kummempaa epäselvyyttä kuin Suomen lajeissakaan.)

Jari Kaitilan kommentti antaa hyvän kuvan siitä, millaista järjestelmää harrastajat kaipaavat:
suoraan netin kautta käytettävissä oleva palvelu, josta löytyvät nuo Jarin toivomat ominaisuudet.
Miten tuollainen järjestelmä saataisiin aikaan? Näkisin tilanteen seuraavasti:

  1. Järjestelmän pitää perustua avoimesti saatavilla olevaan aineistoon.
    Laji.fi on juuri sitä varten, joten systeemin kannattaa hyödyntää sen
    tarjoamia havainto- ja kuva-aineistoja. Tällainen järjestelmähän on jo olemassa,
    eli laji.fi:n tarjoamat havaintojen ja lajien selaustoiminnot.

  2. Voidaan tehdä toinen www-palvelu, joka käyttää myös laji.fi-aineistoja,
    mutta on laadittu paremmin vastaamaan käyttäjien tarpeita.

  3. Tarjotaan käyttäjille omalle koneelle asennettava ohjelma,
    jossa on valmiina monia hyödyllisiä toimintoja ja jota käyttäjä voi myös muokata
    omiin tarpeisiinsa sopivaksi.

Kaikissa edellä olevissa vaihtoehdoissa on omat ongelmansa:

  1. Laji.fi-lajikorteille ei saada riittävästi sisältöä. Myös havaintojen selaustoiminnot voisivat olla monipuolisempia.
  2. Kuka tekisi sopivan www-palvelun?
  3. LajiSelain-ohjelma on liian monimutkainen.

LajiSelain-ohjelma ei ole www-palvelu, joten se ei ole ratkaisu netin kautta toimivaa järjestelmää toivovalle. Koska se kuitenkin käyttää API:n kautta laji.fi-palveluja, se voi olla eräänlaisena
esimerkkinä siitä, millaisia ominaisuuksia tarjottavassa www-palvelussa voisi olla.

Lajikuvaukset ym. tekstit saa API:sta includeDescriptions=true -parametrilla, esim.

https://api.laji.fi/v0/taxa/MX.38815?lang=fi&langFallback=true&maxLevel=0&includeHidden=false&includeMedia=true&includeDescriptions=true&includeRedListEvaluations=true&sortOrder=taxonomic&access_token=OMA-ACCESS-TOKEN-TÄHÄN

(API:n käyttö vaatii access-tokenin, jonka saa tilaamalla, ks. API.LAJI.FI | Suomen Lajitietokeskus)

Ajatuksena heitän: mitä jos yhteisön tuottamat lajikuvaukset kirjattaisiin Wikipediaan? Sieltä ne saataisiin teknisesti melko helposti Laji.fi:hin (en ole kyllä itse kokeillut). Wikipediassa on myös valmiina käyttöliittymä, periaatteet yms. yhteisölliselle sisällöntuotannolle. Wikipedian kautta sisältö saisi myös paljon laajemman lukijakunnan kuin pelkästään Laji.fi:n kautta.

Biodiversiteetti-informatiiikan konferenssissa pari viikkoa sitten Wikipedia ja Wikidata olivat usein toistettu puheenaihe - vaikuttaa että niiden sisältöä käytetään ja suositaan yhä laajemmin erilaisissa palveluissa: tehdään yhteistyötä kilpailemisen sijaan.

Mikko / Lajitietokeskus

_
PS. Aiomme kopioida Hyönteiskuvapankin kuvat talteen. Pohdinnassa on vielä kuitenkin mitä tehdään “all rights reserved”-kuville, ja laitettaisiinko kuvat lajikuviksi (helppoa) vai havainnoiksi (vaikeaa, mutta silloin niitä voitaisiin suodattaa esim. paikan ja ajan mukaan, sekä annotoida jos niissä ilmenee määritysvirheitä).

Käytän itse kuvien hakuun seuraavaa toimintoa:

return request                    
.get( 'https://api.laji.fi/v0/warehouse/query/list' )
.query({ selected: 'unit.media.author,unit.media.caption,unit.media.copyrightOwner,unit.media.fullURL,unit.media.licenseAbbreviation,unit.media.licenseId,unit.media.mediaType',
        pageSize: 5000,
        page: 1,
        taxonId: taxonId,
        hasUnitMedia: true,
        access_token: settings.lajifi_accessToken })

Mistähän tuloksena olevat kuvat tulevat: lajikuvista vai havaintoihin liitetyistä kuvista? Tuloksena saadut kuvat ovat laadultaan monen tasoisia, enimmäkseen varsin heikkolaatuisia. Jos ne ovat pelkästään havaintoihin liitettyjä kuvia, niin miten haetaan erikseen lajikuvat?

/warehouse/query/list palauttaa havainnot ja niihin liitetyt kuvat. Nämä ovat hyvin sekalaisia. Lisäämällä taxonReliability=RELIABLE -parametrin, saa vain ne havainnot, joiden määritys on annotoitu varmaksi. Tämäkään ei ota kantaa itse kuvan laatuun.

“Lajikuvat” (eli taksonomia-asiantuntijoiden lajille määrittelemät kuvat, jotka näytetään Laji.fi lajisivuilla) saa kyselyllä:

https://api.laji.fi/v0/taxa/MX.38815/media?access_token=OMA-ACCESS-TOKEN-TÄHÄN

Uuteen annotointisysteemiin voisi helposti lisätä mahdollisuuden annotoida havainto “laadukkaita kuvia sisältäväksi”, mikä toisi uusia mahdollisuuksia kuvien käyttöön. Tällöinkin annotointi kuitenkin koskisi ensi sijassa havaintoa eikä sen kuvia, ja mikään ei estä havainnoitsijoita vaihtamasta havaintojensa kuvia jälkikäteen… mutta tämä lienee kaukaa haettu ongelma.

Mikko / Lajitietokeskus

Minusta olisi hyvä, jos Kuvapankin kuvat löytyisivät varsinaisista lajikuvista. Kuvapankin kuvat ovat kuitenkin keskimäärin aika hyviä. Ajattelin tehdä tuon LajiSelain-ohjelman sellaiseksi, että jos käyttäjällä ei ole omia kuvia, niin kuvat haetaan laji.fi-palvelusta. Tuohon tarkoitukseen havaintokuvat eivät laadultaan oikein sovi.

Aiemman kuvaviennin aikana näin tehtiinkin. Esim. ylin rivi kuvia: https://laji.fi/taxon/MX.59989/images

Kuvapankkia selailemalla näyttäisi että siellä on kuvia aika kaukaakin. Minkä verran hyönteisten ulkonäössä on maantieteellistä muuntelua? Onko harhaanjohtavaa näyttää Itä-Siperiassa otettuja kuvia, jos käyttäjät olettavat katselevansa suomalaisia lajeja / yksilöitä?

Mikko / Lajitietokeskus

Tuo olisi erinomainen ratkaisu. Olisi hyvä, jos lajiteksti on jaoteltu sopiviin kappaleisiin, esim.

Oikeanlainen jaottelu helpottaisi tekstien hyödyntämistä muissa järjestelmissä.

Nyt näyttää jo paljon paremmalta. Ohessa sukusivu, joka käyttää laji.fi-kuvia:

Teksteille vielä ketju Wikipedia → Laji.fi, niin kuka kaipaa enää mitään perhoswikiä…

Riippuu täysin lajista. Vaeltavillla lajeilla yleensä vähemmän. Itselläni on pankissa ainakin yksi poikkeava otus. Siellä asiasta oli kommentti, eikä kuvaa näkynyt ainakaan lajisivulla. (Colostygia turbata) Useimmin varmaan noita ulkomaisia on lisätty, kun kotimaasta ei oikein löydy.

 Haku:
   
  request                    
 .get( 'https://fi.wikipedia.org/w/api.php' )
 .query({ action: 'query',
          format: 'json',  
          pllimit: 'max',
          prop: 'extracts|extlinks',
          titles: 'Kenttäkiitäjäinen' })
 .then( res =>
{
    let props = Object.getOwnPropertyNames( res.body.query.pages )
    let text = res.body.query.pages[props[0]]
    
    console.log( text )
})

Tulos:

{ pageid: 424430,
  ns: 0,
  title: 'Kenttäkiitäjäinen',
  extract: '<p><b>Kenttäkiitäjäinen</b> (<i>Cicindela campestris</i>) on sukunsa yleisin laji Suomessa.\n</p>\n\n\n<h2><span id="Tuntomerkit">Tuntomerkit</span></h2>\n<p>Helppo tuntea vihreästä väristään ja siitä, että peitinsiivissä ei ole poikkivyötä. Sinertävät, jopa melkein mustat yksilöt ovat harvinaisia. Ylähuuli ja leukarihmojen tyvi ovat vaaleankeltaiset, huulirihmat ovat sen sijaan metallinkiiltoiset (vrt. hietikkokiitäjäinen <i>C. hybrida</i> ja rantakiitäjäinen <i>C. maritima</i>). Kenttäkiitäjäinen on kooltaan noin 15 mm.\n</p>\n<h2><span id="Elintavat">Elintavat</span></h2>\n<p>Vähemmän riippuvainen hiekkaisista ja kuivista maista kuin suvun muut lajit, eikä myöskään vaadi niin lämpimiä paikkoja. Selväpiirteinen kevätlaji, joka jo ensimmäisinä lämpiminä päivinä näyttäytyy kaikenlaisilla avomailla, erityisen mielellään poluilla ja muilla kiinteillä mailla.</p>\n<h2><span id="Esiintymisaika">Esiintymisaika</span></h2>\n<p>Aikuiset Suomessa huhtikuun lopulta heinäkuun alkuun.\n</p>\n<h2><span id="L.C3.A4hteet"></span><span id="Lähteet">Lähteet</span></h2>\n\n<h2><span id="Aiheesta_muualla">Aiheesta muualla</span></h2>\n<ul><li>Laji.fi: Kenttäkiitäjäinen (<i>Cicindela campestris</i>)</li>\n<li>Ötökkätieto: Kenttäkiitäjäinen (<i>Cicindela campestris</i>)</li>\n<li>Insects.fi: Kuvia kenttäkiitäjäisestä</li>\n<li>Ground Beetles of Ireland <span>(englanniksi)</span></li>\n<li>UPM-Kymmene, Kari Heliövaara: Metsiemme kovakuoriaisia, Kenttäkiitäjäinen (<i>Cicindela campestris</i>) sivu 11</li></ul>',

  extlinks: 
   [ { '*': 'http://w3.upm-kymmene.com/for/internet/upm_skog.nsf/images/kovakuoriaisopas.pdf/$FILE/kovakuoriaisopas.pdf' },
 { '*': 'http://www.insects.fi/insectimages/file?dir=images&op=showSpecies&order=COL&family=Carabidae&genus=Cicindela&species=campestris' },
 { '*': 'http://www.otokkatieto.fi/species?id=79' },
 { '*': 'http://www.habitas.org.uk/groundbeetles/species.asp?item=7122' },
 { '*': 'https://laji.fi/taksoni/MX.188496?locale=fi' },
 { '*': 'https://tools.wmflabs.org/fiwiki-tools/testit/INFOBOX/OK' },
 { '*': 'https://tools.wmflabs.org/fiwiki-tools/testit/TEST_1/OK/NIMI' } ] }

Jos osatekstit pitää poimia tuosta html-tekstistä, niin edellytyksenä varmaan on, että kaikilla teksteillä on aika tarkkaan samanlainen sisältörakenne.

Edit: extlinks-linkkilistassa näyttäisi olevan pelkät url-osoitteet, ei näitä tekstejä:

<h2><span id="Aiheesta_muualla">Aiheesta muualla</span></h2>
<ul><li>Laji.fi: Kenttäkiitäjäinen (<i>Cicindela campestris</i>)</li>

Kyllä nuo linkit saa tuolta Wikipedia-sivulta, samoin kuin tekstit. Nyt voisi Harri Jalava ryhtyä muokkaamaan Wikipediaa perhosten osalta…

Jos Wikipedia API tarjoaa POST-mahdollisuuden, niin voisi olla helpointa generoida valmiiksi tarvittavat sivupohjat eri lajeille. Niitä olisi sitten helppo eri kirjoittajien täydentää.

Katsotaan, mitä voin tehdä. Ehkä lajinkuvauksen voisi tehdä omana kappaleena sinne. Englanninkielisessä Wikipediassa joistakin lajeista on sellainen olemassakin.

Tutkin tuota mahdollisuutta generoida sivupohjat automaattisesti. Jos se on mahdollista, niin tässä vaiheessa olisi hyvä sopia siitä, minkälainen kappalejako olisi paras. Tästä voisi ainakin lähteä liikkeelle:

Tuntomerkit
Elintavat
Esiintymisaika
Lähteet
Aiheesta muualla

Jo hiukan kokeilin: Leukaperhoset – Wikipedia. Siellä on vähän vanhaa ja sitten Perhoswikin tekstiä.

Hyvältä näyttää. En ole vielä saanut sivupohjia talletettua…

Wikipedia on lajikuvauksiltaan aivan eri sarjassa kuin LAJI.FI-portaali, missä tekstimuotoiseen tietosisältöön ei ole panostettu oikeastaan ollenkaan. En silti ole kovin innostunut ajatuksesta, että Wikipedian tekstejä kopioitaisiin sellaisenaan LAJI.FI:n lajikorteille.

Wikipedia ei ole ensisijainen tiedon tai alkuteosten lähde. Siellä julkaistavalle tietosisällölle pitäisi olla jokin lähde. Jos joku kokenut asiantuntija kirjoittaa pitkän kokemuksensa pohjalta Wikipediaan tietoja siitä, miten jokin laji tunnistetaan tai millaisia sen elintavat ovat, mihin silloin viitataan?

Lisäksi Wikipedian artikkeleita voi muokata kuka tahansa. Viime aikoina on keskusteltu paljon havaintojen luotettavuudesta. Jonkun tulisi kantaa huolta LAJI.FI-sivujen muunkin tietosisällön luotettavuudesta.

Itse lähtisin ennemmin etsimään ratkaisua lajikorttien tietosisällön tuottamiseen vaikkapa Pinkan tarjoamista työkaluista.