Määritysten tallennus havaintoina

Tässä kuvaan millaisia ajatuksia kolmannen osapuolen tekemien määritysten tallentamisesta Lajitietokeskuksen havaintopalveluun on ollut. Päätöstä täsmällisestä etenemistavasta ei vielä ole, sillä aloitamme perusominaisuuksilla ja etenemme ketterästi suunnitelmia tarvittaessa muuttaen.

Näiden vaihtoehtojen toimivuudesta kaipaisin ajatuksia, hyviä ja huonoja puolia.

Lähtökohta:

  • Kaikki havainnoijat eivät osaa määrittää lajilleen kaikkia havaintojaan vaikka haluaisivat. Voivat kuitenkin usein valokuvata (tai äänittää, videoida) havainnon niin että kokeneemmat ehkä osaisivat.
  • Tarvitaan prosessi pyytää määrityksiä kolmannelta osapuolelta (yleensä kokeneilta harrastajilta) ja tallentaa määritys mahdollisimman sujuvasti havaintopalveluun havainnoksi.
  • Prosessia ei suunnata suurelle yleisölle, joka tarvitsee määrityksiä esim. sinitiaisista ja nokkosperhosista (ainakaan aluksi). Arvokkaimpia olisivat havainnot huonosti tunnetuista ryhmistä.

Vaihtoehtoja:

  1. Nykytila:
    Määrityksiä pyydetään erilaisilla foorumeilla (Hyönteisfoorumi, Ikkuna Suomen Luontoon…), Facebookissa, kavereilta. Määritys tallennetaan johonkin, jos kysyjä sattuu olemaan riittävän aktiivinen. Kuvaa ei liitetä havaintoon, ja määrittäjä & määritystapa (“valokuvasta”) jäävät helposti kirjaamatta.

A) Ohjeistetaan lisää:
Kuten 0-vaihtoehto, mutta ohjataan havaintopalvelun käyttäjät lähettämään määrityspyynnöt Laji.fi-foorumiin, josta toivottavasti löytyy riittävä asiantuntemus. Kirjataan ohjeeksi tai jopa säännöksi että kysyjän pitää kirjata havainto, määritys, määrittäjä ja määritystapa Lajitietokeskuksen havaintopalveluun.

B) Havainto ja kuvat ensin havaintopalveluun:
Kirjataan havainto ensin havaintopalveluun, niin tarkasti kuin havainnoija osaa (vaikka tasolla “perhonen”). Liitetään havaintoon kuva tai useampi. Pyydetään määritystä foorumilla, lisäämällä havainnon tunniste-URL viestiin, jolloin foorumisofta (Discourse) osaa hakea kuvat automaattisesti viestin yhteyteen. Täten havainnoijan ei tarvitse lisätä kuvia muualle kuin havaintopalveluun. Määritys lähetetään viestinä foorumiin kuten 0-vaihtoehdossa, joten havainnoijan pitää edelleen käydä itse kirjaamassa se havaintopalveluun.

C) Määritys suoraan havaintopalveluun:
Kirjataan havainto havaintopalveluun ja pyydetään määritystä foorumissa kuten B-vaihtoehdossa. Määrittäjä kuitenkin kirjaa määrityksen suoraan havaintopalveluun siihen rakennettavalla annotointityökalulla. Mahdollinen keskustelu määrityksestä käydään foorumilla. Havainto merkitään foorumissa määritetyksi jollakin tavalla (esim tagilla).

D) Kaikki määrityskeskustelu havaintopalvelussa
Kuten C, mutta havaintopalvelussa on sivu joka luetteloi varmistamattomat määritykset taksoneittain ja alueittain. Määrittäjät voivat seurata tätä sivua, jolloin foorumia ei tarvita määritysprosessissa lainkaan. Annotointivälineen on mahdollistettava jonkinlainen keskustelu ja sen moderointimahdollisuus, mikäli määritysperusteet eivät ole asiantuntijoillekaan selvät. (Tätä mallia käytetään mm. Tanskan sieniatlaksessa ja iNaturalist-palvelussa)


D-vaihtoehtoa on esitetty, mutta vierastan itse sitä, koska se

  • On työläin toteuttaa
  • Vaatii havaintopalveluun keskustelu- ja moderointiominaisuuksia, joihin varsinainen keskustelufoorumi on kuitenkin aina parempi.
  • Tuo mahdollisesti kärkkäät keskustelut myös niiden havaintoihin, jotka eivät keskustelua kaipaa (ellei havainnoijalle anneta mahdollisuutta kieltää keskustelut omista havainnoista)

C-vaihtoehto tulee ensi vuonna, mutta tarkka toteutustapa ja annotointioikeuksien hallinta ovat vielä auki. Annotointityövälinettä käytetään myös laadunvalvontatietojen lisäämiseksi havaintoihin.

1 tykkäys

Vaihtoehto A voi vähentää foorumiaktiviteettia, jos vaaditaan jotain.

B on hieman monimutkainen, ja havaintopalveluun voi jäädä roikkumaan paljon määrittämättömiä havaintoja yleisistä lajeista.

Olen samaa mieltä D:stä.

Voisiko C:n yhteydessä joku botti postata määrityspyynnön foorumille? Näistä tulee toki ongelma jos pyyntöjä on aivan valtavasti, tosin ne voi tietysti tägätä automaattisesti jne.

Periaatteessa joo, Discoursessa löytyy tähän API. Jotta pyynnöt menisivät oikeaan foorumiin, pitäisi mapata kaikki taksonit Discoursen foorumeihin, tai oikeastaan käyttää Lajitietokeskuksen lajirymäjaottelua täällä foorumissa. Tai sitten laittaa pyynnöt vain menemään yleiseen määrityspyynnöt-foorumiin, josta moderaattorit voivat siirrellä niitä oikeisiin ryhmiin. Laitan korvan taakse.

1 tykkäys

Mitä kaikkea tuo annotointiväline pitää sisällään? Oletan, ettei sitä ole vielä olemassa, joten onko suunnittelu kuitenkin käynnissä ja suuntaviivoja jo määritelty?

Jotenkin tuntuisi, että helpoin tapa saada satunnaisen havainnoijan havainto kirjattua olisi pyytää havainnoija, paikka ja päivämäärätiedot kuvaa foorumille lisättäessä, jonka jälkeen määrittäjä pystyisi kirjaamaan havainnon ja merkitsemään sen viestiketjuun. Koordinaatit pitäisi vain saada ruksattua kartasta ja jos mahdollista, automatisoida prosessia niin, että määrittäjän valitessa lajin listasta, tieto siirtyisi itsestään. Huomioitavaa on myös se, että kaksoishavainnot pitäisi eliminoida, eli jos kysyjä haluaakin itse syöttää havaintonsa, tulisi se käydä jostakin ilmi. Lähinnä siis taitaa olla vaihtoehto C:tä.

Moikka!

Annotointipalvelun kehitystä tai suunnittelua ei ole vielä aloitettu, mutta ajatuksia sen toiminnasta toki on paljonkin. Palvelun suunnittelu ja kehitys on ajoitettu vuoden 2017 aikana tapahtuvaksi. Lajitietokeskuksella on “havainnot-, seurannat- ja kartoitukset” -työryhmä, joka ottaa asian virallisemmin loppuvuoden aikana pohdintaan.

Mutta seuraavanlaisia juttuja voinee järjestelmällä tehdä:

  • Ilmoittaa havainnon spammiksi / epäasialliseksi
  • Adminit voivat hyväksyä spammimerkkauksen, jolloin koko tallennusdokumentti “poistetaan”
  • Ilmoittaa havainnon lajimäärityksen, paikan tai ajan kyseenalaiseksi (Paikan ja ajan osalta, jos näyttää selvästi olevan näppäily/syöttövirheen tulosta)
  • Ehdottaa vaihtoehtoista lajimääritystä
  • “Lajiryhmäkohtainen asiantuntija” voi ehdottaa vaihtoehtoista lajimääritystä tai hyväksyä jonkun toisen käyttäjän ehdottaman lajimäärityksen, jolloin oletuksena havainnosta jatkossa käytetään hauissa ym. annotoinnilla “yliajettua” määritystä (mutta hakuehdoista voi kytkeä tämän pois)
  • Havaintoja/dokumentteja voidaan myös positiivisesti annotoida, eli merkitä jollakin tasolla tarkistetuksi. Tämä voi tapahtua esim tietolähteen perusteella; vaikkapa viranomaislähteestä tai asiantuntijan läpikäymästä aineistosta tuleva havainto voidaan automaattisesti merkitä “vahvistetuksi”

Lisäksi tosiaan mahdollisesti jokaiseen annotointiin voi liittyä keskustelua (Mikon vaihtoehto D).

Joo ja itse kannatan vaihtoehtoa D.

Laji.fi -portaaliin voitaisiin saadan tietenkin osio, josta voi etsiä ja tutkia havaintoja/kuvia, joille on pyydetty lajimääritystä tai nykyinen lajimääritys ei ole lajitasolla ja joille ei ole vielä annettu asiantuntijan vahvistamaa lajimääritystä.

Minusta luonteva paikka keskustelulle on havainnon ohessa, siinä missä kuva, määritys ja muutkin havainnon tiedot ovat.

Käyttäjille voitaisiin “nostaa” esille sellaisia annotointeja, joista käydään vilkasta keskustelua. (Käyttäjän itse mielenkiintoisiksi määrittelemistä lajiryhmistä)

Annotointeja voisi selailla ja hakea/rajata.

1 tykkäys

Mielestäni vaihtoehto C tai sen variaatio tuntuisi luontevimmalta. Lähtökohtana kai on, että havainto kirjataan tietokantaan vasta silloin kun laji on tiedossa. Jos tämä ei ole mahdollista niin silloin tallettaja lisäisi kuvan lajista havaintokantaan ja jonkun täpän että pyytää määritystä, jonka jälkeen järjestelmä kysyy määritystä foorumilta. Kaikki määriykseen käytävä keskustelu tapahtuisi foorumilla. Kun laji on määritetty niin se kirjataan jollakin sopivalla tavalla havaintokantaan. Tässä olisi hyvänä puolena se, ettei sotketa asioita ja tietokanta pysyy “puhtaana” ja foorumi saadaan valjastettua sen oikeaan käyttötarkoitukseen.

C-mallia tukisi myös se että ei voida olettaa että kaikkien alojen asiantuntijat kävisivät havaintopalvelussa määrityspyyntöjä seuraamassa. Väki tulee kuitenkin olemaan hajallaan eri paikoissa (joista tämä foorumi toivottavasti tulee olemaan yksi merkittävimmistä). Ja vetääkseen asiantuntijoita pitää foorumin tuoda lisäarvoa (neuvoja, vertaispohdintaa ym.) kunkin harrastukselle, ei vain määrityshommia.

C-mallissa olisi vapaata mistä määritystä pyydetään. Toisaalta tämä olisi havainnoijan kannalta hankalaakin - en tiedä mistä pyytäisin määritystä esim. hankalille kasveille tai kääville.

Mutta kyllä silläkin olisi arvoa, jos havainnosta käyty keskustelu lopulta tallentuisi havainnon yhteyteen. Tämä olisi teknisesti mahdollista jos keskustelu olisi tällä foorumilla. Toki toteuttaminen voi olla vaikeaa.

Jos otetaan ihan scifi-visio, niin näin: (1) tänne lähetetään kuva; (2) saadaan määrityksiä; (3) joku automaatti lukee standardimuotoiset määritykset ja malli laskee määrittäjien kredibiliteeteistä ja ehkä annetuista vedonlyöntikertoimista koska ollaan riittävän varmoja (määrityshän ei ole koskaan 100% varma paitsi ehkä DNA:sta); (4) botti osallistuu keskusteluun ja pyytää tarkat havaintotiedot, ehkä laittamalla urlin tms.; (5) havaitsijan täyttää ne ja havainto kirjautuu määritysehdotusten ja muun keskustelun kanssa kantaan.

Kevyin versio edellisestä olisi, että määrittäjä tai havainnoija kutsuu botin keskusteluun, tai että botti tarjoaa havainnontalletus-urlia kaikissa keskusteluissa joissa on määritys-tagi. Botti nappaa keskustelun ekasta viestistä kuvat ja havainnoijan id:n pohjaksi. Se voi myös lopulta tallentaa keskustelun kantaan.

Toinen skenaario on sellainen jossa tänne lähetetään linnun ääninäyte ja joku automaatti ehdottaa sille tunnistusta, joku ihminen ehkä myös, jne., lopulta sama prosessi.

Nämä eivät varmaan ole mitenkään realistisia lyhyellä aikavälillä, mutta olisivat teknisesti mahdollisia (paitsi että automaattimäärittäjiä ei ole vielä).

Ehkä tässä pointtina oli kiinteä integraatio foorumin ja kannan välillä, ainakin tavoitteena.

Tähän vähän tietosuojanäkökulmaa:

Foorumikeskustelun on tarkoitus olla ei-pysyvää ja jossain määrin anonyymiä. Ihmiset saattavat esiintyä täällä nimimerkillä, he saattavat poistaa omia tuotoksiaan, eikä Lajitietokeskuksella ole intressiä tehdä tästä mitään ihmisten keskusteluja ikuisesti säilyttävää somehelvettiä. Jos olisi, foorumin käyttösääntöjen olisi oltava paljon mutkikkaammat, ja meidän olisi tehtävä käyttäjille selväksi, että foorumin kirjoitukset saattavat muuttua osaksi pysyvää tieteellistä aineistoa, jota jaetaan kansainvälisesti, eikä välttämättä pelkästään esim. EU-alueen sisällä.

Tällainen integraatio ei oikeasti palvele foorumin ensisijaista tarkoitusta keskustelutilana. Näkisin ennemmin tarkoituksenmukaisena, että foorumia kohdellaan tällaisena kahvilana tai olohuoneena, ja oikea pysyvä määritystyö tapahtuu hieman erillään tästä. Ainakaan sellaista tilannetta emme halua, että foorumikäyttäjien viestit joutuvat heidän itsensä tietämättä osaksi jotain pysyvää ja lajitietokeskuksen ylläpitämää muuta järjestelmää. Tämä olisi ongelmallista jo tietosuojalainsäädännönkin kannalta. Niinpä peräänkuulutettu kiinteä integraatio ei minusta ole tavoiteltavaa.

2 tykkäystä

Olen itsekin miettinyt tätä pitkään ja hartaasti, enkä vieläkään tiedä mikä on viisain ratkaisu, kun lajitietokeskuksen oman havaintotietokannan toteutus on auki. Darelta tulikin sopivasti hyvä huomio tietosuojan näkökulmasta, mitä itsekin olen pohtinut.

Aika paljon tämä riippuu nyt siitä, millainen havaintotietokannan toteutus tulee olemaan. Voiko esimerkiksi yksittäistä havaintoa kommentoida kuka tahansa vai ainoastaan laajemmat oikeudet omaava? Vai käydäänkö määrityskeskustelu foorumilla ja joku vain linkittää sen havainnon alle?

Ehkä se on kuitenkin syytä ottaa huomioon, että määrittäjän tai varmistajan tiedon voi kirjata tietokantaan myös havainnon tekijä (määrittäjän lisäksi). Etenkin kun iso osa määrityksistä tehdään jossain muualla kuin täällä, jolloin niiden kirjaaminen tietokantaan olisi liikaa vaadittu yhdeltä määrittäjältä, jos hän antaa nimet parhaimmillaan kymmenille eri henkilöiden kysymille lajeille päivässä (esim. FB-ryhmissä Suomen Ötökät tai Suomen Perhoset tämä on parhaalla maastokaudella ihan todellinen tahti).

Tämä on varmaan välttämätöntä tai ainakin pitää pystyä tagillä tms. ilmoittamaan, että ei halua tätä liitettävän mihinkään automaattiin. Ainakin itse käytän Virtalan tietokantaa excelillä ja havaintoja esim. perhosista tulee 1000+ vuodessa. Haluan myös, että kaikki havainnot ovat sen kautta poislukien joku vähemmän aktiivinen lahko. Useimmille tilanne varmaan toinen.
Se, että minkä systeemin kautta jatkossa näitä ilmoitan riippunee siitä onko vastaavia menetelmiä olemassa lajitietokannan tulevassa järjestelmässä. Esim. nykyinen järjestelmä on siinä mielessä jäykkä, että epävarmoja ei voi ilmoittaa vaan ne pitää kerätä käsin eri paikkaan siihenastisine tietoineen ja ilmoittaa jos päätyy lajiksi asti.
Joissain heimoissa suurin osa jää määrittymättä lajitasolle (esim. pistiäiset) ja nämä jäävät vain omaan exceliin.
EDIT:
Jatkan vielä vähän - voisiko olla niin, että jos ilmoittaa ilman tai osittaisella nimellä, menisi yksittäiselle ilmoitukselle määritys tagillä + kuva määritys osastoon (jos on tiedossa). Jos ilmoittaa csv ym tiedostolla nin tunnistamattomat ja puuteellisesti tietoja sisältävät jäisivät listalle, jota edistynyt käyttäjä voisi korjailla. Ne, joihin tarvittaisiin määritysapua voisi kuvan kanssa pullauttaa määrityspyynnöksi.
Vielä: ilmoittaja voisi sitten myös itse määrittää esim. preparaatin tuloksena tältä omalta listaltaan. Ehkä liittää preparaattikuvan havaintoon?
Jouni

Menee vähän aiheen sivuun, mutten malta olla mainitsematta että monet näkevät keskustelujen haettavuuden ja suhteellisen pysyvyyden foorumin yhdeksi tärkeimmäksi eduksi Facebookiin verrattuna . Eli jos asiantuntija vaivautuu kirjoittelemaan vaikka lajien elintavoista, tai niistä keskustellaan ja syntyy joukko epäformaaleja muistiinpanoja, ko. tuotokset jäävät foorumille luettavaksi ja haettavaksi vähän pitemmäksi aikaa kuin kolmeksi minuutiksi tai tunniksi. (Jostain syystä hyönteisihmiset eivät kirjoita blogeja.)

Tietysti mikään ei ole ikuista, ja helvettinsä kullakin…

Visioin integraatioskenaarioita käyttäjän helppouden näkökulmasta eikä tietosuoja tullut mieleenkään. Keskustelujen tallettaminen salaa johonkin kantaan olisi varmasti ongelmallista. (Toisaalta tästä julkiwebasta ne voidaan tallettaa ties mihin Väärän Valtion tietovarastoihin, ja ehkä niin tehdäänkin. Eli foorumikeskustelun katoavaisuus, jos sellaista haluaa, voi olla osittain silmänlumetta.)

Foorumin pitäminen tunnelmaltaan olohuoneena on hyvä pointti. Sitä luultavasti häiritsee jo määritysten tulva kesäisin, ainakin jos tämä tulee olemaan yhtään kuten FB:n hyönteisryhmät tai Hyönteisfoorumi.

Monet harrastajat tallentavat suuria määriä havaintoja, ja heitä kiinnostaa helppokäyttöisyys. Ns. määrittäjät ovat toisia harrastajia, jotka eivät luultavasti kaipaa kovin paljon formaliteetteja aktiviteettiinsa. En ymmärrä täysin määrittäjien motiiveja (ml. omiani, sikäli kuin harvoin määritän), mutta voi olla tärkeää että määritykset tapahtuvat muun keskustelun yhteydessä.

Vaivattomimman vaihtoehdon tie johtaa luonnollisesti klassiseen systeemiiin, jossa määrityksiä pyydetään FB:ssä ja eri foorumeilla ja kavereilta Telegrammissa ja havainnot kirjataan havaitsijan toimesta kantaan määrityksen kanssa. Mahdollinen keskustelu tapahtuu spontaanisti määrityksen yhteydessä jossain toisaalla kuin havaintojärjestelmässä. Havaintojärjestelmässä ei silloin synny keskustelua, vaikka keskusteluun tarjottaisiin siellä mahdollisuus. Joku voi joskus kommentoida epäilyttävän näköistä havaintoja, mutta koska kommentit ovat harvinaisia ei niitä juuri kukaan lue (ja päinvastoin).

En ihan heti keksi millä porkkanalla keskustelun tai jälkiannotaatioina tapahtuvat määritykset saisi houkuteltua havaintojärjestelmään, siis sen sijaan että havaitsija vain kirjaa sinne itse jostain saadun määrityksen. Pitäiskö toisen tahon kirjaaminen määrittäjäksi kieltää, ts. pakottaa määrittäjät kirjaamaan määrityksensä itse? Ei… Ehkä jos havainnoijat saataisiin tallentamaan kuvia havaintojärjestelmään, voisi kommentteja määrityksistä tulla enemmän?

Tietysti tilanne voi poiketa eliöryhmittäin, lähinnä on asiaa tullut tarkasteltua hyönteisten näkökulmasta. Eikä mulla ole sen vahvempaa kantaa näihin kuin että helppokäyttöisyys on tärkeää ja klassinen systeemikin on ihan ok.

1 tykkäys