Merkkijonohaut?

Mikähän on ongelmana kun merkkijonohaku ei tunnu palauttavan kaikkia mätsääviä havaintoja. Yritän kaivaa limasienten osalta kaikki ilmoitetut havainnot, mukaan lukien havainnot ei-taksoneista. Yritän siis löytää havainnot lajeista jotka eivät ole taksoneita, merkkijonoihin mätsäävät kirjoitusvirheet, puutteelliset synonyymiohjaukset etc. Jos merkkijonohaku ei niitä palauta niin onko joku muu kikka saada ne listattua. Pitäisi saada varmuus että kaikki mätsäävät löytyvät.

Jos esim. haen ilman rajauksia havaintojen selauksesta merkkijonolla “Diachea*” palautuu seuraava lista

Jos taas haen ilman rajauksia havaintojen selauksesta merkkijonolla “Diachea”, siis ilman asteriskia, palautuu seuraava lista

Nyt siis kummallakaan haulla ei löydä kaikkia nimellä Diachea ilmoitettuja havaintoja, eikä ole varmuutta palauttavatko nämä haut edes yhdessä niitä kaikkia vai jääkö joitain vielä piiloon (vaatisivat esim täsmällistä merkkijohakua ilman asteriskia tms.).

Voi toki olla etten vain ymmärrä näiden hakujen logiikkaa mutta mielestäni merkkijonohaut palauttivat aikaisemmin kaikki mätsäävät havainnot. Listauksen pystyi sitten järjestämään esim. taksonomiseen järjestykseen ja jolloin ei-taksonit listautuivat kärkeen.

Limasienten taksonomia on muuttunut todella paljon sitten 2012 ja uusia lajeja on myös löytynyt runsaasti (luokkaa 40% lisää lajeja sitten 2012). Tästä syystä havaintojen ja taksonomian päivittäminen vastaamaan tämän päivän tilannetta on hyvin hankalaa jos merkkijonohaut eivät palauta kaikkia mätsääviä havaintoja.

Onko sinulla esimerkkiä havainnosta, joka ei palaudu kummallakaan em. hauista?

Tämä haku palauttaa havainnot, jotka on kirjattu nimellä, joka alkaa “Diachea”. Sen sijaan se ei palauta esim. havaintoja, jotka on kirjattu nimellä “kiilukuuranen”.

https://laji.fi/observation/list?target=Diachea*

Tämä haku palauttaa havainnot, jotka on kirjattu nimellä, joka on linkitetty Diachea-sukuun.

https://laji.fi/observation/list?target=MX.290531

Mikko / Lajitietokeskus

Eikö tätä hakualgoritmia voisi vähän selkiyttää? Todella vaikeaa oivaltaa että se mitä haku palauttaa riippuu siitä mitä kielivalintoja on tehty - nehän eivät näy mitenkään haun tekijälle.

“Tämä haku palauttaa havainnot, jotka on kirjattu nimellä, joka alkaa “Diachea”. Sen sijaan se ei palauta esim. havaintoja, jotka on kirjattu nimellä “kiilukuuranen”.” Eikös kaikki kuuraset ole kuitenkin kirjattu myös tieteellisellä nimellä Diachea?

Mitä tuo “esim.” kommentissasi yllä tarkoittaa? Mitä muuta jää palauttamatta? Muilla kielillä kuin suomeksi kirjatut?

Minusta olisi loogista että jos joku hakee “Diachea*” niin haku palauttaisi Diacheat riippumatta käyttäjän kielivallnnoista. Tällöin riittäisi yksi haku jonka voisi järjestää taksonomiseen järjestykseen. Näin saisi listattua kaikki havainnot ei-taksoni Diacheoista listauksen kärkeen (taksonikenttä = tyhjä) - siis uudet lajit, puuttuvat synonyymiohjaukset, kirjoitusvirheet etc.

Tähän tapaan - mutta niin että taksonit listautuisivat kielivalinnoista riippumatta.

Nyt ei tätä haun logiikkaa helpolla ymmärrä, ja havaintoja jää tästä syystä helposti piiloon.

Koetan selventää.

Taksonihakua voi käyttää jommalla kummalla kahdesta eri tavasta:

A) Kirjoittamalla hakukenttään jotakin, ja valitsemalla taksoni pudotusvalikosta. Tällöin selaimen osoiteriville ilmaantuu valitun taksonikäsitteen tunniste, esim. https://laji.fi/observation/list?target=MX.290531

Tämä haku palauttaa kaikki ko. taksonikäsitteeseen linkitetyt havainnot (ja sen lapsitaksonien havainnot, mikäli käyttäjä näin valitsee). Tällä tavalla hakua käytetään yleensä, ja se toimii kun haettava asia on taksonitietokannassa.

B) Kirjoittamalla hakukenttään jotakin, esim. Diachea, ja painamalla enter. Tällöin selaimen osoiteriville ilmaantuu kirjoitattu teksti, esim. https://laji.fi/observation/list?target=Diachea

Tämä haku kohdistuu vain ja ainoastaan siihen nimeen, jolla havainto on alun perin saatu Lajitietokeskukseen - esim. kirjattu Vihko-havaintopalveluun tällä nimellä tai lähetetty Lajitietokeskukseen jostain muusta lähteestä tällä nimellä.

Nimeen voi kirjoittaa asteriskin, joka on ns. wildcard-merkki, eli se vastaa mitä tahansa merkkijonoa. Täten esim. “Diachea*” palauttaa kaikki havainnot, jotka on saatu lajitietokeskukseen nimellä, joka alkaa “Diachea”. Vastaavasti “diachea” palauttaisi kaikki havainnot nimellä, jossa on missä tahansa kohdassa “diachea”. Mutta tämä haku ei palauta “kiilukuuranen”-nimellä saatuja havaintoja, koska teksti “diachea” ei sisälly tekstiin “kiilukuuranen”.

Ymmärränkö oikein, että haluaisit haun, joka tekee molemmat em. asiat yhtä aikaa? Se onnistuu tekemällä molemmat haut (ja B-haun asteriskeilla), jolloin osoiterivillä näkyy https://laji.fi/observation/list?target=MX.290531,diachea

Huom: tämä foorumi näemmä poistaa tässä näkyvästä osoitteesta asteriskit ja sen sijaan kursivoi nimen. Klikkaa linkkiä niin näet miten se toimii.

Mikko / Lajitietokeskus

Joo kiitos, onhan tuossa oma sisäinen logiikkansa ja yhtäaikainen tuplahaku toimii - kiitos opastuksesta.