Digitalkoot.jpg

Pelaa ja auta digiarkistoa

Kansalliskirjasto kerää digitaaliseen muotoon muun muassa sanomalehtiä. Osallistu Digitalkoisiin ja auta korjaamaan sanoja automaattisen tekstintunnistuksen jäljiltä.

sunnuntai 3. huhtikuuta 2011

Kansalliskirjaston ja Microtaskin helmikuun puolivälissä käynnistämien digitalkoiden kävijämäärä ylitti maaliskuun puolivälissä 25 000 rajan. Aluksi digitalkoisiin osallistuminen vaati Facebook-tunnukset, mutta nyt osallistua voi myös sähköpostikirjautumisen kautta. Talkootyötä oli kuukaudessa tehty jo 100 000 minuuttia eli noin 1700 tehokasta työtuntia. Yksittäisiä mikrotehtäviä talkoolaiset olivat suorittaneet yli 2 miljoonaa.

Tällä hetkellä Digitalkoissa on käynnissä urakka, jossa tuodaan sähköiseen muotoon 1800-luvun Aamulehtiä. Koska Kansalliskirjaston sanomalehtikirjaston materiaali on siirretty digimuotoon käyttämällä automaattista tekstintunnistusta, kaikkia sanoja ei ole tunnistettu oikein. Sanoja joudutaan korjaamaan käsin, mikä on hidasta ja paljon työtä vaativaa puuhaa.

Rekisteröitymällä pääsee pelaamaan pelejä, joissa joko kirjoitetaan sanoja, joita tietokone ei ole tunnistanut lainkaan, tai sanoja, jotka tietokone on tulkinnut väärin. Myöhemmin tänä vuonna on luvassa pelejä, joissa voi auttaa artikkelien rakenteen korjaamisessa ja kuvien liittämisessä artikkeleihin.

Korjattu aineisto mahdollistaa hakujen tekemisen. Ilman tekstihakua Kansalliskirjaston aineiston miljoonia sivuja joutuisi selaamaan käsin.

Järjestelmän on kehittänyt suomalainen Microtask. Se on luonut tekniikan, joka pilkkoo esimerkiksi epäselvän tekstin tulkitsemisen kaltaiset rutiinit määrämuotoisiksi mikrotehtäviksi, jakaa ne verkon kautta halukkaille tekijöille ja kokoaa ne takaisin yhteen valmiiksi kokonaisuudeksi. Käyttäjille puuha tehdään viihdyttäväksi pelimäisellä käyttöliittymällä.

”Microtaskin teknologian avulla työ voidaan jakaa uudella tavalla: pienempiin osiin ja useammille tekijöille. Kukin voi tehdä työtä sen verran kun hyvältä tuntuu, silloin kun se sopii, ja siellä missä haluaa. Lisäksi näin rutiinityöstä voidaan tehdä myös hauskaa ja yhteisöllistä”, toteaa Microtaskin toimitusjohtaja Harri Holopainen.

Myyräjahti-pelissä pelaajalle esitetään kaksi eri sanaa, ja pelaajan tehtävänä on mahdollisimman nopeasti vastata, ovatko sanat tismalleen samanlaiset. Näin pelin avulla aineistosta löydetään virheellisiä sanoja. Näitä virheellisiä sanoja korjataan puolestaan Myyräsilta-pelissä, jossa pelaajan tehtävänä on kirjoittaa kuvaruudulle ilmestyvä sana oikein. Kirjoittamalla oikein pelaaja rakentaa myyrille siltaa joen yli.

Ehkä sinua kiinnostaa...