Tervetuloa käyttämään Sanastot-työkalua!

Riitta Alkula

Sanastot-työkalu on selainpohjainen sovellus terminologisten sanastojen ja käsitemäärittelyjen luomiseen, julkaisemiseen ja hallintaan. Toisaalta se on myös sovellus tietoja tarvitseville, jotka voivat tästä verkkopalvelusta hakea ja selata sanastoja sekä käsitteiden ja termien terminologisia määritelmiä.

Työkalu on siis tarkoitettu eri organisaatioiden henkilöille, jotka työssään määrittelevät käsitteitä tai hyödyntävät valmiiksi määriteltyjä käsitteitä. Sanastoihin on koottu eri organisaatioiden valmiita sanastoja, joita muut organisaatiot voivat hyödyntää. Sanastoja pääsee selaamaan kirjautumatta palveluun.

Sanastot-työkalusta julkaistiin vuoden 2022 lokakuussa uusi, saavutettava versio. Kehitystyössä otettiin huomioon aikaisemmasta versiosta annettua palautetta ja lisättiin sovellukseen toivottuja uusia ominaisuuksia.

Mikä Sanastot-työkalu?

Sanastot-työkalun avulla pyritään kuvaamaan ja yksilöimään käsitteet niin täsmällisesti, että nämä käsitetietueet eli käsitteiden kuvaukset ovat sekä ihmis- että koneluettavia. Kuten terminologit tietävätkin, ihmisten välisen yhteisymmärryksen lisäämiseksi ja väärinymmärrysten välttämiseksi tarvitsemme täsmällisesti määriteltyjä käsitteitä. Kun tietojärjestelmät keskustelevat keskenään, ovat täsmälliset määritelmät vieläkin tärkeämpiä, koska tietojärjestelmät eivät osaa (edelleenkään) järkeillä kaikkia asioita yhtä hyvin kuin ihmiset.

Työkalun kehityksen taustalla ovat Euroopan Unionin yhteentoimivuuden periaatteet (EIF, European Interoperability Framework), joiden avulla pyritään sujuvoittamaan eri jäsenvaltioiden välistä tiedonvaihtoa. Jotta tietojen merkitys säilyisi muuttumattomana ja ymmärrettävissä kaikille osapuolille, tarvitaan tietoa tiedosta eli metatietoa. Tällaisten metatietojen kuvaamiseksi on Suomessa rakennettu valtiovarainministeriön rahoituksella kansallinen metatietopalvelu eli Yhteentoimivuusalusta, jota Digi- ja väestötietovirasto (DVV) ylläpitää.

Yhteentoimivuusalustan työkaluja ovat Sanastot-, Koodistot- ja Tietomallit-työkalut. Kaikkien työkalujen tarkoituksena on tarjota paikka, jonne erityisesti julkisen hallinnon toimijat voivat kuvata julkiseen käyttöön tarkoitettuja metatietokuvauksiaan avoimena datana. Näin tiedot löytyvät yhdestä paikasta helpommin eikä eri tahojen tarvitse rakentaa vastaavia julkaisualustoja itse. Ei siis tarvitse keksiä ruutia uudelleen, jos alustalta löytyy jo jonkun muun aiemmin tekemiä valmiita kuvauksia. Lisäksi alusta antaa kullekin tietosisällölle yksilöllisen tunnuksen, jolloin tiedot voidaan tunnistaa myös koneellisesti ja kielestä riippumattomassa muodossa. Yksi tavoite onkin nopeuttaa tietojärjestelmien kehitystä: kun tiedot voidaan ladata Yhteentoimivuusalustalta suoraan koneluettavassa muodossa, kehittäjien käsityö vähenee ja näppäilyvirheitä yms. on vähemmän.

Työkalun ominaisuuksia

Sanastot-työkalu on selainpohjainen sovellus, jolla voi:

  • julkaista ja ylläpitää sanastoja
  • kuvata käsitteitä ja termejä
  • kuvata käsitteiden suhteita toisiin käsitteisiin
  • koota sanaston käsitteistä osajoukkoja eli käsitekokoelmia
  • antaa palautetta sanaston omistajalle käsitteiden määritelmistä ja muista kuvauksista

Työkalulla organisaatio voi siis luoda uusia sanastoja, luoda ja muokata sanastonsa tietoja sekä lisätä, muokata ja poistaa sanastoonsa käsitteitä ja termejä. Lisäksi organisaatio määrittelee osoitteen, johon se haluaa vastaanottaa sanaston käyttäjien palautteita.

Sanaston kuvaustietoja ovat mm. sanaston:

  • nimi
  • kuvaus
  • kielet
  • omistaja(t)

Käsitteen kuvaustietoja ovat mm. käsitteen:

  • termit (suositettava termi, synonyymit, ei-suositettavat termit)
  • määritelmä
  • huomautukset
  • käyttöesimerkit
  • suhdetiedot (hierarkkinen yläkäsite tai alakäsite, liittyvä käsite, koostumussuhteinen ylä- tai alakäsite tässä samassa tai jossain toisessa sanastossa)
  • linkki käsitekaavioon
  • lähteet
  • tiedot muutoksista

Termin kuvaustietoja ovat mm. termin:

  • kieli
  • tyyppi, tyyli, suku, luku jne.

Sanastojen sisällä voi määritellä myös osajoukkoja eli käsitekokoelmia (aiempi nimitys käsitevalikoima). Näin tiettyyn asiayhteyteen tai osakokonaisuuteen liittyvät käsitteet voidaan ryhmitellä niin, että ne löytyvät helposti samasta yhteydestä eli käytännössä samalta verkkosivulta.

Sanastot-työkalun käyttöliittymä on suomeksi, ruotsiksi ja englanniksi. Sanastojen sisällön kieli taas voi olla periaatteessa mikä tahansa. Kun sanasto luodaan, sanastoasiantuntija valitsee valikosta, millä kielillä sanaston käsitteet annetaan.

Koska Sanastot-työkalun käsitemäärittelyt ovat koneluettavia ja niillä on yksilölliset tunnukset, kuvauksia voidaan hyödyntää muualla. Esimerkiksi Tietomallit-työkalua käyttävät mallintajat voivat luokkia ja muita resursseja kuvatessaan viitata Sanastot-työkalussa oleviin käsitekuvauksiin. Tai oikeastaan: mallintajat eivät vain voi, vaan heidän nimenomaan pitää käyttää käsitteitä mallintamisen pohjana. Kun samaa tietoa esittävät eri tietomallit perustuvat samoihin käsitteisiin, ne ovat todennäköisemmin yhdenmukaisia ja siten myös edistävät paremmin yhteentoimivuutta kuin ilman mitään yhteyksiä määritellyt tietomallit.

Mitä uutta työkalussa?

Useimmat Sanastot-työkalun ominaisuudet ovat olleet olemassa jo työkalun aiemmassa versiossa. Isoimpana uutuutena työkalussa ovat sanaston lataus ja muokkaus Excelillä sekä saavutettava käyttöliittymä. Uudistuksessa on myös pyritty selkeyttämään käsitteiden ja termien muokkaustoimintoja.

Nyt työkalussa on Excel-export eli työkalussa olevan sanaston voi tallentaa omalle työasemalle Excel-muodossa. Aiemmin tietojen hyödyntäjät pystyivät vain tarkastelemaan verkkosivuilla työkaluun vietyjä määrittelyjä.

Myös käsitteiden tuominen sanastoon on uudistunut eli nyt on toteutettu kolme tapaa päivittää sanastojen tietoja tiedostoilla:

  1. Yksinkertainen käsitteiden lisäys Excel-tiedostolla.
    • Tämä ominaisuus oli jo työkalun edellisessä versiossa, mutta silloin tiedot pystyi tuomaan vain CSV-tiedostona. Nyt tilalla on Excel ja CSV-vaihtoehto on siis poistettu käytöstä.
    • Yksinkertaisella Excel-tiedostolla voi tuoda käsitteiden perustiedot, kuten käsitteen suositettava termi (nimi), määritelmä, huomautukset ja synonyymit.
    • Tiedostolla voi tuoda vain suomen-, ruotsin- ja englanninkielisiä käsitteitä
  2. XML-tuonti
    • Tiedot tuodaan Sanastokeskuksen käyttämässä NTRF/XML-muodossa
    • Periaatteessa ei muutoksia nykyiseen NTRF-formaattiin; käytännössä XML-tiedostoon on myös tehty joitakin Sanastokeskuksen toivomia lisäominaisuuksia
  3. Monipuolinen olemassa olevan sanaston ja sen tietojen päivittämiseen tarkoitettu Excel
    • Kokonaan uusi toiminnallisuus, jota ei aiemmassa versiossa ei ollut lainkaan
    • Perustuu työkalusta omalle työasemalle ladattavaan Excel-tiedostoon (export).
    • Ladattu tiedosto muokataan ja muokattu tiedosto ladataan takaisin työkaluun (import), joka päivittää käsitteet tiedoston sisältämien tietojen pohjalta. Päivittäminen tietenkin edellyttää, että tietojen lataajalla on sanaston muokkausoikeudet.

Toki käsitteitä voi uudessakin käyttöliittymässä päivittää käsin, verkkosivujen muokkaustoimintoja käyttäen.

Lisäksi sanastojen katseluun on tehty nämä parannukset:

  • Sivutus näyttää nyt 50 riviä ennen sivunvaihtoa
  • Termihaku löytää myös synonyymit
  • Sanastojen tietoja kuvaavia tekstejä on tarkennettu

Jatkosuunnitelmat

Uutta käyttöliittymää kehitettäessä pyrimme ottamaan mahdollisimman paljon huomioon käyttäjien palautteet ja kehitystoiveet. Olemme saaneet palautetta aiemmasta toteutuksesta mm. sähköpostitse ja Yhteentoimivuusalustan Slack-kanavan kautta. Lisäksi uuden version suunnitteluvaiheessa haastattelimme käyttäjiä ja keräsimme tietoa verkkokyselyjen avulla. Kun saimme ensimmäisiä suunnitelmia valmiiksi, esittelimme niitä käyttäjille ja muokkasimme sivuja palautteen pohjalta. Aivan loppuvaiheessa pyysimme työkalun aktiivisia käyttäjiä vielä paikan päälle betaversion käyttäjätesteihin, joissa seurasimme, miten sovelluksen käyttö käytännössä onnistuu. Vielä tässä vaiheessa teimme muutamia viilauksia testikäyttäjien palautteen perusteella.

Yksi tärkeä toive kuitenkin jäi vielä toteuttamatta: käsitekaaviot. Tosin tässä uudessakin versiossa on mahdollista linkittää käsite verkkosivulle, jolta käsitekaaviokuva löytyy.

Syynä työkalun oman käsitekaavion puutteelle on, että aiemman version visualisointisovellus on jo teknisesti vanhentunut. Uusi käsitekaavio pitää tehdä uudella teknisellä ratkaisulla. Tässä kohtaa otimme aikalisän, sillä vastaavantyyppinen visualisoinnin uudistaminen on tarkoitus tehdä myös Tietomallit-työkaluun. Päätimme ensin opiskella teknistä toteutusta Tietomallit-työkalussa ja sitten soveltaa oppeja Sanastot-työkalun käsitekaavioiden toteuttamisessa.

Muutaman kehittäjän kokoisella kehitystiimillä emme voi samaan aikaan kehittää kaikkia Yhteentoimivuusalustan työkaluja, vaan kehittämistä on pakko vuorotella ja vaiheistaa. Näin ollen pidämme Sanastot-työkalun vanhankin käyttöliittymän tarjolla edelleen, jotta visualisointia kaipaavat voivat mennä sinne tarkastelemaan käsitteiden ja käsitekokoelmien visuaalisia esityksiä. Toki Sanastot-työkalun virheiden korjauksia ja käyttöä helpottavia pikkuviilauksia tehdään jatkuvasti, vaikka pääasiallinen kehitystyö tehtiinkin vuoden 2022 aikana. Kun Tietomallien tämänhetkinen kehitysrupeama saadaan päätökseen, voimme taas ottaa muita työkaluja jatkokehitykseen.

Kuinka voit tuoda sanastojasi Yhteentoimivuusalustalle

Sanastojen julkaisijan, käytännössä organisaation, pitää pyytää Digi- ja väestötietovirastolta käyttölupa alustan työkaluihin ja sitoutua noudattamaan käyttöehtoja. Käyttölupahakemus lähetetään DVV:lle osoitteeseen yhteentoimivuus@dvv.fi. (Katso ohjeet Yhteentoimivuusalustan julkisesta dokumentaatiosta.) Sanaston julkaisijan pitää tässä vaiheessa myös nimetä pääkäyttäjä, joka huolehtii oman organisaationsa käyttöoikeuksista.

Kun DVV saa käyttölupahakemuksen, se lisää Yhteentoimivuusalustalle tämän uuden organisaation tiedot ja antaa pääkäyttäjälle tarvittavat pääsyoikeudet. Sen jälkeen pääkäyttäjä voi edelleen antaa muokkausoikeudet oman organisaationsa terminologeille ja muille sanastotyön asiantuntijoille. Näin organisaatio pääsee itse muokkaamaan ja ylläpitämään sisältöjä haluamallaan tavalla ja aikataululla.

Kirjoittajasta:
Riitta Alkula työskentelee johtavana asiantuntijana Digi- ja väestötietovirastossa. Hänen vastuualueenaan on semanttisen yhteentoimivuuden edistäminen. Alkula myös perehdyttää ja kouluttaa Yhteentoimivuusalustan käyttäjiä alustan eri työkalujen käyttöönotossa.

Lisää uusi kommentti

Filtered HTML

  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Sallitut HTML-tagit: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Rivit ja kappaleet päätetään automaattisesti.

Plain text

  • HTML-merkit ovat kiellettyjä.
  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Rivit ja kappaleet päätetään automaattisesti.