Edellinen Seuraava Ylös

Seminaari elektronisesta julkaisemisesta

Timo Nevala

Suomen tieteellinen kirjastoseura järjesti 21.3.1996 Tilastokeskuksessa seminaarin elektronisesta julkaisemisesta, mistä ohessa Timo Nevalan muistiinpanoja


Elektronisten dokumenttien rakenne ja tuottaminen

Riitta Alkula VTT:n tietopalvelusta kertoi seminaarin aluksi elektronisten dokumenttien rakenteesta ja tuottamisesta. Elektronisen julkaisun jakelukanavia ovat magneettiset muistivälineet, optiset levyt ja tietoverkot. Elektroninen julkaisu voi olla perinteisen, painetussa muodossa ilmestyvän julkaisun rinnakkaisjulkaisu (esim. TietäNet) tai sellainen, jolla ei ole paperimuodossa julkaistavaa vastinetta (esim. Microsoftin Cinemania CD-ROM). Samaa aineistoa voi harvoin julkaista suoraan eri muodoissa muokkaamatta

Elektronisen julkaisun tuotantoprosessiin kuuluu: aineiston kerääminen ja tarvittaessa digitointi, aineiston järjestely, toimittaminen ja koodaus, aineiston konvertointi, tietokannan suunnittelu, ohjelmiston valinta, indeksointi, linkittäminen, laaduntarkistukset, kuvittaminen, dokumentointi, aineiston formatointi ja esimasterointi, masterointi ja kopiointi, pakkaus ja jakelu sekä tuki- ja ylläpitotoiminnot.

Formatointi on teknisesti vaativaa puuhaa, on erilaisia tekstiformaatteja (ASCII, RTF), kuvia varten on omat formaatit. Koska tiedostot vievät paljon tilaa, niitä saatetaan tiivistää kompressoimalla. Multimediatuotteita varten on luotu ääni- ja videoformaatteja.

HTML (Hyper Text Markup Language) on SGML rakennekuvauskielen tunnetuin sovellus, millä luodaan WWW-sivuja. HTML-sivu on ASCII-tekstiä, johon on merkitty muotoilukoodeja (tunnisteita). WWW-selaimet tulkitsevat tunnisteet ja muotoilevat sivun näytölle niiden mukaisesti. Dokumentin tuottaja ei voi täysin kontrolloida dokumentin ulkoasua, koska se rippuu selaimesta ja käyttäjän tekemistä määrityksistä. HTML:stä on olemassa kahta ja kohta jo kolmea versiota. Alkeellisin on 1.0 ja tällä hetkellä yleisin on 2.0. Tulossa on 3.0 eli HTML+ , joka tulee tukemaan myös taulukoita.

Riitta Alkula totesi lopuksi, että vaikka elektronisen julkaisemisen tekniikka monilta osin onkin mutkikasta ja erikoisosaamista vaativaa, elektronisen julkaisemisen ongelmat eivät loppujen lopuksi ole teknisiä. Tekniikassa "kaikki" on mahdollista - mahdottomat työt vaativat vain suunnattoman määrän aikaa ja rahaa. Olennaiset ongelmat ovat hallinnollisia. Tekijänoikeus - eli kenellä on oikeus julkaista dokumentti (ja kerätä maksut)? Autenttisuus ja muuntamattomuus, mikä on originaali dokumentti, kun digitaalinen kopio on yhtä hyvä kuin alkuperäinen? Arkistointi, entä jos dokumenttia tarvitaan vielä vuoden tai viidenkymmenen vuoden päästä? Kuka arkistoi ja missä muodossa, onko dokumentit jatkuvasti konvertoitava uusiin esitysmuotoihin?

Seminaarissa esitettiin myös näkemys, että, mikäli elektronisia julkaisuja ei luetteloitaisi eikä arkistoitaisi, kuten paperisia, niin päästäisiin useista ongelmista.

Elekronisten julkaisujen kuvailu

Arne Hedman (Tieteellisten kirjastojen atk-yksikkö) esitteli elekronisten julkaisujen kuvailun tilannetta Suomessa. Elektronisten julkaisujen yleistymisen takia FINMARCia on pitänyt muuttaa. Tekniikan ja terminologian nopea muuttuminen on aiheuttanut paineita sääntöjen ja formaatin ajantasaisuudelle. Tekijyyden ja painoksen määritteleminen mm. on ollut hankalaa. URL:ien muuttuminen aiheuttaa ongelmia luetteloinnissa. Jo kerran tallennetun tiedon pitäisi elää julkaisun mukana.

URN (Uniform resourse names) on yksi keino saada järjestystä vallitsevaan kaaokseen. Elektronisille julkaisuille on suunnitteilla oma ISBN:ää vastaava järjestelmä, joka sopisi kaikille verkossa oleville atk-tallenteille. Se olisi joustava ja vakaa systeemi, jossa verkkodokumentti saisi ainutkertaisen nimen. Linkkien ja URL:in muutokset eivät URN:ään vaikuttaisi, koska se löytyisi aina URN-rekisteristä. Ongelmana ovat kuitenkin elektronisen julkaisun painokset. Miten paljon julkaisun on muututtava ennen kuin se saa uuden URN:n?

Älykkäät dokumentit

Juha Hakala TKAY:stä kertoi elektronisista tallenteista, jotka sisältävät oman kuvailunsa, eli älykkäistä dokumenteista. Ideana on ,että tekijä luetteloi dokumenttinsa itse. Kirjastot saavat kuvailun suoraan tallenteesta. Tallenteen kuvailun voi indeksoida automaattisesti joko kokonaan tai osittain indeksointirobotilla. Pelkän kuvailun indeksointikin parantaa hakujen tarkkuutta.

Kuvailujärjestelmiä on kehitetty useitakin. Johtava järjestelmä on Dublin Metadata Core Element Set. Se on linkitetty jo USMARC-formaattiin.

Juha Hakala on luomassa yhdessä Traugott Kochin ja Ole Husbyn kanssa pohjoismaista elektronisten dokumenttien kuvailujärjestelmää. Projektisuunnitelman NORDINFOlle pitäisi olla valmis toukokuussa. Järjestelmän käyttöönotto Pohjoismaisissa kirjastoissa helpottaisi aineistojen käsiteltävyyttä ja jo yhdellä indeksointirobotilla saataisiin hyviä tuloksia. Tämä Nordic Dublin Coreksi nimetty projekti kartoittaisi olemassa olevat kuvailujärjestelmät ja rakentaisi konversion pohjoismaisiin MARC:eihin.

Kaupallinen elektroninen julkaiseminen Suomessa

Multimediaohjelmoija Sami Sahramies, Alexpress Oy:stä, kuvaili elektronisen julkaisemisen vaikeuksia Suomessa ytimekkäästi lauseella: "Suomi on pieni maa, jossa on pienet markkinat." Elektronista julkaisutoimintaa harjoittavat kirja-, sanomalehti-, ja aikakausilehtikustantajat, ohjelmistotalot ja muut mediatalot (radio,TV).

Tällä hetkellä lukijat etsivät elektronisesta julkaisusta lisäarvoa. Nämä tuotteet täydentävät perinteisiä tuotteita.Julkaisut sisältävät dataa,asiaa, viihdettä ja näiden välimuotoja.

Kaupallisuus on jo mukana kuvassa. Esim. Iltalehden online-versio kannattaa itse itsensä mainosten avulla. Rahaa saadaan myös käyttäjämaksuilla, joita voivat olla kertamaksut, aikaperustaiset veloitukset tai käyttöperustaiset veloitukset.

Elektroniset julkaisut ja tietopalveluala

Helsingin yliopiston kirjaston ylikirjastonhoitaja Esko Häkli asetti aluksi haasteen kirjastoille "ovatko kirjastot tarpeellisia tulevaisuuden yhteiskunnassa?" Ja totesi riippuvan kirjastoista itsestään, miten ne kykenevät vastaamaan haasteeseen. Kirjastoissa on tällä hetkellä valmiudet hyödyntää teknistä kehitystä.

Elektronisten julkaisujen yleistymiseen vaikuttavat monet tekijät, joiden kehitystä on vaikea ennustaa. Mitkä julkaisumuodot tulevat pysymään? On sanottu, että CD-ROM-tekniikka tulee väistymään. Saksassa on arvioitu, että vuonna 2000 elektronisessa muodossa on 20 % julkaisuista. Mikä on verkkojulkaisu? Miten eri painokset eroavat? Miten julkaisujen historia pelastetaan? Internetissä valitsevaan kaaokseen on saatava järjestys.

Tiedemaailmassa elektroninen julkaiseminen ei ole vielä saavuttanut riittävää arvostusta. Julkaisujen autentisuuteen ja muuttamattomuuteen liittyvät ongelmat eivät ole ratkenneet. Ratkaisematta ovat myös julkaisujen kontrolloimaton leviäminen ja väärinkäytökset. Tekijänoikeudet ovat hankala asia. Dynaamisten (WWW) julkaisujen rekisteröintiin ja arkistointiin liittyvät kysymykset on ratkaistava.

Hollannissa on meneillään kokeilu, jossa 450 elektronista lehteä arkistoidaan 5 vuoden ajan CD-ROMeille. Tutkijat ovat arvioineet, että kokeilu tulee kohtaamaan teknisiä ongelmia. Tietoa tallennetaan niin valtavasti, että haku arkistoista tulee muodostumaan pullonkaulaksi.

Norjassa elektroniset julkaisut on saatu mukaan vapaakappalelakiin. Kustantajat vastaavat itse aineiston arkistoinnista. Suomessa asiaa tutkitaan. Elektronisella julkaisemisella on edessään pitkä sisäänajovaihe. Kustantajat eivät ole vielä valmiita tekemään sitoumuksia yhteisistä pelisäännöistä. Edellinen Seuraava Ylös