Arbeidsmøte i Oslo, 7. mai 2004

Deltakarar: Odd Einar Haugen (prosjektleiar Menota TVB), Christian-Emil Ore (Enhet for digital dokumentasjon, Universitetet i Oslo) og Erik Simensen (Gammalnorsk ordboksverk, Universitetet i Oslo).

Møtestad: Enhet for digital dokumentasjon, Niels Henrik Abels hus, Blindern, Universitetet i Oslo.

Tidspunkt: kl. 9.00-12.00 og 12.30-13.30. Erik Simensen var med på møtet fram til kl. 12.00.

Referatet er skrive av Odd Einar Haugen.

 

1. Status for kontroll og konvertering av tekstane frå Gammalnorsk ordboksverk

I samsvar med den tilgangsavtalen som er underteikna mellom Gammalnorsk ordboksverk og Menota er arbeidet no godt i gang med å gjere den siste kontrollen av dette store materialet. Grunnlaget for arbeidet er den overføringa frå ordbokssetlar til databaseformat (først HyperCard, seinare FileMaker) som vart gjord i regi av Dokumentasjonsprosjektet på 1990-talet. Den kontrollen som no skal gjerast, rettar seg mot konsistens og nomenklatur i databasen. Konkret arbeider kontrollørane mot ein skjermversjon av databasen, som vist i skjermbilete 1. Databasen kan sorterast etter alle postane, slik at ein kan kontrollere materialet på grunnlag av løpande tekst, på grunnlag av sorterte ordformer, på grunnlag av sorterte grammatiske former, osv. Ved mistanke om feil lemmatisering eller morfologisk analyse blir dette kontrollert mot sjølve teksten, vanlegvis på grunnlag av det tekstomfanget som ligg på den opphavlege ordbokssetelen, som eksemplifisert i skjermbilete 2. Erik Simensen er fagleg ansvarleg for kontrollarbeidet. Det blir dels utført av han sjølv og dels av timelønte assistenter under hans leiing.

Etter at kontrollarbeidet er utført, kan den løpande teksten byggjast opp gjennom ei samanfletting av dei tekststykka som låg på dei opphavlege setlane. Teksten vil bli konvertert til XML etters Menotas standard ("menotisert") på ein slik måte at lemma og grammatisk form blir knytta til kvart enkelt ord på attributtnivå. Christian-Emil Ore er ansvarleg for dette konverteringsarbeidet, og kjem etter planen til å utføre det sjølv.

Status er no slik:

1. Thómass saga erkibyskups: Ferdig kontrollert og klar for konvertering.
2. Strengleikar: Ferdig kontrollert og klar for konvertering.
3. Þiðriks saga af Bern: Ferdig kontrollert og klar for konvertering.
4. Legendariske Óláfs saga helga: Under kontroll av timelønst assistent; vil deretter bli kontrollert av Erik Simensen.
5. Konungs skuggsjá: Under kontroll; Erik Simensen har kontrollert oppslagsorda frå "a" til "ok", ein assistent vil kontrollere resten, under leiing av Erik Simensen.
6. Diploma fram til 1308: Arbeidet er kome i gang, men det vil vere behov for assistanse her. Finansieringa ser ut til å vere sikra, men det er enno ikkje avklart kven som kan gjere det.

Det er håp om at kontroll og konvertering av desse "seks store" kan vere sluttført innan utgangen av 2004.

 

2. Thómass saga : avskrifter og digitalisering av faksimilane

Til liks med dei andre tekstane i ordboksarkivet har ekserperinga av Thómass saga bygd på ei eksisterande utgåve (i dette tilfelle Carl Richard Ungers utgåve frå 1869), som så har vore korrekturlese mot handskriftet av medarbeidarande i ordboksverket. Under denne korrekturlesinga har abbreviaturar vore markerte og interpunksjonen retta opp i samsvar med handskriftet.

Den Arnamanagnænske Samling i København har stilt til disposisjon ei utgåve av Thómass saga ved Margaret Orme (ikkje publisert). Denne har seinare vore korrekturlese mot handskriftet. På møtet vart nokre avsnitt frå dei to tekstene gjennomgått i fellesskap, og ein førebels konklusjon er at det er svært få avvik mellom dei. Skilnaden ligg i at tekstgrunnlaget i Gammalnorsk ordboksverk er noko meir diplomatarisk, ettersom abbreviaturane er avmerkte og person- og stadnamn er attgjevne utan tilføying av stor forbokstav.

Odd Einar Haugen tok på seg å gå gjennom det tilgjengelege materialet (dei 18 første sidene) for å vurdere om førsteinntrykket stemte.

På byrjinga av 1990-talet (truleg i 1992) vart det kjøpt inn dias av heile Thómass saga (Holm perg 17 4to) frå Kungliga Biblioteket i Stockholm. Det var semje om at desse burde skannast inn og gjerast tilgjengelege parallelt med den transkriberte teksten, for eksempel slik at ein kunne lenke frå kvar side av transkripsjonen til den tilsvarande sida i handskriftet, og omvendt. Meir presis lenking er også mogleg, som Christian-Emil Ore har demonstrert tidlegare, men neppe nødvendig i første omgang.

Ettersom handskriftet ligg i Kungliga Biblioteket i Stockholm må prosjektet ta kontakt med ansvarshavande der for å sikre seg at biblioteket ikkje har innvendingar ei slik publisering av faksimilane. Odd Einar Haugen tek denne kontakten, etter at Erik Simensen har lokalisert dias-samlinga.

Når desse spørsmåla er klarlagde, bør utlegginga av Thómass saga ha første prioritet for Menota.

 

3. Elektronisk utgåve av Fritzners ordbok

Fritzners ordbok vart tasta inn på slutten av 1990-talet under leiing av Bjørn Eithun og Christian-Emil Ore, og har vore godt korrekturlese. Arbeidet vart utført som "arbeid for trygd" og vart gjort innanfor ei kostnadsramme på under 200.000 kr. Teksten ligg føre i ein oppmerkt fil som enno ikkje er "menotisert", men som er fullt brukande til søking og bearbeiding. Christian-Emil Ore har no utarbeidd eit utkast til søkjegrensesnitt for Fritzners ordbok, basert på tilsvarande grensesnitt for andre ordboksressursar (m.a. for Norsk ordbok 2014). Dette vart demonstret under møtet, og fungerte glimrande. Det var semje om at denne versjonen kan publiserast på nettet, sjølv om det enno kan gjerast meir med å utvikle søkjerutinane og å gjere det underliggjande databaseformatet meir tilgjengeleg.

Odd Einar Haugen fekk i oppdrag å utarbeide utkast til ei søkjeside i HTML med "bumerke" (logo) for dei samarbeidande instansane, og tekst som presenterer prosjektet og bruksvilkåra for det.

Teksten til tilleggsbandet frå 1972 er også koda, men vil ikkje bli lagt ut før bruken av dette bandet er avklara.

Ordbog over det norrøne prosasprog i København har stilt til disposisjon si lemmaliste, dvs. ei liste over alle oppslagsord (i dei to banda som hittil er komne, "a-bam" og "ban-da", og i dei planlagde banda. Christian-Emil Ore vil kjøre denne lista saman med ordboksartiklane i Fritzner, slik at brukarane lett kan sjå kva for oppslagsord som er komne (og vil kome) til i ONP.

 

4. Lagringsstrategiar

Odd Einar Haugen orienterte kort om eit møte han hadde hatt med tilvekstavdelinga ved Universitetsbiblioteket i Bergen ved Ole Gunnar Evensen og Gaëlle Bozec. UBB er no i ferd med å byggje opp ei teneste for lagring av elektroniske ressursar (tekst, audio, video osv.) innanfor rammene av DSpace, som er utvikla i samarbeid mellom Harvard University (MIT) og Hewlett-Packard. Dette systemet garanterer lagring og framtidig gjenkjenning av dei formata som er aktuelle for Menota, nærmare bestemt XML (for tekstene), PDF (for typograferte versjonar) og JPG (for dei digitaliserte faksimilane). Lagring i DSpace vil bli brukt for Menota handbook, og ser også ut til å vere eit veleigna lagringstilbod for Menota-tekster. Møtet var samd om at lagring fleire stader berre vil vere ein styrke for arkivet, og vere med på å sikre ressursane for framtidig bruk. Odd Einar Haugen fekk i oppdrag å halde kontakten med UBB i denne saka.

 

Frist for merknader til referatet: 20. mai 2004

 


Oppretta 12.05.2004. Sist oppdatert 19.05.2004.