Referat fra rådsmøte i Menota, Oslo, 27.08.2009

Alle faste representanter i rådet for Menota var innkalt til møtet. Møtet ble holdt i lokalene til Riksarkivet i Oslo. Det ble åpnet kl. 9 og avsluttet kl. 15.

 

Sak 1: Konstituering av møtet

Møtet ble konstituert med følgende deltagere:

Haraldur Bernharðsson (Stofnun Árna Magnússonar í íslenskum fræðum, Reykjavík)
Alex Speed Kjeldsen (Den Arnamagnæanske Samling, Nordisk Forskningsinstitut, Københavns Universitet)
Bjørg Dale Spørck (Nasjonalbiblioteket, Oslo)
Espen Karlsen (Nasjonalbiblioteket, Oslo)
Mette Gismerøy Ekker (Riksarkivet, Oslo)
Tor Ulset (Riksarkivet, Oslo)
Karl G. Johansson (Institutt for lingvistiske og nordiske studier, Universitetet i Oslo)
Merete K. Jørgensen (Det Danske Sprog- og Litteraturselskab, København)
Ebba Hjorth (Det Danske Sprog- og Litteraturselskab, København)
Christian-Emil Ore (Institutt for lingvistiske og nordiske studier, Universitetet i Oslo)
Espen Ore (Institutt for lingvistiske og nordiske studier, Universitetet i Oslo)
Odd Einar Haugen (Institutt for lingvistiske, litterære, og estetiske studier, Universitetet i Bergen)
Anna Wolodarski (Handskriftsenheten, Kungliga biblioteket, Stockholm)
Helle Degnbol (Ordbog over det norrøne prosasprog, Københavns Universitet)

Nasjonalbiblioteket Oslo er tatt opp som nytt medlem i Menota.

Forfall:
Institut for Nordiske Studier og Sprogvidenskab, Københavns Universitet
Det Kongelige Bibliotek, København
Språkbanken, Göteborgs universitet
Svenska fornskriftsällskapet
Svenskt Diplomatarium, Riksarkivet, Stockholm
Institutionen för humaniora, Växjö universitet
Institutionen för nordiska språk, Uppsala universitet

Odd Einar Haugen ble valgt til møteleder, Mette G. Ekker til referent.
Det var ingen merknader til innkalling eller sakliste.

 


Sak 2: Referatsaker

Referatet fra rådsmøtet i Stockholm 29. august 2008 ble godkjent uten endringer.

Referat, Stockholm, 29. august 2008.

 


Sak 3: Statusrapporter

Statusrapportene ble lagt ut på Menotas sider i forkant av møtet, og er gjengitt her. Under møtet ble det gjort en del presiseringer og kommentarer. Disse er gjengitt etter gjennomgangen av hvert enkelt land.

 

Danmark

Rapporter ved Alex S. Kjeldsen, Merete K. Jørgensen, Hanne Ruus og Helle Degnbol.

Fra Den Arnamagnæanske Samling:

ENRICH (European Networking Resources and Information concerning Cultural Heritage) er et projekt finansieret af det europæiske eContent+ program som løber frem til november 2009, og hvis hovedformål er at skabe let samlet adgang til informationer om håndskrifter og gamle trykte bøger i Europa i den såkaldte Manuscriptorium platform. Meningen er at bringe en mængde håndskriftbeskrivelser, -billeder og -tekster på nettet (jf. også beskrivelsen i referatet for sidste årsmøde).

Såvel de to arnamagnæanske søsterinstitutter som Landsbókasafn Íslands er medlemmer af ENRICH, og størstedelen af disse institutioners bidrag til ENRICH udmynter sig ligeledes i hjemmesiden www.handrit.org, der er tænkt som en samlet portal for institutionernes håndskrifter og materiale med relevans for beskrivelsen af disse. På nuværende tidspunkt er der ikke meget at se på www.handrit.org, men inden årets udgang vil meget materiale være tilgængeligt. Vigtige elementer er:

- En samlet katalog over AM-håndskrifterne og håndskrifterne på Landsbókasafn (i november vil materiale svarende til Kålunds kataloger med visse tilføjelser være tilgængeligt, og katalogoplysningerne fra Sagnanet vil ligeledes blive lagt efter at de er blevet konverteret til TEI P5). I København arbejder en videnskabelig assistent (fuldtid) og en studentermedarbejder (deltid) på dette.

- Fælles database (baseret på eXist) og Web infrastruktur. En it-medarbejder, Eric Haswell, arbejder deltid på dette. Som del af denne løsning, der er 100% XML-baseret, vil man finde: -- Database over katalogoplysninger med mulighed for avancerede søgninger, dels på basis af de indtastede katalogoplysninger, dels på basis af filer med mere overordnede oplysninger af eksempelvis historisk og geografisk karakter.

-- Billedmateriale fra de tre institutioner, efterhånden som mere materiale optages/digitaliseres, vil det blive gjort tilgængeligt. En del af dette materiale vil allerede være tilgængeligt i løbet af indeværende år.

-- Transskriptioner af håndskrifter, visse fornaldarsagatekster vil forhåbentlig allerede være tilgængelige mod slutningen af året.

-- Diverse hjælpemidler, fx en web-applikation baseret på Google Earth, der muliggør søgning på alle gårde på Island med særlig markering af gårde, hvortil håndskrifter kan tilknyttes (endnu ikke fuldstændigt implementeret).

Andet bind af Manuscripta Nordica er udkommet. Der er tale om Andrea de Leeuw van Weenens elektroniske (CD-rom) udgave af Alexanders saga (AM 519 a 4°) med tilhørende trykt indledning, udgave på faksimiletrykniveau og fuldstændig indeks over alle ordformer grammatisk og leksikalsk ordnede. På CD-rommen finder man bl.a. håndskriftets tekst på de tre af Menota anbefalde gengivelsesniveauer, "pretty print"-versioner af den diplomatariske og normaliserede tekst i pdf-format (den trykte bog gengiver kun facs-niveauet), latinsk paralleltekst (som der kan hoppes til fra den norrøne tekst) og digitale billeder af håndskriftet. Et javascript sørger for at man ved at holde musemarkøren over et hvilket som helst ord i den norrøne tekst i et "mouse over"-vindue får en angivelse af de øvrige tekstgengivelsesniveauer, lemma og POS. En positiv sideeffekt ved dette arbejde er at AM 519 a 4° allerede er blevet gjort tilgængelig i Menotas tekstarkiv, og noget tilsvarende kan forventes ved kommende udgaver i samme serie.

Som en del af de eksternt finansierede projekter har instituttet ansat to IT-medarbejdere, Eric Haswell og Wolf-Dieter Syring. Den førstnævnte har bl.a. arbejdet på www.handrit.org, mens den sidstnævnte bl.a. har konverteret en række eksisterende tekster til P5. Det drejer sig ikke mindst om en række fornaldarsagatekster (transskriberede og opmærkede af studentermedhjælpere og Matthew J. Driscoll) og Marine Jespersdatters bønnebog (AM 421 12mo, begyndelsen af 1500-tallet -- transskriberet og opmærket af Annemette Hansen som del af et ph.d.-projekt). Wolf-Dieter Syring har desuden lavet et stylesheet til konvertering fra ren TEI P5 til et format som er fuldstændigt kompatibelt med retningslinjerne i The Menota Handbook, og han arbejder på et script som kan konvertere i modsat retning (hvilket er mere kompliceret). Efter korrekturarbejde, som til dels falder ind under rammerne af ENRICH-projektet, vil i hvert fald fornaldarsagateksterne ved hjælp af det omtalte stylesheet kunne konverteres og direkte indgå i Menotas tekstarkiv (foruden at være en del af materialet på www.handrit.org). Én af teksterne, Hrolfs saga kraka i AM 285 4°, vil inden længe kunne overføres til tekstarkivet, og én eller flere af de 6--7 øvrige fornaldarsagatekster vil forhåbentlig ligeledes kunne overføres inden årets udgang eller i begyndelsen af 2010.

Wolf-Dieter Syring har desuden arbejdet en del med løsninger til sammenkædning af billede- og tekstmateriale på basis af XML-opmærket tekstmateriale. Som testmateriale har han bl.a. anvendt Andrea de Leeuw van Weenens transskription af AM 519 a 4° (Alexanders saga), en tekst som allerede findes i Menotas tekstarkiv, og resultatet er meget lovende (det muliggør bl.a. popups af en enkelt relevant linje på håndskriftbilledet svarende til linjen i transskriptionen uden at man behøver tagge billedet eller "klippe" det i stykker). Det synes derfor oplagt at Menota orienterer sig i denne retning, når billedmateriale i fremtiden skal inkorporeres i arkivet.

Som allerede nævnt ved sidste årsmøde er Tereza Vachunová og Silvia Hufnagel ansat som ph.d-stipendiater frem til hhv. begyndelsen og midten af 2011. Begge arbejder med XML-opmærkede transskriptioner af fornaldarsagaer. Særlig kan det bemærkes at Silvia Hufnagel arbejder på en elektronisk udgave af _Sörla saga sterka_ i et TEI P5 kompatibelt format.

Fra første september 2009 tiltræder Maria Arvidsson et treårigt ph.d.-stipendium, hvor hun skal undersøge (østnordiske) samlingshåndskrifter. Det empiriske grundlag er i vid udstrækning materiale som hun har transskriberet i forbindelse med Vadstena-projektet, og som allerede har fundet vej til Menotas tekstarkiv. I løbet af projektet vil disse tekster blive forbedrede og yderligere opmærkede, og de reviderede tekster vil naturligvis igen finde vej til tekstarkivet.

Alex Speed Kjeldsens arbejde med Morkinskinna (GKS 1009 fol) fortsætter, og efter indleveringen af afleveringen (efteråret 2009), vil der kunne arbejdes på en konvertering til et format som er i fuldstændig overensstemmelse med retningslinjerne i seneste version af The Menota Handbook. Tekstmængden er ca. 100.000 ord, alle gengivne på facs-, dipl- og norm-niveau, lemmatiserede og morfosyntaktisk opmærkede.

Instituttet vil fra begyndelsen af 2010 (dvs. efter afslutningen af ENRICH-projektet) bestræbe sig på at gennemgå eksisterende materiale med henblik på konvertering. En del af dette arbejde kan muligvis allerede påbegyndes i efteråret 2009 som del af arbejdet for en praktikant (studerende fra andet universitet).

Ved sidste rådsmøde omtaltes forskningsprojektet Fornaldarsagastudier, hvis ene delformål skulle være udarbejdelse af en model for elektronisk XML-baseret udgivelse af fornaldarsagatekster. Desværre har man ikke fået bevilliget midler til projektet.

 

Fra Det Danske Sprog- og Litteraturselskab:

Det Danske Sprog- og Litteraturselskabs middelalder- og renæssanceprojekter har fået en fælles portal: http://middelalderogrenaessance.dk. Portalen omfatter følgende projekter: Diplomatarium Danicum, Gammeldansk Ordbog, Studér Middelalder på nettet og Renæssancens Sprog i Danmark.

Diplomatarium Danicum. Diplomatarium Danicum har fået nyt design og befinder sig nu i DSL's samlede portal for middelalder- og renæssanceprojekter. I løbet af foråret 2008 er person- og stedregistre til supplementet lagt på siden. Hertil er i foråret d.å. lagt person- og stedregistre til 1401-12 samt sagregister. Arbejdet med 5. række (1413-1450) er kommet godt i gang. Diplomerne skal publiceres løbende, og vi regner med at dette kan ske fra november d.å. Siden nytår 2008 er diplomatariet blevet udvidet med to redaktører, historikeren Anders Leegaard Knudsen og den nordiske filolog Jon Adams. Fra juli d.å. er diplomatariets introduktions- og instruktionstekster blevet oversat til hovedsprogene, hvilket har forøget trafikken på sitet betydeligt.

Gammeldansk Ordbog. Hele Gammeldansk Ordbogs seddelsamling er ved udgangen af 2008 digitaliseret; alle sedler forefindes dels som billedfil, dels som tekstfil, idet billedfilerne er OCR-tolket. Filerne er importeret i en database og vil blive søgbare på en hjemmeside i DSL's nye design. På hjemmesiden vil man kunne søge på opslagsord, idet de elektroniske sedler alle er identificeret med evt. homografnummer, lemma og ordklasse. Men det bliver også muligt at raffinere søgningerne med fx kilde, kronologi og emneområde som søgeparametre. Beskrivelser af samtlige gammeldanske kilder bliver også tilgængelige fra hjemmesiden. Det er planlagt at præsentere den færdige hjemmeside i slutningen af dette år. Redigeringsarbejdet fortsætter, idet der indsættes links til billedfiler i stedet for indskrivning af citater. Det er tanken løbende at publicere artikleren på nettet, men der er endnu ikke udarbejdet et site til præsentation.

Studér Middelalder på nettet. Projektet er afsluttet, men enkelte af teksterne er endnu ikke tilgængelige på hjemmesiden. Det er imidlertid planen, at den færdige hjemmeside skal præsenteres for offentligheden sammen med Gammeldansk Ordbogs digitaliserede seddelsamling.

Renæssancens Sprog i Danmark. Projektet er nu afsluttet, og resultatet foreligger i form af hjemmesiden renaessancesprog.dk. Siden indeholder: 1. En ordbogbase omfattende 7 forskellige ordbøger mellem dansk og latin fra 1510 til 1626. Ordbøgerne kan anvendes samlet eller hver for sig, og man kan slå op på såvel dansk som latin. Fra en første liste over hits kan man klikke sig videre til de oprindelige ordbogsartikler, enten separat eller i deres kontekst, i tekstformat såvel som faksimile. 2. En tekstbase: et søgbart korpus af danske og latinske tekster fra perioden 1500-1700.

 

Fra Institut for Nordiske Studier og Sprogvidenskab, Københavns Universitet:

DK-CLARIN wp.2.3. Knowledge for everyman 1500-1750, Institut for Nordiske Studier og Sprogvidenskab, Københavns Universitet

DK-CLARIN (http://dkclarin.ku.dk/) er et konsortium som har en løbetid fra januar 2008 til udgangen af 2010. DK-CLARIN-konsortiet skal opbygge en humanistisk, dansk forskningsinfrastruktur med skrevne og talte tekster samt visuelle data til brug for forskere.

Projektet Knowledge for everyman 1500-1750 udgør DK-CLARIN-arbejdspakke 2.3. På baggrund af DUDS’ (Digitale Undersøgelser af Dansk Sprog, se http://duds.nordisk.ku.dk) erfaringer med indsamling og udforskning af tekster bidrages til infrastrukturen ved at opbygge og annotere et korpus på 250.000 ord sammensat af sagtekster på ældre dansk fra perioden 1500 til 1750 for det almindelige publikum. Sagteksterne indsamles, registreres og annoteres efter materialfilologiske principper. Teksterne xml-mærkes i TEI-kompatibelt format.

Arbejdet inddeles i fire faser som har følgende milepæle:

- Efter 9 mdr.: Specifikation af korpus og værktøjer. Pilottekster skannes og digitaliseres.

- Efter 18 mdr.: Specifikation af tekstlig indholdsstruktur. Digitaliseret tekstkorpus igangsat. Annoterings- og søgeværktøj.

- Efter 28 mdr.: Korpus digitaliseret. Relevante dele af udvalgte tekster forsynet med leksikalsk flerniveaupræsentation. Tekstkorpus testet på brugerpanel.

- Efter 36 mdr.: Færdigudviklet tekstkorpus. Udbygget flerniveaurepræsenteret tekstkorpus. Annoteret korpus og søgeværktøj tilgængelige.

Projektets medarbejdere er Hanne Ruus, professor dr.phil. (projektleder, medlem af DK-CLARIN styregruppe), Dorthe Duncker, lektor ph.d. (tekst-teknisk projektleder), Vibeke Arendse Pedersen, lektor ph.d. (etablering af tekstkorpus), Louise Lau Pedersen (Projektkoordinator) og en række studentermedarbejdere. Desuden har man som eksterne eksperter tilknyttet Karen Skovgaard-Pedersen, Projektleder på Det Danske Sprog- og Litteraturselskab, Thorkil Damsgaard Olsen, Rektors kommitterede for biblioteker og studiemiljø, Københavns Universitet, og Anne Mette Hansen, Adjunkt Ph.d., Nordisk Forskningsinstitut, Københavns Universitet.

 

Fra Ordbog over det norrøne prosasprog:

Ordbog over det norrøne prosasprog (ONP) befinder sig ved slutningen af det treårige digitaliseringsprojekt (1. september 2009).

Indskanningen af citatsedler (begyndende med h, idet a–g allerede foreligger indtastet) er afsluttet.

Assistenter har i databasen konverteret sedlernes evt. forældede eller fejlagtige henvisninger til korrekte henvisninger til de nu af ONP benyttede udgaver, hvilket har indebåret relokering af ca. 1/3 af seddelmaterialet. En del citater foreligger både i indtastet form og som fotoseddel, og den type citatposter er samordnet. Af tekniske grunde er dobbeltposter endnu ikke udryddet. Det bør overvejes at fjerne potentielt vildledende fotosedler fra brugernes øjne.

Redaktørerne har set til, at der er overensstemmelse mellem ordliste og citater, og har foretaget en vis omorganisering med henblik på koherens inden for hele materialet. Ordlisten, der er dynamisk, justeres fortsat løbende.

Arbejdet med materialet kalder spørgsmål frem, der ikke alle kan besvares under denne summariske gennemgang. En nyttig proces kan iagttages, når forskere på basis af ordlisten henvender sig med spørgsmål, der trænger til afklaring. Det bliver spændende, i hvilken grad og hvordan det frugtbare samarbejde udvikler sig efter publicering af citatmaterialet.

Sideformer er så vidt muligt noteret, men noteringen må betragtes som foreløbig, nærmere beslutning om kan ikke træffes uden nærmere (især) håndskriftkendskab og undersøgelser, og de kan ikke træffes sikkert eller endegyldigt på basis af materialet, som det foreligger.

Materialet bør differentieres med henblik på sortering og udnyttelse, således at man fx. ved den enkelte citatpost ikke blot har oplysning om håndskrifts alder og proveniens, men også om den tilgrundliggende udgaves normaliseringsgrad.

Materialet lider, med henblik på generel leksikografisk udnyttelse, men også mere specifikt med henblik på bestemmelse af ordformer, under manglende supplering fra tidligere ordbogsværker, en bekendt mangel, som vi håber at kunne indhente snarest muligt.

Selvsagt vil ONP’s materiale blive mere brugbart og beslutninger om ordenes former (mv.) vil kunne træffes på et langt bedre grundlag med den tilgang til elektroniske tekster og tekstkorpora, som så småt haves allerede og som kan tænkes udnyttet på mange forskellige måder i fremtiden.

Ordforråd, der falder uden for ONP's korpus, men som er repræsenteret i ordbøger og glossarer og tildels på ordbogssedler, er summarisk ordnet.

Et system til visning på skærm af ord/citat og tilsvarende skannet tekstside i udgave er ved at få en passende brugerflade.

De fleste tekster er skannet eller stillet til rådighed for ONP af andre instanser, fra Saganet og Universitetsbiblioteket i Oslo for eksempel. Teksterne stilles til rådighed til intern brug ved ordbogsprojektet i deres helhed.

I forbindelse med visning af skannede sider af udgivne tekster føres der positive forhandlinger med den danske statslige ophavsretsinstitution Copydan : Tekst & Node og også med Forlæggerforeningen. Forhandlingerne vedrører værker, som er så "unge", at de stadigvæk er behæftet med ophavsretsklausuler. Vi håber at kunne forelægge resultaterne af disse forhandlinger, når en såkaldt aftalelicens er godkendt i Kulturministeriet. Det forventes, at det for de ophavsretligt beskyttede værkers vedkommende desværre ikke vil være muligt for netbrugeren at linke til flere end tre sider af en udgave i tilknytning til hver fremvist citatseddel (den pågældende side, den foregående og den efterfølgende). Ophavsretlige problemer ang. netpræsentation af selve ordbogens seddelmateriale løses ligeledes for nærværende. Efter afklaring og løsning af disse problemer kan materialet præsenteres på nettet.

Teksterne bliver ikke i denne omgang OCR-behandlet, dvs. konverteret til ægte elektronisk tekst, men OCR-behandling af det fotografisk skannede materiale er det logiske næste trin på vejen.

Til brug for Menota kan ONP's oversigt inkl. bibliografi over norrøne tekster, læst efter udgaver eller håndskrifter (såvel middelalderlige tekster som eftermiddelalderlige tekster repræsenterende middelalderværkerne) tænkes kompletteret mht. eksistensen af elektroniske norrøne tekster (af forskellig standard), en idé, der allerede er fremsat ved tidligere Menota-møder og som ONP er positiv overfor. Der arbejdes i øvrigt, i forb. m. projektet Enrich, med en sammenlægning (med tilhørende udveksling af bibliografiske data) af bibliografien ved ONP og de to arnamagnæanske håndskriftinstitutter (Kbh. og Rvk.).

Alle, inkl. ordbogens medarbejdere, ser frem til at have nem adgang til det nu digitaliserede materiale og til at kunne benytte det nye værktøj, som hele tiden vil kunne videreudvikles og få tilkoblet mere materiale. Brugere (på islandsk grund og internationalt) har fremsat og fremsætter fortsat klare ønsker om mindst mulig afbrydelse af selve redigeringsvirksomheden ved ordbogen, og mange har også udtrykt ønsket om fortsat at kunne købe ONP i bogform; spørgsmålet om elektronisk form vs. papirform bør dog ikke betragtes som et problem i sig selv, da databasen i lige høj grad lægger op til begge slags præsentation; udgifter til trykning og indbinding er minimale; bogform repræsenterer en vis sikkerhed.

Vigtigt er spørgsmålet om redigering. Redaktionen havde håbet pr. 1. september 2009 at kunne genoptage semantisk/syntaktisk redigering af ordstoffet på en rationel måde og i et omfang, der sikrer fortsat faglig kvalitet og videregivelse af håndværk og værktøj til kommende medarbejdere, men de planer, der for tiden skitseres, peger i en anden retning.

 

Tilføyelser under møtet:

Annet bind av Manuscripta Nordica, Alexanders saga (AM 519 a 4˚): Alexanders saga ble publisert i Menota før den kom ut i Manuscripta Nordica. Dette ble klarert med forlaget på forhånd og var uproblematisk da det dreide seg om ulike publikasjonskanaler.

Diplomatarium Danicum: Det foreligger ingen planer om å utgi DD på papir igjen.

ONP: Man hadde håpet å kunne gjenoppta det egentlige ordbogsarbeidet med rasjonell og faglig forsvarlig redigering pr. 1. september 2009, men de planer som foreligger, peker i retning av en grovere og hurtigere strukturering av utvalgte deler av ordstoffet. Tidsrammen er anslagsvis 6 år.

 

Island

Rapport ved Guðvarður Már Gunnlaugsson.

Fra Stofnun Árna Magnússonar í íslenskum fræðum.

1. ENRICH (European Networking Resources and Information Concerning Cultural Heritage). Projektet ENRICH (for håndskriftkatalogisering og -digitalisering) – som Stofnun Árna Magnússonar í íslenskum fræ›um, Landsbókasafn Íslands - Háskólabókasafn og Den Arnamagnæanske Samling deltager i – er et projekt finansieret af det europæiske eContent+ program (se nærmere referatet fra sidste års møde i Stockholm). Projektet startede 1. december 2007 og skal løbe frem til november 2009. I november vil instituttet have lagt frem elektronisk katalog over mere end 400 håndskrifter og digitaliserede billeder af omkring 50.000 håndskriftsider. Nationalbiblioteket vil lægge frem elektronisk katalog over 632 håndskrifter som har været overført fra Marc-format (Saganet) til XML-format og digitaliserede billeder af omkring 220.000 håndskriftsider.

2. Codex Regius af den ældre Edda. Projektet omkring Codex Regius af den ældre Edda er nu næsten færdigt, og det skal afsluttes nu til efteråret. I første omgang vil der være udgiven en CD (eller DVD), men forhåbentlig vil man, når de økonomiske omstændigheder bliver bedre, kunne trykke en del af materialet på CD/DVD og gøre den lemmatiserede konkordance tilgængelig på Internettet.

3. Projekt: Metrik, grammatik, syntaks og pragmatik í poesi-tekster. Projektledelse: Þórhallur Eyþórsson, Kristján Árnason, Bjarki M. Karlsson. Poesi-tekster bliver indlæst til en database hvor adskillige metriske, gammatiske, syntaktiske og pragmatiske oplysninger bliver annoteret. Det er også muligt at indlæse en del av disse oplysninger fra eksterne resourcer. Det er blevet udført i tilfælde av eddadigterne fra Codex Regius, hvor XML-baserede oplysninger fra Guðvarður Már Gunnlaugsson's og Haraldur Bernharðsson's edda-projekt indlæses. Her arbejder man videre med disse oplysninger og markerer bl.a.:

- alliteration
- stavelser
- tryk
- syntaks (Dependency Grammar Annotation)
- semantiske/pragmatiske oplysninger

I andre typer av poesi (ikke eddadigter) markeres der også bl.a. rim og kenninger.

Projektet's output kommer til med at bestå av:
1) tekst med gengivelse av den foreliggende annotation, bl.a. syntaks-træer
2) søgemuligheder
3) XML

Det er output-type 3) som er av fælles interesse med Menota. Eftersom vi allerede har indlæst Menota-basered XML-oplysnginger om eddadigter er vi interesserede i at kunne udlevere viserne igen på XML som inheholder både de allerede markerede oplysninger og den nye annotation fra os - og det vil vi gerne gøre under Menota's beskrivelse. På den anden side dækker MENOTA-håndbogen ikke alt det som vi vil beskrive - og i andre tilfælde kan der være sporgsmål om hvordan man bedst udfører markeringen.

4. Andre tekster. I fire tilfælder har man kodet tekster som meningen er at lægges ind i Menota når de bliver færdige i løbet af næste måneder: sagahåndskriftet AM 557 4to i sin helhed (Lasse Mårtensson), homiliefragmentet AM 237 a fol (Haraldur Bernharðsson), Margrétar saga håndskriftet AM 433 d 12mo (Ludger Zeevaert) og Margrétar saga fragmentet AM 667 I 4to (Alex Speed Kjeldsen).

5. XML-kursus. I februar afholdt instituttet et kursus i XML for sine medarbejdere og andre. Undervisere var Matthew J. Driscoll og Haraldur Bernharðsson.

 

Tilføyelser under møtet:

Den kommende utgaven av Codex Regius blir kun CD/DVD, ikke papirutgave.

For tekster som er under arbeid, var følgende ikke kommet med i statusrapporten: AM 652 4to, Postula sögur, ved den finske studenten Ulla Eevastiina Korri.

 

Norge

Rapporter ved Christian-Emil Ore, Karl G. Johansson, Tor Ulset og Odd Einar Haugen.

Fra Enhet for digital dokumentasjon, Universitet i Oslo:

1 Norrøn metaordbok. Norrøn metaordbok er et større prosjekt for å lage en felles formtesaurus for å kunne lenke lemmatiserte tekster og ordbøker med ulik normalisering og valg av grunnform. Lenkingen vil være på tre nivåer: 1) felles normalisering 2) lik valg av oppslagsform og grammatisk klassifisering 2) ytterligere sammenslåing av relaterte ordformer. Høsten 2008 ble Fartein Øverland engasjert for å gjennomføre nivå 1 og 2 for J. Fritzners ordbok, ONPs ordlise og grunnformslisten fra Gammelnorsk ordboksverk. Normering på nivå 1 ble gjennomført og ligger klart mens nivå 2 er utført for omtrent 50% av materialet. Materialet har blitt liggende på grunn av reduksjon i bevilgningene etter at EDD ble en del av det større Institutt for lingvistiske og nordiske studier.

2 Þiðriks saga af Bern, Holm perg 4 fol. Dette er en av de to større tekstene fra Gammelnorsk ordboksarkivs samling som ennå ikke er ferdigstilt som lemmatisert og morfosyntaktisk kodet tekst på Menotas diplomatariske nivå. Den elektroniske teksten baserer seg på Henrik Bertelsens utgave fra 1905 – 11, lest og korrigert mot faksimiler av manuskriptet. Utgaven er supplert med tekst fra papirhåndskriftene AM177fol og AM178fol. Den elektronisk er korrekturlest og klar. Dette ble gjort i 2007- 2009 av Karoline Kjesrud. Gjenstående arbeid er på fjerne/markere supplerende tekst og å flette elektronisk tekst og ordopplysningene. Etter planen skal teksten ferdigstilles i 2009.

3 Gammelnorsk homiliebok, AM619 quarto. Denne teksten inngår ikke i Gammelnorsk ordboksverks samling og er hverken lemmatisert eller morfosyntaktisk analysert ut over det som er gjort av Anne Holtsmark i forbindelse med hennes bok ”Ordforrådet i de eldste norske håndskrifter”. Den elektroniske teksten baserer seg på Gustav Indrebø utgave fra 1905 – 11, lest og delvis korrigert mot faksimiler av manuskriptet. Utgaven er supplert med tekst fra andre håndskrifter. Det gjenstår å omgruppere teksten tilbake håndskriftens rekkefølge og en del andre småjusteringer. Sluttproduktet vil være en menotisk tekst på diplomatarisk nivå. Arbeidet finansieres av tiltaket Fleksibel læring ved Universitetet i Oslo . Det originale prosjektet innholder en forutsetning om kobling av norrøn tekst mot den moderne norsk oversettelse. Det skal påføres ”allignment”-merker mellom en elektronisk versjon av den moderne teksten og den gallenorske teksten på s-unitnivå i den moderne teksten. Prosjektet skal være avsluttet ved utgangen av 2009.

4 Søknad om korpusoppbygging. Det ble utarbeidet detaljerte planer for et gammelnorsk tekstkorpus, Menotec, på om lag 1,5 millioner ord hvorav 1 million skal lemmatiseres og 0,5 millioner skal merkes syntaktisk og inngå i en trebank. Søknad har blitt sendt til Norges Forskningsråds infrastrukturprogram, men var ikke blant de 5 prioriterte prosjektene fra Universitetet i Oslos side og blir vel derfor neppe støttet.

 

Fra Institutt for lingvistiske og nordiske studier, Universitetet i Oslo:

Ved ILN har man det siste året blitt gjennomført transkribering av ytterligere ett håndskrift av Magnus lagaböters landslov etter at arbeidet med Holm Perg 34 4to ble avsluttet. Anna Catharina Horn har transkribert og kodet på faksimilær nivå håndskriftet AM 305 fol. Begge transkripsjonene er på det nærmeste klare for publisering i Menota.

Karoline Kjesrud er ferdig med korrekturlesningen av Þiðriks saga af Bern, blant annet mot Holm Perg 4 fol. Jf. pkt. 2 ovenfor.

Det ble sendt en større prosjektsøknad til NFR om et mellomnorsk prosjekt, der man bl.a. ville transkribere en rekke diplomtekster og også noen lovhåndskrifter. Prosjektet fikk god omtale, men nådde desverre ikke helt opp i konkurransen. Dette prosjektet sprang ut av et samarbeid mellom flere av de norske universitetene.

 

Fra Riksarkivet:

Reidar Astås' Stjórn-utgave vil sannsynligvis bli trykket i løpet av september 2009. Det blir to bind på til sammen ca 1460 sider.

Regesta Norvegica bd. IX vil være klar i løpet av høsten, men trykningen avhenger av hvor mye det er tilbake av trykningsmidlene da.

Siste hånd blir nå lagt på Diplomatarium Norvegicum bd. XXIII. Vår nye medarbeider Jo Rune Ugulen er neste ferdig med å kollasjonere teksten. Vi regner med utgivelse i løpet av neste år.

Fragmentkatalogiseringsprosjektet i Riksarkivet: Samarbeidet med NTNU, representert ved Espen Karlsen (nå ansatt ved Nasjonalbiblioteket, der han bl.a. er ansvarlig for katalogiseringen av museets fragmentbestand) ble avsluttet for et par år siden. Men vi holder kontakten og opprettholder et visst samarbeid. Etter et par års avbrudd fortsettes nå katalogiseringen i Riksarkivet av Gunnar Pettersen, og status er at av de anslagsvis 6000 fragmentene her er det nå registrert i overkant av 1300. Det registreres fortsatt i databasen vi fikk fra Riksarkivet i Stockholm, som de selv har brukt i MPO-prosjektet, og som også Espen Karlsen bruker i Nasjonalbibliotekets prosjekt.

 

Fra Institutt for lingvistiske, litterære og estetsiske studier (LLE) og Avdeling for kultur, språk og informasjonsteknologi (Aksis), Universitetet i Bergen:

Fem nye tekster er lagt til arkivet, på grunnlag av transkripsjoner fra medarbeidere i Oslo, Leiden, Greifswald og London. Validering og konsistenskontroll har vært utført i Bergen, og de inngår nå som søkbare tekster i Menota. To av tekstene er lemmatisert og morfologisk annotert. Se nærmere oversikt her: Fem nye tekster i arkivet.

MUFI character recommendation v. 3.0, redigert av Odd Einar Haugen, ble publisert 5. juli i år. Den er delt i to, en alfabetisk oversikt og en oversikt ordnet etter kodetabellene i Unicode. Totalt inneholder denne versjonen 1548 tegn. Nedlasting fra denne adressen: MUFI character recommendation.

Andron Scriptor Web ved Andreas Stötzner er publisert i en versjon kompatibel med MUFI v. 3.0. Arbeidet med fontutviklingen er finansiert av Universitetet i Bergen. Fonten kan lastes ned fra denne adressen: MUFI fonts.

Det er gjennomført en rekke mindre justeringer av grensesnittet i Menotas tekstarkiv ved Paul Meurer og Sindre Sørensen. Særlig er det verdt å merke seg at man nå kan generere PDF direkte fra hvilken som helst side i arkivet. Se mer her: PDF av tekster i arkivet.

Tone Merete Bruvik og Odd Einar Haugen har publisert to hjelpesider. Den ene gir utkast til svar på kodingsspørsmål, Encoding questions, mens den andre (som er under oppbygging) gir råd om hvordan man går fram for å konvertere en tekst til menotisk XML, Making a text Menotic.

Ingvil Brügger Budal arbeider med en utgave av Elis saga fra håndskriftet DG 4-7. Hun bygger på en tekst fra Gammelnorsk Ordboksverk, men kontrollerer denne mot håndskriftet og legger inn koding for dokumentstruktur.

 

Tilføyelser under møtet:

ILN har en søknad inne til behandling hos Norges Forskningsråd for prosjektet "Magnus Lagabøtes landslov - ei tekstkritisk undersøking" hvor Magnus Rindal er ansvarlig. Prosjektet innebærer transkribering av landslovshåndskrift fra 1300-tallet.

Søknaden om korpusoppbygging, Menotec, har gått videre til trinn 2 i NFR. Endelig avgjørelse ventes ved årsskiftet.

Gammelnorsk homiliebok: Det skal lages en kobling mellom norrøn tekst og norsk oversettelse på setningsnivå. Her kan det trekkes paralleller til pågående arbeid i København med sammenkobling av tekst og bilde. Til tross for at det finnes kurante teknikker og metoder, har det ikke vært utført mye av denne typen arbeid innen Menota. Man oppfordret Homiliebokprosjektet til å rapportere tilbake til Menota med en anbefaling til framgangsmåte for alignment av tekst og oversettelse slik at dette kan bli et supplement til håndboken.

Andron Scriptor Web, utviklet av Andreas Stötzner, er kompatibel med MUFI v. 3.0. Alex Speed Kjeldsen og Florian Grammel har jevnlig kontakt med Stötzner. Dersom noen har ønsker om nye tegn i Andronfonten, kan ønskene sendes til Kjeldsen som vil videreformidle dem til Stötzner.

Junicode-fonten, utviklet av Peter Baker, er nå tilnærmet MUFI 3.0 kompatibel i alle 4 stiler. Dette er en freewarefont som kan lastes ned fra MUFI font page.

Odd Einar Haugen etterlyste en fontdesigner til å lage en sans seriff font. Ulike fonttyper ble diskutert. Med tanke på konkordanser var det behov for en monospaced font. Oppfordring: Dersom noen vet om en god fontdesigner, ta kontakt med Odd Einar Haugen.

 

Sverige

Rapporter fra Lars-Erik Edlund, Per-Axel Wiktorsson, Roger Andersson og Karl G. Johansson.

Fra Svenska Fornskriftsällskapet:

Bland utgivningsplanerna finns:

1) Sällskapets historik 1943-1993.

2) Fornsvenska legendariet, häfte 2 (forts. på häfte 1 av Valter Jansson).

3) Utgivningen av tre manuskript om teckenanvändning i Vadstena kloster.

 

Fra Svenskt Diplomatarium:

När det gäller verksamheten vid Diplomatariet ber vi att få återkomma med en fylligare rapport vid nästa årsmöte. Inte mycket har förändrats sedan sist. Det viktigaste är kanske att fil. dr Sara Risberg nu (fr.o.m. 1 januari 2009) fått fast anställning som IT-redaktör med speciell uppgift att utveckla vårt digitala register (huvudkartoteket 'SDHK') och förbereda för en mer professionell digital textutgivning parallellt med de tryckta häftena.

 

Fra Institutionen för nordiska språk, Universitetet i Uppsala:

Lasse Mårtensson har fullført transkripsjonen av det håndskriftet som lå til grunn for hans doktoravhandling, AM 557 4to, og denne er konvertert til menotisk XML i Oslo av Christian-Emil Ore; teksten er snart klar til publisering (se også pkt. 4 under Island ovenfor). Lasse Mårtensson er nå godt i gang med transkripsjonen av DG 11, den såkalte Uppsala-Eddaen.

 

Tilføyelser under møtet:

Lasse Mårtenssons transkripsjon av AM 557 4to består av fragmenterte tekster og passer derfor godt for Menota. Status: Christian-Emil Ore meldte at han har kjørt en testkonvertering av teksten til menotisk xml.

Konvertering av tekster transkribert til andre formål enn publisering i Menota, ble noe diskutert på dette punktet. En slik transkripsjon vil ikke nødvendigvis være i henhold til menotisk standard. Den kan fortsatt konverteres til menotisk format dersom arbeidet er konsistent utført. Informasjon om presisjonsnivå i transkripsjonen kan legges i header hvis ønskelig; den konverterte teksten blir fortsatt en kompatibel menotisk tekst.

 


Sak 4: Normalisering i Menota

For vestnordisk tekst heter det i håndboken at det skal normaliseres i henhold til ONP. Det har vist seg å være enkelte praktiske problemer knyttet til dette, både når det gjelder normalisering på <norm>-nivå og normalisering av lemma.

Man diskuterte behovet for ulike former for normalisering på <norm>-nivå. Ved å normalisere ut fra håndskriftenes interne språkform, blir tekstene vanskeligere tilgjengelig for studenter og andre brukere. Menota vil likevel tillate ulike normaliseringer på <norm>-nivå, særlig med tanke på svenske og danske tekster.

For norrøne teksters vedkommende må disse kunne foreligge i forskellige skikkelser. De må alle kunne konverteres til standardnormalisering, såfremt arbeidet er konsistent utført og beskrivelse foreligger; en redegørelse for prinsippene for en evt. avvikende normalisering er et desideratum.

Det var enighet om at Menota må ha en fast normalisering med entydig lemma. Men det må gå tydeligere fram hva det betyr å følge ONP når man normaliserer. Det ble opprettet en arbeidsgruppe til å jobbe videre med dette spørsmålet. Arbeidsgruppen skal sette opp retningslinjer for normalisering slik at dette kan bli et supplement til håndboken. Første møte i arbeidsgruppen er satt til 19./20. november 2009 i København. Helle Degnbol fikk i oppdrag å organisere arbeidsgruppen og innkalle til første møte.

Man diskuterte videre hvordan en strengere normalisering av lemma skulle tilbakeføres i tekster som allerede er lemmatisert. To mulige løsninger ble skissert.

(1) Man kan vaske eksisterende tekster. Når man har oppnådd enighet om valg av lemma, går man tilbake i allerede lemmatiserte tekster og korrigerer lemma der det er nødvendig.

(2) Man kan akseptere at tekstene har en viss variasjon i lemmatiseringen, og legge et filter over som knytter de ulike lemmaformene sammen.

Flere av møtedeltagerne mente at den første løsningen var for risikabel og arbeidskrevende, og mente det var bedre å bruke et filter i form av en formtesaurus som kan ligge som et metanivå over de lemmatiserte tekstene. Fartein Øverlands formtesaurus fra arbeidet med Norrøn Metaordbok er et godt utgangspunkt til dette filteret. Det trengs imidlertid finansiering til å fullføre listen.

Under diskusjonen kom det fram ønske om endring av brukergrensesnittet ved søk etter lemma eller ordformer i Menotas arkiv. Man vil gjerne få opp en liste med forslag til tilslag etter hvert som man skriver inn søkeordet.

Det ble også foreslått å generere og legge ut lemmaliste for hver enkelt tekst, både for lemma og for <norm>-formen.

 

Tilføyelse til referatet, 30. august 2010:

Arbeidsgruppen bestod av Helle Degnbol (København), leder, Alex S. Kjeldsen (København), Haraldur Bernharðsson (Reykjavík), Chrstian-Emil Ore (Oslo) og Odd Einar Haugen (Bergen). Arbeidsgruppen holdt sitt møte fredag 20. november i Den Arnamagnæanske Samling, København.

 


Sak 5: Annotering av tekster

Xml-kodede tekster kan bli svært komplekse og dermed vanskelige å håndtere. En mulig løsning kan være stand-off annotering, dvs. å flytte kodingen ut av teksten. Dette innebærer et radikalt brudd med måten å arbeide på i Menota. Espen S. Ore innledet om stand-off annotering av tekster:

Presentasjon av ekstern koding (odp-format).

Ved stand-off, eller ekstern, koding har man ett datasett, og koding separat i andre, eksterne filer, lenket inn i datasettet. Det kan være et vilkårlig antall eksterne filer som lenker inn i ett datasett, og de samme eksterne filene kan lenke inn i flere datasett. Ut fra disse filene kan det autogenereres én eller flere xml-filer. Det finnes greie redigeringsverktøy for stand-off koding og formidling/framvising av resultatet. Stand-off koding er særlig gunstig der man har flere overlappende hierarkier eller ulike analyser av samme tekst. Forutsetningen for å kunne bruke stand-off annotering er at dataene er persistente og finnes på et fast sted.

Hovedproblemet med stand-off koding i forhold til Menota er at tekstene til nå nettopp ikke har vært persistente. Det ble en del diskusjon rundt dette. I tekstarkivet tas det vare på tidligere versjoner; den eksternkodede filen kunne tenkes knyttet til versjonsnummer i Menota. Eller man kunne etablere en frosset versjon 1.0, med framtidige rettelser som eksternt kodet fil.

Et annet problem i forhold til ekstern koding er at menotiske tekster ikke representerer en lineær tekststreng. Hvis man ekstraherer all koding ved f.eks. rettelser, margtekst, interlineære tillegg, vil man ofte stå igjen med en tekstsekvens som kan være heller meningsløs.

På den annen side innebærer intern koding at materialet må sendes bort for å få utført supplerende koding. Pr. idag har man ikke faste kontrollrutiner i slike situasjoner på at det er de samme data som sendes tilbake.

Møtet kom fram til at Menotas materiale foreløpig ikke var tilstrekkelig persistent til at man kunne gå over til ekstern koding av tekstene. Stand-off annotering vil imidlertid være en mulig løsning dersom filene etterhvert blir enda mer komplekse, og man vil da måtte arbeide videre med persistens-problematikken.

 


Sak 6: Konvertering av eksisterende digitale tekster

Menota må kunne tilby brukerne konverteringsveiledning for tekster i ikke-menotisk format. Det arbeides nå i Bergen med å lage retningslinjer for konvertering. Retningslinjene er under utprøving av Ingvil Brügger Budal på hennes arbeid med Elis saga, en ren Word-fil. Hun tester ut Menotas konverteringsveiledning på denne teksten.

Saken utsettes i påvente av resultatet av testen og videre arbeid med retningslinjene i Bergen.

 


Sak 7: Vilkår for publisering av digitale tekster

Digitale tekstutgaver får ennå ikke den nødvendige akademiske uttelling. Vitenskapelige publikasjoner må hovedsakelig tilfredsstille 2 krav for å få akademisk aksept: de skal være fagfellevurdert og de skal frambringe ny kunnskap. Ifølge vurderende instanser tilfredsstiller menotiske tekstutgaver ikke nødvendigvis disse kravene.

Tradisjonelle tekstutgaver har gjerne en grundig innledning med presentasjon av faglig nyvinning for å tilfredsstille kravet til ny kunnskap. Med korte innledninger i nettutgavene er det vanskeligere å få tilsvarende aksept. Det kan i den forbindelse være aktuelt å få satt opp en form for minstekrav til faglige innledninger.

Foreløpig har man ikke hatt fast kvalitetskontroll av tekstene i arkivet. Det er nødvendig å bygge opp en infrastruktur med fagfellevurdering av de tekster som legges ut. Menotas nettverk består av flere utgiverinstitusjoner og det er derfor i alles interesse at menotisk tekstutgivelse blir ansett på linje med andre vitenskapelige publikasjoner.

Det ble besluttet å opprette en arbeidsgruppe for å arbeide videre med saken. Arbeidsgruppen skal utarbeide et notat som kan sendes til institusjonene med tanke på samarbeid, kvalitetssikring og fagfellevurdering av menotiske publikasjoner. Arbeidsgruppen skal bestå av Haraldur Bernharðsson, Alex Speed Kjeldsen og Odd Einar Haugen. Gruppens første møte er satt til 19./20. november 2009 i København. Opprettelsen av en arbeidsgruppe kan kombineres med at de enkelte medlemmene i Menotas råd kontakter sine egne institusjoner og rapporterer til arbeidsgruppen.

Det ble også argumentert for at kvalitetskravene til publisering ikke måtte være for høye. Menota bør fortsatt oppmuntre studenter o.a. til å levere inn tekster. Når teksten har gjennomgått kvalitetskontroll, kan den merkes ved f.eks. å få et bestemt versjonsnummer, men teksten bør likefullt kunne legges ut før den har nådd dette stadiet.

 


Sak 8: Eventuelt

På forrige rådsmøte ble det foreslått å endre møtefrekvensen til ett møte hvert annet år. Med opprettelsen av to nye arbeidsgrupper synes behovet for årlige møter fortsatt å være til stede.

Neste års møte blir i København. De danske medlemmer kommer tilbake med nærmere angivelse av tid og sted.

 


Vertskapet bød deltakerne på kaffe, kaker og lunsj, og om kvelden spiste man (på egen regning) på en restaurant i Oslo sentrum.

 

Oslo, 09.09.2009
Mette G. Ekker

 

Merknadsfrist: 15.10.2009


Tilbake til hovedsiden

Opprettet 22.09.09. Sist oppdatert 30.08.10. Vevsjef.