Menota logoMenota logo2 Hovedside
Menota Handbook

Referat fra rådsmøte for Menota, 18.08.2023

Tidspunkt: Islandsk tid: kl. 09:00-12:00. Skandinavisk tid: kl. 11:00-14:00.

Heldigitalt møte på Zoom.

Møtet ble avholdt med disse deltagerne:

- Alex Speed Kjeldsen, Institut for Nordiske Studier og Sprogvidenskab, Københavns Universitet - møteleder
- Nina Stensaker, Institutt for lingvistiske, litterære og estetiske studier, Universitetet i Bergen - referent
- Haraldur Bernharðsson, Íslensku- og menningardeild, Háskóli Íslands
- Odd Einar Haugen, Institutt for lingvistiske, litterære og estetiske studier, Universitetet i Bergen
- Espen Karlsen, Nasjonalbiblioteket, Oslo
- Lasse Mårtensson, Institutionen för nordiska språk, Uppsala universitet
- Beeke Stegmann, Stofnun Árna Magnússonar í íslenskum fræðum, Háskóli Íslands
- Haukur Þorgeirsson, Stofnun Árna Magnússonar í íslenskum fræðum, Háskóli Ísland
- Roger Andersson, Institutionen för svenska och flerspråkighet, Stockholms universitet
- Marco Bianchi, Institutionen för nordiska språk, Uppsala universitet
- Simon Skovgaard Boeck, Det Danske Sprog- og Litteraturselskab, København
- Åslaug Ommundsen, Institutt for lingvistiske, litterære og estetiske studier, Universitetet i Bergen
- Veturliði Óskarsson, Institutionen för nordiska språk, Uppsala universitet
- Tarrin Wills, Ordbog over det norrøne prosasprog, Københavns Universitet
- Paul Meurer, Universitetsbiblioteket i Bergen
- Rune Kyrkjebø, Universitetsbiblioteket i Bergen
- Juliane Marie Therese Tiemann, Universitetsbiblioteket i Bergen
- Katrine Andresen, Institutt for lingvistiske, litterære og estetiske studier, Universitetet i Bergen
- Tonje Helen Johnsen Waldersnes, Institutt for lingvistiske, litterære og estetiske studier, Universitetet i Bergen
- Harald Tveiten, The Script Ad Hoc Group, Unicode Consortium.
- Guðvarður Már Gunnlaugsson, Stofnun Árna Magnússonar í íslenskum fræðum, Reykjavík
- Patrik Granholm, Kungliga biblioteket, Stockholm
- Sara Risberg, Riksarkivet, Stockholm

 

1. Konstituering

Alex Speed Kjeldsen (ASK) ønsket velkommen og ble valgt til møteleder.

Nina Stensaker (NS) ble valgt til referent.

ASK gjennomgikk dagsorden og meldte fra om avbud fra ulike personer på e-post. Deretter ble det gjennomført en kort presentasjonsrunde.

 


2. Godkjennelse av referat

Referatet fra rådsmøtet i Reykjavík, 19. august 2022, har ligget ute på nettsidene siden 22. september 2022:

Referatet ble godkjent uten merknader. Rune Kyrkjebø ble takket for sitt arbeid som referent.

 


3. Menotas fire arkiver

Menota består i dag av fire ulike arkiver og ASK holdt en kort presentasjon om hver av dem:

Hovedarkivet
Består i dag av 85 ulike tekster på til sammen 1 949 944 ord. Tekstene er på et eller flere nivåer (faksimilært, diplomatarisk og normalisert) og en del er fullstendig eller delvis annotert og lemmatisert.

Diplomarkivet
Inneholder i dag alle diplomer på gammelnorsk til og med 1310 samt noen senere diplomer, totalt 163 diplom på til sammen 46 748 ord. De er alle gjengitt på diplomatarisk nivå med helt eller delvis gjennomført lemmatisering og morfologisk annotasjon.

Runearkivet
Består i dag av 100 runeinnskrifter på totalt 1204 ord. Alle innskriftene er gjengitt på både faksimilært nivå (runer), diplomatarisk nivå (translitterasjon) og normalisert nivå. I tillegg finnes det oversettelse til moderne norsk, kommentarer, bilder og avtegninger.

Testarkivet
I utforming likt hovedarkivet. Dette er første nivå og et arbeidsredskap for transkripsjoner som senere skal inn i et av de tre overstående arkivene.

De som har tekster som de ønsker å arbeide videre på kan ta kontakt med Tarrin Wills.

Etter presentasjonen var det en kort diskusjon. TW påpekte behovet for en arkivar i betydningen en person som har ansvar og kontroll på hva som skal komme inn i de ulike arkivene og at diplom- og runearkivet er noe ulik i utforming sammenlignet med hovedarkivet.

OEH: Gav en kort visning av diplomarkivet og påpekte at diplomene på sikt kan komme inn i hovedarkivet, spørsmålet er hvordan man skal utforme dem.

ASK: kommenterte at ansvaret for hvilke tekster som skal komme inn og hvordan er en oppgave for styret.

Haraldur Bernharðson (HB): Stilte spørsmål om person- og stedsnavn er søkbart. OEH svarte at per dags dato er ikke det mulig, men at det vil være av stor interesse for historikere og at disse må knyttes til et slikt arbeid.

Paul Meurer (PM): Informerte om at per dags dato er de fire arkivene i Menota adskilt og således er det ikke mulig å gjøre søk i alle samtidig. Han arbeider nå med en ny versjon hvor det blir mulig. Arbeidet er kommet langt og den nye versjonen har universell utforming og er mer brukervennlig. Det vil også være mulig å vise dependensanalyser for syntaktisk annoterte tekster i den nye versjonen. I dag ligger det tekster i Menota som har full syntaktisk annotasjon.

OEH informerte om at de ulike arkivene gjenspeiler ulike interesser i forskningsfelleskapet. Det er viktig at runeinnskrifter får morfologisk annotasjon.

 


4. Menota Lemmatisation Assistant (MLA)

MLA er et verktøy for annotering og normalisering som har en lang forhistorie, men sommeren 2023 er den blitt utviklet langt videre av Paul Meurer. Utvikling har vært mulig gjennom støtte fra Clarino+ som PM også arbeider for.

Katrine Andresen holdt en fin presentasjon av MLA og noen av dens funksjonaliteter. Det er nå mulig å annotere og normalisere tekster på en svært ergonomisk og effektiv måte kun ved å brukte tastaturet (ingen mus nødvendig).

PM supplerte presentasjonen med at det er mulig å legge til egne normaliseringsregler som er svært presise og fleksible. For eksempel kan en velge egne regler for hele ord (eller for initiale, mediale eller finale deler av ord). Det er også en egen grammatikk som ligger bak den morfologiske annotasjonen og forslagene som kommer opp. For eksempel samsvarsbøyning. Denne grammatikken kan også bygges videre ut gjennom syntaktiske regler.

Juliane Tiemann (JT) spurte om det var noen relasjon mellom MenotaBlitz (Robert Paulsen sitt verktøy for enkel transkripsjon av tekster) og MLA. Er det mulig å koble de to verktøyene sammen?

ASK: Viktig at Menota kan tilby ulike tilganger. Det er opp gjennom årene blitt utviklet mangle ulike løsninger for transkripsjon, annotasjon og lemmatisering av håndskrifter og det er en fordel at det finnes litt «for enhver smak».

HB stilte spørsmål om tekster som allerede er arbeidet litt på, for eksempel, en del av teksten er annotert, kan arbeides videre på i MLA?

PM svarte at Testarkivet skal dekke det formålet, men at det må lages en løsning på hvor tekster skal sendes inn.

TW viste en kort presentasjon av sitt verktøy, Menota Data Service. Det er mange idéer som er lik som MLA og de to verktøyene kan lære av hverandre. Videre stilte TW spørsmål om hvordan en får tilgang til MLA. PM svarte at man må få tilgang og logge seg på via Feide. Akkurat nå er MLA en Beta-versjon og denne skal testes videre av noen få personer. Når denne betatestingen er ferdig vil flere få tilgang.

OEH supplerte med at det som trengs for å få en XML-fil til MLA er at den må være valid og opplastet i Menota (et av arkivene) og alle ord må ha sin egen XML-id. En slik indeksering kan PM hjelpe med. I den videre utviklingen av MLA kan en supplere med regler innenfor Constraint Grammar (no. føringsgrammatikk, sv. restriktionsgrammatik), noe som kan forenkle annotasjonsarbeidet.

Simon Skovgaard Boeck (SSB): Kan MLA hente inn andre ordbøker enn ONP? PM svarte at det er mulig, men de må være i riktig format.

ASK: Kan korpuset som MLA henter forslag fra avgrenses? For eksempel vil danske ordformer bare være unødvendige forslag når en skal arbeide med en gammelnorsk tekst. PM: Ja, det kan avgrenses, men må diskuteres hvordan en skal gjøre det.

 


 

20 minutters pause, 12:30-12:50.

 


5. Menota Handbook

OEH viste raskt hvor rettelser og tilføyelser i håndboken blir lagt til nederst i hvert kapittel. Det er bestemt at alle endringer (rettelser og mindre tilføyelser) i versjon 3 av håndboken tar OEH seg av. Beeke Stegmann (BS) blir redaktør av versjon 4. BS informerte om at arbeidet med versjon 4 vil starte om ca. et år. Versjon 4, slik den nå foreligger, er fremdeles på idéstadiet, selv om kapitlene om koding av diplomer (nå kap. 17) og koding av runeinnskrifter (nå kap. 18) har kommet et godt stykke på vei. Nødvendig med et kapittel om EAE.

BS vil ta kontakt med de som meldte seg på det forrige rådsmøtet når arbeidet skal starte.

ASK informerte om at versjon 3 skal integreres i del 4 når den tid kommer. BS påpekte at det er noen ting som må oppdateres i versjon 3. ASK: Håndboken er essensiell og et svært viktig verktøy. Den beste reklamen vi kan få for Menota.

 


6. Runer i Menota

TW: Misforståelse i innkallingen, TW har ikke så mye med runer i Menotas arkiv å gjøre, men med MUFI. OEH fikk ordet og informerte om et svært vellykket runemøte i Uppsala tidligere i år sammen med Marco Bianchi (MB) som i hovedsak omhandlet runefonter.

For tiden arbeider både MB og OEH på å bygge opp Unicode-kompatible fonter; MB videreutvikler eksisterende runefonter i Uppsala, mens OEH arbeider videre med fonten UNI Runes (som allerede er i bruk i runearkivet). Målet er at fontene skal være koordinerte så langt det er praktisk mulig.

TW sa at det var ulike synspunkt og ufordringer. Hvor mange runetegn som det være? Slike spørsmål er ikke et problem i Menota hvor vi allerede er vant til tre ulike nivå. MUFI må samle flest mulig runer og opprettholder en internasjonal standard.

Det er også flere kulturelle forskjeller mellom håndskriftsfolk og runologer. Teknologisk forskjell i den forstand at mange forskere arbeider med XML og TEI, mens arkeologer og runologer er vant til databaser som enklere kobler sammen ulike ressurser. ASK påpekte at forholdet mellom runer og Menota er en parallell til EAE og Menota. Menota tilbyr noe annet enn tradisjonelle utgaver, men det er ikke konkurrerende systemer, de kan supplere hverandre.

 


7. Forholdet mellom MUFI og Menota

TW: Entiteter må oppdateres. Kort visning av MUFI og hvordan entiteter nå er søkbare, tidligere brukte man en PDF-fil utarbeidet av OEH, men med unntak av de nyeste tilskuddene er de også tilgjengelige gjennom dokumentet MUFI Character Recommendation (hittil i fire versjoner). Styret i Menota kan diskutere entitetene som skal brukes i Menota.

OEH påpekte viktigheten av at det ikke må være konflikt mellom entiteter. Det må være en form for kontroll når det legges til nye. TW informerte om at det ikke var noe problem. OEH sa at fordelen med Menota er at alle tekstene forholder seg til én og samme entitetsliste og denne listen kan utvikles videre gjennom MUFI.

Tidligere har OEH som leder både for Menota og MUFI gjort alt arbeidet med entiteter alene. Det er mye jobb for en person å holde listen oppdatert og samtidig legge til nye entiteter når det trengs. Det beste er om TW har en integrert løsning i MUFI som er både sikker og dynamisk.

 


8. Østnordiske XML-tekster

Det Danske Sprog- og Litteraturselskab har siden 2021 arbeidet med en digital utgivelse av 27 gammeldanske tekster. Simon Skovgaard Boeck holdt en fin presentasjon om dette prosjektet som nå er godt i gang. Utvalget av de 27 tekstene har som mål å gi et mer nyansert bilde av livet i middelalderen og omfatter både verdslige og religiøse tekster. Prosjektet utgir tekstene på tre nivå:
Versjon 1: diplomatarisk nivå.
Versjon 2: lett normalisert nivå.
Oversettelse: oversettelse til moderne dansk.

I tillegg har noen få tekster fått et fjerde nivå:
Neutralisering: full ortografisk normalisering til moderne danske rettskrivingsprinsipper, men hvor eldre morfologiske trekk er beholdt.

Prosjektet er digitalt og det er brukt XML, men per i dag er ikke denne kompatibel med Menotisk XML. ASK sa at det ikke var umulig å få tekstene til Menota, men xml-kodene må da omgjøres. Hvis det skjer kan tekstene få lemmatisering og annotasjon i Menota og det vil øke graden av danske tekster i arkivet.

OEH viste til Paola Peratello sin nylige phd-avhandling om Codex Runicus og utfordringene med å normalisere gammeldansk. Gammeldansk ordbok er bare en «torso».

SSB informerte om at de gjerne vil dele de 27 tekstene med Menota.

 


9. Editiones Arnamagnæanæ Electronicæ (EAE)

TW: Begge de arnamagnæanske miljøer har godkjent og signert på en avtale om organisering. De tre første bindene er i gang og Paola Peratello har ytret ønske om en egen utgave for Codex Runicus. Denne forespørselen skal behandles.

ASK informerte om at det planlegges et møte/seminar i mai/juni 2024 hvor Morkinskinna og Codex Regius av eddadiktene vil presenteres i ferdig form.

 


10. Eventuelt

ASK stilte et åpent spørsmål om neste rådsmøte skal være fysisk eller digitalt? Hvor skal det være og når skal det være?

HB foreslo at møtet kunne legges til det planlagte seminaret i mai/juni hvor EAEs første fullstendige tekster skal presenteres.

BS sa at vi hadde klart møtet fint på tre timer i dag og at digitalt fungerer fint.

ASK sa at det noen ganger kunne være fordel med mer tid, slik at en kunne gå i dybden på ting og få i gang større diskusjoner.

Neste rådsmøtet blir i mai/juni 2024 sammen med EAE sin presentasjon. Møtet blir hybrid; fysisk oppmøte i København og digitalt gjennom zoom.