Referat fra rådsmøte for Menota, Reykjavík 26.08.2011

Alle faste representanter i rådet for Menota var innkalt til rådsmøte i arkivet.

Møtested: Þjóðarbókhlaða, Landsbókasafn Íslands. Rom: kennslustofa i 4. etasje.

Møtet ble åpnet kl. 09.30 og avsluttet kl. 16.30.

 

1. Konstituering av møtet

Møtet ble konstituert med følgende deltagere:

• Guðvarður Már Gunnlaugsson (Stofnun Árna Magnússonar í íslenskum fræðum)
• Gunnlaugur Ingólfsson (Stofnun Árna Magnússonar í íslenskum fræðum)
• Haraldur Bernharðsson (Stofnun Árna Magnússonar í íslenskum fræðum) (måtte gå kl. 15.00)
• Odd Einar Haugen (Institutt for lingvistiske, litterære, og estetiske studier, Universitetet i Bergen)
• Karl G. Johansson (Institutt for lingvistiske og nordiske studier, Universitetet i Oslo)
• Espen Karlsen (Nasjonalbiblioteket, Oslo)
• Alex Speed Kjeldsen (Den Arnamagnæanske Samling, Nordisk Forskningsinstitut, Københavns Universitet)
• Kristín Bjarnadóttir (Stofnun Árna Magnússonar í íslenskum fræðum)
• Bjørg Dale Spørck (Nasjonalbiblioteket, Oslo)
• Christian-Emil Ore (Institutt for lingvistiske og nordiske studier, Universitetet i Oslo)
• Sigríður Jörundsdóttir (Landsbókasafn Íslands, Reykjavík)
• Jo Rune Ugulen (Riksarkivet, Oslo)
• Örn Hrafnkelsson (Landsbókasafn Íslands, Reykjavík)

Sak 6 ble flyttet foran sak 4. Under denne saken møtte også Eiríkur Rögnvaldsson, Einar Freyr Sigurðsson, Anton Karl Ingason og Joel Wallenberg fra prosjektet "IcePaHC", og Þórhallur Eyþórsson, Kristján; Árnason, Bjarki M. Karlsson, Eiríkur Kristjánsson, Gunnhildur Jónatansdóttir, Sigríður Sæunn Sigurðardóttir og Sigrún Gunnarsdóttir fra prosjektet "Greinir skáldskapar".

Odd Einar Haugen ble valgt til ordstyrer og Haraldur Bernharðsson til referent. Da Haraldur måtte gå kl. 15.00, overtok Odd Einar føringen av referatet

 


2. Referatsaker

Referatet fra rådsmøtet i København 3. september 2010 ble godkjent uten endringer:

 


3. Statusrapport for arkivet

Diskusjon på grunnlag av innsendte rapporter fra hvert av medlemslandene.

 

Danmark

Rapportene fra Danmark er innsamlet av Alex Speed Kjeldsen

(Institut for Nordiske Studier og Sprogvidenskab, Københavns Universitet)

DK-CLARI N Workpackage 2.3: Knowledge for everyman 1500-1750. Leder: professor dr.phil. Hanne Ruus, tekstteknisk ekspert: lektor ph.d. Dorthe Duncker.

Datasamlingen omfatter 49 tekster som kommer til at blive tilgængelige i den humanistiske forskningsinfrastruktur DK-CLARIN ca. 15.sept. 2011.

Alle teksterne vil være visbare med facsimiler af bogsideoriginalerne og parallelt hermed en translitteration, kodet i TEI-kompatibelt format der er fastsat fælles for arbejdspakke 2 i infrastrukturen.

 

Nordisk Forskningsinstitut, Københavns Universitet: Den Arnamagnæanske Samling

Fra den Arnamagnæanske samling skal særlig nævnes aktiviteterne omkring forskningsprojektet "Stories for all time: The Icelandic fornaldarsögur" (se http://am-dk.net/fasnl/). Projektet begyndte 1. marts 2011. Det har modtaget midler til tre år fra Veluxfonden (desuden medfinansierer NFI en del af projektet). Midlerne vil blive brugt over fire år. En ph.d.-studerende vil blive ansat i tre år fra og med 1. oktober 2011, og der vil snarest blive opslået to toårige postdoc-stipendier med formodet ansættelse fra og med 1. jan. 2012 eller snarest derefter.

Projektet satser på at udgive ca. tyve fornaldarsögur i elektronisk form (i overensstemmelse med TEI-P5). Man vil transskribere hele håndskrifter (i alt formentlig omtrent ti), og da visse af håndskrifterne indeholder andre teksttyper, vil det også medføre udgivelse af andet end fornaldarsögur. Man er ved projektet i gang med at udvikle en brugergrænseflade til præsentation af teksterne. En beta-version kan ses på http://am-dk.net/fasnl/dev/texts/hsk/. Ud over udgivelsen af en række elektroniske tekster er en database over hele transskriptionshistorien for de i alt ca. 750 håndskrifter indeholdende fornaldarsögur en hjørnesten i projektet.

Ved den Arnamagnæanske Samling er der endvidere planer om en ny elektronisk serie (muligvis i samarbejde med det islandske søsterinstitut). Der arbejdes på at dette skal ske snarest muligt.

Endelig er instituttet via Matthew Driscoll involveret i en række europæiske projekter/netværk som ligger inden for Menotas interesseområde, bl.a. det fireårige netværk NeDiMAH (Network for Digital Methods in the Arts and Humanities), hvor Matthew Driscoll er formand for en arbejdsgruppe om elektronisk tekstudgivelse.

 

Nordisk Forskningsinstitut, Københavns Universitet: Ordbog over det norrøne prosasprog

Juni 2010 var alle ordbogens ikke redigerede citater (en-ǫ), mest håndskrevne sedler i fotografisk form, tilgængelige på netstedet http://onp.hum.ku.dk. Alle henvisninger til teksterne er opdaterede, så der henvises til de kurante ved ONP benyttede udgaver. Som tidligere beskrevet kan der linkes fra ord til citater og fra citaterne til udvalgte sider i de tilsvarende norrøne tekstudgaver (tekstsamlingen dog ikke komplet), ligesom der kan linkes fra ord til citater/artikler inden for det redigerede materiale (a-em), udgivet i ONP 1-3 (1995-2004). Det hidtil upublicerede citatmateriale er ikke kontrolleret mod udgaverne/håndskrifterne.

ONP's netsted giver fortsat adgang til en række grundlæggende databaser, opdaterede i forhold til ONP : Registre // Indices (1989). Det er hensigten, at registrene skal gøres søgbare og manipulerbare for den internetbruger, der ønsker sig fx. en oversigt over håndskrifter fra en vis periode (af en vis proveniens) eller en oversigt over tekstindholdet (på norrøn prosa!) i det og det håndskrift - med angivelse af tilsvarende steder i udgaver og håndskrifter og med henvisning til den stadig akkumulerende bibliografi.

November 2010 blev de første udkast til artikler (verber og præpositioner, sorteret først og fremmest efter syntaktisk/grammatiske kriterier) tilgængelige; september 2011 ligger samtlige citater til præpositionerne (en-ǫ) og en god del af verberne på nettet, sorteret strukturelt. Endnu en kategori er kommet til: usammensatte substantiver, grovsorteret efter semantiske kriterier af én redaktør på ét metasprog; de første udkast lægges på nettet september 2011, endvidere talrige såkaldte spøgelser inden for alle ordklasser (en-ǫ).

Alt på ONP's netsted er åbent for brugernes kommentarer og kritik. Man kan maile, men først og fremmest er der nu via et ikon (en konvolut) givet mulighed for direkte tilbagemelding til redaktionen ved det enkelte ord, den enkelte definition eller det enkelte citat.

 

Det Danske Sprog og Litteraturselskab (DSL)

Det Danske Sprog- og Litteraturselskabs middelalder- og renæssanceprojekter har en fælles portal: http://middelalderogrenaessance.dk. Portalen omfatter følgende projekter: Diplomatarium Danicum, Gammeldansk Ordbog, Studér Middelalder på nettet og Renæssancens Sprog i Danmark.

Diplomatarium Danicum

Omkring nytår var 225 tekster incl. oversættelse fra perioden 1413-1450 udarbejdet og tilgængelige på projektets hjemmeside http://diplomatarium.dk. Teksterne er vidt forskellige, hvad indhold og længde angår, men dog alle afgrænset af de fire temaer: 1) dansk diplomsprog, 2) social- og retshistorie i forbindelse med periodens centralistiske tendenser, 3) konflikten om Sønderjylland og 4) TEI og netpublicering. I november afholdtes et møde i København imellem de nordiske diplomatarier. Det blev aftalt at holde et sådant møde hvert andet år. DD's ansøgning til Carlsbergfondet for årene 2011-2013 blev desværre kun halvt imødekommet, dvs. at fra og med 1. september 2011 til 31. december 2013 er bemandingen kun to redaktører. Den tematiske arbejdsmåde består dog.

Gammeldansk ordbog

I november blev Gammeldansk Ordbogs seddelsamling (http://gammeldanskordbog.dk) præsenteret. Den digitale version af samlingen er forsynet med en række søgemuligheder. Man kan definere periode, emneområde og kilde(gruppe) efter ønske, og ved at kombinere parametrene opslagsord, kilde, periode og emne er det muligt at foretage ganske komplicerede søgninger. Også søgninger efter kilder kan målrettes perioder og emner. Der arbejdes på at opnå finansiering til en videreudvikling af hjemmesiden, så også redigerede artikler kan tilgås derfra. Artiklerne redigeres faseopdelt; der arbejdes i øjeblikket på at forsyne alle opslagsord med oplysning om tidligste belæg samt en moderne form, der hvor det er muligt. Derved forberedes samlingen til en integrering i DSL's øvrige elektroniske ressourcer.

Studér Middelalder på Nettet

Revisionen af Studér Middelalder på Nettet (http://studermiddelalder.dk) har vist sig at tage længere tid end først antaget. Projektet lægges over i php 4, og teksterne konverteres til et format, der tilnærmelsesvis overholder TEI-standarden. Når omlægningen er tilendebragt, kan en repræsentativ del af den danske middelalders tekster atter studeres. Alle teksterne er forsynede med et tekstkritisk apparat, ligesom de alle har en litteratur- eller kulturhistorisk indledning. Til alle håndskrifter er der udarbejdet en håndskriftbeskrivelse, og til en del af teksterne er også faksimiler af originalerne tilgængelige.

 

Diskusjon om arbeidet i Danmark

Alex Speed Kjeldsen orienterte om integreringen av Ordbog over det norrøne prosasprog i Nordisk forskningsinstitut. Det var også en diskusjon om grensesnittet i ONPs nye nettutgave.

Alex Speed Kjeldsen fortalte videre om forskningsprosjektet “Stories for all time: The Icelandic fornaldarsögur”, som nå er i gang ved Nordisk forskningsinstitut. I dette prosjektet skal omkring tjue fornaldarsagaer utgis i elektronisk form ifølge TEI P5-standarden. Der var diskusjon om TEI P5-standarden vs. Menota-standarden og hvorvidt filer fra den ene standarden kunne konverteres til den andre. Det ser ut til å være lettere å konvertere TEI P5 til Menota enn omvendt.

Planer om en ny elektronisk serie ved den Arnamagnæanske Samling, muligvis i samarbeid med det islandske søsterinstituttet, ble diskutert. En elektronisk serie ville være et stort skritt framover.

Alex Speed Kjeldsen rapporterte at Kirsten Wolfs nye utgave i Manuscripta Nordica, "A female legendary from Iceland. Kirkjubæjarbók – AM 429 12mo in The Arnamagnæan Collection", var nesten ferdig og ville komme ut i bokform og på CD i løpet av de nærmeste ukeme. Det er planer om å avlevere den elektroniske teksten til Menota-arkivet.

 

Island

Stofnun Árna Magnússonar í íslenskum fræðum (rapport ved Guðvarður Már Gunnlaugsson)

1. Projektet www.handrit.is (et samarbejde mellem Landsbókasafn Íslands – Háskólabókasafn, Den Arnamagnæanske Samling og Stofnun Árna Magnússonar í íslenskum fræðum)

Efter afslutningen af ENRICH-projektet, som var af stor betydning for tilblivelsen af handrit.is, har arbejdet med den digitale katalogisering og fotografering af håndskrifterne i de tre samlinger fortsat selvom det, på grund af resursemangel, ikke fremskrider med den hastighed som man ville ønske. Antallet katalogiserede håndskrifter er nu oppe i 6.312 og håndskriftsider som kan beskues på Internettet er 311.051.

2. Projekt: Metrik, grammatik, syntaks og pragmatik i poesi-tekster.

Dette projekt var nævnt i sidste års rapport. Eddakvadernes xml-tekst har været indlæst i databasen. I øjeblikket tilføjes andre teksttyper i databasen, dvs. skjaldekvad og rímur.

3. Projekt: Njáls saga

De ældste fragmenterne af Njáls saga skal undersøges og sammenlignes med de ældste intakte håndskrifterne (feks. Gráskinna). Til at få et billede af håndskriftoverleveringen ser man også på håndskrifter og fragmenter fra 1600-tallet. Indtil nu har man indtastet og kodet - ifølge Menota - tre fragmenter og det fjerde er næsten færdigt.

 

Diskusjon om arbeidet i Island

Guðvarður Már Gunnlaugsson rapporterte at den elektroniske utgaven av Codex Regius av Eddadiktene nesten er ferdigstilt og at den elektroniske teksten skal avleveres til Menota-arkivet.

Örn Hrafnkelsson fortalte om planer om å legge til en tekstmodul til håndskriftkatalogen www.handrit.is. Når håndskriftsamlingene i Stofnun Árna Magnússonar, Landsbókasafn og i den Arnamagnæanske samling er fullt katalogiserte, er det planer om å supplere med opplysninger om islandske håndskrifter i andre samlinger. Örn fortalte videre at på nettsiden http://baekur.is/ hos Landsbókasafn Íslands–Háskólabókasafn blir trykte islandske bøker fra før 1870 tilgjengelige i PDF-format. I øyeblikket er det 154 titler på siden.

 

Norge

Menotec-prosjektet, Universitetet i Oslo og Universitetet i Bergen (rapport ved Karl G. Johansson og Odd Einar Haugen)

Siden forrige rådsmøte er en rekke norske lovhåndskrifter transkribert på "facs"-nivå. Anna Horn har gjort en særlig stor innsats med denne transkripsjonen:

Holm perg 30 4to
Holm perg 34 4to
AM 56 4to
AM 60 4to
AM 78 4to
AM 302 fol
AM 305 fol
DG 8 fol

Når det gjelder korrektur, tilføying av "dipl"-nivå og konvertering til XML av de nevnte håndskriftene er situasjonen denne:

1. Holm perg 34 4to är konverterad till "dipl" och levererad till annotering
2. AM 305 fol är korrekturläst och delvis konverterad till "dipl"
3. DG 8 fol är under korrekturläsning av Cecilie Kornsæther
4. AM 302 fol är under stilarksbehandling hos Vemund och kommer att korrekturläsas av Anna Horn

Från 1. september går Anna Horn ner på 50 %. Samma dag går Cecile Kornsæther och Oliver Blomqvist formellt in i projektet med 50% fram till nyår, med möjlig förlängning ytterligare 8 månader under 2012.

AM 114 a fol (En tale...) är färdigtranskriberad och kodad av Maria Bratlie (ca 7.500 ord). Den går nu till vår amerikanske medarbetare Jørgen Sandstedt som kommer att arbeta vidare med filen och kanske rentav kan komma att lemmatisera och morfologiskt koda den

Odd Einar Haugen og Fartein Øverland har arbeidet med retningslinjer for morfologisk og syntaktisk annotasjon av Menotec-materialet på grunnlag av de tilsvarende retningslinjene for PROIEL-prosjektet. Siste versjon av retningslinjene er fra 28. april 2011 (140 sider), og kan lastes ned her: Retningslinjer for annotasjon per 28.04.2011. Under arbeidet med disse retningslinjene har forfatterne hatt god hjelp fra andre deltagere på Menotec-prosjektet, ikke minst Dag T.T. Haug og Hanne M. Eckhoff på PROIEL-prosjektet.

Det er en aktiv postliste for annotasjonsspørsmål, Menotec-annotation. De som er interessert i å delta på lista, kan henvende seg til Odd Einar Haugen.

Under oppbyggingen av annoteringsapplikasjonen ved Universitetet i Oslo har Eszter Horvati lagt ned et stort arbeid. Denne applikajsonen er basert på den tilsvarende applikasjonen for PROIEL-prosjektet, men er tilpasset gammelnorsk materiale og lagt til EDD.

Fartein Th. Øverland (Bergen), Eiríkur Kristjánsson (Reykjavík), Haraldur Bernharðsson (Reykjavík), Kari Kinn (Oslo) og Signe Laake (Oslo) har alle (i ulikt omfang) arbeidet med syntaktisk annotasjon av de to gammelnorske tekstene "Strengleikar" i DG 4-7 og den legendariske "Óláfs saga" i DG 8 II. Denne annotasjonen er nå på det nærmeste ferdig, og omfatter ca. 80.000 ord. I disse to tekstene har man kunnet bygge på den morfologiske annotasjonen utført ved Gammelnorsk Ordboksverk, og dette har spart mye tid for annotatorene, selv om de har måttet kontrollere anntasjonen og i noen tilfeller rettet opp justerte ordklassetildelinger. I august 2011 er en ny tekst lagt ut til annotasjon, Magnus Lagabøtes landslov i Holm perg 34 4to. Denne teksten må annoteres fra grunnen av både morfologisk og syntaktisk. I første omgang skal Fartein Th. Øverland, Eiríkur Kristjánsson og Kari Kinn annotere teksten, men flere vil komme til etter hvert, enten på denne eller andre tekster.

Gammelnorsk homiliebok i AM 619 4to har vært under en lengre konvertering til menotisk XML. Mette Ekker (Riksarkivet, Oslo) har lagt ned et stort arbeid i dette, og våren 2011 har Alex S. Kjeldsen (København) arbeidet videre med konverteringen, og Vemund Olstad (Oslo) med oppdaterng av skjemaene.

Endelig har Fartein Th. Øverland fullført gjennomgangen av diplomtekster fra Gammelnorsk Ordboksverk for perioden 1175-1308 og korrekturlest den morfologiske annotasjonen i disse. Dette er et stort materiale (drøyt 65.000 ord).

 

Riksarkivet, Oslo (rapport ved Jo Rune Ugulen)

Gunnar I. Pettersen arbeider med Regesta Norvegica bd. X, som dekker 1420-åra. Arnhild Aasen arbeider med Regesta Norvegica bd. XI, som dekker 1430-åra. Ingen av desse binda er forventa ferdige på nokre år enno.

Diplomatarium Norvegicum bd. XXIII, ved Tor Ulset, er sendt til ny ombrekking som vi har venta fleire månader på. Håpet er at den kjem i tide til at den kan verta utgjeve i 2011.

Jo Rune Ugulen arbeider parallelt med Diplomatarium Norvegicum XX og XXIV, med ei viss prioritering av bd. XX. Her reknar vi med å ha korpusutvalet til bd. XX klart i løpet av 2012, men det står att fleire rundar med kollasjonering etter det.

Ei ny utgåve av Bergens Kalvskinn, ei jordebok frå Bergen bispedømme i frå første helvta av 1300-talet, er i kjømda. Ole-Jørgen Johannessen har oversendt manuskriptet til Riksarkivet, og arbeidet med eit førsteutkast til register er ferdig. Det kan tenkjast ei ferdigstilling av denne i løpet av 2012, men tidsramma er høgst usikker.

 

Nasjonalbiblioteket, Oslo (rapport ved Espen Karlsen)

Bjørg Dale Spørck arbeider med å gjennomgå de gammelnorske lovhåndskriftene ved NB for i detalj å se hvilke tekster som står i dem. Målet er etter hvert å få disse tekstene digitalisert og noen av dem transkribert. Henens utgave av Axel Charlot Drolsums brev (469 sider) lanseres den 31. august.

Breviarium og Missale Nidrosiense (1519) er nå digitalisert og tilgjengelige på nettet (NB Digital) og via Bibsys.

Språkbanken er nylig etablert ved Nasjonalbiblioteket i Oslo. I denne rapporten vil medarbeiderne ved Språkbanken fokusere på hva banken kan tilby, for Menota og for andre brukere:

"Språkbanken vart etablert i Nasjonalbiblioteket i januar 2010. Det primære målet for Språkbanken er å leggje til rette for språkteknologisk produktutvikling og forsking ved å vere ein infrastruktur som leverer språkteknologiske verktøy og korpus av ulik karakter. Det politiske bakteppet er å oppfylle intensjonane i språkmeldinga (Meld. St. nr. 35 2008–2009 Mål og meining – ein heilskapleg norsk språkpolitikk).

Me ser for oss at Språkbanken òg kan sikre og eventuelt distribuere språkressursar meir generelt; Dette er i tråd med Nasjonalbiblioteket si generelle rolle som bevarar av nasjonal kulturarv og tilretteleggar for forsking og dokumentasjon. Om ønskjeleg, kunne Språkbanken tene som deponeringsstad/sikring for Menota-ressurser.

Språkbanken skal altså primært byggje opp ressursar som representerer moderne norsk, men han skal òg etablere ei samling av verktøy og applikasjonar. Desse kan ha relevans for Menota. Det er òg tenkeleg at Menota rår over verktøy som kan nyttast i relasjon til andre språkformer enn norrønt, og slik høyrer heime i Språkbanken.

Som ein lekk i realiseringa av den norske delen av det europeiske CLARIN-prosjektet – CLARINO – skal Nasjonalbiblioteket levere ei nasjonal løysing for metadata for humanistiske fag, med eit primært fokus på språkressursar. Denne tenesta skal hauste metadata frå ulike nodar (forskingsinstitusjonar) som deltek i CLARINO-nettverket, og utveksle metadata med dei andre CLARIN-nodene i Europa. Menota kan vere interessert i å delta i dette nettverket for å synleggjere ressursane sine for eit breiare europeisk forskarsamfunn. Dette vil òg kunne auke potensialet for at andre forskarar kjem opp med løysingar som kan optimalisere bruken av Menota-tekstarkivet.

Viss de har idear eller tankar om kva rolle Språkbanken kan spele for Menota, ta kontakt med oss: Språkbanken."

 

Diskusjon om arbeidet i Norge

Odd Einar Haugen og Christian-Emil Ore fortalte om Menotec-projektet ved universitetene i Oslo og Bergen. Transkribering av tekster og morfologisk og syntaktisk annotering går godt, men det mangler brukergrensesnitt for å søke i databasen.

Jo Rune Ugulen meddelte at den elektroniske teksten til den nye Stjórn-utgaven av Reidar Astås ved Riksarkivet (2009) er tilgjengelig i TEX-format, men Riksarkivet har ikke midler til å konvertere filen til XML-format.

Odd Einar Haugen fortalte om Språkbankens invitasjon til samarbeid. De norske representantene vil be om et møte med Språkbanken for å diskutere saken.

 

Sverige

Svenska Fornskriftsällskapet (rapport ved Lars-Erik Edlund)

I december 2010 utgavs:

Serie 1. Svenska skrifter
93. Börje Westlund, Svenska fornskriftsällskapet 1944-1993. Historik. 2010.
94. Bengt R. Jonsson, Erikskrönikans diktare. Ett försök till identifiering. 2010.

Under 2011 har hittills följande arbeten nytryckts (i vardera 300 exemplar):

Serie 1. Svenska skrifter
49. Hertig Fredrik av Normandie. Kritisk upplaga på grundval av Codex Verelianus. Utg. av Erik Noreen. 1927.
50. Herr Ivan. Kritisk upplaga. Utg. av Erik Noreen. 1931.
61. Flores och Blanzeflor. Kritisk upplaga. Utg. av Emil Olson. Nytryck (med ett Tillägg). 1956.

Under hösten 2011 planeras följande arbeten utkomma:

Serie 1. Svenska skrifter
95. Bilden av Budde. Studier kring en svensk språkpionjär. Symposiehandlingar utg. av Lars Wollin.

Serie 2. Latinska skrifter
X. Christian Lovén, Handskriften UUB C 92 och källtillgången i Uppsala före 1344 (arbetstitel).

Serie 3. Smärre texter och undersökningar
6. Nyheter från medeltiden (arbetstitel).

 

Uppsala universitet, Institutionen för nordiska språk (rapport ved Lasse Mårtensson)

Vi skall den 1 sept. lämna in en ansökan till Knut och Alice Wallenbergs stiftelse som skall vara ett samarbetsprojekt mellan Inst. för nordiska språk, Inst. för lingvistik och filologi (Datalingvistik i första hand) och Centrum för bildanalys, de två förstnämnda inom Uppsala universitet och den sistnämnda SLU (Sveriges lantbruksuniversitet). Vi har för avsikt att driva ett antal delprojekt som har det gemensamt att de inbegriper bruk av avancerad bildanalys på medeltida handskrifter. Vi har spänt bågen högt; ytterst har vi för avsikt att ta itu med frågan om automatisk transkribering av handskriven text, med början på svenska medeltidshandskrifter. Vi har dock även andra avsikter, t.ex. skrivarattribuering med hjälp av dataprogram som utifrån inmatade grafer från ett manuskript framställer s.k. genomsnittsgrafer, med information om vilken variation som ryms (typ System for Palaeographic Inspection, SPI) och Word Spotting. Vi skall delta med en Word Spotting-artikel, Data Mining Medieval Documents by Word Spotting, vid The First International Workshop on Historical Document Imaging and Processing i Peking (HIP 2011). Förhoppningsvis kommer vi att producera ytterligare två pilotundersökningar i höst.

Vi som huvudsakligen har arbetat med ansökan är jag själv, Mats Dahllöf (Datalingvistik), Anders Brun (Bildanalys) och Fredrik Wahlberg (Bildanalys), och det är också vi som har skrivit artikeln som nämndes ovan. Huvudsökande blir som det ser ut nu Henrik Williams, men det är oklart hur många sökande det skall vara. Vi skulle helst vilja ha in en bildanalytiker också, men det ännu oklart hur många som kommer att stå som sökande.

Projektet har tillkommit som en del i en strategisk satsning inom fakulteten, och vi har också varit avlönade därifrån. Man har velat satsa på en förening mellan humaniora och teknik, och detta blev den större satsningen.

 

Svenskt Diplomatarium (rapport ved Sara Risberg)

Svenskt Diplomatarium håller just på att slutföra manus till DS 11:3 med 1378 års brev. Häftet beräknas komma ut från trycket i november. Ungefär samtidigt kommer brevtexterna finnas tillgängliga i SDHK.

Ingela Hedström vikarierar för Roger Andersson som nordistredaktör sedan 1 januari. Roger är tjänstledig för att förbereda för en kommande nyutgåva av Birgittas uppenbarelser på fornsvenska. Besked om finansiering av detta storprojekt kommer i oktober.

Fotograferingen av originalbrev på pergament är snart färdig. Bilderna kommer att knytas till respektive post i SDHK och bli tillgängliga on-line i samband med att omläggningen till SQL Server blir färdig - förhoppningsvis under hösten. (Fotograferingen kommer sedan att fortsätta med pappersbrev och kopieböcker.)

SDHK finns med i betaversionen av Riksarkivets nya samsöktjänst (Nya NAD): Nationell ArkivDatabas.

Fil.dr Elin Andersson är under 3 månader anställd hos Diplomatariet. Elin disputerade tidigare i år och är specialiserad på medeltidslatin. Hennes uppgift nu är att genomföra en förberedande undersökning av Vatikanmaterial i Riksarkivet. Arbetet finansieras av Riksbankens Jubileumsfond och ska utmynna i en ansökan om ett större forskningsprojekt: "Sverige och Vatikanen under senmedeltid och 1500-tal".

DMS (Det medeltida Sverige) kommer från 1 januari 2012 att knytas till Diplomatariet med tre tjänster. Två postdok-anställningar utlyses nu. Riksbankens jubileumsfond och Vitterhetsakademien finansierar.

En internationell Birgittakonferens arrangeras på Riksarkivet 6-8 oktober. (För anmälan och mer info, mejla birgittaconference@gmail.com)

Svenskt Diplomatarium finns sedan drygt ett år på Facebook: Svenskt diplomatarium.

 


4. Flytting av arkivet

Menota har inntil nå vært lokalisert ved den oppdragsfinansierte avdelingen Aksis i tilknytning til Universitetet i Bergen. Nå er imidlertid Aksis (eller Uni Digital som det heter fra 1. januar 2010) under så stor omlegging at det kan bli aktuelt å flytte arkivet til Oslo. Dette skjer innenfor det nye infrastrukturprosjektet Menotec, som er et samarbeid mellom fagmiljøene i Oslo og Bergen.

Det ble ikke tid til å diskutere denne saken på møtet. Ledelsen i Menota vil orientere rådsmedlemmene etter hvert om hva som skjer.

 


5. Normalisering i Menota

Spørsmålet om normalisering av norrøne tekster ble tatt opp på rådsmøtet i Oslo 27. august 2009 (sak 4), og på nytt på Rådsmøtet i København 3. september 2010 (sak 5). På det siste møtet ble det opprettet en arbeidsgruppe med disse medlemmene:

Alex Speed Kjeldsen (innkallende leder), Helle Degnbol, Haraldur Bernharðsson, og Christian-Emil Ore

Gruppen fikk dette mandatet:

1. utarbeide retningslinjer for normalisering av norrøne tekster
2. utarbeide et forslag til norm for lemma

Alex orienterte om arbeidet i gruppen.

Gruppen ønsker at resultatene av arbeidet skal publiseres i The Menota Handbook (og gjerne i andre sammenhenger). Det vil føre til en utvidelse av kap. 8 i håndboken, særlig kap. 8.6, og et nytt kap. 9 med tittelen "Normalisation". Dette kapitlet skal ha to deler, en innledning om bakgrunnen for normaliseringen, og deretter mer spesifikke anbefalinger. Her må man også ta opp spørmålet om hvordan man normaliserer morfologi, interpunksjon, avsnittsdeling osv. Det skal gies konkrete eksempler, og man skal få en kort presentasjon av normaliseringsreglene til ONP, Íslenzk fornrit, Gammelnorsk Ordboksverk, og dessuten standard innføringsbøker.

Haraldur utarbeider utkast til første del av kap. 9, herunder hvordan man dokumenterer normaliseringsreglene i header av XML-filen.

Alex og Helle Degnbol utarbeider et utkast til andre del av kapitlet. Her vil de diskutere hvor omfattende normaliseringen skal være. Foreløpig tenker man seg en høy grad av fonologisk og ortografisk normalisering, men mindre av morfologisk og syntaktisk art. For eksempel bør man tillate både "ek em" og "ek er". Spørsmålet om sideformer er særskilt vanskelig, og bør føre fram til en tabellarisk oppstilling av ONPs norm i forhold til andre normer.

Gruppen satser på å møtes virtuelt i tiden fremover.

Odd Einar står for det praktiske redaksjonsarbeidet innenfor rammene av det som etter planen skal bli v. 3.0 av The Menota Handbook. Den ligger nå ute i v. 2.0 (16. mai 2008).

 


6. Annotasjon av tekster i Menota

Denne saken ble behandlet før sak 4.

I flere prosjekter i Norge og på Island foregår det nå morfologisk, syntaktisk og metrisk annotasjon av norrøne tekster. Det ble gitt en presentasjon av to pågående islandske prosjekter:

1. "Icelandic Parsed Historical Corpus" (IcePaHC), ledet av Eiríkur Rögnvaldsson og Joel Wallenberg. Prosjektet ble presentert av Einar Freyr Sigurðsson, Anton Karl Ingason og Joel Wallenberg. IcePaHC er et syntaktisk annotert korpus med én million ord fra et utvalg islandske tekster fra 1100-tallet til 2000-tallet. Korpuset er kompatibelt med Penn Historical Corpora, og er basert på en forenklet frasestrukturanalyse. Man har gjennomgående tatt et utdrag på ca. 25.000 ord fra hver tekst eller periode. Den eldste teksten er fra ca. 1150, dvs. Første grammatiske avhandling (overlevert i Codex Wormianus fra ca. 1350), og deretter følger et utvalg helt fram til vår tid. Prosjektlederne mener at man må ha et korpus på rundt 1 million ord for å kunne gi tilstrekkelig sikker kunnskap om språket over en så lang periode.

Annotasjonen har krevd tre årsverk over to år (til sammen seks årsverk), foruten bidrag fra flere assistenter. Tempoet på annotasjonen økte betraktelig under arbeidet, fra rundt 100 ord per time til 500-600 ord per time mot slutten. I tillegg til den syntaktiske annotasjonen blir det også gitt en partiell, men ikke fullstendig morfologisk annotasjon.

Korpuset har allerede dannet grunnlag for en rekke artikler publisert eller under publiseirn i 2011. Hele korpuset vil bli gjort fritt tilgjenglig for forskersamfunnet.

2. "Greinir skáldskapar: Interfaces in meter, phonology and syntax" (se http://brag.fraedi.is), ledet av Þórhallur Eyþórsson. Prosjektperioden er 2009-2011. Greinir skáldskapa er et syntaktisk, morfologisk og metrisk annotert korpus av eddadikt, skaldedikt, rímur og lausavísur. Den syntaktiske annotasjonen er en modifisert form for dependensanalyse, utviklet i PROIEL-prosjektet ved Dag T. Haug m.fl. og videreført i Menotec-prosjektet (for gammelnorske tekster). Av den grunn er det et nært samarbeid med PROIEL og Menotec, og noen av annotatorene har arbeidet på flere av disse prosjektene.

Bjarki M. Karlsson har utviklet et søkegrensesnitt for korpuset med mulighet for framvising av syntaktiske trær. Þorhallur viste hvordan dette kunne brukes i en rekke av kombinerte søk i materialet.

I den påfølgende diskusjonen om begge prosjektene ble det fremhevet at man måtte forsøke å koordinere de to korpusene, inkl. Menotec-korpuset over gammelnorsk, så langt det lar seg gjøre. Det ble videre pekt på behovet for et syntaktisk kapittel i The Menota Handbook. Þorhallur orienterte om at det i nordisk sammenheng ville bli holdt flere møter om syntaktiske korpora, det første allerede høsten 2011 i Reykjavík.

 


7. COST-aksjonen Medieval Europe

Våren 2011 ble det satt i gang en COST-aksjon, "Medieval Europe - Medieval Cultures and Technological Resources", under ledelse av Agostino Paravicini Bagliani (SISMEL: International Society for the Study of Medieval Latin). Denne aksjonen har fire arbeidsgrupper, der Matthew J. Driscoll er oppnevnt som leder av arbeidsgruppe 2 "Manuscripts and textual tradition" (i denne gruppen er bl.a. Svanhildur Óskarsdóttir og Odd Einar Haugen medlemmer), og Christian-Emil Ore er oppnevnt som leder av arbeidsgruppe 4 "VCMS Design".

Nærmere opplysninger om aksjonen finnes på denne nettsiden:

Det ble ikke tid til å diskutere denne saken på møtet. Ledelsen i Menota vil orientere rådsmedlemmene etter hvert om hva som skjer.

 


8. Eventuelt

Neste rådsmøte kan muligens holdes i Stockholm tidlig på høsten 2012, koordinert med et diplomatarie-møte.

 

Det ble arrangert en felles middag på fredags kveld.

 

Reykjavík og Bergen, 20.09.2011
Haraldur Bernharðsson og Odd Einar Haugen


Tilbake til hovedsiden

Opprettet 12.09.2011. Sist oppdatert 20.09.2011. Vevsjef.