Menota logoMenota logo2 Hovedside
Menota Handbook

Referat fra rådsmøte i Menota, Stockholm, 31. august 2013

Møtet ble avholdt i lokalene til Riksarkivet i Stockholm med disse deltakerne.

- Odd Einar Haugen (Institutt for lingvistiske, litterære og estetiske studium, Universitetet i Bergen)
- Jo Rune Ugulen (Riksarkivet, Oslo)
- Guðvarður Már Gunnlaugsson (Stofnun Árna Magnússonar í íslenskum fræðum, Reykjavík)
- Christian-Emil Ore (Eining for Digital Dokumentasjon, Universitetet i Oslo)
- Espen Karlsen (Nasjonalbiblioteket, Oslo)
- Lasse Mårtensson (Avd. för svenska språket, Högskolan i Gävle)
- Thomas Hansen (Dansk diplomatarium, Det danske sprog- og litteraturselskab, København)
- Karl Gunnar Johansson (Institutt for lingvistiske og nordiske studier, Universitetet i Oslo)
- Alex Speed Kjeldsen (Nordisk forskningsinstitut, Københavns universitet)
- Claes Gejrot (Svenskt diplomatarium, Riksarkivet i Stockholm)
- Lars-Erik Edlund (Svenska fornskriftsällskapet og Umeå universitet)
- Anna Wolodarski (Kungliga biblioteket, Stockholm)
- Roger Andersson (Svenskt diplomatarium, Riksarkivet i Stockholm)
- Sara Risberg (Svenskt diplomatarium, Riksarkivet i Stockholm)
- Marco Bianchi (Institutionen för nordiska språk, Uppsala universitet)
- Jan Axelson (Svenskt diplomatarium, Riksarkivet i Stockholm, var med etter lunsj)

Claes Gejrot ønsket velkommen på vegne av Riksarkivet i Stockholm og Svenskt Diplomatarium.

 

Sak 1: Konstituering av mötet

Odd Einar Haugen åpnet møtet og presenterte saklisten. Odd Einar Haugen ble valgt til møteleder. Rune Kyrkjebø ble valgt til referent. Deltakerne presenterte seg

 


Sak 2: Referatsaker

Referat fra rådsmøtet i Reykjavík 26. august 2011 ble godkjent uten videre merknader.

Referat, Reykjavík, 26. august 2011.

 


Sak 3: Styrets sammensetning

Odd Einar Haugen foreslo en gjennomgang og uformell diskusjon av styrets sammensetning. Guðvarður Már antydet, for Island, at Haraldur Bernharðsson kan være aktuell som representant, Guðvarður som suppleant, med tiden. Men det kan ikke avgjøres nå. Alex Speed Kjeldsen fortalte om den danske representasjonen. Det kunne være en fordel at andre miljø var med (f.eks. DSL). Alex vil konferere med kollegene ved de aktuelle instituttene og gi en tilbakemelding. Karl G. Johansson foreslo at Marco Bianchi går inn for Sverige i styret, i stedet for Karl G. Johansson. Marco Bianchi ble valgt inn i styret ved akklamasjon. Roger Andersson ønsket avløsning som suppleant og ville gjerne at en annen går inn i styret. De svenske representantene vil diskutere dette. Haugen tok opp den norske styrerepresentasjonen. Alex Speed Kjeldsen ga uttrykk for ønske om at Odd Einar tar en ny periode, siden det ellers blir noen utskiftinger. Den norske delegasjonen vil snakkes om den norske styrerepresentasjonen. Det ble således gjort ett valg, Marco Bianchi, som blir styremedlem for Sverige. Når det gjelder rådet, vil det bli skrevet til institusjonene med spørsmål om neste 3-års periode.

 


Sak 4: Statusrapporter

Statusrapportene var på forhånd lagt ut på denne lenken:

Det ble lagt opp til kommentarer og spørsmål, ikke hele gjennomganger som før, som gjerne tok mye tid

Kommentar til status for Danmark

Alex Speed Kjeldsen hadde en tilleggsmerknad når det gjelder ONP. Hvordan skal vi fange opp oppdateringer som gjøres av ONP? Hvilket nivå av oppdateringer er relevant for Menota? Christian-Emil Ore sa at det vi trenger er en stabil grunnordsliste med identifikatorer, med homografer på et nivå under dette igjen. Lemma-listen vil på dette nivået trolig være svært stabil. Ore mente at en grunnordsliste må være en egen husholdning, en egen Menota-ordliste som ONP er koblet til. På et tidspunkt må en liste fikseres. Haugen og Ore mente at vi bør sette opp et eget arbeidsseminar om dette, og Alex Speed Kjeldsen ble bedt om å ta med dette som konkret forslag til Nordisk forskningsinstitut. Guðvarður Már uttrykte, som flere var enige i, at ONP på nettet er et fantastisk godt verktøy.

Kommentar til status for Island

Guðvarður Már Gunnlaugsson tilføyde at nettstedet handrit.is nå har registrert rundt 7000 håndskrifter. Det er nettpublisert 330 000 elektroniske sider. Dette arbeidet fortsetter.

Kommentar til status for Norge

Anna Wolodarski spurte om hva digitaliseringen i NBO omfattet. Espen Karlsen svarte at det i første omgang dreier seg om manuskripter i egne samlinger. Det ble en diskusjon om registrering av fragmenter og arbeidet med fragmentsamlinger. Jo Rune Ugulen fortalte at Riksarkivet i Oslo nå skanner latinske fragmenter systematisk. Det var spørsmål om Menotec-leveransen, og hva som kan lastes ned. Ore svarte at intensjonen er at programvaren skal deles, men at det vil kreve noe å få den installert.

Kommentar til status for Sverige

Lasse Mårtensson opplyste at man ikke hadde fått det omsøkte prosjektet fra Wallenberg-stiftelsen. Alex Speed Kjeldsen opplyste om digitalt paleografisk arbeid som Peter Stokes har i gang. Sara Risberg opplyste at Svenskt Diplomatariums hovedkatalog nå er digitalisert. Bilder og katalogposter er koblet sammen. Materialet fram til 1520 (med unntak av 3 tiår) er fotografert. Fragment-databasen i RA skal være online i løpet av et års tid.

Tilføyelse fra Sara Risberg om Svenskt Diplomatarium og Riksarkivet (innsendt 5. september 2013):

I november 2011 utkom häfte 11:3 av Diplomatarium Suecanum innehållande breven från 1378.
Sedan mars 2012 är SDHK (Svenskt Diplomatariums huvudkartotek) en del av NAD (Nationell ArkivDatabas): www.nad.riksarkivet.se/sdhk. Förutom det nya gränssnittet och delvis ny sökteknik är den största nyheten att bilder på originalbrev på pergament i Riksarkivet är kopplade till respektive post. Hittills finns bilder på odaterade brev, brev från den äldsta tiden (1135) t.o.m. 1378, och från 1401-1520.
Arbetet med att tillgängliggöra databasen över de medeltida pergamentsomslagen (MPO) har påbörjats på Riksarkivet. Planen är att databasen ska bli tillgänglig online under nästa år (2013).
Det historiska forskningsprojektet "Det medeltida Sverige" som kartlägger den medeltida bebyggelsen i Sverige är sedan 1 januari 2012 en del av Riksarkivet och Svenskt Diplomatarium.

 


Sak 5: Flytting av det digitale arkivet

Christian-Emil Ore orienterte. Han mente det beste ville være at nettstedet for Menota ikke blir bundet til Bergen eller Oslo (eller Norge), men at det blir et nettsted for hele Menota som sådan. Alex Speed Kjeldsen, Karl G. Johansson og Haraldur Bernharðsson har tilgang som redaktører, og kan legge til nye html-filer. Siste versjon av filer vil regelmessig lastes ut på nettet. Det skal være et system som redaktører i Menota kan jobbe med. Dette er viktig å få til, for at arkivet skal bli brukt. Nettstedet er basert på enkel webteknologi, og er flyttbart. Nettadresse ”www.menota.org” kan vi fortsette å bruke.

Ore orienterte videre om at selve tekstarkivet nå er bygget om fra Lisp til Cocoon / Tomcat, med Corpus Workbench som arbeidssystem. Det er et åpent, modulært system basert på XML. Alle dokumenter skal være TEI-dokumenter. Egne søk kan lagres som resultatdokumenter i TEI. Alt ventes å være oppe og gå i september. Validerte Menota-filer vil gli lett inn i arkivet. Det vil kunne utbygges innlastingsmuligheter. Samme teknologi vil bli brukt i Menotec-prosjektet.

Odd Einar Haugen støttet tanken om å gjøre modellen mer kollektiv, ved at flere har redaktørtilgang.

Alex Speed Kjeldsen spurte om vi skal prøve å gjøre tekstene tilgjengelige for full nedlasting fra brukere, fritt og åpent. Haugen støttet at vi bør gjøre dette. Kyrkjebø nevnte at dette kan gjøres nå i det danske Clarin på en elegant måte. På dette området har verden endret seg i retning av mer deling. Haugen mente dette kan tas opp konkret i forbindelse med Menotec-prosjektet, og vi kan da se om vi får en strømlinjeformet løsning.

Vi diskuterte fysisk plassering av Menota-arkivet. Portabilitet er viktig, stabile nettadresser for objektene er viktig. Menota-standarden er veldefinert og transparent – så kan vi flytte det over til andre system. Ore understreket at modularisering er et viktig prinsipp. Det nye Menota-systemet er delt opp i moduler. Dermed kan f.eks. søkeboksen byttes ut. Systemene vil alltid kunne skifte.

Gejrot spurte om finansieringen i dag for Menota. Ore svarte at Menotec-prosjektet er én finansiering, men at Menota-tekstene ellers sees som en del av EDD sitt faste oppdrag.

Alex understreket at Menota er en større ressurs til felles bruk, noe vi må jobbe med å gjøre klart for miljøene og institusjonene våre

 


Sak 6: Digitale fulltekstarkiv i CLARIN

Rune Kyrkjebø orienterte om prosjektene "Digitale fulltekstarkiv" og Clarino/Clarin samt DM2E (”Digitised Manuscripts to Europeana”). Han framhevet tendensen til at selve nettet "blir plattformen" hvor data mer og mer deles som Linked Open Data. Kyrkjebø viste eksempler på nettsteder som fører vitenskapelig tekst helt frem for brukeren (Perseus-prosjektet og UB Cambridge sine Newton-nettutgaver med faksimilær og normalisert visning).

Kyrkjebø foreslo å vurdere: (1) Deling av Menota-tekster som Linked Data knyttet til f.eks. håndskriftbilder i handrit.is og katalogposter i Manuscriptorium, gjerne med bruk av DM2E-verktøyer som blir utviklet nå, og (2) at vi kanskje kan ta eksempel av arbeidet med brukergruppe-aktivering som f.eks. skjer i DM2E.

Kyrkjebø nevnte et seminar som UB Bergen skal holde 27. november i forbindelse med "Digitale fulltekstarkiv" og inviterte interesserte til å ta kontakt. Haugen mente vi kunne få opp en prototype i Menota med Gamalnorsk homiliebok der både tekst og bilder ble presentert. Det ble nevnt i diskusjonen at det også er viktig å stimulere til vitenskapelig transkripsjon av flere tekster.

 


Sak 7: Transkripsjon og koding av diplomer

Thomas Hansen innledet om oppmerking av diplomer. Eksempler finnes på:

Siden ca. 2006 er kodingen gjort i TEI-standarden. All informasjon redaktørene lager, lagres på ett sted. XML og TEI ble valgt som en stabil datamodell, og som ett grunnlag for utvikling av verktøy og prosedyrer. Konkret blir det brukt et kodeskjema (en template) til inntasting, som så konverteres med XSLT til TEI. Hansen gjennomgikk kodeskjemaet, og feltene i den ferdige TEI-filen. Den sistnevnte er noe mer detaljert. Man har forsøkt å legge seg tett på Clarin.dk. Stilark konverterer til lesbare tekster f.eks. for korrektur. Redaktørene legger inn i oXygen. Det er ingen grunn til å utvikle egne innleggingsverktøyer. I DSLs data-arkitektur er TEI én komponent, for å ha et stabilt datagrunnlag.

Christian-Emil Ore innledet deretter med presentasjonen ”Interlinking source text collections – a Norwegian example”. Ore sa at DSL har gjort en forbilledlig bruk av TEI Header. I Diplomatarium Norvegicum (DN) trenger en innførsel ikke representere et fysisk eksisterende dokument, men være rekonstruert på grunnlag av vidisser. Det er tale om 3 samlinger som nå er retrodigitalisert: Det trykte DN, blyantavskrifter av norske diplomer, og Regesta Norvegica. Et eksempel på en kobling mellom sted og diplom er koblingen til Norske Gaardnavne (Oluf Rygh). Gårdsnavnet kan peke videre til registerpost med arkeologisk informasjon. Ore foreslo en forsøksvis sammenlenking av de 5 nordiske diplomatariene.

Ore viste at data fra TEI-header kan trekkes ut og puttes i register for Linked Data (RDF). Et nyttig hierarki å arbeide med har vært FRBR (Functional Requirements for Bibliographical Records). En regest kan sees på som en abstraksjon (jfr. FRBR). FRBR er laget for bibliotek, med tanke på å håndtere trykte kopier. Brukt på manuskripter kan man tenke seg, i FRBR-terminologi, at det er én manifestasjon pr. manuskript.

DN vil bli levert i løpet av høsten som 1 fil pr. bind. Papirtranskripsjonene blir levert som en fil pr. transkripsjon. Det må gis stabile URI-er.

Ore foreslo at man tenkte på en felles bibliografi i Menota-sammenheng. Gjerne koplet til ONPs kilde-lister. En ting er å kode som tekster, en annen er å har referanseinformasjon for gjenfinning og rask tilgang. Historiker-tradisjon og filolog-tradisjon møtes. Det er derfor flere hensyn når man skal kode diplomer. For header er TEI egnet. CEI (Charter Encoding Initative) mener Ore kanskje ikke er nødvendig å bruke, men at man kan bruke modifisert TEI. Det ble nevnt senere den erfaringen at CEI er tidkrevende, men pedagogisk og strukturelt er den veldig interessant. CEI er også bygget på en typologi som er preget av tysk diplomform. Også CIDOC-CRM-standarden kan være relevant.

Møtet diskuterte deretter temaer omkring diplom-kodingen om prinsipper og praksis ved transkripsjoner. Det er et godt samarbeid mellom de nordiske diplomatarie-redaksjonene. Haugen oppsummerte at det er ulike perspektiver på kodingen av tekstene, mens arbeidet med TEI header er mye likt. Interessene i og omkring hvert arkiv er med og styrer kodepraksisen.

 


Sak 8: Eventuelt

Det ble antydet at neste møte vil bli i Norge, flere mente det passet å ha neste møte om 1 år, gjerne slutten av august eller først i september.

Odd Einar Haugen takket Sveriges Riksarkiv for god mottakelse og lunsj, og takket deltakerne for presentasjoner og frammøte.

 


Bergen, 12.09.2012
Rune Kyrkjebø (referent)