Redaksjonsmøte i Bergen 12.–13. april 2005

Deltagere: Tone Merete Bruvik, Matthew J. Driscoll, Odd Einar Haugen, Karl G. Johansson, Rune Kyrkjebø (bare 13. april) og Tarrin Wills.
Møtested: Møterom 504, Rica Travel Hotel, Christiesgt. 5–7, Bergen.
Tidsramme: 12. april 2004, 16.00–19.30 og 13. april 10.15–12.30.

Møteleder: Odd Einar Haugen
Referent: Odd Einar Haugen

 

Sak 1: Forholdet til TEI P5

TEI P5 vil sannsynligvis være klar i oktober/november 2005. Redaksjonsmedlemmene ble enige om å holde fast på linjen fra det forrige møtet, nemlig at redaksjonen av versjon 2.0 av håndboken ikke bør sluttføres før TEI P5 foreligger. I praksis innebærer dette at neste versjon av håndboken neppe kan publiseres før i begynnelsen av 2006.

I TEI P5 blir bruken av Document Type Definition (DTD) supplert med bruken av såkalte skjema (schemes), og det hele blir organisert gjennom et såkalt ODD-dokument (One Document Does it all). Selv om dette er en større strukturell endring, trenger ikke de praktiske konsekvensene være så store. Tone Merete Bruvik har allerede laget utkast til omtalen av endringene for neste versjon av håndboken, og ved hjelp av verktøyet ROMA har hun laget et skjema i RELAX NG for Menota: Menota schemes. På denne siden blir det også gitt en fullstendig oversikt over de endringer som er aktuelle for Menota ved overgangen fra TEI P4 til P5: Changes for Menota.

En avgjørende endring i TEI P5 er at attributt ikke lenger kan inneholde alminnelige c data (character data, dvs. ordinære tegnsekvenser). Dette får konsekvenser for en rekke av de tidligere anbefalte løsningene i TEI Guidelines, og for vårt vedkommende særlig bruken av <abbr> med expan som attributt (eller omvendt), og <sic> med corr som attributt. Imidlertid har vi allerede gått bort fra disse løsningene, og velger som kjent å bruke elementer i alle tilfeller. I praksis skjer dette ved at <abbr> og <sic> typisk blir gitt på <facs>-nivå og <expan> og <corr> på <dipl>-nivå. Her har vi – mer eller mindre tilfeldig – foregrepet utviklingen i TEI Guidelines.

Derimot gjenstår det som et problem at vi har <lemma> som attributt etter anbefalingene i kap. 8 av håndboken. Dette er i en forstand et brudd med reglene, siden lemma-former kan sies å være c data. Etter en del diskusjon kom møtet fram til at det likevel kan være mulig å beholde lemma som et attributt, siden lemmaformene kan defineres som name tokens, og dermed vil de trolig kunne aksepteres. Name tokens refererer til en liste utenfor teksten, men denne listen inngår ikke som et grunnlag for valideringen; med andre vil teksten kunne erklæres som valid selv om listen ikke foreligger. Når det gjelder norrøne tekster, vil for øvrig den eksisterende lemmalisten ved Ordbog over det norrøne prosasprog (ONP) i København kunne brukes. For østnordiske tekster vil det være behov for en tilsvarende liste, noe som kanskje kan løses innenfor det planlagte koordineringsarbeidet mellom de nordiske middelalderordbøkene.

Utfallet av denne diskusjonen var at man ønsket å holde fast ved at lemma bør være et attributt til <w>-elementet, så sant dette lar seg gjøre. Alternativet vil være å etablere <lemma> som et element innenfor <w>-elementet, som diskutert på det forrige redaksjonsmøtet (Stockholm 18. september 2004). I tillegg til lemma er for tiden også pos (part of speech, dvs. den morfologiske beskrivelsen) et attributt til <w>-elementet. Dette er imidlertid mindre problematisk ettersom innholdet av pos er name tokens fra en ganske kort liste (se kap. 8 om dette).

I TEI P5 vil det bli innført et nytt <choice>-element, som kan være aktuelt for vår koding. Det var enighet i redaksjonen om at P5 her har beveget seg i samme retning som den anbefalte kodingen i Menota handbook, som nå har denne strukturen (merk at ikke alle nivåene trenger være utfylt):

<w>
  <facs>k<abbr>&bar;<abbr>i</facs>
  <dipl>k<expan>onong</expan>i</dipl>
  <norm>konungi</norm>
</w>

Det ble pekt på at denne strukturen kan minne om TEIs koding av varianter, der <rdg>-elementer opptrer som en liste innenfor <app>-elementet.

Ved bruken av <choice>-elementet vil lesningene på <facs>- og <dipl>-nivå bli nøstet, og videre kan man tenke seg at <facs> blir erstattet med <orig> og <norm> med <reg>, i samsvar med nåværende TEI Guidelines. I så fall blir kodingen seende slik ut:

<w>
  <choice>
    <orig>k<abbr>&bar;</abbr>i</orig>
    <dipl>k<expan>onong</expan>i</dipl>
    <reg>konungi</reg>
  </choice>
</w>

Møtet tolket retningslinjene slik at <choice> kunne inneholde mer enn to alternativ. Dermed bør det ikke være nødvendig å nøste valgene, som vist her:

*<w>
  <choice>
    <choice>
      <orig>k<abbr>&bar;</abbr>i</orig>
      <dipl>k<expan>onong</expan>i</dipl>
    </choice>
    <reg>konungi</reg>
  </choice>
</w>

Redaksjonen var enig i at den nåværende kodingen, som ikke bruker <choice>-elementet, og den alternative kodingen, som bruker <choice>-elementet, var strukturelt ekvivalente, og at det ville være mulig å lage skript som kunne generere den ene fra den andre, og omvendt. Det var imidlertid ikke enighet om at det var ønskelig å innføre <choice>-elementet, og heller ikke at det var nødvendig å endre navnene på elementene <facs> og <norm>. Det ble pekt på at ved å operere med egne elementer her (noe man under alle omstendigheter må gjøre for det tredje elementet <dipl>) har man større kontroll over innholdet av dem.

Redaksjonen ble derfor enig om at man skulle fortsette diskusjonen om bruken av <choice>-elementet, og dessuten vurdere den på bakgrunn av den endelige versjonen av TEI P5. Det var videre enighet at man under alle omstendigheter skulle tydeliggjøre dette problemet i håndboken, og vise hvordan den ene formen for koding kan avledes av den andre, og omvendt.

Til slutt minte Matthew J. Driscoll om at i TEI P5 blir tilføyelsene i MASTER (håndskriftbeskriveslen) en integrert del av header. Dette gjør at kap. 10 i Menota handbook må omskrives. Matthew tar på seg ansvaret for å gjennomføre dette så snart TEI P5 foreligger i endelig form.

Matthew J. Driscoll (supplert av Tone Merete Bruvik) nevnte at en arbeidsgruppe i TEI under ledelse av Christian Wittern, Kyoto, har utarbeidet forslag til koding av tegn som ligger utenfor Unicode-standarden. Dette er beskrevet i to dokumenter:

Representation of non-standard characters and glyphs
Languages and characters sets

Redaksjonen av Menota handbook har inntil videre ikke tatt stilling til dette forslaget.

 

Sak 2: Kap. 7 (“Altered, corrected and unreadable text”)

Dette kapitlet ble inngående diskutert på redaksjonsmøtet i Stockholm, og etter planen skulle en oppdatert versjon av kapitlet nå foreligge. I påvente av denne fortsatte møtet diskusjonen med sikte på å nå fram til en ytterligere avklaring. Et hovedgrep i det nye kap. 7 vil være å innføre et nytt, allment <textSpan>-element med attributter som spesifiserer hvilken type det er tale om (addition, deletion etc.). Dermed unngår man den lange og ad hoc-pregede listen av typen <addSpan>, <delSpan> osv.

Matthew J. Driscoll opplyste at hans kontakt med sentrale personer i TEI-miljøet tydet på en allmenn skepsis mot denne løsningen, og mente at det var viktig å legge denne fram for drøfting i TEI-miljøet. Tone Merete Bruivk fortalte at hun for en tid siden hadde kontaktet Syd Bauman om dette; hans reaksjon hadde vært positivt avventende, men også han foreslo at løsningen skulle luftes i TEI-miljøet.

Det ble derfor bestemt at Tarrin Wills skulle legge fram problemet (og vårt utkast til løsning av det) på SourgeForge.net med en lenke dit fra TEI-listen. På SourceForge er det en egen feature request som vi kan bruke.

Matthew J. Driscoll har forøvrig ansvaret for å redigere det tilsvarende kapitlet i TEI Guidelines P5, og vil derfor kunne bringe denne løsningen inn i retningslinjene, dersom det viser seg å være oppslutning om den i miljøet.

Det var videre enighet om at kapitlet burde innehold flere konkrete eksempler, gjerne understøttet med faksimiler. Tarrin Wills viste til at det lå ute svært mange faksimiler som del av skaldediktingsprosjektet, og at man trolig kunne finne egnede eksempler her. Se denne oversikten over håndskrifter: Skaldic project mss. (klikk på mss. i menylinjen øverst på siden).

Tarrin Wills fikk i oppdrag å revidere kap. 7 i samsvar med det som ble bestemt under dette og det forrige møtet:

- Siste avsnitt i kap. 7.2.3 skal strykes.
- Omtalen av elementet <space> flyttes til kap. 7.2, ettersom det hører med til hva skriveren gjør bevisst.
- Kap. 7.2 skal omhandle “addition, deletion and omission”.
- I kap. 7.3.1 skal desc gå ut.
- I kap. 7.3.2 skal rend strykes i tabellen.
- Det nye elementet <textSpan> skal også ha source som attributt (foruten det ovenfor nevnte cat).
- Nytt kap. 7.4.2 skal være om tekst som er strøket av utgiveren (dvs. i det nye elementet <expunged>). Deretter kommer omtalen av rettelser (“corrections”) som nytt kap. 7.4.3.

Tarrin Wills vurderer i hvilken grad han ønsker å bygge på den eksisterende teksten eller om han heller finner det formålstjenlig å skrive kapitlet fra grunnen av. Han vil prøve å ha klart et utkast i løpet av mai måned med tanke på at en foreløpig versjon kan legges ut i midten av juni måned.

Karl G. Johansson pekte på at kapitlet kan forenkles noe og at man i stedet kan føye til en liste over konkrete problemer og våre forslag til hvordan disse kan løses. Dette svarer til en journal av samme type som blir ført ved f.eks. Ibsen-prosjektet.

 

Sak 3: Menota header

Allerede på redaksjonsmøtet i Bergen 18. januar 2003 (sak 3) ble det bestemt at det skulle utarbeides en minimal header på grunnlag av et samlehåndskrift av typen Codex Wormianus. Av ulike grunner har dette arbeidet ikke vært utført, og Odd Einar Haugen understreket sterkt nødvendigheten av at det nå ble gjort, og at det fanget opp de endringene som ligger i TEI P5, særlig innpassingen av MASTER.

Innledningsvis viste Matthew J. Driscoll eksempel på en maksimalt utfylt header, nemlig den som er del av Anne Mette Hansens utgave av AM 421 12mo, og som ligger til grunn for hennes elektroniske utgave, som nå ligger på nettsidene til Den Arnamagnæanske Samling: Utgave av AM 421 12mo. I den motsatte enden av skalaen ligger minstekravene som ligger i MASTER, nemlig bare de tre location, repository og shelf mark.

Tarrin Wills pekte på behovet for å normere titlene på verk i header, slik at man kunne være sikker på å gjenfinne alle forekomster av en tekst i arkivet. Matthew J. Driscoll viste til det grunnleggende skillet mellom såkalte supplied titles, f.eks. En tale mot biskopene, og uniform titles, f.eks. Njáls saga (som dog kan ha ulike former, f.eks. både Njáls saga og Brennu-Njáls saga). Det var enighet om at titlene i registerbindet til Ordbog over det norrøne prosasprog kunne brukes som en normert liste; men at problemet ikke er løst for østnordiske tekster.

Møtet tok deretter en ekskurs om tekstomgrepet, der Karl G. Johansson refererte til en ny tredeling lansert i et kommende hefte av Arkiv för nordisk filologi av Bo-A. Wendt, nemlig mellom – oversatt til engelsk – (text) bearer, text (witness) og text (work). Dermed kan teksten så å si løftes ut av begrepsapparatet. Det ble innvendt at denne tredelingen så ut til å være sammenfallende med skillet mellom document, text og work. Det var enighet om at man kunne vende tilbake til dette spørsmålet under den nært forestående konferansen Creating the medieval saga, Bergen 13–15 april, hvor dette temaet vil bli drøftet av flere av redaksjonsmedlemmene.

Deretter gikk møtet gjennom den eksisterende header i Menota handbook v. 1.1.

Her ble det pekt på at det ikke var nødvendig å føre opp noen <author> i Title Statement, <titleStmt>, og at det i alle fall ikke var den middelalderlige forfatteren (som oftest anonym) som skulle føres inn her.

Det er videre behov for en egen Publication Statement, <publicationStmt>, for Menota. Denne bør bruke for de tekster som faktisk er deponerte i arkivet. Som forslag til utfylling for de utgiverne som er igang med sin egen tekst, vil det være bedre å anbefale <p>Unpublished draft for research purposes</p> e.l.

I Source Description, <sourceDesc>, kan det være tjenlig å opplyse om hva som er grunnlag for transkripsjonen (original / fotografiske faksimiler / eksisterende utgave).

Det bør også formuleres et tydelig krav om at forkortelser for titler skal følge de standarder som finnes, i praksis ONPs forkortelser.

I beskrivelsen av de enkelte språkformer i <textLang> bør det ikke brukes skråstreker, f.eks. “oic/onw”. I stedet kan man bruke den eksisterende og noe avvikende forkortelsen “non” for tekster som ikke kan bestemmes som enten norske eller islandske.

Det var en viss usikkerhet når det gjelder innholdet av Project Desciription, <projectDesc>, og om dette var det rette stedet å opplyse om kvaliteten av transkripsjonen. Matthew J. Driscoll undersøker dette. Det var imidlertid enighet om at dette er en type informasjon som det er viktig å ha med i header.

Når det gjelder Revision Description, <revisionDesc>, ble det påpekt at så lenge en enkelt person står ansvarlig for arbeidet med teksten, var det ikke nødvendig å bruke denne til egenrapportering. Men så snart flere personer bidrar til filen (f.eks. etter innlevering til et arkiv), er det viktig at denne blir brukt.

Deretter gikk man gjennom det utkastet til header for Codex Wormianus (AM 242 fol) som Karl G. Johansson har utarbeidet. Det sentrale i denne ligger i beskrivelsen av de enkelte delene av håndskriftet og lenkingen av disse delen til de relvante <div> i selve teksten. Det ble innvendt at denne beskrivelsen skulle flyttes lenger ned i header og gjøres til en del av Manus Description. Matthew J. Driscoll tok på seg å rette opp header for Codex Wormianus.

På bakgrunn av denne diskusjonen understreket redaksjonen på nytt behovet for å ha en permanent arkivar som bl.a. kan kontrollere at innleverte tekster faktisk er konforme med anbefalingene i Menota. Tarrin Wills pekte på at det egentlig er tale om to funksjoner. Den ene funksjonen er en systemadministrator som sørger for at arkivet til enhver tid er oppe og går. Dette er en rent teknisk stilling. Den andre funksjonen er en arkivar, som kan vurdere og gi råd om innholdet. Dette er en faglig stilling som krever innsikt i både den nordiske middelalderlitteraturen og hovedtrekkene i tekstkodingen.

Til slutt argumenterte Matthew J. Driscoll for at håndboksredaksjonen skulle delta mer aktivt i TEI-miljøet. Det var enighet om at dette er ønskelig, selv om det er et problem å finne tid til slik kontakt. Et første skritt på denne veien vil være å drøfte bruken av <textSpan>-elementet på SourceForge og TEI-listen. Det kan også være en idé å presentere Menota-prosjektet på et medlemsmøte i TEI; det neste vil bli holdt i Sofia i slutten av oktober 2005. Endelig bør man være oppmerksom på de såkalte Special Interest Groups, f.eks. den om manuscript encoding.

 

Sak 4: Framdrift

Ansvaret for den videre framdriften blir fordelt slik:

Matthew J. Driscoll: Oppdatering av kap. 1 og kontroll av eksisterende anbefalt header mot endringene i TEI P5, foruten utarbeidelse av ny anbefalt header for Codex Wormianus på grunnlag av utkast fra Karl G. Johansson. Dette blir gjort innen 17. april 2005.
Tarrin Wills: Utarbeidelse av ny versjon av kap. 7 innen 15. juni 2005. Videre utlegging av spørsmålet om bruken av det generelle elementet <textSpan> på SourceForge med referanse til dette fra TEI-listen.
Tone Merete Bruvik: Oppfølging av utviklingen innenfor TEI, særlig med tanke på TEI P5, testing av Menotas DTD mot forventede endringer i P5.

I egenskap av redaktør koordinerer Odd Einar Haugen det samlede arbeidet.

 


Opprettet 16. april 2005. Sist oppdatert 25. april 2005.