Arbeidsmøte i Bergen, 05.12.2001

Deltagere: Claus Huitfeldt (HIT-senteret, Bergen) Christian-Emil Ore (DokPro, Oslo) og Odd Einar Haugen (leder av interimsstyret i Menota).

Møtested: Dromedar kaffebar, Fosswinckelsgt. 16, Bergen

Tidspunkt: kl. 12.15-14.00.

Referent: Odd Einar Haugen.

Innledningsvis ble en del praktiske kodingsspørsmål diskutert med utgangspunkt i redaksjonsmøtet i København 1.-3.12.2001 (se hovedprinsipper, pkt. 4 i referatet fra dette møtet). Det var enighet om at de ulike måtene å kode på, var likeverdige, og at dette dreide seg om tekniske spørsmål snarare enn filologiske. Konvertering mellom de ulike løsningene kan f.eks. skje ved bruk av stilark. Det ble ellers vist til at stand-off markup er en velkjent teknikk, men at det er store problemer knyttet til validering av slike tekster

Møtet gikk deretter i gang med å diskuterte fordelingen av arbeidsoppgaver mellom HIT-senteret, DokPro og den faglige redaksjonen for arkivet på grunnlag av et notat skrevet av Odd Einar Haugen 09.11.2001.

Dette referatet gjengir de enkelte punktene i notatet, og den fordeling som det ble enighet om under møtet.


1. Teknisk drift av arkivet

Det er nødvendig med en server der en kan legge ut tekster og annet materiale, og personale som kan vedlikeholde og rette opp feil på denne serveren.

Denne oppgaven kan dekkes av DokPro.

 

2. Administrasjon av arkivet

Arkivet bør ha tilgang på sekretariatsfunksjoner, dvs. en konkret adresse (post, telefon, faks) og personale som kan svare på spørsmål om arkivet, ev. ekspedere dem videre til fagpersonalet. Sekretariatsfunksjonene bør også omfatte arkivering (gjerne i elektronisk form på nettsiden) og hjelp til bokføring og økonomistyring. Dette kan skje ved at Menota blir opprettet som et eget prosjekt.

Denne oppgaven kan dekkes av HIT-senteret.

 

3. Oppretting av nettside med database-funksjonalitet

Det er opprettet en nettside for Menota på domenet www.menota.org. Denne siden bør utbygges og utstyres med en databasefunksjon, slik at brukerne kan søke på de innlagte tekstene etter ulike trekk - f.eks. (a) verktittel, (b) katalogsignatur, (c) proveniens, (d) datering, (e) genre.

Denne oppgaven kan utføres av DokPro og koordineres med tilsvarende databaseutvikling ved DokPro. Det er mulig å bygge opp en tekstdatabase med versjonskontroll og separate søkeverktøy, og med jevne mellomrom indeksere denne. En slik database kan også inneholde faksimiler. Aktuell programvare er Corpus Query Processor' (CQP), utviklet ved Institut für Maschinelle Sprachverarbeitung, Stuttgart. Disse verktøyene er bl.a. brukt ved DokPro i Oslo, HIT-senteret i Bergen og Språkbanken i Göteborg.

 

4. Utvikling av stilark

Det står ennå igjen en del arbeid med å utvikle stilark slik at tekster kan vises på ulike nivåer (<orig>, <expform>, <reg>) og med riktige fonter. Jf. oppsummeringen på stilarksiden i håndboken. Dette arbeidet henger nøye sammen med utvikling av font-løsningen jf. pkt. 5 nedenfor.

Denne oppgaven kan dekkes av HIT-senteret.

 

5. Utvikling av fontløsninger

For visning av tekst (på nett, PDF) er det nødvendig at entitetskodingen blir knyttet sammen med tjenlige fonter. Her bør det trolig arbeides i to retninger, en Unicode-løsning og en løsning som baserer seg på web-fonter. Unicode-løsningen bør ha prioritet. Se her for eksempel på en side med norrøn web-font (NB! Siden kan bruke noe tid på nedlasting, og blir ikke vist korrekt i alle nettlesere).

Denne oppgaven kan dekkes av HIT-senteret så langt det er kompetanse til det.  

 

6. Overføring og tilpassing av tekster

Det er viktig at Menota får inn en tilstrekkelig mengde tekster tidlig i oppstarten. På bakgrunn av diskusjonen under møtet 10.09.2001 bør vi trolig starte med å ta inn tekster i ulike lokale formater, og heller konvertere disse til et felles format etter hvert. Et helt avgjørende tekstkorpus er det som DokPro i dag forvalter.

DokPro er innstilt på å gjøre korpus av gammelnorske tekster tilgjengelig for Menota.  

 

7. Perl-programmering

Det er bruk for programmeringshjelp til å videreutvikle og dokumentere de Perl-skriptene som Espen S. Ore har laget for tekstkonvertering.

DokPro kan yte støtte til dette arbeidet.

 

8. Validering

Etter hvert vil det komme inn tekster som er kodet etter den standarden som er utviklet og dokumentert i håndboken. Selv om innsenderne blir oppfordret til å følge de retningslinjene som er lagt i håndboken, vil det trolig være behov for valideringshjelp. I noen tilfeller kan det bli tale om flere runder med validering.

HIT-senteret kan yte assistanse på dette feltet.

 

9. Spørsmål-og-svar-tjeneste

Det vil komme inn spørsmål om alle slags praktikaliteter når det gjelder tekstkoding. Det er bruk for noen som kan svare på de tekniske spørsmålene, og legge dem inn i et arkiv for Ofte Stilte Spørsmål.

Dette må dekkes av redaktørene for håndboken.

 

10. Utredning av copyright-forhold

Spørsmålet om copyright o.l. ble ikke drøftet på møtet i Oslo, men vil være sentralt for mange av bidragsyterne til Menota. Her er det viktig med erfaring fra andre prosjekter.

Claus Huitfeldt skaffer eksempler på standardkontrakter for innlegging av tekster i arkivet. I disuksjonen ble det for øvrig fremholdt at det særlig er to forhold som må avklares når en tekst skal legges inn i arkivet: (a) den som overdrar den teksten, må presisere hvem det er som har utført arbeidet med tekstkodingen, (b) den eller de ansvarlige må gjøre det klart at de stiller materialet til disposisjon for arkivet, og presisere hvilke vilkår som gjelder for denne overdragelsen.

 


Tilbake til internsiden
Tilbake til hovedsiden


Opprettet 06.12.2001 av OEH. Sist oppdatert 10.12.2001 av OEH.