|
Arbeidsmøte
i Bergen, 05.12.2001
Deltagere: Claus
Huitfeldt (HIT-senteret, Bergen) Christian-Emil Ore
(DokPro, Oslo) og Odd Einar Haugen (leder av
interimsstyret i Menota).
Møtested:
Dromedar kaffebar, Fosswinckelsgt. 16,
Bergen
Tidspunkt: kl.
12.15-14.00.
Referent: Odd
Einar Haugen.
Innledningsvis
ble en del praktiske kodingsspørsmål
diskutert med utgangspunkt i redaksjonsmøtet
i København 1.-3.12.2001 (se
hovedprinsipper, pkt. 4 i referatet
fra dette møtet). Det var enighet om at de
ulike måtene å kode på, var
likeverdige, og at dette dreide seg om tekniske
spørsmål snarare enn filologiske.
Konvertering mellom de ulike løsningene kan
f.eks. skje ved bruk av stilark. Det ble ellers
vist til at stand-off markup er en velkjent
teknikk, men at det er store problemer knyttet til
validering av slike tekster
Møtet gikk
deretter i gang med å diskuterte fordelingen
av arbeidsoppgaver mellom HIT-senteret, DokPro og
den faglige redaksjonen for arkivet på
grunnlag av et notat skrevet av Odd Einar Haugen
09.11.2001.
Dette referatet
gjengir de enkelte punktene i notatet, og den
fordeling som det ble enighet om under
møtet.
1. Teknisk
drift av arkivet
Det er
nødvendig med en server der en kan legge ut
tekster og annet materiale, og personale som kan
vedlikeholde og rette opp feil på denne
serveren.
Denne
oppgaven kan dekkes av DokPro.
2.
Administrasjon av arkivet
Arkivet
bør ha tilgang på
sekretariatsfunksjoner, dvs. en konkret adresse
(post, telefon, faks) og personale som kan svare
på spørsmål om arkivet, ev.
ekspedere dem videre til fagpersonalet.
Sekretariatsfunksjonene bør også
omfatte arkivering (gjerne i elektronisk form
på nettsiden) og hjelp til bokføring
og økonomistyring. Dette kan skje ved at
Menota blir opprettet som et eget prosjekt.
Denne
oppgaven kan dekkes av HIT-senteret.
3. Oppretting
av nettside med
database-funksjonalitet
Det er opprettet
en nettside for Menota på domenet
www.menota.org. Denne siden bør utbygges og
utstyres med en databasefunksjon, slik at brukerne
kan søke på de innlagte tekstene etter
ulike trekk - f.eks. (a) verktittel, (b)
katalogsignatur, (c) proveniens, (d) datering, (e)
genre.
Denne
oppgaven kan utføres av DokPro og
koordineres med tilsvarende databaseutvikling ved
DokPro. Det er mulig å bygge opp en
tekstdatabase med versjonskontroll og separate
søkeverktøy, og med jevne mellomrom
indeksere denne. En slik database kan også
inneholde faksimiler. Aktuell programvare er
Corpus
Query Processor'
(CQP),
utviklet ved Institut
für Maschinelle Sprachverarbeitung,
Stuttgart.
Disse verktøyene er bl.a. brukt ved DokPro i
Oslo, HIT-senteret i Bergen og Språkbanken i
Göteborg.
4. Utvikling
av stilark
Det står
ennå igjen en del arbeid med å utvikle
stilark slik at tekster kan vises på ulike
nivåer (<orig>, <expform>,
<reg>) og med riktige fonter. Jf.
oppsummeringen på stilarksiden
i håndboken.
Dette
arbeidet henger nøye sammen med utvikling av
font-løsningen jf. pkt. 5
nedenfor.
Denne
oppgaven kan dekkes av HIT-senteret.
5. Utvikling
av fontløsninger
For visning av
tekst (på nett, PDF) er det nødvendig
at entitetskodingen blir knyttet sammen med
tjenlige fonter. Her bør det trolig arbeides
i to retninger, en Unicode-løsning og en
løsning som baserer seg på web-fonter.
Unicode-løsningen bør ha prioritet.
Se her
for eksempel på en side med norrøn
web-font (NB! Siden kan bruke noe tid på
nedlasting, og blir ikke vist korrekt i alle
nettlesere).
Denne
oppgaven kan dekkes av HIT-senteret så langt
det er kompetanse til det.
6.
Overføring og tilpassing av
tekster
Det er viktig at
Menota får inn en tilstrekkelig mengde
tekster tidlig i oppstarten. På bakgrunn av
diskusjonen under møtet 10.09.2001
bør vi trolig starte med å ta inn
tekster i ulike lokale formater, og heller
konvertere disse til et felles format etter hvert.
Et helt avgjørende tekstkorpus er det som
DokPro i dag forvalter.
DokPro
er innstilt på å gjøre korpus av
gammelnorske tekster tilgjengelig for Menota.
7.
Perl-programmering
Det er bruk for
programmeringshjelp til å videreutvikle og
dokumentere de Perl-skriptene
som Espen S. Ore har laget for
tekstkonvertering.
DokPro
kan yte støtte til dette
arbeidet.
8.
Validering
Etter hvert vil
det komme inn tekster som er kodet etter den
standarden som er utviklet og dokumentert i
håndboken. Selv om innsenderne blir
oppfordret til å følge de
retningslinjene som er lagt i håndboken, vil
det trolig være behov for valideringshjelp. I
noen tilfeller kan det bli tale om flere runder med
validering.
HIT-senteret
kan yte assistanse på dette
feltet.
9.
Spørsmål-og-svar-tjeneste
Det vil komme inn
spørsmål om alle slags praktikaliteter
når det gjelder tekstkoding. Det er bruk for
noen som kan svare på de tekniske
spørsmålene, og legge dem inn i et
arkiv for Ofte Stilte
Spørsmål.
Dette
må dekkes av redaktørene for
håndboken.
10. Utredning
av copyright-forhold
Spørsmålet
om copyright o.l. ble ikke drøftet på
møtet i Oslo, men vil være sentralt
for mange av bidragsyterne til Menota. Her er det
viktig med erfaring fra andre
prosjekter.
Claus
Huitfeldt skaffer eksempler på
standardkontrakter for innlegging av tekster i
arkivet. I disuksjonen ble det for øvrig
fremholdt at det særlig er to forhold som
må avklares når en tekst skal legges
inn i arkivet: (a) den som overdrar den teksten,
må presisere hvem det er som har
utført arbeidet med tekstkodingen, (b) den
eller de ansvarlige må gjøre det klart
at de stiller materialet til disposisjon for
arkivet, og presisere hvilke vilkår som
gjelder for denne overdragelsen.
|