Was sollte man noch wissen über - Bits und Bytes, Daten
und Dateien?
Für eilige Leser: Welche Dateien hat eine allegro-Datenbank?
Fangen wir mal ganz anders an. Nicht am unteren
Ende (bei den Bits) und nicht am oberen (bei den Dateisystemen und
Datenbanken),
sondern in der Mitte. Da liegt das, was jeder kennt: der Datensatz,
in Bibliotheken früher Titelaufnahme
genannt.
Rein ins kalte Wasser, hier ist so ein Datensatz: (wie er in vielen allegro-Datenbanken
aussieht)
#00 216478049
#20 ¬Der¬ Herzogsprozeß : ein Bericht über den Prozeß des welfischen Herzogshauses gegen
den Freistaat Braunschweig um das Kammergut (1921/25)
#30a ge
#30k 15.51
#31s Fürstenabfindung; Braunschweig <Staat>
#37 de
#39 von Burkhard Schmidt
#40 Schmidt, Burkhard
#74 Wolfenbüttel
#75 Braunschweig. Geschichtsverein
#76 1996
#77 184 S. : Ill
#81 Literaturverz. S. 172 - 176
#85 Beihefte zum Braunschweigischen Jahrbuch ; 12
#87 3-928009-10-9
#89 D952579413
#90 Q4-1234
Verwirrend? Altgediente Bibliothekare
erwarten vielleicht so etwas wie das hier:
| Signatur: Q4-1234 |
| Schmidt, Burkhard: |
| Der Herzogsprozeß : ein Bericht über den Prozeß des welfischen |
| Herzogshauses gegen den Freistaat Braunschweig um das Kammergut (1921/25) |
| / von Burkhard Schmidt. |
| Wolfenbüttel : Braunschweigischer Geschichtsverein, 1996. - 184 S. : Ill |
| (Beihefte zum Braunschweigischen Jahrbuch ; 12) |
| ISBN 3-928009-10-9 |
| Literaturverz. S. 172 - 176 |
| Themen: |
| Fürstenabfindung |
| Braunschweig <Staat> |
Oder so ähnlich. Warum kann man Daten nicht
so eingeben und speichern? Das
hat zwei Gründe:
- Computer sind
zu dumm. Sie brauchen die Daten in kleineren Häppchen, sonst
können sie die Angaben nicht sicher unterscheiden und getrennt
auffindbar machen. Daten müssen deshalb in lauter einzelne Elemente
zerlegt werden. Die nennt man auch "Datenfelder".
Oben sieht man das: z.B. ist #74 das Datenfeld für den Erscheinungsort.
- Ein Online-Katalog soll mehr als nur ein elektronischer Zettelkatalog
sein!
Er soll noch andere Funktionen erfüllen (Erwerbung, Ausleihe) und
andere Produkte hervorbringen (Listen verschiedenster Art,
Statistiken). Auch deshalb ist das Zerlegen der Daten in Elemente
nötig, die man auch getrennt verwenden kann und mit denen Programme
arbeiten können. Dabei ist eine strikte, formale Einheitlichkeit
wichtig – Automatismen gehen sonst schief, weil sie keine echte
Intelligenz besitzen. Hätte man z.B. nur ein einziges Feld für Namen
und würde dort mal "Fritz Müller" eintragen und mal "Müller Fritz"
und mal "Universität Köln" oder auch mal "Köln, Universität" –
ein Programm könnte diese Uneinheitlichkeit nicht ausgleichen und auch nicht erkennen,
welche Namen denn Personen und welche Körperschaften bezeichnen.
Altgediente
Datenbankleute
erwarten dagegen
was ganz anderes, nämlich sowas wie eine Tabelle:
|
IdNr
|
Titel
|
Verfasser
|
Ort
|
Verlag
|
Jahr
|
...
|
|
...
|
...
|
|
|
|
|
|
|
216478049
|
¬Der¬ Herzogsprozeß : ein Bericht ...
|
Schmidt, Burkhard
|
Wolfenbüttel
|
Braunschweig. Geschichtsverein
|
1996
|
...
|
|
...
|
...
|
|
|
|
|
|
Denn die
Tabelle ist
das
Grundkonzept der
relationalen Datenbanken
- das wichtigste Konzept der professionellen Informatik.
Warum wird's nicht
so
gemacht?
Das hat mehr als zwei Gründe, die an anderer Stelle ausführlich
zusammengestellt
wurden:
"Vergleichende Gegenüberstellung
allegro –
Relationale
Datenbanksysteme",
http://www.allegro-c.de/a-r.htm
.
Ein paar wichtige Gründe sind:
- Man braucht sehr
viele Spalten, d.h. die Tabelle wird unhandlich
breit,
- Schwierig und unübersichtlich wird
es auch, wie das Beispiel schon zeigt, wenn lange Inhalte auftreten
(Titel, Namen)
- Etliche Felder werden recht selten gebraucht, d.h. man hat oft viele leere
Spalten in der Tabelle,
- Mehrfachfelder
(z.B. für Personen und Schlagwörter) sind nicht gut möglich: es gibt
keine geteilten Tabellenspalten,
- Strukturen
innerhalb von Spalten werden vom System nicht unterstützt (z.B.
Nichtsortierzeichen oder vorgeschriebene Interpunktion, Unterfelder). Man muß
viel extra Software schreiben,
um so etwas zu handhaben.
- Einfügen neuer
Spalten in eine einmal existierende Datenbanktabelle ist
schwierig.
Die Tabelle ist somit nicht die beste Idee für
Bibliotheksdaten.
(Für Neugierige steht in einem anderen Papier ganz ausführlich, was
denn das Besondere an bibliographischen Daten ist:
http://www.allegro-c.de/formate/kap1.htm
)
Wir halten fest: Ein Datensatz besteht in fast
allen Systemen aus numerierten Elementen, wie z.B.
#40
Schmidt, Burkhard
was ja offenbar ein Verfassername ist. Und
#20
steht wohl
für den Titel,
#76
für das Erscheinungsjahr – einiges kann man erraten. Diese Elemente werden
oft
Kategorien genannt. Das
hat sich
im Bibliothekswesen so eingebürgert, in der Informatik aber nicht, da
spricht
man von
Datenfeldern. Die
Datenfelder
haben Nummern, die man auch
tags nennt (das ist
Englisch und
heißt sowas wie
Label). Es gibt mehrere solche
Nummernsysteme,
die man auch "Bibliothekarische Datenformate" nennt: das weltweit
bekannteste
ist
MARC21. In Deutschland wird für den Austausch von Daten
MAB2
verwendet, aber MARC21 soll es ablösen.
allegro-Anwender benutzen meistens das
leichter zu lernende und zu handhabende "Konsolidierte Format":
http://www.allegro-c.de/doku/form2004/
.
Es gibt noch andere, aber sogar die berühmten Standards wie MARC und auch MAB
sind von System zu System immer unerfreulich anders.
Innerhalb einer Datenbank müssen die Daten aber
einheitlich sein. Daher steht ganz am Anfang, wenn man eine neue
Datenbank
aufmachen will, die Entscheidung für eines der Formate. Alles über
Bibliothekarische Datenformate, mehr als Sie jemals wissen wollten,
verrät die Web-Adresse
http://www.allegro-c.de/formate/
.
Summa summarum: aus der
Titelkarte
im Zettelkatalog wird ein
Datensatz
im Online-Katalog. Der Online-Katalog ist eine besondere Art von
Datenbank. Eine Datenbank besteht also aus einer Menge
von
Datensätzen und ein Datensatz aus einer Anzahl von Datenfeldern, d.h.
wir
haben es mit drei Ebenen zu tun:
Eine Datenbank
enthält Datensätze
bestehend aus Datenfeldern
Was ist anders als bei Karteien?
Einen Zettelkatalog kann sich jeder vorstellen -
das
ist nichts anderes als eine Kartei. Neue Zettel werden von Hand an den
richtigen Stellen eingeordnet. Wie ist das bei einer Datenbank, was
passiert da mit neuen Datensätzen? Das Eintippen der Daten ist
Handarbeit, wie früher das Schreiben der Zettel, aber das Einordnen
(hier sagt man "Abspeichern"), damit man alles hinterher leicht
wiederfindet, das passiert vollautomatisch. Aber nur, wenn für diese
Aufgabe eine Software da ist, ein Programmsystem, das sich
Datenbanksystem
nennt. Von sich aus, nur mit
Windows oder
UNIX ausgestattet, kann ein Computer das nicht machen - er hat da
gar keine Ahnung von.
allegro ist ein solches
Datenbanksystem.
Pica ist ein ganz anderes, und es
gibt noch mehr von der
Sorte. Sie unterscheiden sich in vielen Dingen, unter anderem in den
Ansprüchen, die sie an die Hardware und das Software-Umfeld stellen. In
den Kosten auch, ganz klar.
Den
Datensatz
kann man sich gut vorstellen, man
kann ihn ja sehen. Sowas wie ein kleiner Text ist das, ein Dokument,
aufschreibbar auf einer Karteikarte oder einem Blatt Papier. Aber wie
kann man sich die
Datenbank genauer vorstellen? Ist das nur ein
großes Dokument, das
sich aus vielen kleinen (eben den Datensätzen) zusammensetzt? Das wäre
zu
simpel, es gehört noch einiges mehr dazu. Es ist auch mehr als ein Karteischrank voller Zettel oder ein
Ordner voller
Dokumente. Solche Vorstellungen sind zu oberflächlich.
Fragen wir noch mal etwas anders:
Ist ein Datensatz eine Datei – ist die
Datenbank ein Ordner?
Nein, so einfach ist das auch wieder nicht. Wer
mit Windows
arbeitet, wird immer wieder mit "Ordnern" konfrontiert. Die Ordner
haben
Namen, z.B. gibt es da den Ordner "Eigene Dateien". Läßt man sich einen
Ordner
vom "Explorer" oder vom "Arbeitsplatz" aus zeigen, dann sieht man eine
Menge
Namen und Symbole. Diese stehen für weitere Ordner (Unterordner) oder
für
Dateien. Die Ordner und
Unterordner erkennt man an diesem Symbol:
|
oder auch |
|
Das sieht absichtlich so aus wie eine
Karteischublade bzw. eine Aktenmappe: man soll intuitiv ahnen: da
stecken mehrere Dinge (Dokumente oder Dateien) drin.
Übrigens: das englische Wort für "Datei" ist
file. Das ist kein Computer-Fachwort, es ist das alte
Wort für
"Kartei". Die Ordner werden
folder genannt, also Mappen.
Klickt man auf ein solches Symbol, dann erscheint,
was drinsteckt: der Inhalt des Ordners, und das ist wieder ein
Sortiment von
Symbolen und Namen - ein Unterordner kann wieder noch mehr Unterordner
und
noch mehr Dateien beherbergen.
Die Symbole sind übrigens nur eine
Orientierungshilfe für den Nutzer, von Windows spendiert, sie sind
nicht gespeichert, sie gehören nicht zum Inhalt der Ordner und Dateien.
Schalten Sie lieber um auf die
"Detail"-Ansicht, da sehen Sie erst die Dinge, auf die es ankommt.
Aber was ist wirklich
eine "Datei"?
Kann man das nicht ganz knapp sagen?
Einerseits
ja:
Jede
Datei ist eine Folge von Zahlen. Das ist aber nur die unterste
Ebene,
die
der Mensch normalerweise nicht sieht. Weiter oben wird's schwieriger,
denn
Computer speichern alles in Dateien, wirklich
alles.
Auch
ein Dokument oder ein Bild ist nur eine Datei. In dieser Form kann kein
Mensch ein Bild erkennen, das geht nur mit einer Software, die aus den
Zahlen Bildpunkte macht.
Sogar Programme sind Dateien! Man nennt solche
auch "ausführbare"
Dateien, denn es stehen lauter Befehle drin, die der Computer ausführen
kann
– wenn er die Programmiersprache beherrscht, in der die Programmdatei
geschrieben
ist.
Aber eine Daten
bank ist
mehr als eine Datei,
es gehören mehrere dazu. Diese Dateien stecken zwar meistens alle in
einem
Ordner, aber nicht unbedingt: das ist Sache der Software. Ein Daten
satz ist
weniger
als
eine Datei, denn meistens stecken sehr viele Datensätze gemeinsam in
einer Datei.
Abschweifung : Was bedeutet
eigentlich
"eine Datei öffnen"?
·
Man doppelklickt auf ein Dateisymbol, um die Datei zu
öffnen
– jeder kennt das. Das wirkt so selbstverständlich, ist es aber nicht.
Windows
verbirgt sogar dabei die Existenz von Programmen (wie sie heißen und wo
sie sich befinden) die mit der
Datei etwas anfangen können.
·
Wenn die Datei einen Namen hat, der mit .DOC endet, dann
wird
das Programm Word gestartet und Word öffnet die Datei. Oft heißt es
hier zwar Dokument, es ist aber nichts anderes als eine
Datei. Wenn
man Word nicht installiert hat, kann der Computer eine DOC-Datei nicht
öffnen.
Sie erscheint ihm dann als eine unbekannte Datei – als eine lange Folge
von
Zahlen und sonst nichts. Wenn andersrum ein Dateiname mit .DOC endet,
ist es nicht unbedingt eine Word-Datei, es kann also passieren, daß
Word daran scheitert. Nicht der Name ist entscheidend, sondern die
Struktur des Inhalts.
·
Oft gibt es mehr als ein Programm, mit dem man eine Datei
öffnen
kann! Windows nimmt automatisch dasjenige, das für die
Namenserweiterung
intern eingetragen ist. Wer Bescheid weiß, kann aber ein anderes nehmen
–
und dann sieht die Datei u.U. etwas anders aus, obwohl der Inhalt (die
Zahlenfolge) natürlich derselbe ist.
·
Wenn die Datei einen Namen hat, der mit .EXE endet, ist
es
ein Programm, und "öffnen" ist dann ein ungünstiges Wort, man sollte
"starten"
sagen.
·
Aber: Wenn man an einen Dateinamen
einfach
.DOC anhängt oder .EXE, dann wird daraus keineswegs ein Word-Dokument
bzw.
ein Programm! So einfach ist das nicht. Es kommt alles auf das
Eingemachte
an: die innere Struktur. Wenn die nicht stimmt, passiert nichts
Sinnvolles.
Tip: Windows hat im "Explorer"
oder "Arbeitsplatz"
eine Einstellmöglichkeit unter "Extras / Ordneroptionen / Ansicht", die
da
lautet "Erweiterungen bei bekannten Dateitypen ausblenden". Nehmen sie
das
Kreuzchen weg, das dort normal eingestellt ist! Machen Sie das
unbedingt,
Sie werden sonst in den Dateiübersichten unvollständig informiert: Sie
sehen
die Dateitypen nicht: die Anhängsel .DOC oder .EXE usw. werden dann
einfach nicht gezeigt!
Nochmal anders gefragt: Aus was besteht eine Datei?
Jede Datei hat einen
Namen
und einen
Inhalt. In der Übersicht
des
Ordners sieht man bei jedem Namen ein Symbol (auch Icon genannt). Das
Symbol
gehört, wie gesagt, nicht zur Datei! Windows hat eine Liste von
Namenserweiterungen
und ordnet diesen jeweils ein Symbol zu , aber genau genommen hat dieses mit
der
Datei gar nichts zu tun.
Der
Dateiname
(auch ein Ordnername) kann bis zu 255 Zeichen lang sein, inkl. der
Erweiterung. Es ist sehr zu raten, nicht solche langen Namen zu
verwenden, denn das hat Nachteile. Wenn man aufgefordert wird, einer
Datei einen Namen zu geben
(z.B. bei "Speichern unter..."), halte man sich an folgende Regeln (es
sei
denn, man weiß genau, was man will und warum):
- Nicht mehr als 20 Zeichen
- Nur Kleinbuchstaben,
Ziffern und Bindestrich verwenden
- Ein Punkt nur zwischen Name und
Erweiterung
- Keine Leerzeichen im Namen (besonders
wichtig, denn es kann ärgerliche Probleme verursachen)
- Keine Umlaute oder anderen
Sonderbuchstaben
- Keine andere Erweiterung als die
automatisch vorgeschlagene. Wenn keine vorgeschlagen wird, dann nicht
mehr als drei Zeichen.
Diese Regeln sind nicht zwingend, d.h. Bill Gates
besteht nicht darauf, aber man erspart sich damit wirklich Ärger, z.B.
bei der Übertragung von Dateien nach UNIX oder Linux.
Nebenbei: Word, hilfreich wie es
sein will, schlägt als Namen immer die erste Zeile des neuen
Textes
vor.
Ändern Sie
das dann unbedingt, denn fast immer ist so ein "Name" unpraktisch lang und
enthält Leer- und Sonderzeichen.
Früher, zu DOS-Zeiten, da
konnte ein Name
nur
aus 8 Zeichen plus 3 Zeichen Erweiterung bestehen. Viele halten sich
noch
heute daran, um keine Probleme beim Kopieren zwischen den Plattformen,
mit
alten Programmen, beim Austausch mit anderen Anwendern und bei der
Arbeit
unter DOS zu haben. Auch alle offiziellen
allegro-Dateien
folgen dieser Regel. Die Dateien im Kern von Windows übrigens auch
immer noch...
Der
Inhalt
einer Datei, ob .DOC oder .EXE oder .TXT oder sonstwas, ist
(wir sagten es schon)
immer nur eine Folge von Zahlen,
und zwar Zahlen zwischen 0 und 255. Das sind die Zahlen, die man mit 8
Nullen und Einsen
(sog. Bits) codieren kann, daher kommt das. (Ab 256, das ist 2 hoch 8,
braucht
man 9 Bit.) Eine Folge von 8 Bit nennt man auch
Byte.
Auf
den unteren Ebenen können die Rechner nur mit Bytes arbeiten, daher ist
das
eine so wichtige Einheit.
Zum Verständnis sehr wichtig: In der Datei steht keine Information über
sich selbst, sie enthält keine Angaben (sog. "Metadaten") zu ihrer
eigenen Struktur und zu ihrem Inhalt! Wenn man nur die Zahlenfolge
betrachtet, wird man nicht schlau draus. Der Dateityp, .DOC oder .html
oder was auch immer, ist eine Äußerlichkeit, die vollkommen irreführend
sein kann.
Die kleinste mögliche Datei hat 0 Byte Inhalt,
d.h. sie
besteht nur aus ihrem Namen. Nach oben gibt es kaum eine Grenze. Wenn man sich von einem Ordner die
"Detail"-Ansicht anschaut, sieht man, wie groß jede Datei ist, meistens
angegeben in K, wobei ein K = 1024 Byte ist. (Warum 1024? Das ist 2
hoch 10. )
Wo sind aber die
Buchstaben in
einer Textdatei, wenn die nur aus Zahlen besteht? Sie sind natürlich
verschlüsselt. Jeder Buchstabe bekommt eine Nummer zugeordnet, z.B.
wird das 'A' mit 65, das 'a' aber mit 97 verschlüsselt. Meistens
jedenfalls! Eine Software kann es u.U. auch anders machen, das kann der
Nutzer nicht sehen. Was er sieht, ist fast nie
das, was
wirklich gespeichert
ist. Das erschwert an vielen Stellen das Verständnis, das ist klar, mit
Intuition kann man das nicht durchschauen.
Außer den
Textzeichen braucht
eine Textdatei noch mindestens ein besonderes
Steuerzeichen
für "Neue Zeile". Unter DOS/Windows sind das zwei Zeichen: die Codes 13
und 10 hintereinander. Sie sind normalerweise unsichtbar, wenn man die
Datei "öffnet". Was man
sieht, ist ihre Wirkung: es beginnt eine neue Zeile. Unter UNIX ist es nur der Code 10, der zwei Zeilen trennt. Ein
anderes Steuerzeichen kommt auch oft vor: Code 09 für "Tabulator". Eine
TXT-Datei enthält nur
Text und diese wenigen Steuerzeichen, eine .DOC-Datei enthält noch sehr
viel mehr Steuerzeichen – nur WinWord kennt sie alle und kann damit
umgehen...
Neuerdings wird immer mehr mit
Unicode
gearbeitet. Das ist eine Methode, mit der man mehr als 256 verschiedene
Zeichen codieren kann. Was über die normalen Buchstaben und Ziffern
hinausgeht,
das wird mit Hilfe von zwei oder drei Bytes verschlüsselt. Das 'a'
bleibt
Code 97, aber 'ä' besteht aus zwei Codes: 195/164, statt 132 bei DOS
und
228 bei Windows!
Mehr dazu steht in einem eigenen Kapitel:
http://www.allegro-c.de/unicode/
.
Noch 'ne Abschweifung : Was passiert
bei "Speichern
unter ..."? (Englisch: "Save as ..." )
·
Man wird dann ja nach einem Namen gefragt. Oft wird einer
vorgeschlagen, aber
denken Sie an die Regeln! Den Namen können Sie beliebig ändern, die
vorgegebene
Erweiterung sollten Sie normalerweise nicht ändern.
·
Dabei kann man auch vorgeben, in welchem Ordner die Datei liegen
soll!
·
Aber
dann: es entsteht eine Datei, was sonst, mit dem eingegebenen Namen.
Das Programm
"weiß" also, wie es das Dokument, oder was es ist, in Zahlen
umzuschlüsseln hat, damit es gespeichert werden kann - denn anders als
mit Zahlen verschlüsselt
kann man nun mal nichts speichern.
·
Wenn man später die Datei wieder "öffnet", liest das Programm die
Zahlen
wieder aus der Datei und "weiß", was es damit zu tun hat, damit wieder
der Text oder das Bild entsteht, aus dem die Datei bei "Speichern
unter ..."
entstanden war.
·
Als Mensch bekommt man also die Zahlen nicht zu sehen, die
Programme
ersparen einem das. Wer sich auskennt, kann aber mit besonderen
Programmen
sich jede Datei auch in der internen Form anschauen. Oft bringt das
nichts,
es kann aber für Fehlerdiagnosen manchmal sehr wichtig sein.
Eine
Datenbank
- Besteht meistens aus mehreren Dateien
- Diese müssen nicht im selben Ordner
liegen, tun es aber meistens
- Die Dateien unterscheiden sich
mehrfacher Hinsicht:
1.
Inhalt (was für Angaben stecken
drin?)
2.
Struktur (wie sind die Angaben
gestaltet und
codiert?)
3.
Funktion (was wird damit gemacht,
wofür wird
die Datei gebraucht?). Äußeres Merkmal dafür ist meistens die
Namenswerweiterung.
4.
Wichtigkeit (manche Dateien dürfen fehlen, andere sind
lebenswichtig -
ohne sie geht nichts)
5.
Größe (das ist die Anzahl der Bytes)
Mindestens eine der Dateien enthält die Daten, die
man eingetippt hat, das wird man intuitiv vermuten. Aber welche ist es?
Und
wozu gibt es da noch andere Dateien –
müssen wir das
wissen, müssen wir uns darum
kümmern? Im Prinzip sollte es
reichen, wenn die
Software alles weiß, aber es gibt
Situationen, wo ein paar Kenntnisse doch sehr helfen. Denn Wissen gibt
Sicherheit, Unwissenheit macht verletzbar und unmündig.
Am Beispiel einer
allegro-Datenbank
sind die Dinge gut erklärbar. (Bei
anderen Systemen kann es ähnlich, aber auch völlig anders aussehen.)
Ganz
ausführlich steht es in den Kapiteln 0.3 und 0.8 des Handbuchs. Hier
beschreiben
wir nur die wichtigen Bestandteile, die immer gebraucht werden.
Die Datenbank braucht einen Namen. Der Name der
Demo-Datenbank ist
CAT.
Die Namen der zugehörigen Dateien beginnen deshalb alle mit
CAT.
Die wichtigsten
Dateien einer allegro-Datenbank sind
diese:
|
Datei
|
Name.Typ
|
Inhalt und Funktion : Wozu ist
sie gut, was steht drin?
|
|
Datendateien
|
CAT_1.ALD
CAT_2.ALD
|
Enthalten die eingegebenen
Daten. Es kann mehrere solche Dateien geben. Diese haben dann Nummern
von 1 bis 255. Diese Dateien muß man unbedingt sichern, die anderen sind reparabel.
|
|
Indexdatei
|
CAT.ADX
|
Da stecken die
alphabetischen Register drin, über die man zugreift
|
|
Kurztiteldatei
|
CAT.STL
|
Die Kurzzeilen, die man
sieht, wenn man eine Ergebnismenge betrachtet
|
|
Adressentabelle
|
CAT.TBL
|
Die Adressen (=
Positionen) der
Datensätze in den Datendateien
|
|
*Restriktionendatei
|
CAT.RES
|
Hilfsdatei zur
Einschränkung von Erg.Mengen (nicht bei jeder Datenbank)
|
|
*LOG-Datei
|
CAT.LOG
|
Zur Datensicherung: Kopien
der neuen und veränderten Datensätze
|
|
Konfiguration
|
$A.CFG
|
Darin steht, welche
Datenfelder es geben kann und andere Einstellungen
|
|
Indexparameter
|
CAT.API
|
Vorschriften für die
Bildung der Index-Einträge aus den Daten
|
|
Anzeigeparameter
|
D-*.APR
|
Vorschriften für den
Aufbau der
Anzeige eines Datensatzes
|
|
*INI-Datei
|
CAT.INI
|
Einstellungen für die
Benutzung der Datenbank
|
Genau diese Dateien liegen manchmal alle zusammen
in einem Ordner, die letzten vier aber oft woanders, und zwar im
Programmordner (normalerweise c:\allegro ). Als
Beispiel schauen Sie sich den Ordner demo2 an, der an Ihrem allegro-Programmordner hängt.
Was man eintippt, das steckt das Datenbanksystem
also alles nur in die Dateien des Typs .ALD, die anderen Dateien werden
mitgeliefert oder legt das System selber an, und sie lassen sich
notfalls (über das "Reorganisieren"-Menü) wiederherstellen. Die mit *
markierten Dateien sind nicht lebensnotwendig, aber wenn eine der
anderen fehlt, kann man mit der Datenbank nicht arbeiten, die Software
streikt dann mit entsprechenden Fehlermeldungen.
Die letzten vier Dateien sind schlichte
Textdateien, die man modifizieren kann. Ein Hilfsprogramm für die
Bearbeitung von Textdateien, ein sog. Editor (dt. Bearbeiter), wird
dazu gebraucht. Theoretisch kann man WinWord nehmen, es wird aber davon
abgeraten! Der Anhang D des Handbuchs
beschreibt, wie man den zu allegro gehörigen
Texteditor X.EXE
benutzt. Das kann jeder in wenigen Minuten lernen! Weil
man dabei automatisch ein besseres Gefühl dafür bekommt, was Dateien
eigentlich
sind (jedenfalls Textdateien), wird es sehr dringend empfohlen, den
Umgang
mit diesem Editor zu lernen. Als Alternative kann man auch den Editor
namens edit von Microsoft
nehmen. Man startet ihn mit dem Befehl edit.
Geheimtip: Geben Sie im
Schreibfeld
von a99 mal ein:
h dos
dann erhalten Sie eine Kurzeinführung mit Übung.
Das ist ein Schritt zur Mündigkeit im Umgang mit dem PC. Sie werden es nicht bereuen, vor
allem wenn Sie bisher noch keine rechte
Vorstellung hatten, was DOS eigentlich ist.
Nicht direkt zur Datenbank selbst gehört das schon erwähnte Datenbanksystem
- das sind die Programme (Dateityp .EXE), ohne die man mit der
Datenbank gar nichts anfangen könnte. Ein Datenbanksystem besteht aus
zwei Arten von Dateien:
1. Programme
Das wichtigste Programm des allegro-Systems ist heute (2007) das Programm allegro.exe, aus historischen Gründen gibt es eine Kopie davon mit dem Namen a99.exe. Es gibt noch einige andere Programme für besondere Aufgaben, so z.B. index.exe zum Erneuern der Indexdatei einer Datenbank oder import.exe zur Umwandlung von Fremddaten.
2. Vorschriften
Flexibel
wird ein Datenbanksystem nur dadurch, daß man ihm von außen
Vorschriften machen kann, die nicht fest in die Programme eingebaut
sind. Und diese Vorschriften stehen in Textdateien, die man leicht
bearbeiten kann. Nicht mit WinWord, sondern mit einem viel einfacheren
Programm, einem Texteditor wie z.B. Notepad.
Dateien mit Vorschriften für das System, das sind im Fall allegro die folgenden:
Konfiguration: z.B. $A.CFG. Darin
steht, welche Datenfelder in den Sätzen der Datenbank vorkommen können.
Wenn man weitere, neue Felder braucht, kann man sie hier jederzeit in
die Liste der Felder einfügen.
Parameter: z.B. cat.api für die Register der Datenbank (welche Felder sollen in welche Register?), d-krtf.apr für die Anzeige der Datensätze (welche Felder sollen in welcher Reihenfolge angezeigt werden?), mab2.aim
für das Umwandeln von MAB-Daten in allegro-Daten des A-Formats (welches
MAB-Feld sol iinn welches allegro-Feld umgewandelt werden?)
Umwandlungstabellen::d-utf8.apt zur Umwandlung der internen Daten (sog. OstWest-Code) in Unicode
Makros:
Das sind eigentlich kleine Programme, oder Folgen von Befehlen, die man
auch mit der Hand ausführen könnte. Sie dienen hauptsächlich der
Automatisierung von häufig vorkommenden oder komplizierten Aktionen.
Viele Menü- und Button-Funktionen sind in Wahrheit FLEXe - und damit
sind sie modifizierbar.
Die Makros sind Dateien vom Typ .FLX und man kann sie ebenfalls mit
einem Texteditor leicht betrachten und bearbeiten.
Hilfetexte: Dateien im RTF-Textformat, z.B. doku.rtf (das sog. Füllhorn") oder flex.rtf, die FLEX-Dokumentation.
Geben Sie ein h doku bzw. h flex,
dann sehen Sie diese Dateien. In solche Texte eingebaut sind oft
anklickbare Funktionen, was Sie an diesen beiden Beispielen gut
erkennen. Die Menüs für zusätzliche Aufgaben wie Erwerbung und Ausleihe
sind alle mit dieser Technik gestaltet. Damit wird es möglich, daß sich
Anwender für eigene Anwendungen eigene Menüs entwickeln.
Die
hier genannten Dateien werden mitgeliefert, sind aber frei
modifizierbar (es stehen Kommentare drin), und der Anwender kann
beliebig viele eigene Dateien dieser Typen erstellen.
Möglicherweise werden Sie jetzt mehr darüber wissen wollen, wie denn
die
bibliothekarischen Daten aussehen und warum es so ist. Schon bei der
ersten
Benutzung sehen Sie ja z.B. die Nummern der Datenfelder, siehe oben,
aber
vielleicht sind Sie noch im Zweifel, ob das eine gute Methodik ist.
Dann
lesen Sie mehr über die Hintergründe.