PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH

PROJECT CONSULT ECM DRT DMS KM ILM

Contentmanager - Magazin Tipps für die DMS-Einführung Bereits bei der Auswahl der Dokumenten M	Contentmanager - Magazin Relevante AdWords-Anzeigen mit Platzhalt Mit Platzhaltern können Werbetreibende i
XING - Information & Documen [DE] Jobangebot: IT-Spezialist / IT-Proj Sehr geehrte Damen und Herren, mein Name	XING - Information & Documen [DE] Jobangebot: IT-Spezialist / IT-Proj Sehr geehrte Damen und Herren, mein Name

Home

Englisch

Newsletter

Intern

Hilfe

Kontakt

Impressum

Rechtshinweis

Detailsuche

PROJECT CONSULT Dr. Ulrich Kampffmeyer

Unternehmen

Vision

Grundsätze

Leistungen

Methoden

Qualität

Mitgliedschaft

Slide-Show

Mitarbeiter

Auszeichnungen

Unternehmensinfo

Adresse

AGB

Beratungsangebot

Fachberatung

Coaching

Projekt-Management

Workshops

Anfrage

Seminarangebot

Seminare

Vorträge

Seminartermine

Handouts

Anmeldung

Projekte

Branchen

Lösungen

Karriere

Perspektive

Stellenangebot

Stellenmarkt

Markt-Regeln

Presse

Pressemitteilung

Interview

Artikelangebot

Autorenrechte

Akkreditierung

Website

Sitemap

Site-Info

Aktualisierte Seiten

Impressum

Online-Publikationen

Google Werbung

Archivierte alte Webseite - Datenschutzerklärung, Adressen und Links zu externen Seiten sind vielfach ungültig - Bitte besuchen Sie www.PROJECT-CONSULT.com
Archived old Web Site - Privacy declaration, addresses and links to external web sites may be invalid - Please visit www.PROJECT-CONSULT.com

Multilinguale Informations- und Retrievalsysteme - Technik und Anwendungsbeispiele

Abstract

Bedeutung multilingualer Softwaresysteme mit optischen Speichern für den europäischen Wirtschaftsraum

Software-Design

Anwendungsbeispiele

Ausblick






Von Dr. Ulrich Kampffmeyer		Kampffmeyer

Abstract



This paper on multilingual information and retrieval systems with optical mass storage describes the technical principles of software design. The different layers and modules from the user interface via transformation modules, thesaurus modules and fulltext interpretation to database management are explained in detail. Three examples of multilingual document imaging systems are presented:



HYPARCHIV		multilingual standard optical filing software for Microsoft Windows and Novell Netware;


wfBase		multilingual press and commerce information system base on four ISDN-knots in Switzerland;


HEMIS		multilingual information system for CD-ROM distribution on environmental institutions, projects and programmes of the UN Environmental Programme UNEP/HEM.

Bedeutung multilingualer Softwaresysteme mit optischen Speichern für den europäischen Wirtschaftsraum



Das vereinigte Europa ist ein vielbenutztes Schlagwort. Auch nach Öffnung der Grenzen und Beseitigung der Handelshemmnisse bleiben sprachliche und kulturelle Barrieren bestehen. Diese betreffen alle unternehmen und Organisationen, die in verschiedenen Ländern tätig sind.



Die Sprachbarriere betrifft nicht nur die reine Sprachverstehen- und Sprachübersetzungsebene, sondern schließt mehrere Ebenen unterschiedlicher Interpretation, Bedeutung in verschiedenen Zusammenhängen und Umsetzung in Fachnomenklatur ein. Im Wirtschaftsleben ist nicht die Umsetzung in die Umgangssprache sondern die Einhaltung "ungeschriebener" Gesetze der Fachsprache ausschlaggebend.



Neben den unterschiedlichen sprachlichen Anforderungen sind Umrechnungen von Maßen und Währungen, Umstellungen von Formaten (Datum, Adresse, Schreibweisen) etc. erforderlich.



Multilinguale Software ist überall dort erforderlich, wo auf gleiche Information unabhängig von der Art der Quelle zurückgegriffen werden muß. Dies betrifft insbesondere:



		Handelsunternehmen



		Dienstleistungsunternehmen



		Internationale Behörden und Organisationen



		Produktionsunternehmen mit Sublieferanten in unterschiedlichen Ländern



		Kommunikationsunternehmen



		Banken



		Versicherungen



		Kontrollinstitutionen



		(Flugsicherung / Polizei / Katastrophenschutz / Umweltdaten), etc.



Vielerorts wird die englische Sprache als Standard für die Kommunikation erachtet. Die Benutzung einer Fremdsprache kann jedoch zu Fehlinterpretationen führen, wenn die genaue Bedeutung von Begriffen und Zusammenhängen nicht bekannt ist. Umgangssprachkenntnisse sind hier nicht ausreichend. Je komplexer Software und die zugrunde liegenden Informationen werden, desto komfortabler und umfassender muß die Unterstützung durch das Programm werden. Dies betrifft insbesondere Anforderungen an die Gestaltung der Benutzeroberfläche, Mitteilungen zur gegenwärtigen Aktion, Zustandsmeldungen, kontextsensitive Hinweise (besonders bei Fehlbedienung oder kritischen Programmverzweigungen) sowie Hilfetexte. Letztere müssen als Index wie auch kontextsensitiv zur Verfügung stehen.



Moderne "Windows"-orientierte Programme verfügen in der Regel über diese Eigenschaften. Wie die meisten Programme sind sie jedoch nur in einer Benutzersprache gehalten.



Standardsoftware wird heute hauptsächlich von wenigen großen Softwarehäusern in den USA hergestellt. Dies bedeutet, daß Software und Dokumentation zunächst in Englisch oder in amerikanischem Englisch vorliegen. Von dieser Ursprungsversion ausgehend werden verschiedene nationale Versionen erstellt. In Abhängigkeit von der Bedeutung eines Marktes liegen diese mehr oder weniger verzögert in unterschiedlichen Release-Ständen vor. In einem solchen Standardprogramm sind häufig die Bildschirmdarstellungen, zugehörige Texte etc. im Hauptteil des Programms enthalten. Dies macht eine Übersetzung mit Anpassung der Darstellung und zusätzlichen Tests sehr aufwendig.



Auch wenn auf die gleichen Daten zugegriffen werden kann, ist ein Wechsel der Benutzersprache während der Laufzeit nicht möglich, sondern das anderssprachige Programm muß zeitaufwendig komplett geladen werden. Auch verfügen die meisten Standardprograme über keine integrierte Datenbank oder Ressourcen-Management-Komponente, die die Verwaltung der verschiedenen Sprach- und Funktionsmodule, sogar deren Erstellung und Pflege erleichtern würden.



Herkömmliche Standardsoftware ist daher bereits aus Design-Gesichtpunkten nicht multilingual ausgelegt. Der vorliegende Artikel beschäftigt sich mit multilingualen Informationssystemen, die auf einer Datenbank basieren.

Software-Design



Multilingualität muß ebenso wie das modulare Zuladen von Programmteilen oder Funktionen bereits beim Entwurf eines Programms berücksichtigt werden. Die nachträgliche Umstellung einer vorhandenen Software ist kaum möglich. In einem solchen Fall eis ein komplettes Redesign unter Einsatz moderner Tools sinnvoller.

Struktur und allgemeine Anforderungen an multilinguale Software



Multilinguale Software folgt folgenden Designkriterien:



		Modulares Design mit klarer logischer und programmtechnischer Trennung der verschiedenen Ebenen (Benutzerschnittstelle, Hauptprogramm, Ressourcen, Transformations-Module, Datenbank, etc.) Die Interaktion wird über Nachrichten (Messages) und globale Variablen gesteuert.



		Keine Textkomponente darf in ausführenden Programmteilen enthalten, sondern muß über Variable referenziert sein. Die Umschaltung von einer Sprache zur anderen erfolgt über ein globale Variable.



		Die Texte werden strukturiert in Ressource-Libraries (Bibliotheken) gehalten und werden über Variablen aufgerufen. Diese Bibliotheken müssen einfach zu pflegen und die Texte zur Laufzeit aufrufbar sowie in der Applikation ladbar sein.



		Alle Teile einer Anwendung müssen über definierte Schnittstellen verfügen. Dies betrifft insbesondere die Benutzerschnittstelle, die eigentliche Applikation und das Betriebssystem sowie die Zusatzmodule der Applikation.



		Applikation, Benutzerschnittstelle und Betriebssystem müssen variable Textfeldlängen und -positionen unterstützen. Diese können in Abhängigkeit der gewählten Sprache unterschiedlich sein.



		Applikation, Betriebssystem, Bildschirm- und Druckertreiber sowie die Datenbank müssen unterschiedliche Fonts, Zeichensätze, Sortierungen, Datumsformate, etc. unterstützen. Voraussetzung ist die Eignung des Betriebssystems.



Die multilinguale Anwendung gliedert sich dementsprechend in verschiedene Module und Ebenen, die miteinander kommunizieren. Das eigentliche Anwendungsprogramm, das Teil der Datenbankanwendung sein kann, steuert über Nachrichten und globale Variable die Wahl einer Sprache, deren Anzeige (und Druck) sowie die eigentlichen Recherche- und Umwandlungsfunktionen.



Die Variable "Lx" für "Language Resource" bestimmt, welche Texte angezeigt und welche Transformationsmodule und Auswahllisten benutzt werden, um eine Eingabe oder eine Recherche in der angewählten Sprache zu steuern. Die Information in der Datenbank selbst wird nicht verändert, nur Anzeige und Ausdruck werden umgesetzt.



Die verschieden Schichten einer multilingualen Anwendung sind auf Abb. 3 dargestellt.



Schicht 1 beinhaltet im wesentlichen die Darstellung der Informationen, Schicht 2 dient zur Transformation der angezeigten Informationen von einer Sprache in eine andere, Schicht 3 verwaltet die Zugriffsinformationen und dient zur Recherche, Schicht 4 verwaltet die "Dokumente" (Datensätze, Bilder, Grafiken etc.) auf optischen Speichermedien. Auf die letztgenannte Schicht 4, das IRS Information Resources Management Programm soll in diesem Artikel nicht näher eingegangen werden (vergleiche hierzu Kampffmeyer, Ulrich; "Kombinierte WORM- und magnetooptische Massenspeicher und vorgangsorientierte Informationsverarbeitungssysteme", GI Gesellschaft für Informatik, Arbeitskreis "Datenbanken", Tagung am 19.2.1990, Universität Oldenburg, 1990). Die einzelnen Ebenen und die darin enthaltenen Komponenten werden im Folgenden erläutert.

Benutzeroberfläche und Anwendung



Die Benutzeroberfläche ist in starkem Maße von dem darunterliegenden Betriebssystem abhängig. Viele Betriebssysteme werden den Anforderungen für multilinguale Software nicht gerecht, da sie zur Laufzeit nicht umkonfigurierbar sind und keine internationalen Zeichensätze sowie Formate unterstützen. Für multilinguale Anwendungen sind Betriebssysteme mit einer grafischen Benutzeroberfläche wie Microsoft Windows, OS/2 Presentation Manager oder Oberflächen, die auf XWindows basieren (OSF Motif, OpenLook u.a.) gut geeignet. Sie gestatten die Kontrolle der Bildschirmanzeige weitgehend unabhängig vom eigentlichen Betriebssystem.



Es ist grundsätzlich zwischen



		der Standard-Windows-Oberfläche und



		der auf Basis dieser Oberfläche realisierten anwendungsspezifischen Benutzeroberfläche zu unterscheiden. Letztere benutzt die Mittel, die von der Standardoberfläche bereitgestellt werden, um die Funktionen der Applikation darzustellen.



Eine grafische Oberfläche bietet zahlreiche Vorteile: Vom verringerten Lernaufwand, integrierte Hilfefunktionen bis zur einfachen Benutzerführung, die wahlweise über Mausaktionen, Anwahl aus Menüleisten oder Tastaturkombinationen steuerbar ist. Ein besonderer Vorteil von Windows-Oberflächen ist die frei skalierbare Größe von Fenstern und anderen Anzeigen.



Es ist wenig sinnvoll für multilinguale Anwendungen alle Anzeigen in der Applikation mit einer eigenen Benutzeroberfläche zu realisieren, da dies die Zahl der einsetzbaren Bildschirm- und Druckertreiber einschränkt. Die Benutzeroberfläche der Applikation sollte soweit möglich auf Standardroutinen der Windows-Oberfläche zurückgreifen.



An die Benutzeroberfläche (Standard-Windows und Anwendungsoberfläche) sind folgende Anforderungen zu stellen:



		Umschaltbarkeit der Tastaturbelegung während der Laufzeit gesteuert durch die Applikation



		Umschaltbarkeit der Bildschirmdarstellung während der Laufzeit gesteuert durch die Applikation



		Anzeigemöglichkeit von spezielle Zeichensätzen (z.B. Deutsch: ä, ö, ü, ß; Französisch: é, è, ê, ç; Spanisch: Í; Dänisch: Ø, å, Æ; Ungarisch: ÿ, ý, ï; Griechisch: , , *; etc.)



		Umschaltbarkeit von Formaten während der Laufzeit (z.B. Datum, Währung, Zeit, etc.)



		Automatische Anpassung der Anzeige am Bildschirm in Bezug auf unterschiedliche Textlängen, Sonderzeichen, Fonts, etc. Die Anpassung muß in Abhängigkeit der verfügbaren Bildschirmauflösung durchführbar sein.



		Sprachabhängige, kontextsensitive Hilfe in Abhängigkeitder Position auf dem Bildschirm, des aktuellen Programmzustandes und der durchgeführten oder durchführbaren Aktion.



		Zuladbare Module während der Laufzeit, ohne das Programm zu verlassen.



Wichtigstes Merkmal einer multilingualen Anwendung ist die Umschaltbarkeit während der Programmausführung, ohne daß ein anderes Programm geladen und gestartet werden muß und ohne daß sich der Bildschirmaufbau und angezeigten Informationen (inhaltlich) ändern.



Die einzelnen Textkomponenten werden in separaten Dateien gehalten, sog. "Resource Libraries". Diese werden zur Laufzeit in Abhängigkeit der Sprachenwahlvariable "Lx" geladen.



Vorausbedingung für die Benutzung von Sprachressourcen ist, daß alle Texte in einem Programm, die angezeigt oder gedruckt werden sollen, durch eine eindeutige Schlüsselvariable mit der zugehörigen Bibliothek referenziert sind.



"Resource Libraries" werden benötigt für:



		alle statischen Textanzeigen auf einem Bildschirmformular ("Statische" Anzeigen sind Texte wie Beschriftungen, die sich erst beim Wechsel des Bildschirmformulars ändern). Dies sind Texte, die in der Regel mit einem bestimmten Bildschirmformular fest verbunden sind.



		dynamische Textanzeigen auf dem Bildschirmformular, die sich in Abhängigkeit des Zustandes verändern oder einblenden (Messages). Hierzu gehört auch das "Ausgrauen" von nicht aktiven oder auswählbaren Funktionen auf dem Bildschirmformular (Schaltflächen) und in Menüauswahllisten.



		Hilftexte, die automatisch erscheinen oder interaktiv abgerufen werden (Helptexts).



		Fehlermeldungen, Systemmeldungen und andere Hinweismeldungen, die aktionsbezogen erscheinen.



Viele Anwendungen benutzen Icons (Sinnbilder) und Schaltflächen zur vereinfachten Anwahl von Funktionen. Sind sie mit Texten versehen oder durch Buchstaben (als Abkürzung) gekennzeichnet, so müssen auch diese Icons bei einem Sprachwechsel umgeschaltet werden. Es empfiehlt sich daher, auch die Sinnbilder in eigenen Ressourcen-Bibliotheken zu halten und nicht direkt im Programm zu verwalten. Gleiches gilt auch für Icons mit Grafiken, wenn die Grafik Dinge zeigt, die in einem anderen Sprachraum oder Land, nicht mit der gezeigten Funktion des Icons verknüpft werden.



Objektorientierte Programmiersprachen und Datenbanken unterstützen häufig die Benutzung von ladbaren Ressourcen und sind deshalb herkömmlichen Tools vorzuziehen.



Für die Erstellung der eigentlichen Anwendung, die sich auf eine Programmiersprache oder eine Datenbankprogrammiersprache stützen kann, ist die Wahl des geeigneten Tools wichtig. Die Anwendung stellt die übergreifende und integrative Komponente im gesamten System dar. Die Applikation beinhaltet nicht nur die üblichen Algorithmen zur Datenverarbeitung und Module für Ein- und Ausgabe, sondern ebenfalls die Steuerung und Auswahl der Sprachressourcen (Transformationsmodule, Auswahllisten, Thesauri, Hilfetexte, Mitteilungen und Hinweistexte, Bildschirmaufbau und -anzeige, etc.).



Objektorientierte Programme mit einem "Message"- Konzept, wie es z.B. Microsoft Windows beinhaltet, erlauben die ständige Kontrolle über die verwendeten Ressourcen und den Zustand der Bildschirmanzeigenzeige. Für die Kontrolle der Module auf Ebene 2 sollte eine direkte Kommunikation aufgebaut werden. Für die Kommunikation mit der Datenbank, in der die eigentlichen Information verwaltet und gehalten wird, kann SQL als standardisierte Kommunikationsschnittstelle benutzt werden. Alle Module der Schichten 2, 3 und sollten während der Laufzeit direkt aufrufbar oder zuladbar sein.

Transformationsmodule



Die numerischen Informationen in der Datenbank werden in einem Format abgelegt, daß bei Bedarf für eine bestimmte zugeladene Sprachressource gewandelt wird. Diese Wandlung wird ebenfalls durch die Variable "Lx" gesteuert. Transformationsmodule sind wesentlich einfacher als Textübersetzer zu realisieren, da sie nach genauen Regeln und nur mit numerischen Werten arbeiten.



Die wichtigsten Standard-Transformationsmodule sind:



		DatumsformatumwandlungDieses Modul wandelt die Anzeige zwischen amerikanischen (Monat-Tag, Jahr) und europäischen (Tag-Monat-Jahr) Format um. Diese Funktion wird häufig direkt vom Betriebssystem unterstützt und erlaubt auch die volle oder abgekürzte Verwendung des Monatnamens. Das Transformationsmodul sollte auch für die Umwandlung von Datumsformaten vor dem Jahr 2000 auf das neue Jahrtausend hin ausgelegt sein. Dies ist wichtig für alle Datenbestände mit Aufbewahrungspflichten von 7 Jahren und mehr. Das Datum-Transfer-Modul muß ebenfalls für die richtige Sortierung bei der Anzeige sorgen.



		ZeitformatumwandlungÄhnliches wie für die Datumsformate gilt für die Transformation von Zeiten und deren Anzeige. Für international agierende Unternehmen empfiehlt sich die Speicherung von Zeitdaten im "coordinated universal time"-Format (UTC). Datum- und Zeittransformationsmodule können so ausgelegt werden, daß sie prüfen, ob die interne Zeiteinstellung des Systems korrekt ist (das aktuelle Datum/Zeit muß immer jünger sein als das zuletzt gespeicherte Dokument; Abgleich mit Standard-Arbeitszeiten und Werktagen; etc., um gegebenenfalls des Ausfall der Systemzeit festzustellen und zu melden).



		Adressen-TransformationDie Adressenformat-Transformation betrifft mehr den Ausdruck als die Anzeige am Bildschirm. Postanschriften sind in Europa nicht standardisiert und benutzen unterschiedliche Reihenfolgen von Straße, Hausnummer und Postleitzahlen. Das Transformationsmodul erkennt, welches Land bei einem Anschreiben gewählt ist und stellt für den Druck das richtige Adressformat ein.



		Transformation von WertenFür international tätige Handels- und Produktionsunternehmungen stellt die Transformation von Maß-, Entfernungs- und anderen Werten eine wichtige Anforderung dar. Dies soll an einem Beispiel erläutert werden:In der Mineralölindustrie werden täglich große Mengen unterschiedlicher Ölsor-ten und Ölprodukte transportiert und zwischengelagert. Je nach Art, Gewicht und Temperatur ändern sich Werte sowie davon abhängig Zoll- und Steuersätze. Besonders bei grenzüberschreitendem Verkehr ist daher eine Umwandlung in die landesüblichen Einheiten erforderlich.Zu den wichtigsten umrechenbaren Werten gehören Währungen sowie Entfernungs-, Gewichts- und Hohlmaße.



		EDI-DatenDer standardisierte elektronische Datenaustausch (EDI - Electronic Data Interchange), z.B. EDIFACT, erlaubt die Abwicklung kompletter Geschäftstransaktionen auf elektronischem Wege. Hierbei entstehen keine Papieroriginale mehr. Die Daten sind digital zu archivieren. Für die Anzeige und den Ausdruck werden EDI-Codes in Texte umgesetzt. Diese Umsetzung in Klartext kann durch eine Sprachsteuervariable ebenfalls sprachabhängig gemacht werden. Bei EDI-Informationen ist zu berücksichtigen, mit welcher Version einer bestimmten EDI-Anwendung die Daten zu transformieren sind.



Entsprechend verschiedener branchenspezifischer Anforderungen an eine Applikation können weitere Transformationsmodule hinzukommen. Hierzu gehören z.B. die Umsetzung von Produktcodes in Klartext.

Auswahllisten



Grafische Oberflächen wie Microsoft Windows unterstützen einfache (single select) und mehrfach (multiple select) Auswahllisten. Bei den erstgenannten Auswahllisten kann aus der angezeigten Liste nur ein Eintrag markiert und übernommen werden. Bei multiplen Auswahllisten können einer oder mehrere Einträge markiert und übernommen werden.



Auswahllisten bieten bei Datenbankanwendungen eine Reihe von Vorteilen gegenüber Standard-Texteingabefeldern:



		Auswahllisten vermeiden Tippfehler.



		Auswahllisten sorgen für die Vereinheitlichung der Datenbank und stellen sicher, daß ein eingegebener Eintrag eindeutig wiedergefunden wird. Sie sorgen für eine standardisierte Eingabe, bei der sich der Benutzer für einen bestimmten Begriff entscheiden muß.



		Bei Auswahllisten wird in der Datenbank nur eine Referenzziffer zu einer Textressource gespeichert. Dies erfordert wenig Platz, kann in Abhängigkeit einer Sprachanwahlvariable auf unterschiedliche Textressourcen verzweigen und beschleunigt das Retrieval der Datenbank, da nur vordefinierte Ziffern und keine Textsequenzen durchsucht werden müssen.



		Multiple Auswahllisten erleichtern die Mehrfachzuordnung eines Dokumentes und gestatten dem Anwender bei unsicherer Zuordnung zu nur einem Begriff die zusätzliche Anwahl weiterer verwandter Begriffe.



Für multilinguale Anwendungen ist besonders die Option c) von Bedeutung. Sie erlaubt durch die Verwendung von Referenznummern die Zuweisung zu mehreren Listen in unterschiedlichen Sprachen. Weiterhin können die Referenznummern auch für den Zugriffschutz benutzt werden, indem nur zulässige Begriffe bei einer Recherche angezeigt werden. Auswahllisten erleichtern auch die Erfassung von Informationen durch Voreinstellungen für häufig wiederkehrende Einträge.



Auswahllisten können mit Standard-Texteditoren erstellt werden. Dies sollte jedoch nur von bestimmten autorisierten Personen geschehen, da Änderungen und besonders Löschungen von Einträgen Merkmalen (Einträge in einer Auswahlliste) die Datenbankkonsistenz gefährden können. Bei verteilten Systemen und Ressourcen ist die Einhaltung von strengen Update- und Pflegerichtlinien unerläßlich.



Auswahllisten mit kontrolliertem Wortschatz sind das geeignete Medium zur Standardisierung der Nomenklatur in Unternehmen und zur Schaffung multilingualer Softwaresysteme. Multilinguale Systeme sollten die freie Texteingabe nach Möglichkeit vermeiden und Auswahllisten - wo immer sinnvoll und einsetzbar - verwenden.

Thesauri



Der Begriff "Thesaurus" wird sehr unterschiedlich benutzt. Ursprünglich steht er für eine definierte Fachnomenklatur, die hierarchisch vom Grobem zum Feinen heruntergebrochen ist. Die Begriffe sind in der Bedeutung von einander eindeutig unterschieden und in mehreren Hierarchieebenen gegliedert, wobei mehrere Begriffe auf einer unteren Hierarchieebene einem inhaltlich übergreifendem Begriff auf der nächst höheren Ebene zugeordnet sind. Begriffe auf einer Ebene sollten einen ähnlichen Detaillierungsgrad haben.



In vielen aus den USA kommenden Textverarbeitungsprogrammen wird der Begriff "Thesaurus" für eine Hilfsfunktion zur Wahl geeigneter Synonyme benutzt. Diese Art Thesaurus hat nichts mit der strukturierten Nomenklatur zu tun, wie sie z.B. durch die International Standardization Organization (ISO) für einfache und multilinguale Thesauri festgelegt ist.



Die hier behandelten Thesauri für multilinguale Programmsysteme verhalten sich nach außen ähnlich wie Auswahllisten. Es wird zunächst eine Liste mit den Oberbegriffen angezeigt (ISO Top Term; TT). Bei der Anwahl eines Oberbegriffs wird eine zweite Auswahlliste mit den zugeordneten Unterbegriffen angezeigt (ISO Narrower Term; NT). Wird hier ein Begriff ausgewählt, so bildet dieser den Oberbegriff (ISO Broader Term; BT) für die nächste Ebene von Unterbegriffen. Diese strenge Hierarchie ist auf die wenigsten Sachgebiete voll anwendbar. Der ISO-Standard sieht deshalb auch sogenannte "Crosslinks" vor. Diese setzen Begriffe auf unterschiedlichen Ebenen und Verzweigungen unabhängig von der Position in der Hierarchie zueinander in Beziehung. Dies läßt sich mit einem Programmsystem einfacher als in gedruckter Form nachbilden.



Ein elektronischer Thesaurus wird programmintern ebenfalls durch Referenznummern abgebildet (vgl. Auswahllisten). Im Gegensatz zu Auswahllisten sind einem Eintrag im Thesaurus zusätzlich zum "unique Identifier" (eindeutige Schlüsselnummer, die in der Datenbank gespeichert wird) die Anzeigeposition (auf welche Ebene und Verzweigung in der hierarchischen Darstellung der Eintrag angezeigt werden soll) und die Art (gegebenenfalls auch Art und Richtung) einer Verbindung als Merkmale zugeordnet. Die Verbindungen erlauben die Zuordnung eines Begriffes zu mehreren Oberbegriffen anderer Zweige wie auch die Zuordnung als Oberbegriff zu verschiedenen Unterbegriffen in anderen Verzweigungen unabhängig von der Position innerhalb der Hierarchie. Die Verwendung unterschiedlicher Links (uni-direktional, bi-direktional, broad-to-narrow, narrow-to-broad, additional reference, synonym, etc.) macht die Navigation in einem solchem System einfacher. Im Prinzip stellt ein elektronischer Thesaurus eine eigene Datenbankanwendung dar, die zwischen Benutzeroberfläche und eigentlicher Datenbank geschaltetet ist.



In der Datenbankanwendung wird nur der "Unique Identifier" abgespeichert. Ist dieser mit einem "Narrower Term" referenziert, können über die Verbindungen und die Position in der Hierarchie alle zum Begriff gehörigen Oberbegriffe und der "Top Term" erschlossen werden.



Ein elektronischer Thesaurus wird intern als Netzwerk abgebildet (relationales System), nach außen aber als Hierarchie präsentiert. Die Zusammenstellung einer Liste von Begriffen ist daher nicht nur vom Oberbegriff, sondern auch von den Verbindungen und dem Weg, auf dem man zum Oberbegriff gelangt ist, abhängig. Im Gegensatz zu Auswahllisten können Listenanzeigen eines elektronischen Thesaurus je nach Situation unterschiedlich zusammengesetzt sein.



Neben der Navigationshilfe durch die Anzeige der Auswahllisten in Abhängigkeit eines zuvor gewählten Oberbegriffs kann ein Datenbankgestützter Thesaurus auch in unterschiedlichen "Spezialisten"- und "Anfänger"-Modi benutzt werden. Bei der Erfassung von Informationen ist ein "Spezialisten"-Modus sinnvoll, bei dem ein Unterbegriff oder ein Kürzel direkt eingegeben werden kann und die Datenbank selbsttätig die dazugehörigen Oberbegriffe ohne Durchlaufen der Hierarchie ermittelt. Bei einer Recherche durch Benutzer, die keine Erfahrung mit hierarchischen Auswahllisten oder mit dem sachlichen Inhalt des Thesaurus haben, ist ein "Anfänger"-Modus sinnvoll, bei dem die Texteingabe des Benutzers analysiert, auf einen "Match" im Thesaurus durchsucht wird und im Zweifelsfall durch Hinzuziehung von Synonym-Listen und Hilfetexten eine Empfehlung zur Wiederholung oder Konkretisierung der Anfrage angezeigt wird. Eine solche "Global Search" kann auch über weitere Felder oder andere zum Thesaurus gehörende Ressourcen durchgeführt werden.



Abb. 12 zeigt, wie mehrere "Scheiben" den eindeutigen Schlüsselvariablen der Thesaurus-Datenbank zugeordnet sind. Jede der Sprachscheiben enthält auch alle Informationen, wie die Begriffe hierarchisch und vernetzt angeordnet sind, da die Ordnung von Sprache zu Sprache verschieden sein kann (Begriffsunschärfen, feinere oder gröbere Unterteilungen). Unabhängig von den Differenzen in der Sprache muß aber immer die gleiche Information eindeutig auffindbar sein. Neben dem eigentlichen Begriff (Main Keyword) sind deshalb auch Acronyme (Abkürzungen aus den Anfangsbuchstaben von zusammengesetzten Begriffen oder Namen), Homonyme (gleichlautende Begriffe unterschiedlichen Inhalts), Synonyme (anderslautende Begriffe ähnlichen oder gleichen Inhalts), Pluralformen des Begriffs, etc. sowie eine erklärende Hilfe dem "Unique Identifier" zugeordnet. Bei einer "Global Search" werden diese mitdurchsucht.



In einer solchen "Sprachscheibe" muß jedoch nicht unbedingt eine Fremdsprache enthalten sein, es können auch unterschiedliche Ressourcen in einer Landessprache benutzt werden. Dies ist sinnvoll, wenn es sich um Fachinformationen handelt. So kann z.B. in einer "Scheibe" die umgangssprachliche Information enthalten sein, die nur zwei bis drei Ebenen enthält und Nicht-Fachspezialisten zugänglich ist, und in einer zweiten "Scheibe" die Fachnomenklatur fein aufgegliedert in weiteren Ebenen, die nur dem Fachmann zur Verfügung steht. Damit läßt sich auch Umfang, Tiefe und Zugriff zur Information steuern.



Der Nutzen einer elektronischen Thesaurus-Datenbank neben der modularen "Scheiben"-Struktur für multilinguale Anwendungen ist vielfältig:



		Standardisierter, kontrollierter Wortschatz sichert das eindeutige und vollständige Wiederfinden aller korrekt erfaßten Informationen.



		Eingabefehler werden vermieden.



		Auswahllisten und Hilfefunktionen erleichtern die Navigation durch umfangreiche und tiefgegliederte Fachnomenklatur.



		Funktionen wie "Global Search" erlauben die Suche auch im Synonym-, Homonym-, Acronym- und anderen Verweiseinträgen sowie im Hilfetext selbst.



		Aufbau und Struktur von Thesauri sind international standardisiert.



		Eine Thesaurus-Datenbank arbeitet als "Pre-Processor" und spart Zeit bei der Suche in der eigentlichen Datenbank, da nur noch kurze, eindeutige numerische Referenzen durchsucht und ausgewertet werden. Die Umsetzung der Schlüsselzahlen für die Anzeige erfolgt wiederum durch den Thesaurus.



		Thesaurus-Datenbanken können auf PC-Rechnern in einem Netzwerk lokal betrieben werden und entlasten damit als "Pre-Processor" die zentrale Datenbank und das Information Resources Management (IRS).



Wird zusätzlich zur Thesaurus-Datenbank und zur eigentlichen Datenbank eine Verwaltungssoftware zur Ansteuerung optischer Systeme eingesetzt, so ergibt sich eine dreistufige Datenbankhierarchie:



		Datenbank für einen oder mehrere Thesauri (lokal oder zentral)



		Datenbank zur Verwaltung von Schlüsselzahlen zu Auswahllisten und Thesauri sowie von standard Datenbankeinträgen (numerisch, alphanumerisch, Datum, Zeit, boole´sche Variable, etc.)



		Information-Retrieval-and-Access-System (IRAS). In der Regel eine Non-Standard-Daten-bank zur Verwaltung nur einmal beschreibarer WORM-Medien, wieder-beschreibarer optischer Speicher (Erasable, Rewritable, M/O) oder nur lesbarer Speicher (CD-ROM).



Für eine Thesaurus-Datenbank kann ebenso wie für die eigentliche Anwendung eine Standard-Datenbank eingesetzt werden (vorzugsweise eine relationale Datenbank). Volltext-Datenbanken sind für diese Art der Anwendung nicht geeignet.

Volltextinterpretation



Die elektronische Interpretation und Übersetzung von Volltext folgt gänzlich anderen Strategien als die bisher beschriebenen Techniken. Transfomationsmodule, Auswahllisten und Thesauri lassen sich beliebig kombinieren und in einem System vereinigen, da sie alle nach der gleichen Regel arbeiten: numerische Kennziffern werden nach festgelegten Regeln eindeutig in vordefinierte, kontrollierte Begriffe oder andere Werte umgesetzt.



Ein System, das die Analyse von Volltext erlaubt, ist nur schwer mit den vorgenannten Modulen zu kombinieren. Es ist ein eigenständiges komplexes Softwaresystem, das sich aus verschiedenen Komponenten zusammensetzt:



		Wörterbuchkomponenten beinhalten die einzelnen Worte in verschiedenen Formen (Plural, Singular, Konjugation, Deklination, irreguläre Verben, etc.) Das Wörterbuch stellt in der Regel eine eigene Datenbankanwendung dar. Es ist jedoch grundverschieden in Struktur, Aufbau und Inhalt des zuvor diskutierten Thesaurus.



		Statistik-Module analysieren das Vorkommen und die Zusammensetzung von Worten und Wortkombinationen.



		Linguistik- und Grammatik-Analyse-Module stellen den am schwierigsten zu realisierenden Teil dar. Sie beinhalten alle Regeln und Vergleichsbeispiele für die Analyse der Syntax. Hierfür werden häufig Techniken der Mustererkennung (Pattern Recognition) und Fuzzy Logic eingesetzt.



		Die Ergebnisse der drei Module a), b) und c) werden in einem Vergleichsmodul zusammengeführt, gewertet und interpretiert. Das Vergleichsmodul ist so konzipiert, daß es Zwischenergebnisse eines Moduls zur Auswertung an ein anderes Modul zurückgeben kann. So entsteht ein iterativer Prozeß mit einer relativ hohen Erkennungsrate bei fachbezogenen Texten, für die es spezielle elektronische Wörterbücher mit der Fachnomenklatur gibt.



		Da herkömmliche Datenbanken aufgrund ihrer Architektur mit der zeitintensiven Volltextauswertung wenig effektiv sind, werden häufig spezielle "Cache"- und "Inverted File"-Module zwischengeschaltet.



		Präsentations- oder Darstellungsmodule sorgen für die korrekte Wiedergabe der übersetzten Texte am Bildschirm. Sie werden mit Informationen aus dem Wörterbuchmodul, dem ausgewerteten Text aus der Datenbank und dem "Inverted File"-System gespeist.



Das beschriebene Volltextinterpretationssystem kann zur Auswertung von Klartext-Anfragen benutzt werden. In Abb. 15 ist der Bearbeitungsweg für eine Anfrage dargestellt. Bei der Umsetzung eines Textes aus der Datenbank werden die Module in gleicher Weise von unten nach oben durchlaufen. Die vorgestellte Lösung stellt nur eine mögliche Konfiguration dar. Da diese Technik sehr neu ist, werden auch zahlreiche andere Ansätze verfolgt. Der hier vorgestellte Ansatz hat den Vorzug, daß zugleich verschiedene Module mit unterschiedlichen Auswertungsstrategien durchlaufen werden. Jedes Modul kann zudem auf bestimmte Sprachen oder Fachnomenklaturen spezialisiert und bei Bedarf automatisch vom Vergleichsmodul zugeschaltet werden. Die Interpretation und Übersetzung eines Textes ist sehr zeitaufwendig und in der Regel nur auf schnelle Dialog-Rechnern möglich. Komplexe Systeme wie das beschriebene sollten nicht mit einfachen Übersetzungshilfen verwechselt werden.



Herkömmliche Volltextdatenbanken sind für solche Systeme selten geeignet. Die Strategie bei Standarddatenbanksoftware ist, Füllworte, Adjektive, Adverbien etc. wegzulassen, um Speicherplatz zu sparen, sowie die Geschwindigkeit der Datenbank zu erhöhen. Bei einem sprachinterpretierenden System werden jedoch alle Informationen des Textes benötigt, da ansonsten keine zusammenhängende und kontextbezogene Übertragung möglich ist.



Erste Erfolge mit dem Einsatz von "Language-Interpreter"-Datenbank-Systemen wurden bei der UNO und der Europäischen Kommission erzielt.



Die Wahl einer Strategie für multilinguale Datenbankanwendungen ist heute noch einfach:



		Für Dokumentorientierte (Faksimile) Systeme, Anwendungen mit kontrolliertem Wortschatz und Systeme, die zu einer Standardisierung der Benutzung führen sollen, ist der Ansatz mit Transformations-, Auswahllisten- und Thesaurus-Modulen zu wählen.



		Für Anwendungen im Volltextbereich, die nicht innerhalb der nächsten drei bis vier Jahre in den Produktionsbetrieb gehen sollen, ist die Erprobung oder Beschäftigung mit dem hier beschriebenen Ansatz sinnvoll.



Kommerziell nutzbare, sofort einsatzfähige Standardsoftware existiert zur Zeit weder für a), noch für b). Auch in Zukunft ist nicht mit "Off-the-shelf"-Lösungen zu rechnen, da die Art der Anwendung und die zu verwendende Nomenklatur immer Änderungen erfordern wird.



Ideal ist jedoch nach Meinung des Verfassers ein Ansatz, wie er in Abb. 3 dargestellt ist. Hier sind die verschiedenen Umsetzungs- und Interpretationskomponenten in einer Schicht zusammengefaßt und arbeiten parallel. Sie verbinden die Benutzeroberfläche mit der eigentlichen Datenbank. Ein solcher integrativer Ansatz verbindet die Vorzüge aller genannten Techniken, die in einer Anwendung nach Bedarf einzeln oder kombiniert eingesetzt werden können.

Anwendungsbeispiele



Anhand von drei Beispielen sollen multilinguale Informations- und Retrievalsysteme anwendungsorientiert erläutert werden:



		HYPARCHIVStandard "Document-Imaging"-Software für Microsoft-Windows



		wfBase Presse- und Wirtschaftinformationen in einem verteilten "Document Imaging"-System



		HEMIS Umweltinformationen auf CD-ROM

HYPARCHIV



HYPARCHIV ist ein vollständig in Deutschland entworfenes und programmiertes Archivierungssystem für Faksimile-Dokumente und Dateien. HYPARCHIV wird als Einzelplatz- und als Netzwerkversion in allen wichtigen europäischen Sprachen angeboten. Es unterstützt zahlreiche Scanner, Drucker, "Image-Boards" und optische Speicher (WORM, M/O, Jukeboxen). Weitere Module erlauben die automatische Indizierung von Dateien (COLD), Faxversendung und Empfang, Datenaustausch mit externen Datenbanken, Dokumentenaustausch zwischen verschiedenen HYPARCHIV-Systemen und zusätzliche Datensicherung (Kryptographische Kodierung). Zur einfachen Generierung von Anwendungen existiert ein "WYSIWIG"-Editor.



Die Auswahl der Beispiele aus einer Vielzahl anderer erfolgte auf Basis der vom Autor selbst durchgeführten Projekte. Als Marketing- und Sales-Manager sowie Systemberater der ACS Systemberatung GmbH war der Verfasser von 1989 - 1992 für Design, Entwicklung und Vermarktung von HYPARCHIV, sowie in den Jahren 1990 - 1992 für das Design und Projektmanagement von wfBase verantwortlich. Seit 1990 betreut der Verfasser das HEMIS-Projekt.



Das Programm besitzt eine grafische Benutzeroberfläche, die Ordnungsmittel und Funktionen ikonisiert darstellt. HYPARCHIV gestattet mehrere frei kombinierbare Zugriffs- und Informationsverwaltungstechniken:



		Hierarchische Ordnung mit Aktenschränken, Ordnern, Mappen, etc.



		Datenbank, formulargesteuert mit "Query by Example" (QBE). HYPARCHIV unterstützt mehrere Anwendungen gleichzeitig mit Umschalten der Datenbank während der Laufzeit.



		Hyperlinks zur virtuellen Verbindung von Objekten (Notizen, Ordnungsmittel, Dokumente und Dateien)



HYPARCHIV unterstützt die Multilingualität nur an der Benutzeroberfläche: Menues, Hilfetexte, Meldungen, Ikonen, Knöpfe, Dokumentbeschriftungen, etc. werden während der Laufzeit durch eine einfache Menu-Anwahl umgeschaltet. Der "elektronische Schreibtisch" und der Zustand des Systems ändert sich nicht. Die komplette Systemumschaltung dauert ca. 2 Sekunden inklusive Anpassung aller Texte, Fenster und Ikonen auf dem Bildschirm. Für Datenbankmasken (Bildschirmformular) können mit Einschränkungen Arbeitsplatzbezogen auch verschiedene Auswahllisten hinterlegt werden, die auf die numerischen Schlüssel des gleichen Datenbankfeldes referenzieren. Dadurch ist eine eingeschränkte Multilingualität auch für die HYPARCHIV-Datenbank gegeben.



Abb. 19 zeigt eine dreisprachige Pressearchivanwendung. Hier sind auf der Datenbankmaske die Texte in allen drei Sprachen angegeben. Die Schaltfelder "Documentation", "Press review" und "Bibliography" verzweigen auf Untermasken. Hinter den Feldern "Sachgebiet" und "Schlagworte" liegen Auswahllisten, die lokal in jeweils einer der drei Sprachen vorgehalten werden. Alle anderen Feldinhalte werden nicht übersetzt und erscheinen in der Eingabesprache.



Von HYPARCHIV ist inzwischen auch eine Client-Server-Version mit einem multilingualen Thesaurus verfügbar. Die letztgenannte Version wird jedoch nicht als Standardprodukt vertrieben. Die verfügbare Standardversion HYPARCHIV NET für Novell-Netzwerke wird in Europa bereits mehr als 200 mal eingesetzt. Von der Einzelplatz- und der STARTER-Version wurden mehrere tausend verkauft. HYPARCHIV hat sich damit zum europäischen Standard für Windows-basierte "Optical-Filing"-Systeme entwickelt.

wfBase



wfBase ist eine individuelle Applikation, die für die Schweizer Wirtschaftsförderung (wf) entwickelt worden ist. wfBase befindet sich seit 1992 im Produktionsbetrieb.



Die Zentrale der Schweizer Wirtschaftsförderung (wf) ist in Zürich. Außenstellen befinden sich in Genf, Bern und Lugano. Vor der Einführung von wfBase wurden an allen vier Orten Dossiers über politische Ereignisse, Wirtschaftsdaten, etc. unabhängig von einander geführt. Ziel von wfBase ist, allen internen Benutzern Zugriff auf Presseartikel, Zeitschriften und selbst erzeugtes Schriftgut unabhängig von der Eingabesprache zu ermöglichen.



wfBase integriert unter seiner grafischen Oberfläche auch andere Anwendungen zusätzlich zur Dokumentenverwaltung. Hierzu gehören Textverarbeitungs- und Spreadsheet-Anwendungen, Adress- und Bibliotheksverwaltung, Abrechnung für externe Nutzer des Systems, elektronischer Faxeingang und -ausgang, elektronische Posteingangs- und Ausgangskörbe, etc. wfBase benutzt Module von HYPARCHIV, ist im Übrigen aber eine eigenständige Anwendung mit Client-Server-Architektur und einer relationalen Datenbank auf einem OS/2-Server. Die Arbeitsplätze unter Microsoft Windows sind in einem Novell-Netzwerk zusammengeschlossen. Außer den internen Nutzern können auch Dritte sich in wfBase über Modem einwählen, Dokumente ("Subset") abfragen, lokal anzeigen und drucken oder per Fax sich senden lassen.



Die vier Standorte der wf sind über Hochleistungs-SwissNet2 (ISDN) miteinander verbunden. Dies erlaubt auch die Übermittlung von komprimierten gescannten Faksimiles. In zwei Jukeboxen sind neben gescannten Faksimiles auch selbst erzeugte Dateien und eingegangene Faxmitteilungen gespeichert. Das System ist weitgehend fehlertolerant und ausfallsicher ausgelegt.



Kernstück von wfBase ist die Datenbank mit einem viersprachigen Thesaurus für die Sachgebiets-Klassifikation (Deutsch, Französisch, Italienisch und Englisch). Der Thesaurus beinhaltet über 2.000 Sachgebiete, die hierarchisch und in einer Link-Struktur in vier Ebenen gegliedert sind.



Neben dem Thesaurus existieren Auswahllisten für andere Felder sowie Text- und Dateneingabefelder. Mit der Datenbank können die Dokumente unabhängig von der Sprache, in der sie erfaßt wurden, gefunden werden. Die Anzeige erfolgt jedoch in derjenigen Sprache, in der das Dokument erzeugt wurde. In einem multilingualen Staat wie der Schweiz ist die Übersetzung des Inhaltes nicht erforderlich. Ziel von wfBase ist vielmehr die Kommunikation zwischen den wf-Standorten zu verbessern, Adress- und Dokumentenbestände zu vereinheitlichen, Redundanzen abzubauen und Dritten (Mitgliedern der wf-Trägerschaft) einen einfachen, Zeit- und Kostensparenden Zugriff zu erlauben.

HEMIS



Die Vereinten Nationen haben im Rahmen ihrer Umweltorganisation (United Nations Environmental Programme - UNEP) eine Instituion zur Harmonisierung von Umweltmeßmethoden, -vorhaben, -projekten und -informationen gegründet (UNEP/HEM - Harmonization of Environmental Measurement). Im Münchner Büro von UNEP/HEM wird seit 1990 ein Projekt zur Schaffung eines Informations- und Meta-Daten-banksystems durchgeführt (HEMIS - HEM Informations System). HEMIS soll in Bezug auf Umweltforschung, Umwelt-"Monitoring" und Umweltschutz einen Überblick über



		Laufende Projekte im globalen und nationalen Umfang der UN, anderer internationaler und großer nationaler Organisationen im Umweltbereich,



		Institutionen, Forschungsschwerpunkte, Periodika und leitende Mitarbeiter,



		Methoden, Referenzmaterialien, etc.,



		Datenbanken, Datenformate, Datenqualität, Zugang, etc.



geben. Die in HEMIS enthaltenen Informationen sind Meta-Daten, die aus den unterschiedlichsten Quellen kompiliert werden.



Umweltorganisation UNEP/HEM



Ziel ist die Harmonisierung des Zugriffs auf heterogene Informationen unterschiedlicher Qualität, verschiedenen Umfangs und aus diversen Quellen.



Das HEMIS hat zwei Systemkomponenten:



		In München wird ein System installiert werden, mit dem alle Informationen gesammelt, aufbereitet, inhaltlich erschlossen und verwaltet werden. Das System soll in der Lage sein, aus seiner Datenbank heraus selektierte Berichte (printouts) und CD-ROM-Datenbanken zu erstellen.



		Weltweite Distribution von Auszügen der HEMIS-Anwendung in München auf CD-ROM in regelmäßigen, aktualisierten Editionen.



Beide System werden daher über unterschiedliche Benutzeroberflächen, Datenbanken, etc. verfügen . Das System a) ist ein Produktionssystem, das im Wesentlichen nur von Mitarbeitern von UNEP/HEM genutzt wird. System b) soll helfen, international über Umweltvorhaben zu informieren, Parallelentwicklungen zu vermeiden sowie Grundinformationen über Projekte und Datenbanken zu liefern, auch wenn die Informationen nicht in der Sprache des Benutzers vorliegen.



Die HEMIS-CD-ROM soll möglichst attraktiv gemacht werden, damit sie von vielen benutzt wird und damit auch andere Institutionen, die nicht in das UN-Netz von Organisationen eingebunden sind, Daten für das System liefern.



Die Thesauri und Auswahllisten sind Bestandteil beider HEMIS-Systeme. Im stationären System dienen sie zur Verschlagwortung von Datensätzen, Dokumenten, Grafiken, Bildern, etc. sowie zur Suche und Kompilation von Daten. Werden Daten in zuvor vereinbarten Formaten auf Datenträger angeliefert, so kann die Verschlagwortung teilweise automatisch per Programm erfolgen. In der CD-ROM-Version dienen Thesauri, Auswahllisten und alle anderen Einträge nur zur Recherche und Kompilation von Informationen.



Die HEMIS-CD-ROM-Version hat einen mehrschichtigen modularen Aufbau.



Neben der Suche nach bestimmten Schlagworten oder Begriffen bietet HEMIS zusätzlich die Benutzung von zuvor zusammengestellten "Guided Tours" und individuelle "Links" als Navigationshilfen an. Eine übergreifende Suche über die Datenbank ("Global Search") ist zwar zeitaufwendig, erlaubt jedoch die Benutzung des Systems ohne Kenntnis, was sich inhaltlich hinter einem Feld der Recherchemaske verbirgt. Die Benutzeroberfläche kann zwischen verschiedenen ladbaren Sprachen umgeschaltet werden. Gleiches gilt für Thesauri, Auswahllisten, Links und Guided Tours. Freie Texteinträge und gescannte Dokumente werden nicht gewandelt. HEMIS soll eine erste Information liefern, die dann bei den angegebenen Institutionen, Datenbanken oder Publikationen vertieft werden kann.



Abb. 26 zeigt den vorgeschlagenen Startbildschirm des HEMIS-Prototypen mit den Schaltflächen zum Einstieg in die Bildschirme der Hauptsachgebiete.

Ausblick



Multilinguale Informations- und Retrievalsysteme stehen erst am Beginn ihrer Entwicklung.



Ziel des Artikels ist, folgende Argumente darzustellen.



		Multilinguale Software ist für alle Europa- oder Weltweit agierenden Unternehmen nützlich, die sich nicht auf eine "Company Language" festlegen wollen.



		Multilinguale Software ist in Ansätzen als Standardsoftware verfügbar (vgl. HYPARCHIV, Abschnitt 3.1), muß in der Regel jedoch individuell angepaßt werden (vgl. wfBase, Abschnitt 3.2 und HEMIS, Abschnitt 3.3).



		Multilinguale Retrievalsoftware kann zur Erschließung großer Daten- und Dokumentbestände auf digitalen optischen Speichern eingesetzt werden.



		Multilinguale Thesauri fördern die Standardisierung bei der Klassifikation von Dokumenten, erlauben einen eindeutigen und strukturierten Zugriff sowie unterstützen die Recherche nach Dokumenten, die nicht in der Sprache des Benutzers verfügbar sind.



		Multilinguale Volltextretrieval- und -übersetzungssysteme befinden sich im Probeeinsatz. Zusammen mit anderen Techniken wie Thesauri werden sie in Zukunft einfach zu benutzende Informationssysteme ermöglichen.



		Multilinguale Software ist eine Marktchance für europäische Software- und Systemhäuser.



		Multilinguale Retrieval- und Informationssysteme können in fast allen Wirtschafts- und Verwaltungsbereichen, die grenz- und kulturübergreifend arbeiten, sinnvoll eingesetzt werden.

Rechtshinweis



© CopyRight PROJECT CONSULT 1992 - 2002 Autorenrechte Dr. Ulrich Kampffmeyer		Rechtshinweis Autorenrechte


Zum Download sind auschließlich die Beiträge in der Rubrik Download vorgesehen. Als PDF bereitgestellte Beiträge enthalten auch die zugehörigen Grafiken.		Download

Seitentitel: Artikel_Multilinguale Informationssysteme, Zitierung: http://www.pc.qumram-demo.ch/portal.asp?SR=239
Zuletzt aktualisiert am: 22.1.2002

CopyRight © 1992-2012 PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH
20251 Hamburg, Breitenfelder Str. 17, Tel.: +49-40-46076220, E-Mail, Rechtshinweis
Optimiert für MS Explorer 5.x, 6.x, 1024x768 Pixel, Cookies(on), JavaScript(on)