Schweizerisches Handelsamtsblatt

Konzept

Im Auftrag von D&B Schweiz haben wir ein System entwickelt, das die Einträge des Schweizerischen Handelsamtsblattes (SHAB) strukturiert in eine Datenbank ablegt. Die Handelsregister-Einträge liegen wohl in elektronischer Form vor, jedoch ohne irgendwelche strukturellen Informationen.

Originaltext

Probleme

Handelsregister-Einträge werden in natürlicher Sprache formuliert. Dabei hat jeder Kanton seine föderalistischen Eigenheiten, wodurch eine Unmenge an möglichen Formulierungen entsteht.

Bis heute gibt es kein Computersystem, das die menschliche Sprache vollständig versteht. Da es sich beim SHAB jedoch um ein abgegrenztes Sachgebiet mit einem einigermassen überschaubaren Wortschatz handelt, ist eine Lösung trotzdem möglich, wenn auch nicht einfach.

Personendaten

Realisierung

Das von uns realisierte System liest zuerst die Eingangsdateien, bestimmt Anfang und Ende eines Eintrages und teilt die Einträge in einzelne Sätze auf. Danach werden in einem aufwendigen Verfahren Schlüsselwörter, Personennamen, Ortschaften etc. identifiziert. Anschliessend werden die Beziehungen dieser Elemente untereinander analysiert und daraus die Bedeutung der einzelnen Sätze bestimmt.

Benutzeroberfläche

Das System kann den Grossteil der Einträge fehlerfrei erkennen. Bei einigen Einträgen treten jedoch Fehler auf, insbesondere hervorgerufen durch Druckfehler oder komplizierte Formulierungen. Deshalb verfügt das System über eine umfangreiche Benutzeroberfläche, mit der die Einträge manuell korrigiert werden können.

Plattform: Windows 3.1/95/98/2000, Visual C++