RA Dr. Wieland Bosman
Spracherkennung mit Dragon Naturally Speaking XP:
Eine interessante Option für jede Anwaltskanzlei
I. Einführung:
Die Existenz von Spracherkennungsprogrammen ist dem interessierten
PC-Anwender seit längerem geläufig, ebenso wie die Skepsis darüber, ob sich diese Systeme bereits in einem Entwicklungsstadium befinden, das einen wirklich effektiven
Einsatz in der beruflichen Praxis ermöglicht. Ein mehrmonatiger Einsatz des Spracherkennungsprogramms Dragon Naturally Speaking im anwaltlichen Berufsalltag hat die auch
beim Autor dieses Erfahrungsberichts zunächst vorhandene Skepsis beseitigt. Verwendung fand die im Frühjahr 2002 erschienene aktuelle Version Professional XP bzw. Legal
Edition XP für den Einsatz unter Windows XP. Diese Version ist bis Windows 98 abwärts kompatibel. Das Programm ist auf Grund seiner Leistungsmerkmale, seiner guten
Bedienbarkeit und nicht zuletzt seiner hohen Erkennungsrate Teil des täglich selbstverständlich und automatisch genutzten Handwerkszeugs in der Kanzlei geworden.
Entwicklungstechnischer Hintergrund für die erreichte Praxistauglichkeit ist offensichtlich neben einem hohen Stand der Softwareprogrammierung auch die Verfügbarkeit
hochleistungsfähiger PC-Hardware.
II. Hardware und Installation:
 Die
amerikanische Firma Scansoft empfiehlt eine Prozessorleistung von mindestens 400 MHz, einen Arbeitsspeicher von 128 MB RAM, 300 MB freien Festplattenspeicher sowie eine
vollständig SoundBlaster-kompatible Soundkarte. Anforderungen, die vor noch nicht allzu langer Zeit erhebliche Investitionen erfordert hätten, heute aber selbst von den
meisten Niedrigpreisangeboten erfüllt bzw. deutlich übertroffen werden. Zu beachten ist, dass die On-Board-Chips mancher Notebooks nicht die erforderliche
Soundkarten-Qualität aufweisen.
 Der
Nutzer wird mittels einer leicht verständlichen Benutzerführung mühelos durch die nur wenige Minuten dauernde Installation geführt. Die Standardinstallation erfordert
mindestens 170 MB Festplattenspeicher. Bei der Installation wird eine individuell zugeordnete Identifikation-Nummer abgefragt. Soll die XP-Edition als Update für die frühere
Version 5 verwendet werden, wird auch dies von der Benutzerführung berücksichtigt. Unter der Version 5 angelegte Vokabularien und Befehlsdateien bleiben hierbei
erhalten.
Die Standardlizenz ermöglicht die Installation auf einem stationären PC sowie zusätzlich auf einem Laptop bzw. Notebook.
Im Lieferumfang sind neben der Software ein Kopfbügelmikrofon (Headset), Kurzreferenz, Schnelleinstieg sowie ein über 200 Seiten umfassendes ausführliches Benutzerhandbuch
enthalten.
III. Anlage und Pflege von Sprachdateien:
Nach der Installation ist beim ersten Programmstart ein sog. Benutzer, d. h. eine Sprachdatei mit einem individuellen Sprachprofil anzulegen und auf der Festplatte zu
speichern. Diese Sprachdatei enthält alle Informationen, die das Programm für die individuelle Spracherkennung benötigt, d. h. Daten über die eigene Aussprache des Nutzers
und dessen Präferenzen beim Sprachgebrauch, wie etwa die Benutzung bestimmter Begriffe in bestimmten Kontexten. Grundlage für diese Datei ist zunächst das Einlesen eines
vorgegebenen Textes sowie die Eingabe bereits vorhandener Textdateien des Nutzers (z. B. in der Textverarbeitung abgespeicherte Schriftsätze). Bei dem Einlesen des Textes
ist auf eine korrekte Platzierung des Mikrofons zu achten.
Mit Hilfe dieser Dateien sowie eines 340.000 Wörter (270.000 aktiv) umfassenden allgemeinen Wörterbuchs und bei der Legal Edition XP eines mehrere tausend Einträge
umfassenden speziellen Wörterbuchs juristischer Fachbegriffe und Abkürzungen identifiziert das Programm die diktierten Lautfolgen und setzt sie in Text um. Durch den
Rückgriff auf die Wörterbücher sind echte Rechtschreibfehler, d. h. nicht existierende Schreibweisen ausgeschlossen. Diese Kombination verschiedener
Sprach-Identifizierungskomponenten ist offensichtlich die Grundlage für eine Erkennungsrate, die bis zu 97 % erreicht. Es liegt auf der Hand, dass angesichts der Menge der
kurzfristig zu verarbeitenden Daten unabhängig von den herstellerseitig genannten Minimalanforderungen eine möglichst hohe Prozessorleistung und ein möglichst großer
Arbeitsspeicher von Vorteil ist. In meiner Praxis hat sich ein Prozessortakt von 1 GHz bzw. ein Arbeitsspeicher von 256 MB als sehr geeignet erwiesen. Treten
Erkennungsfehler auf, ist also das als Text ausgegebene Wort nicht das diktierte Wort, ist eine Korrektur durchzuführen, die am Ende einer Sitzung Eingang in die
Sprachdateien findet. Derselbe Fehler kann damit nicht ein zweites Mal auftreten. Auf diese Weise und durch zunehmende Routine beim Diktieren verbessert der Nutzer die
Erkennungsrate kontinuierlich und erzielt nach mehrwöchiger regelmäßiger Nutzung das individuelle Optimum. Das Programm honoriert ein natürliches und kontinuierliches
Sprechen mit normaler Geschwindigkeit, deutliche Aussprache und den Verzicht auf überflüssige Laute. Es können verschiedene Benutzer, also Sprachdateien für
unterschiedliche Nutzer des Programms oder auch für einen Nutzer verschiedene Benutzer, etwa für die verfügbaren Sprachen Deutsch und Englisch angelegt werden.
IV. Programmfunktionen:
Dragon Naturally Speaking ist nicht allein ein Programm zum Diktieren, d. h. zum Umsetzen von Sprache in Text. Die Möglichkeiten der Spracherkennung eröffnen vielfältige
zusätzliche Anwendungsfelder und erhöhen damit die Arbeitsökonomie deutlich. Das Programm lässt sich auch zur Steuerung des Computers selbst einsetzen. So können durch
Sprachbefehle z. B. Anwendungen gestartet, Menüs geöffnet oder Schaltflächen angeklickt werden, ohne dass hierzu die Tastatur oder Maus bemüht werden muss.
Für die tägliche Nutzung des Programms im juristischen Alltag von besonderer Bedeutung sind jedoch die Möglichkeiten des sprachgesteuerten Bearbeitens und Überarbeitens
von Texten entweder schon während des Diktierens oder nach Abschluss eines Diktats. Die wenigsten diktierten Texte befinden sich hinsichtlich sämtlicher gewählter
Formulierungen, ihrer Vollständigkeit oder auch ihrer Formatierung bereits in der gewünschten Endfassung. Hierfür bietet das Programm eine außergewöhnliche Fülle
sprachgesteuerter Möglichkeiten. Sämtliche mit Tastatur und Maus steuerbaren Aktionen sind auch durch Sprachbefehle schnell und unkompliziert zu aktivieren.
Dragon Naturally Speaking unterstützt dabei grundsätzlich alle auf Windows basierenden Anwendungen, wie z.B. Microsoft Word, Corel WordPerfect, Lotus Notes und lässt
sich auch im Rahmen von Anwaltsprogrammen wie z.B. dem weit verbreiteten RA-MICRO sowie von Netzwerkanwendungen, wie z. B. DictaNet einsetzen. DictaNet ist eine
Sprachverarbeitungssoftware, die es - auch in Verbindung mit RA-MICRO - ermöglicht, Diktate über ein Mikrofon direkt in den PC zu sprechen, als Sprachdatei zu verwalten
und im Kanzleinetzwerk einem bestimmten Bearbeiter mit einer bestimmten Erledigungspriorität zuzuweisen. Verfügt der Anwender zusätzlich über Dragon Naturally Speaking,
erübrigt sich das Abtippen der Sprachdatei, da additiv eine Textdatei erzeugt wird.
Die Funktionen des eigenen Kanzlei- oder Textverarbeitungsprogramms können also wie gewohnt weiter benutzt werden. Darüber hinaus kooperiert das Programm auch mit allen
verbreiteten Email-Anwendungen, so dass auch eigene Emails diktiert und mittels Sprachbefehl Posteingänge überprüft, eingegangene Nachrichten geöffnet, geschlossen,
weitergeleitet und gelöscht werden können. Besonders interessant für den anwaltlichen Anwendungsbereich ist weiterhin die Möglichkeit, Diktatkürzel und individuelle
Sprachbefehle zu erstellen. Hierbei können nicht nur häufig verwendete Wörter und Textbausteine durch einen einzigen Befehl aufgerufen, sondern darüber hinaus auch
beliebige Tastenfolgen einschließlich Sonderzeichen verbal aktiviert werden.
V. Headset und digitales Diktiergerät:
Die Spracheingabe erfolgt mittels eines Mikrofons, das in Form eines Headsets im Lieferumfang enthalten ist. Die Arbeitssituation beim Diktat lässt sich damit völlig
entspannt gestalten und unterscheidet sich grundlegend vom eigenhändigen Schreiben. Das Verbindungskabel des Headsets zum PC ist ausreichend lang und stört nicht. Wer
es dagegen vorzieht, zur Förderung der gedanklichen Kreativität während des Diktats auf und ab zu gehen, kann sich gegen Aufpreis auch eines Headsets mit
Infrarotsender bedienen und damit während des Diktats sogar den Raum verlassen. Das kabellose Headset ermöglicht zudem weitere Effekte, wie z.B. die Möglichkeit, sich
z.B. während einer Powerpoint-Präsentation in einem Vortragsraum ungezwungen zu bewegen und den Laptop durch kurzen Sprachbefehl aus der Distanz um die nächste Seite
zu bitten.
Die Spracheingabe kann daneben auch durch ein als Zubehör zu Dragon Naturally Speaking erhältliches mobiles digitales Diktiergerät, das Dragon Naturally Mobile,
erfolgen. Dieses sehr leichte und handliche Gerät verfügt über einen 4 MB-Speicherchip, der eine Sprachaufnahme von ca. 40 Minuten ermöglicht. Größere und zusätzliche
Chips sind erhältlich. Der Preis beträgt ca. 253.- EURO zuzüglich MwSt.
Bestimmte Geräte anderer Hersteller lassen sich über eine zusätzliche Software in gleicher Weise nutzbar machen. Der Hersteller verweist im Benutzerhandbuch auf eine
Internetadresse ( www.dragonsys.de) mit einer aktuellen Liste von ihm
zertifizierter Diktiergeräte. Diese Adresse lässt sich allerdings nur mit einer besonderen Autorisierung öffnen. Deshalb sollte man lieber die Adresse http://support.scansoft.com wählen und dort die Hardware Compatibility List aufrufen.
 Dort bislang noch nicht zu
finden ist der zur Cebit 2002 auf den Markt gebrachte Digital Voice Recorder DS-330 von Olympus. Ungeachtet dessen bietet dieses ungemein handliche und gut
ausgestattete digitale Diktiergerät eine außergewöhnlich gute Performanz bei der Spracherkennung. Dank eines integrierten 16 MB Flash-Speichers steht im Langzeit-Modus
eine Aufnahmekapazität bis zu 5:30 Stunden (Standard-Modus: 2:25 Stunden) zur Verfügung. Eine USB-Docking-Station ermöglicht nicht nur einen schnellen Datentransfer,
sondern auch eine Nutzung unter Windows NT, sofern eine USB-Schnittstelle installiert ist. Die Sprachaufzeichnungen lassen sich in bis zu fünf Ordnern mit jeweils bis
zu 199 Dateien übersichtlich abspeichern und mit den Funktionen Überschreiben, Einfügen, Löschen und Schreibschutz bearbeiten. Durch ein hintergrundbeleuchtetes
LC-Display ist das Diktiergerät auch in abgedunkelter Umgebung einsetzbar. Der Preis beträgt ca. 210.- EURO zuzügl. MwSt.
Der Einsatz eines mobilen Diktiergeräts ermöglicht die effektive Nutzung von Leerzeiten zwischen zwei Verhandlungsterminen, auf dem Flughafen oder in der Bahn. Die
Diktate können zeitnah und noch unter dem aktuellen Eindruck einer Verhandlung abgesetzt und nach Rückkehr in die Kanzlei direkt als Schriftsatz ausgegeben werden. In
eiligen Fällen kann der Text auch von einem auswärtigen Termin per Email in die Kanzlei zur weiteren Veranlassung übermittelt werden. Da mit der Sprachdatei auch die
Originalstimme übermittelt wird, kann das Diktat in der Kanzlei nicht nur gelesen, sondern auch abgehört und hiernach entsprechend korrigiert werden. Für das
Diktiergerät ist ein eigener Benutzer anzulegen, der eine im Vergleich zum Headset intensivere Trainingsphase erfordert. Bei diesem Training ist zu beachten, dass das
Diktiergerät typischerweise in einer Umgebung mit mehr und anderen Hintergrundgeräuschen eingesetzt wird. Das Training sollte deshalb in einer gleichen oder ähnlichen
Umgebung durchgeführt werden, da sich anderenfalls die Erkennungsrate vermindert.
VI. Kosten und Nutzen für die Kanzlei:
Die beschriebenen Funktionalitäten von Dragon Naturally Speaking und die dargestellten internen und externen Nutzungsmöglichkeiten lassen die Aussage zu, dass das
Programm für annähernd jede Anwaltskanzlei - darüber hinaus aber auch für Gerichte, Behörden, Rechtsabteilungen in Unternehmen etc. - von erheblichem Nutzen sein
kann. Die kleine, noch umsatzschwache Kanzlei kurz nach der Gründung erspart sich Schreibkosten, die große Sozietät steigert in vielfacher Hinsicht die Effektivität.
Vor diesem Hintergrund ist die nicht geringe Investition von ca. 999.- EURO (Legal Edition XP bzw. ca. 799.- EURO für Professional XP, Update ca. 249.- bzw. 299.-
EURO) zuzüglich MwSt. für die Software zu rechtfertigen. Der nicht unwesentliche Faktor, dass es einfach auch Vergnügen bereitet, mit dem Programm zu arbeiten, sei
nur am Rande erwähnt.
|