Rund eineinhalb Jahre hat sich der amerikanische Softwareentwickler ScanSoft Zeit genommen, um die Version 7 seines Spracherkennungs-Premiumprodukts Dragon NaturallySpeaking
Professional/Legal auf den Markt zu bringen. Die neue Version folgt auf die im Frühjahr 2002 erschienene Version XP (5.05), bei der es sich im Wesentlichen um eine Adaption
der Version 5 auf das Betriebssystem Microsoft Windows XP handelte. Da meine ausführliche Besprechung der
Vorgängerversion
Dragon NaturallySpeaking XP aus dem Jahr 2002 nach wie vor auf jurawelt.com nachzulesen ist, kann sich dieser Beitrag auf die Darstellung der relevanten Neuerungen und
Weiterentwicklungen konzentrieren.
Ebenfalls Bezug genommen wird auf die Rezension der
Preferred-Edition von Dragon NaturallySpeaking 7 durch Alexander
Levenetz.
1. Lieferumfang
Im Lieferumfang sind neben der Installations-CD ein Headset (Kopfbügelmikrofon), eine Kurzreferenz sowie ein 185 Seiten umfassendes ausführliches Benutzerhandbuch in
deutscher Sprache enthalten.
Das Headset ist angenehm geformt, sehr leicht und mit einem ausreichend langen Kabel versehen; der hierdurch erzielte Tragekomfort macht es dem erstmaligen Nutzer leicht,
sich an die neue Arbeitssituation vor dem PC zu gewöhnen und sie bereits nach kurzer Zeit als normal zu akzeptieren.
Das Benutzerhandbuch verdient seinen Namen zu Recht, denn es ist im Unterschied zu vielen anderen Software-Handbüchern so kompetent und anschaulich gestaltet und gegliedert,
dass es sowohl der Neuling als auch der fortgeschrittene Nutzer jederzeit gerne für einen kurzen und gezielten Blick oder auch für das Lesen längerer Passagen im
Zusammenhang gerne zur Hand nimmt. Die Erklärungen werden durch eine Vielzahl praktischer Anwendungsbeispiele illustriert, so dass letztlich keine Frage offen bleibt.
2. Systemvoraussetzungen
Elektronische Spracherkennung erfordert überaus komplexe und umfangreiche Rechenoperationen, so dass die Anforderungen an die Hardware beträchtlich sind. ScanSoft definiert
hierfür die folgenden Mindestanforderungen :
• Pentium III- oder gleichwertiger AMD-Prozessor mit 500 MHz Taktfrequenz,
• 256 MB Arbeitsspeicher,
• 700 MB Festplattenspeicherkapazität für vollständige Installation, 300 MB für Standardinstallation,
• Betriebssystem Microsoft Windows XP, abwärtskompatibel bis einschließlich Millennium Edition (Windows 98 Second Edition, NT 4.0 mit Service Pack 6 oder höher, Windows
2000),
• 16 Bit Creative Labs Sound Blaster oder gleichwertige Soundkarte, 11 KHz für Audioaufnahmen,
• CD-ROM-Laufwerk (8x oder schneller),
• Lautsprecher (optional).
Der im Benutzerhandbuch ausdrücklich gegebene Hinweis, dass Dragon NaturallySpeaking nicht auf Rechnern installiert werden kann, deren Prozessor eine Taktfrequenz von 500
MHz nicht erreicht, verdeutlicht, dass der Nutzer von dem Prinzip ausgehen sollte, je mehr Rechenleistung und je mehr Arbeitsspeicher, desto besser.
3. Installation, Update, Upgrade, Lizenz
Bei der erstmaligen Installation wird der Nutzer ebenso wie bei einem Update oder einem Upgrade mittels einer verständlichen Benutzerführung mühelos durch den
Installationsvorgang geleitet. Bereits in den Vorgängerversionen 5 und XP angelegte individuellen Sprachdateien (Benutzer und Vokabulare) werden bei der Installation
automatisch auf die Version 7 transferiert. Die Software der Vorgängerversionen wird dabei überschrieben.
Die Lizenz für Dragon NaturallySpeaking wird grundsätzlich nur jeweils an eine Person vergeben. Dieser ist es gestattet, die Software auf mehreren Computern zu installieren,
z. B. auf dem Desktop- und einem Laptop-Computer oder auf Computern im Büro und zu Hause, die Software darf aber nicht gleichzeitig auf mehreren Computern verwendet werden.
Ebenso ist es nicht gestattet, Sprachprofile für verschiedene Personen zu erstellen; soll die Software also - wie z. B. in der Anwaltskanzlei häufig - auf demselben PC von
verschiedenen Personen benutzt werden, sind mehrere separate Lizenzen zu erwerben. Mengenlizenzen sind ebenfalls erhältlich.
4. Neuerungen und Weiterentwicklungen
Nach der Installation der Version 7 fällt zunächst die neugestaltete Desktop-Leiste, das Befehlscenter, angenehm auf. Auf dieser Leiste sinddie verschiedenen
Bedienungsfunktionen in Form farblich gestalteter Segmente angeordnet, was nicht nur ein ästhetischer Gewinn ist, sondern auch der Übersichtlichkeit dient. Das Befehlscenter
gewährleistet zudem eine höhere Flexibilität bei der Erstellung und Verwaltung eigener Befehle. Das Center ist nach der Installation am oberen Rand des Desktops verankert,
es kann jedoch bei anderen ergonomischen Vorlieben des Nutzers auch an anderen Stellen frei platziert werden.
Weiter sind folgende wesentliche Neuerungen und Weiterentwicklungen hervorzuheben:
•
Vokabularoptimierung. Auf Anweisung des Nutzers analysiert Dragon NaturallySpeaking Satzstrukturen und Wortgebrauch in zuvor erstellten Dokumenten.
Typischerweise sind dies in der Anwaltskanzlei Schriftsätze, aber auch Email-Nachrichten, mit deren Hilfe sich das Programm auf sprachliche Gewohnheiten und Eigenarten des
Nutzers gezielt einstellt. Diese Funktion optimiert die Erkennungsrate.
•
Neuer Leistungsassistent. Der Leistungsassistent führt den Nutzer durch die Prozesse der Fehlerbehebung und Leistungsoptimierung und gewährleistet auf diese
Weise die bestmögliche Nutzung des Programms.
•
Verbesserte Text- und Grafikbefehle. Mit neuen Text- und Grafikbefehlen wird der Nutzer in die Lage versetzt, Text wahlweise der im neu zu erstellenden
Dokument verwendeten Schrift anzupassen oder besondere Formatierungen und Bitmaps hinzuzufügen.
•
Unterstützung zusätzlicher Eingabegeräte. Dragon NaturallySpeaking unterstützt nunmehr zusätzliche Eingabegeräte wie Pocket-PCs, MP3-Player als mobile digitale
Diktiergeräte und drahtlose Mikrofone. Eine Liste empfohlener Mikrofone, Headsets, Pocket-PCs und Diktiergeräte findet sich unter
www.ScanSoft.de.
•
Tools für Entwickler und IT-Experten. Dragon NaturallySpeaking 7 liefert eine ganze Reihe neuer Werkzeuge, die die Implementierung von Sprachtechnologie in
einer Netzwerkumgebung erheblich vereinfachen. Mit dem Entwickler-Toolkit DNS SDK lassen sich kommerzielle und interne Anwendungen sprachfähig machen, z. B. internetbasierte
Content- Management-Systeme, Workflow-Automatisierung, Kanzleiverwaltungen oder Datenbankanwendungen. Darüber hinaus werden Funktionen zur vereinfachten Verwaltung von
Spracherkennungsprozessen in Unternehmens- und Mehrplatzumgebungen zur Verfügung gestellt. Dazu gehört eine vorkonfigurierteMSI-Datei für zentrale Netzwerkinstallationen und
-aktualisierungen sowie der ScanSoft DNS Administrator, ein neues Hilfsprogramm, mit dem sich auch Sprachprofile und benutzerdefinierte Vokabulare zentral über ein Netzwerk
verwalten lassen.
•
Verbesserte RealSpeak-Korrektur. Zeit- und Arbeitsaufwand beim Korrektur- lesen eines mittels Spracherkennung erstellten Dokuments werden mit der ScanSoft
RealSpeak-Proofing-Funktion maßgeblich reduziert. Textdokumente werden hierbei zur Korrektur in natürlich klingender Diktion laut vorgelesen. Mit Dragon NaturallySpeaking
lassen sich zudem auchdie Original-Sprachdateien diktierter Texte abspielen, was z. B. die Transkriptionsüberarbeitung durch Dritte, etwa die Schreibkräfte in einer
Anwaltskanzlei, vereinfacht.
•
Benutzerdefinierte Diktierkürzel. Die Diktierkürzelfunktion zum Erstellen kurzer Sprachbefehle, um bestimmte, häufig genutzte Textbausteine in einen Text
einzufügen, wurde erweitert. Möglich sind hierdurch z. B. Diktierkürzel für individuelle Standardschlussformeln einschließlich der eigenen Signatur, die dann durch Sprechen
des Kürzels (z. B. "Signatur") automatisch in E-Mails und Briefe unter Microsoft Word eingefügt werden. Der eingefügte Text wird dabei der Schriftart des Zieldokuments
automatisch angepasst.
•
Unterstützung weiterer Windows-Anwendungen. Mit der neuen Version sind nunmehr nahezu alle Microsoft Windows-Standardanwendungen sprachfähig; hinzugekommen
sind Outlook Express und Microsoft Excel.
5. Erkennungsgenauigkeit
Ungeachtet aller aufgeführten neuen Funktionen und Features bleibt das Non-Plus-Ultra einer Spracherkennungssoftware die Fähigkeit, diktierte Texte so fehlerfrei wie möglich
in Schrift umzusetzen. Allein von dieser Primärfunktion einer Spracherkennungssoftware leitet sich der Nutzen aller anderen zusätzlichen Funktionen ab. Ohne eine hohe
Erkennungsgenauigkeit blieben mithin alle anderen Features bloße technische Spielerei und damit jedenfalls für den professionellen Einsatz etwa in einer Anwaltskanzlei
Makulatur. Ein besonders kritischer Blick desTesters auf diese Funktion war nicht zuletzt deshalb angezeigt, weil die Spracherkennungsfunktion von Dragon NaturallySpeaking 7
Standard und Preferred in Heft 1/2004 der Stiftung Warentest lediglich mit knapp gut (2,3) bzw. befriedigend (2,9) bewertet worden ist.
Als wesentliches Ergebnis lässt sich festhalten:
• Bei Anwendung aller von dem Programm zur Verfügung gestellter Möglichkeiten zur optimalen Anpassung an den individuellen Sprachstil und Wortschatz des Nutzers,
• bei regelmäßiger Korrektur falsch geschriebener Worte in den ersten Tagen und Wochen der Nutzung des Programms,
• bei Einsatz eines möglichst leistungsstarken Rechners mit großem Arbeitsspeicher,
• bei optimaler Platzierung des Mikrofons und weitgehender Vermeidung von störenden Hintergrundgeräuschen und last not least
• bei subjektiver Bereitschaft des Nutzers, sich bei der Art und Weise des Diktierens auf das Programm positiv einzustellen und einzulassen, was zu Beginn Training und
intensives Ausprobieren erfordert,
wird der Nutzer mit einer erfreulich hohen Erkennungsrate belohnt, die nahe an die vom Hersteller gelegentlich genannten 97 Prozent heranreichen dürfte. Wann dieses Stadium
erreicht ist, wird der Nutzer dann bemerken, wenn er nach dem Starten seines PCs nicht mehr automatisch zur Tastatur, sondern zunächst zum Headset greift.
Die Erkennungsgenauigkeit für den Einsatz des Programms in der Anwaltskanzlei wird bei der Legal Edition durch einen zusätzlichen, mehrere tausend Einträge umfassenden
juristischen Fachwortschatz weiter optimiert. Mit Hilfe dieses integrierten Rechtsvokabulars ist das Programm in der Lage, von Beginn an eine Vielzahl gängiger juristischer
Fachtermini (z.B. Unterlassungserklärung, Widerrufsbelehrung, Sorgerechtsregelung, Güterabwägung, Persönlichkeitsrechtsverletzung, Gegendarstellung), Gerichtsbezeichnungen
(z. B. BayObLG, BVerfG, BVerwG, EuGH, LG Hamburg), Gesetzeskürzel (z. B. ZPO, InsO, BGB, HGB, GmbHG, AktG, BRAGO, UWG, ZuSEG) oder auch Fachzeitschriften (z. B. FamRZ, NVwZ,
VersR, NZA, WRP) korrekt wiederzugeben.
6. Kosten und Nutzen
Unter den genannten Voraussetzungen stellt Dragon NaturallySpeaking 7 Professional / Legal ebenso wie bereits die Vorgängerversionen 5 und XT ein exzellentes Hilfsmittel für
die Optimierung aller Arbeitsabläufe, bei denen es um die Erstellung und Gestaltung schriftlicher Unterlagen geht, dar. Damit kann das Programm für annähernd jede
Anwaltskanzlei - darüber hinaus aber auch für Gerichte, Behörden, Rechtsabteilungen von Unternehmen etc.- von erheblichem Nutzen sein. Die kleine, noch umsatzschwache
Kanzlei kurz nach der Gründung erspart sich Schreibkosten, die große Sozietät steigert in vielfacher Hinsicht, insbesondere auch durch den Einsatz des Programms in
vernetzten Arbeitsstrukturen, die Effektivität.
Vor diesem Hintergrund ist die nicht geringe Investition von ca. 999 € (Update ca. 249 €, Upgrade von Professional auf Legal Edition 7 ca. 349 €) zu
rechtfertigen; sie dürfte sich nach jeweils kurzer Einsatzzeit amortisiert haben.