Zum Hauptinhalt springen

Digitale Hauptverhandlungsdokumentation: Mehr Effizienz durch KI-Transkription

6 Minuten zum Lesen
media 4 cast GmbH
Vorteile einer Audio-KI-Transkription im Justizwesen.

Die Digitalisierung bringt viele Vorteile für die Justiz. Sie ermöglicht es, Strafverfahren effizienter zu gestalten und die Dokumentation von Hauptverhandlungen zu erleichtern. Eine wichtige Maßnahme ist die KI-gestützte Transkription von Audioaufnahmen, um Protokolle zu erstellen. 

Wenn man diese Aufnahmen mit Netzwerk-Kameras kombiniert, verbessert sich die Qualität der Dokumentation durch genauere Sprecherzuordnung und zusätzliche Informationen wie nonverbale Kommunikation. Diese Lösung wurde bereits in einer Live-Simulation vom Bundesministerium der Justiz und zwei Juristenverbänden erfolgreich vorgestellt und überzeugte mit 99,5 Prozent korrekter Transkription sowie 80 Prozent korrekter Sprecherzuordnung.

Derzeit werden bei Hauptverhandlungen nur Notizen gemacht, keine Wort-für-Wort-Protokolle. Richtern und Anwälten entsteht dadurch ein erheblicher Mehraufwand. Sie müssen sich auf Notizen und ihr Gedächtnis verlassen, wenn Fragen später geklärt oder das Verfahren weiterbearbeitet wird.

Hier setzt die Lösung des Unternehmens media-4-cast GmbH an. Das inhabergeführte Unternehmen aus Emden ist ein Pionier für digitale Lösungen im Justizwesen und sammelte bereit viele Erfahrungen. Die eigens entwickelte Multi-Capture-V4-Software ist von den Gerichten in Deutschland, Österreich und Luxemburg abgenommen und genehmigt.

Die Lösung:
Mittels Mikrofone wird das Geschehen in einer Hauptverhandlung live aufgezeichnet und mit künstlicher Intelligenz in ein offline-Transkript umgewandelt. So können sich die Beteiligten auf das Geschehen konzentrieren, die Dokumentation ist umfassend und später in Textform verfügbar. Durch eine Kombination von Live-Audioaufzeichnungen mit Netzwerk-Kameras wird die Qualität der Dokumentation weiter verbessert. Diese Maßnahmen unterstützen Gerichte, dem bis 2030 in Kraft tretenden Hauptverhandlungsdokumentationsgesetz (DokHVG) zu entsprechen. 

Digitale Transkription

Vorteile von Audio-KI-Transkriptionen kombiniert mit Video

1. **Effizienzsteigerung**

Die Schreibkräfte im Gericht sparen viel Zeit bei der Protokollerstellung von Hauptverhandlungen und Vernehmungen. Dank der MCC-KI-Transkriptionssoftware ist die Nachbearbeitung einfach, und das Protokoll wird genauer und umfangreicher. Insgesamt erleichtert die offline MCC-KI-Transkription die Arbeit der deutschen Gerichte erheblich.

Das Feedback der Gerichte ist sehr gut. Sie beziffern die Zeitersparnis mit bis zu 80 Prozent. Also eine bis zu 80 Prozent schnellere Bearbeitung von Protokollen als zuvor“, erklärt Johannes Reentjes, Geschäftsführer der media-4-cast GmbH.

2. **Umfassende und präzise Dokumentation**

Die vor Gericht verwendete und genehmigte MCC-KI Transkriptionslösung, die offline als Desktoplösung funktioniert, wird laufend vom Media-4-cast Team angepasst. Doch eine Herausforderung bleibt: Bei Antworten unter drei Wörtern hat jede KI-Software Schwierigkeiten, eine Sprecherzuordnung zu machen. Denn weder die Software, noch das menschliche Gehirn, können bei kurzen Antworten, die Person hinter dem „Ja/Nein“ erkennen.

Hier unterstützen Netzwerk-Kameras von Axis Communications eine visuelle Darstellung des Geschehens und verbessern die Transkription. Durch die Kombination von Live-Audioaufzeichnungen mit Kameras kann zusätzlich zur Sprecherzuordnung auch die nonverbale Kommunikation erfasst werden. Dadurch entsteht eine vollständige Sicht auf den Verhandlungsablauf.

3. **Konzentrierte Teilnahme der Beteiligten**

Die Beteiligten können sich auf die Verhandlung konzentrieren, anstatt Notizen zu machen. Die KI-Transkription nimmt den Prozess auf und erstellt ein akkurates, textbasiertes Protokoll

4. **Datenschutz und Sicherheit**

Datenschutz ist nicht verhandelbar, daher können Protokolle sowie die Videoaufzeichnungen nur in einem sicheren, nicht mit dem Internet verbundenen, Netzwerk, bearbeitet werden. Zudem können die Beteiligten die Aufzeichnung individuell steuern. Etwa mit der "Mandantentaste", wenn ein Anwalt mit seinem Klienten etwas Vertrauliches bespricht. Der Richter hat weitere Funktionen via eine Bedienkonsole, die schnell und unkompliziert bedient werden können. Ein Beispiel ist die „Nur Audio“-Taste, um die Videoaufnahme zu stoppen. 

5. **Optimierte Suchfunktion**

Die Transkriptionen sind als Index hinterlegt. Dies ermöglicht, schnell und effizient eine bestimmte Äußerung zu finden, ohne im schriftlichen Protokoll blättern zu müssen.

6. **Praktische Erprobung**

Die Technologie wurde in einer Live-Simulation einer realistischen Gerichtsverhandlung erfolgreich getestet. Erfahrene Beamte und Juristen bestätigten die überzeugende Leistung der KI, selbst unter herausfordernden Bedingungen.

7. **Weitere Entwicklungen**

Die Einführung moderner Technologien im Justizwesen verspricht nicht nur eine Effizienzsteigerung, sondern auch mehr Transparenz in Gerichtsverfahren. Die Kombination von 99,5 Prozent korrekter Transkription und 80 Prozent korrekter Sprecherzuordnung ist ein bedeutender Fortschritt in der Dokumentation von Hauptverhandlungen.

Im Detail: Visuelle Dokumentation mittels Axis Netzwerk-Kameras

Eine gängige Lösung ist die Installation von fest ausgerichteten Dome-Kameras (AXIS M32-Serie) mit Blick auf den Zeugenstand im Gerichtssaal sowie einer Kamera (AXIS M5526-E) hinter dem Richter, die flexibel bewegt werden kann. Dabei können etwaige spezifische Wünsche des Richters und der am Strafverfahren Beteiligten Folge geleistet werden. „Die Technik ist hier schon sehr weit. Jeder Richter kann mittels einer simplen Tastenkonsole bestimmen, ob er eine Videoaufzeichnung wünscht. Wir haben bereits viele Gerichte mit unserer audio-visuellen Lösung ausgestattet und oftmals anfängliche Skepsis in Begeisterung umwandeln können“, so Reentjes.

Gerichts Live-Simulation: Besteht die KI den Realitätstest?

Um sich davon zu überzeugen, ob und wie die Lösung im tatsächlichen Gerichtsalltag funktioniert, organisierten 2024 zwei Juristenverbände eine Präsentation sowie Erprobung einer Gerichts Live-Transkription im Rahmen einer Dokumentation einer Hauptverhandlung im Strafrecht. Hochrangige Beamte des Bundesministeriums der Justiz und führende Vertreter der Verbände eröffneten die Veranstaltung. Der Testlauf stieß auf reges Interesse, alle 42 Sitzplätze waren vollständig belegt.

Das technische Setup wurde Schritt für Schritt erklärt. Die Kombination aus der Multi Capture V4-Software, Axis Netzwerk-Kameras, DSP-Systemen, Tischmikrofonen und die offline Desktoplösung MCC-KI-Transkription vermittelte ein klares Bild davon, wie modern die Justiz ausgestattet werden und wie sie dem DokHV-Gesetz Folge leisten kann. Besonders der Fokus auf die minimale Bedienung (Start/Stopp, Kamera ON/OFF) zeigte, wie alltagstauglich diese Technologie ist.

Die Simulation einer Gerichtsverhandlung wurde dann so alltagsnah wie möglich dargestellt. Inklusive lauter Zwischenrufe, leisen Kommentaren, Dialekten. 

Aus technischer Sicht war die Verhandlung ein Albtraum, denn parallellaufende Gespräche, Dialekte und die zunehmende Lautstärke machten es der KI schwer. Aber genau solche Szenarien zeigen, wie gut oder schlecht ein System funktioniert. Denn die Realität ist nicht anders“, erklärt der Geschäftsführer von media-4-cast.

Nach 42 Minuten Verhandlung wurden dann die Audio- und Videodateien mit 320 MB in das MCC-System eingespeist. Die Ergebnisse überzeugten selbst die Kritiker und viele der Teilnehmer waren überrascht, wie gut die KI bereits arbeitet.

Fazit:

Die Möglichkeit, Verhandlungen nahezu lückenlos zu dokumentierten, eröffnet im Justizwesen völlig neue Perspektiven. Die MCC-KI-Transkription in Kombination mit Axis Netzwerk-Kameras für eine visuelle Dokumentation revolutioniert die Protokollierung von Strafprozessen, indem sie Effizienz und Genauigkeit vereint. Unternehmen wie die media-4-cast GmbH sind Pioniere in diesem Bereich und tragen zur Digitalisierung und Modernisierung des Justizsystems bei.

Im Titelbild: Wer ist media 4 cast GmbH? v.l.n.r. Johannes Reentjes, Christian Wurlitzer & Jens Kothhuber.