Lokales KI-Tool für Audiotranskription


01.04.2026

Volle Datenkontrolle: Lokales KI-Tool für Audiotranskription


Switch to English
 

Es gibt Daten, die will man nicht in einer fremden Cloud haben. Audioaufnahmen von Interviews zum Beispiel, die heikle Informationen enthalten können, wie jene des Instituts für Politikwissenschaft der Universität Innsbruck. Da die Gespräche künftig mit KI transkribiert werden sollen, suchte das Team eine Möglichkeit, diese Aufgabe lokal abzuwickeln. Sie fanden Andreas Lindner vom österreichischen Kompetenzzentrum für Supercomputing, der im Rahmen des EuroCC Projektes ein KI-Tool konstruierte, das auf Innsbrucks Hochleistungscomputersystem (HPC-System) LEO5 läuft und dem Institut Datenhoheit bietet.

Bettina Benesch

In der Politikwissenschaft sind Interviews oftmals Mittel der Wahl, um Forschungsdaten zu erheben. Allerdings ist besonders die händische Verschriftlichung ein sehr zeit- und kostenintensiver Prozess. Daher greifen viele Interviewende auf Transkriptionen mit künstlicher Intelligenz zurück. „Heute finden sich automatisch transkribierte Texte überall, auch wenn die Qualität nicht immer überzeugt“, sagt Politikwissenschaftler Prof. Franz Eder von der Universität Innsbruck (UIBK). „Da habe ich mich gefragt: Können wir das besser – und vor allem: Können wir es lokal auf unseren Servern laufen lassen, damit die Daten im Haus bleiben?“

Um diese Frage zu beantworten, kam Andreas Lindner an Bord, der weiß, wie man KI-Modelle auf einem HPC-System zum Laufen bringt. Unterstützung erhielt das Projekt zusätzlich vom HPC-Team des Zentralen Informatikdienstes (ZID) und dem Forschungsschwerpunkt Scientific Computing der UIBK.

Derzeit werden verschiedene Wetterphänomene einzeln betrachtet, die vermutlich zusammenhängen. Wenn wir ein übergreifendes Konzept erstellen können, dann hat es hoffentlich sehr viel Wert für die Wettervorhersage.

Die Anforderungen: leistungsfähig, lokal, kontrolliert


Die Lösung musste leistungsfähig genug sein, um moderne KI-Modelle zu nutzen, sollte lokal laufen und der Universität Kontrolle über die Prozesse garantieren. Diese Anforderungen waren rasch erfüllt. Und weitere folgten, denn im Austausch mit den Nutzer:innen wuchs der Anspruch Stück für Stück: Sprecher:innen sollten zuordenbar sein, Zeitstempel eingefügt und Übersetzungen in andere Sprachen möglich werden. So entstand aus dem kleinen Auftrag ein spannendes Projekt, das Features, Effizienz und digitale Souveränität zusammenführt.

Heute folgt das Tool einem klaren Workflow, der zwischen einem Linux-Arbeitsplatzrechner und dem lokalen HPC-System LEO5 abläuft: Nachdem die Datei vom Rechner im Büro für Open Science an der Fakultät für Soziale und Politische Wissenschaften auf den Großrechner der Universität Innsbruck geschickt wurde, wird das Audio analysiert und in Sprechersegmente unterteilt. Anschließend transkribiert das Tool diese Segmente automatisch. Optional kann danach der fertige Text in andere Sprachen übersetzt werden.

Die Technik dahinter


Die KI-Lösung setzt bewusst auf etablierte, gut dokumentierte KI-Bausteine, die Andreas Lindner eigens für den Einsatz auf LEO5 adaptiert hat: 

Wie das Tool heute genutzt wird – und was es ermöglicht


Heute ist die Lösung technisch einsatzbereit und dokumentiert. Es fügt sich in die bestehende Forschungsinfrastruktur ein, kann Wissenschaftler:innen vom zeitaufwändigen Transkribieren entlasten und wahrt die Datenhoheit. Die AI Factory Austria (AI:AT) verwendet das Tool intern für die Transkription von Videokonferenzen. Auch das Interview mit Andreas Lindner, das diesem Post zugrunde liegt, wurde übrigens mit dem neuen Tool auf LEO5 verschriftlicht.

Ein weiteres Goodie des neuen Tools: Die Transkriptionen sind nicht zeitkritisch und werden automatisiert in Freiräume zwischen andere Projekte verteilt. Das bedeutet, dass die HPC-Systeme (die auch in Ruhe Strom verbrauchen) besser ausgelastet werden. Weil somit weniger Energie ungenutzt verpufft, sondern stattdessen für die zusätzlichen Aufgaben verwenden wird, steigt die Effizienz.

Mit dem neuen Tool steht der Fakultät für Soziale und Politische Wissenschaften nun eine KI-gestützte Lösung zur Verfügung, die Forschung erleichtert, Datenhoheit wahrt und zeigt, wie moderne Technologie verantwortungsvoll eingesetzt werden kann.


Datensatz jetzt öffentlich zugänglich


Da automatisierte Transkriptionen nicht nur in Innsbruck, sondern an vielen anderen Orten gebraucht werden, hat Andreas Linder das GitLab Repository öffentlich zugänglich gemacht. So kann es auch für andere Betreiber von High-Performance-Clustern nützlich sein, die eine ähnliche Umgebung bereitstellen möchten:

https://researchdata.uibk.ac.at/records/z877w-c6110
https://doi.org/10.24433/CO.0416787.v1


Zur Person

Dr. Andreas Lindner promovierte in Computational Physics an der LMU München, wo er Simulationen von Quantenphänomenen auf HPC-Systemen durchführte. 2024 wechselte er als HPC- und AI-Experte an das österreichische Kompetenzzentrum für Supercomputing (EuroCC Austria), das er seit April 2026 als Projektleiter managed.