Neues KI-Tool für Musikproduktion
Wiener Start-up entwickelt neues KI-Tool für Musikproduktion
Es gibt kaum Dinge, die es heutzutage nicht gibt – aber ab und zu stößt man tatsächlich noch auf unentdecktes Land. Taylor Peer und seine Kollegen haben genau eine solche Gegend betreten und mit Hilfe von EuroCC Austria ein KI-Tool für elektronische Musik entwickelt, mit dem sich nicht nur fertige Songs generieren lassen, sondern auch editierbare Projektdaten. Genau das ist neu und vor allem für Profiproduzent:innen interessant. Sämtliche Trainingsdaten sind lizenziert, was das Tool zu einer rechtlich wasserdichten Option macht.
Bettina Benesch
Die großen US-amerikanischen Anbieter für KI-generierte Musik bekommen Konkurrenz aus Österreich: Das Team des Wiener Start-ups Beat Shaper hat ein KI-Modell trainiert, das Musiker:innen bei Songwriting und Sounddesign unterstützt, indem es ihnen ermöglicht, Beats, Melodien, Basslinien sowie Synthesizer- und Effekt-Einstellungen zu generieren. Wie ChatGPT erstellt das Tool seinen Output auf Basis von Spracheingaben.
„Beat Shaper unterstützt sowohl absolute Einsteiger:innen, die oft an der komplexen Musikproduktionssoftware scheitern, als auch professionelle und semiprofessionelle Musiker:innen“, erklärt Taylor Peer, einer der vier Gründer des Start-ups. „Musikproduktion wird so auf allen Levels vereinfacht – ohne steile Lernkurve für Anfänger und mit fortschrittlichen, generativen Funktionen für erfahrene Produzierende.“
Beat Shaper entwickelt KI-Modell von Grund auf neu

© Anna Remizova/EuroCC Austria
Beat Shaper ist mit seinen fünf Millionen Parametern ein relativ kleines KI-Modell; ein kleines Sprachmodell, um genau zu sein (Small Language Model). Dennoch braucht es auch zum Trainieren solcher Modelle eine beachtliche Rechenleistung – vor allem, wenn man mit vielen Modellen experimentieren möchte und von null weg trainiert, wie Taylor und seine Partner.
Das Team entwickelte sein Modell nicht anhand fertiger Musikstücke, sondern mit sogenannter symbolischer Musik: Anhand von Anleitungen erfährt das Modell, wie ein Lied abgespielt werden soll. Das ist vergleichbar mit einem menschlichen Musiker, der auf einem Notenblatt abliest, welche Noten gefragt sind - aber auch welches Tempo und welcher Rhythmus das Musikstück hat.
Auf diese Weise lernt das Modell, dass für die Ausgabe der Musik nicht nur Noten vorhanden sein müssen, sondern auch viele weitere Faktoren den Klang beeinflussen. „Man kann sich das so vorstellen, als würde man auf einem Synthesizer spielen“, erklärt Taylor: „Da gibt es dutzende oder hunderte Parameter, die den eigentlichen Ton beeinflussen; zum Beispiel die Einstellungen für die Oszillatoren und Filter. All das wirkt sich darauf aus, wie ein Ton abgespielt oder ausgegeben wird. Bisher hat niemand sein KI-Modell auf diese Art trainiert. Es gibt also keinen Datensatz dafür. Deshalb haben wir alles selbst aufgebaut."
“
Bisher hat niemand sein KI-Modell auf diese Art trainiert. Es gibt also keinen Datensatz dafür. Deshalb haben wir alles selbst aufgebaut.
„
Eine der Herausforderungen war es, das sogenannte Overfitting zu vermeiden: Beat Shaper soll innovative, kreative Stücke generieren, die sich von den Trainingsdaten unterscheiden. Das Tool hat schließlich den Auftrag, etwas Neues zu erschaffen. Gleichzeitig soll es nichts produzieren, was unseren Ohren zu schräg oder zu kreativ vorkommt. Denn damit Musik gefällt und auch als Musik erkannt wird, muss sie gewissen Regeln folgen. Beim Training des Modells ging es darum, diese Regeln zu beachten – ohne das Alte wiederzukäuen. Gefragt war also eine gute Balance zwischen Regeln und Innovation.
“
Der Hauptvorteil des Clusters war, dass wir so viele Modelle auf einmal trainieren konnten. Wir hätten sonst niemals derart ausgiebig experimentieren können und das hätte die Qualität des finalen Modells negativ beeinflusst.
„
Supercomputer VSC ermöglicht Training hunderter Modelle gleichzeitig
Um das zu erreichen, braucht es reichlich Experimente und Rechenkapazität. Denn mit einem oder zehn Modellen zu arbeiten ist zu wenig: Es braucht ein paar mehr; ein paar Hundert in etwa. Da kommt ein Supercomputer wie der Vienna Scientific Cluster (VSC) gerade recht. Das Team von Beat Shaper trainierte auf dem österreichischen Hochleistungsrechner über 500 einzelne Modelle, wählte regelmäßig das beste aus und verbesserte es über die Zeit.
Durch das Rechnen am VSC konnte das Team die Trainingszeiten im Vergleich zur eigenen Infrastruktur um den Faktor 50 verkürzen. Jedes Modell trainierte etwa ein bis zwei Stunden auf dem VSC. „Der Hauptvorteil des Clusters war, dass wir so viele Modelle auf einmal trainieren konnten. Wir hätten sonst niemals derart ausgiebig experimentieren können und das hätte die Qualität des finalen Modells negativ beeinflusst“, sagt Taylor. Auf dem VSC wurde das beste Modell immer weiter feinabgestimmt, bis letztlich die Qualität des Outputs den hohen Anforderungen der Entwickler gerecht wurde.
Gratis- und Bezahlvariante ab Sommer 2025
Derzeit wird das Modell in der Beta-Version von ausgewählten User:innen getestet. Taylor und seine Partner planen den Echtbetrieb für Sommer 2025, mit einer kostenfreien Basisversion, einer Premium-Bezahlvariante und einer weiteren Stufe für Profimusiker:innen mit zusätzlichen Integrationen zu personeller Musiksoftware.
Einzigartig: Musikprojektdateien und rechtlich einwandfreie Musik
Das Besondere an Beat Shaper ist, dass der Output nicht nur aus fertigen Musikdateien besteht, sondern wahlweise aus Musikprojektdateien, die in gängiger Musiksoftware weiterbearbeitet werden können. Auch die rechtliche Basis ist anders als bei den großen Mitbewerbern: Sämtliche Trainingsdaten stammen entweder aus Fair Use oder aus lizenzierten Dateien, die Beat Shaper für das Training angekauft hat. Das Modell wurde also nur auf Daten trainiert, die explizit dafür freigegeben wurden. Im rechtssicheren Raum bewegen sich auch die Nutzer:innen, denn sie behalten alle Urheber- und Nutzungsrechte an dem von ihnen generierten Output, wenn er weiterbearbeitet wird.
“
Es gibt in Europa kaum nennenswertes privates Risikokapital für Start-ups in der Frühphase. Daher sind Programme wie EuroCC entscheidend, um europäischen Unternehmen zu helfen, global wettbewerbsfähig zu bleiben.
„
Taylor Peer über die Arbeit mit EuroCC Austria
EuroCC Austria unterstützte Beat Shaper mit kostenlosem Zugang zum Supercomputer VSC-5. „Ich finde es großartig, dass es das EuroCC-Programm gibt. Wir stehen im Wettbewerb mit deutlich größeren und besser finanzierten Unternehmen, die größtenteils in den USA ansässig sind. Da es in Europa kaum nennenswertes privates Risikokapital für Start-ups in der Frühphase gibt, sind Programme wie dieses entscheidend, um europäischen Unternehmen zu helfen, global wettbewerbsfähig zu bleiben.“
Über Beat Shaper
Beat Shaper wurde 2024 von Taylor Peer, Jeremy Brown, Joaquín Molina, und Filip Miškovic in Wien gegründet. Der KI-Co-Pilot für Musikproduzent:innen integriert generative KI direkt in den Produktionsworkflow und unterstützt Anfänger:innen sowie Profis beim Erstellen elektronischer Musik. Die erste Idee zum Produkt entstand im Jahr 2023. Dank des Investments des Wiener High-Tech Inkubators INiTS, der Förderung der Österreichischen Forschungsförderungsgesellschaft (FFG) und der technischen Unterstützung von EuroCC Austria konnte das Team das innovative KI-Tool trotz großer US-amerikanischer Konkurrenz auf den Markt bringen.
https://www.beatshaper.ai
https://www.linkedin.com/company/beat-shaper
