Orchestra | Von Klaus Härtel

Künstliche Intelligenz und Musik

Künstliche Intelligenz

Das Thema “Künstliche Intelligenz” befeuert momentan jede Menge dystopischer Zukunftsvisionen. Wenn KI immer mehr Be­reiche unseres Lebens erobert, werden die Menschen sich, so befürchten Fachleute, der “Intelligenz” der Maschinen unterordnen müssen.

Zukunftsforscher sprechen davon, dass wir irgendwann für die KI letztlich nur noch wie eine Art Haustier sein werden – oder gar wie Ameisen. Manche glauben, dass sich die Evolution bzw. das Universum erst in der KI ganz verwirklichen wird. Heute erleben wir bereits, dass KI (etwa im Internet) alles massenhaft weiter verarbeitet und verbreitet, womit immer man sie füttert. Sie scheint ein willenloses Werkzeug zu sein, das von Superschurken für jegliches Unheil eingesetzt werden kann. Viele befürchten aber darüber hinaus, dass sich die Logik der KI verselbstständigen wird und dass sie die ge­samte Gesellschaft einer Algorithmen-Diktatur unterwerfen könnte. KI kennt keine Ethik, keine Menschenrechte, keine Demokratie, keine Privatsphäre. Ihrem einprogrammierten Zweck – und selbst wenn er banal ist – ordnet sie alles andere unter. Humane Werte sind da nur im Weg. Und der Gipfel der Zukunfts-Dystopien: KI könnte eigenes Bewusstsein entwickeln und ganz eigene Ziele formulieren. Dann heißt es: sie oder wir.

Man muss gar nicht groß in der Zukunft herumstochern, denn die Gegenwart ist alarmierend genug. KI – also lernende Computer – stecken heute schon in vielen industriellen Produktionsprozessen, in der Medizin- und Militärtechnik, in Verwaltung und Verkehr, Rechtsprechung und Unternehmensführung. KI bewertet für uns Straftäter und Stellenbewerber, erfasst und lenkt unseren Konsum, steuert Überwachungskameras und internationale Finanztransaktionen. Wie sie ihre Entscheidungen trifft, ist für Menschen überhaupt nicht mehr nachvollziehbar. Dennoch akzeptieren wir diese Entscheidungen und ordnen uns ihnen unter. Die Menschen sind in vielen Bereichen bereits Sklaven ihres Werkzeugs.

KI generiert Musik

Wie arbeitet KI? Ihre Basis sind Daten, und zwar gewaltige Mengen davon, also Texte, Bilder, Musiknoten usw., die ins System eingelesen werden. Stellt man zum Beispiel dem Chatbot “Chat GPT” eine Frage, so erhält man in Sekundenschnelle eine umfangreiche, plausibel klingende Antwort. Diese Antwort ist aber nicht von einem Bewusstsein formuliert, sondern nach den Regeln der Wahrscheinlichkeitsrechnung aus den vorhandenen Datenmengen zusammengebastelt. KI ist also nicht “intelligent”, sondern nur rechenstark: ein Statistiksystem, ein digitaler Hochstapler, ein “stochastischer Papagei” (wie die Linguistin Emily Bender sagt). Vermutlich beherrscht KI nicht einmal sprachliche Grammatik, sondern imitiert sie nur – wie ein Kind, das den Erwachsenen etwas nachplappert. Dabei kann dann selbstverständlich auch Blödsinn herauskommen. Füttert man KI mit Müll (Falschinformationen, rassistische Parolen usw.), dann generiert KI auch Müll. (Und ihr eigener Müll landet wiederum in den Datenreserven, auf die sie zugreift. Theoretisch könnte diese künstliche “Intelligenz” also immer dümmer werden…) 

Nicht anders arbeitet KI, wenn sie Musik generiert. KI-Programme “komponieren” zum Beispiel im Stil von Bach, Mozart, Chopin oder Prokofiew. Sie haben auch Mahlers letzte Sinfonie vervollständigt, Schuberts Unvollendete vollendet und aus Beethovens hinterlassenen Skizzen eine 10. Sinfonie gemacht. Sie griffen dafür auf einen riesigen Datenvorrat an Partituren zurück, aber was am Ende dabei herauskommt, kann eben auch Blödsinn sein oder ein statistischer »kleinster gemeinsamer Nenner«. Manche sprechen von “sinfonischem Hollywood” oder “konservativem Nachahmungsbrei”. Ein neuer KI-Mahler klingt bestenfalls wie eine langweilige Verwurstung der bekannten Mahler-Sinfonien, aber nicht wie ein Originalwerk. Komponierende KI hat keine Geistesblitze, verstößt nicht gegen Regeln, ist nicht originell, nicht wirklich kreativ, liefert keine Verblüffungen. KI könnte kein eigenstän­diges sinfonisches Konzept entwickeln, wie es Mahler tat – so formuliert es der KI-Forscher Ali Nikrang. Allerdings ist durchaus vorstellbar, dass man der KI die Erlaubnis einprogrammiert, Regelverstöße »gegen« die Statistik vorzunehmen. Würde KI dann zum Musikgenie?

Mensch und Maschine

Am 9. Oktober 2021 hat das Beethoven Orchester Bonn die KI-Version einer 10. Beethoven-­Sinfonie uraufgeführt. In die Vorbereitung wurde allerdings viel menschliche Arbeit gesteckt. Nicht nur hat man die KI-Maschine mit rund 10 000 Musikstücken “gefüttert”, man hat auch den von der KI generierten Output kräftig nachbearbeitet. Die meisten KI-Versionen klangen, so heißt es, »trocken und emotionslos«. Für manche Abschnitte wurden 200 oder 300 verschiedene Vorschläge der KI als unbrauchbar verworfen. Am Ende waren es musikkundige Menschen, die aus den künstlich generierten Passagen die besten auswählten, sie zusammensetzten und orchestrierten. Dirk Kaftan, der Dirigent der Bonner Aufführung, sagt: »Die KI verarbeitet Dinge, die schon passiert sind. Sie verarbeitet die Vergangenheit. Die Frage ist, ob sie etwas originär Neues schafft […] und daraus ein unverwechselbares Kunstwerk macht. […] Da hätte ich meine ganz, ganz großen Zweifel.«

Der Zufall macht Vorschläge, der Mensch entscheidet – diese Methode ist im Grunde nicht neu. Viele Komponisten (bis zurück in die Renaissance) benutzten mathematische oder mechanische Hilfsmittel, um verschiedene Varianten zu entwickeln, aus denen sie eine Auswahl treffen konnten. Der Komponist Iannis Xenakis (1922 bis 2001) verfuhr bei seiner “stochastischen” Musik nicht anders. Es gehe darum, sagte Xenakis, die Ausgangsdaten zu definieren und die Verfahrensmittel festzulegen – ein »abstraktes Gerippe« von Wahrscheinlichkeits-Formeln. Das Klang­ergebnis allerdings ist bei jedem Durchlauf des »stochastischen Komponierens« ein anderes. Über die endgültige Werkform entscheidet schließlich der Komponist. “Ich prüfe alle Daten, bis ich die wirkungsvollste Kombination gefunden habe. Man muss ein interessantes Resultat bekommen.” Xenakis ging es beim musikalischen Ergebnis nicht um mathematische Logik, sondern um menschliche Emotion. »Der Mensch denkt mit dem Bauch und fühlt mit dem Kopf« – eben das unterscheidet ihn von der Maschine. Als Xenakis anfing, hatte er nur einen Rechenschieber. Als er seine letzten Werke schrieb (um 1997), war der 386er PC der technische Standard.

Popsongs am Fließband

Die KI-Technologie entwickelt sich in halsbrecherischem Tempo weiter. Wer weiß, wozu sie in zwei, drei Jahren fähig sein wird? Im Moment aber sieht es so aus, als wäre die kontrollierte »Zusammenarbeit« zwischen Mensch und Maschine die sinnvollste Anwendung für Musik-KI. Man darf von ihr keine echte Kreativität erwarten, wohl aber eine große (millionenfache) Bandbreite an alternativen Vorschlägen. In einem eng definierten Rahmen, etwa einem dreiminütigen Popsong, könnte dann schon einmal eine gute Lösung darunter sein. Nutzer von Musik-KI empfehlen sie daher zur Umgehung von Schreib­blockaden und zur Erledigung von Routinen, als Trainingsprogramm oder wie ein »inspirierendes neues Musikinstrument«. Wenn KI in diesem Sinn nur als »Assistent« dient, bleibt der Songschreiber auch juristisch und urheberrechtlich auf sicherem Boden. 

Wer zum Beispiel eine klangliche Untermalung für einen Naturfilm oder für ein Videospiel braucht, kann mit einer KI-Software gut bedient sein. Doch längst hat Künstliche Musik-Intelligenz auch statistisch errechnet, was es braucht, damit ein Song zu einem echten Hit wird. Fachleute sehen daher die Gefahr, dass Pop durch den Einfluss von KI ganz auf den »Hit-Effekt« re­duziert wird (oder dass sich Alltagsmusik KI-­gesteuert direkt unserer Stimmung anpasst) – und dass wir irgendwann nur noch reflexhaft und ungeduldig auf Musik reagieren: ein weiterer Schritt zur Maschine-Werdung des Menschen. KI-generierte Musik kann berühmte Popstimmen imitieren, den Stil bekannter Bands nach­ahmen oder auch Jazz-Soli im Sound und in der Phrasierung längst verstorbener Saxofonisten erfinden. Vielleicht erwarten uns bald Hunderte neuer Beatles-Alben aus der Maschine? Ein Programm des Sony Computer-Labors ist sogar in der Lage, zusammen mit Jazzmusikern täuschend echt zu »improvisieren«. Chat GPT bestätigt auf Anfrage: »KI-Systeme können in Echtzeit während einer Live-Performance auf einen musikalischen Input reagieren, ergänzendes musikalisches Material generieren oder interaktiv begleiten.« Wie lange wird es dauern, bis wir in der Musik die Menschen gar nicht mehr vermissen?