„Unsupervised Sounds“ wird erstmalig auf dem ECLAT-Festival 2023 aufgeführt. In der Performance nutzt der Komponist Genöel von Lilienstern eine künstliche Intelligenz. Ein Gespräch über Kunst, die Zukunft und die Rolle des Menschen.
Wie kamst du dazu, künstliche Intelligenz (KI) in deine künstlerische Arbeit zu integrieren?
Wir leben in einer Zeit, in der KI stärker in unseren Alltag integriert und potenter ist als vor einigen Jahrzehnten. Ich komponiere Neue Musik, experimentiere gerne. Mit interessiert die nicht standardisierte Klangerzeugung. Früher nutzten Künstler*innen zum Beispiel Messgeräte, woraus dann die elektronische Musik um Stockhausen entstanden ist – und heute arbeite ich mit neuronalen Netzen.
Und wie waren deine ersten Annäherungen an neuronale Netze in der Musik?
Mit Freunden gründete ich eine Facebook-Gruppe. Dort tauschten wir und über neuste Entwicklungen von künstlerischer Intelligenz und Musik aus. Einer aus dieser Gruppe, Antoine Daurat, war besonders technologieaffin und ging in die Wirtschaftsinformatik. Wir dachten, dass es cool wäre, sein Wissen zu nutzen. Wir wollten nicht nur über KI philosophieren, sondern machen. Antoine kam nach einem Jahr zurück und hatte in der Zwischenzeit gelernt, wie Texte ausgelesen werden. Er hat einen Code geschrieben und wir haben angefangen, ihn zu verstehen, zu nutzen und zu testen und Feedback zu geben. Das war der Beginn der Komponistengruppe ktonal.
Wie ging es weiter?
Zunächst ging es darum, die Software weiterzuentwickeln. Wir hatten jetzt ein neuronales Netz, das Klänge lernen kann – und nun? Das ist die Fragestellung von „Unsupervised Sounds“. Wir haben mit Klängen aus dem Internet gearbeitet. Häufig geht es in anderen Branchen darum, dass ein großer Berg an Daten ausgelesen wird. Wie zum Beispiel bei ChatGPT, die unter anderem Zusammenfassungen schreiben kann. Bei uns ist es genau das Gegenteil. Wir arbeiten mit kleinen Datenmengen. Da kommt Data Augmentation ins Spiel, denn die Datenmenge ist eigentlich zu klein, um von der KI gelernt zu werden, weswegen sie erstmal „aufgeblasen“ werden muss. Nach vielen Ausleseprozessen baut sich ein Wahrscheinlichkeitsnetz auf. Im zweiten Schritt schmeißt man dann einen kleinen Soundfetzen da rein, ein Prompt. Das ist wie ein Köder. Daraufhin generiert das Netzwerk eine Klangvorhersage, wie das der Klang weitergehen könnte.
Das Netzwerk lernt dazu, hatte aber zu Anfang nur einen kleinen Datensatz, richtig?
Ein Beispiel: Ich nehme eine Bratschenmelodie oder einen Ton der Bratsche, der zehn Sekunden dauert. Dann schaue ich, was passiert, wenn mit verschiedenen Einstellungen das Netzwerk diesen Klang durchliest, was zurückkommt. Außerdem versuche ich, dem neuronalen Netzwerk nach und nach komplexere Klänge anzubieten.
Wo siehst du deine Arbeit zwischen Experiment und Komposition?
Speziell diese Arbeit hat forschenden Grundcharakter. Auf einem recht rudimentäreren Level werden Klangarten durchgegangen und geschaut, was passiert, wenn sie vom Netzwerk gelesen werden. Es ist häufig die Rede von der Blackbox KI. Den Eindruck einer Blackbox sollte man aber nicht zu hoch hängen. Ich weiß, da drin werden viele Zahlen addiert, subtrahiert und multipliziert. Es ist nur so viel, dass man es nicht nachvollziehen kann, was konkret passiert. Es stimmt, dass im Prozess Zufall eine Rolle spielt. Es ist viel Trial-and-Error. Ich mache mir auch mit dieser Technologie das Leben total schwer, da ich viel rumprobieren muss.
Weißt du genau, was bei „Unsupervised Sounds“ passieren wird, oder ist die Zufallsvariable im Moment der Aufführung schon drin?
Ja. Das haben wir schon alles ausprobiert und geprobt.
Inwiefern nimmst du KI im Alltag stärker wahr, seitdem du dich damit in der Kunst beschäftigst?
Die Arbeit lässt mich über meine Entscheidungsprozesse und kreativen Prozesse nachdenken. Wenn ich einen Klang nehme und die KI den perfekt lernt, dann kommt am Schluss der gleiche Klang raus. Perfekt auswendig gelernt. Das ist unterinteressant, nicht kreativ. Bei der künstlichen Intelligenz kommt es vor, dass auf dem Weg zum perfekten Lernen das Halbfertiggelernte Fehler hat. Man spricht vom Glitch. Doch dann frage ich mich: Wenn ich mir selbst was ausdenke, ist das dann ein Fehler? Ist Kreativität ein Fehler?
Also kann Perfektion Kreativität behindern.
Deshalb finde ich es zum Beispiel spannend, wenn das Netzwerk zwei unterschiedliche Klänge gleichzeitig lernt. Dann kann es das perfekt Auswendiggelernte gar nicht geben. Die Frage, was Kreativität oder Kunst ist, wird schon nochmal auf einen Prüfstand gestellt. Das ist eine Veränderung, die ich wahrnehme.
In den Bereichen Bild und Text gibt es ziemlich viel KI, die kreieren kann. Macht das Kreativität kaputt, werden Künstler durch KI ersetzt werden?
Ich ziehe das in einen historischen Kontext. Eine naheliegende Analogie: die Fotografie. Die hat die Malerei in eine Krise gestürzt. Weil der Aspekt des bildnerischen Festhaltens zu dem Zweck, dass man es später sehen kann, dadurch wegfiel. Infolgedessen sind aber neue Kunstbewegungen entstanden – Impressionismus und Expressionismus. So könnte ich mir auch vorstellen, dass jetzt gewisse Möglichkeiten auf Knopfdruck vorhanden sind und dann dafür andere Prozesse möglich werden.
Hast du Sorge, dass menschengeschaffene Kunst irgendwann ersetzt wird durch KI?
Was ist eigentlich Kunst? Ist es, wenn ein Handwerk perfekt beherrscht wird? Wenn man das so definiert, dann wird die KI dominieren. Doch eine KI steht nicht morgens auf und schaltet sich selbst ein. Sie muss keine Miete zahlen. Sie will auch gar nichts. Sie bewegt sich nicht in einem sozialen Netz. Ist Kreativität nicht viel mehr, gegen Erlerntes zu agieren? Es ist eben nicht damit getan, dass ein Bild perfekt gemalt ist. Jemand muss entscheiden, wie es gerahmt wird und wo es hängt im Museum. Das spielt alles eine große Rolle. KI kann Kreativität und Kunst verändern. Aber das wird man einordnen und erkennen. Ich glaube, dass die Menschen letztendlich doch das Menschengemachte interessiert.