funklust ki-woche web

KI und Kunst: Wie zweckentfremdete KI-Algorithmen Datendieben den Garaus machen sollen

Bildgenerierende KIs sorgen seit Ende 2022 vor allem in der Künstler:innen-Community für Kontroversen. Nicht nur sehen die Kreativen ihre Jobs gefährdet – viele Bilder in den Datensätzen, die die Grundlage für die Bildgenerierung bilden, wurden zudem ohne Einverständnis der Urheber:innen eingespeist. Rechtslage: bisher unklar. Die University of Chicago hat zwei Tools entwickelt, die Künstler:innen dabei helfen sollen, ihre Werke jetzt schon vor allem im digitalen Raum besser zu schützen.

Bild: Wikipedia / „Die große Welle vor Kanagawa“ von Katsushika Hokusai, 1830–1832, mit den Programmen Glaze und Nightshade bearbeitet

Im März 2023 veröffentlichte ein sechsköpfiges Team von Entwicklerinnen um die Computer Science-Professoren Ben Zhao und Shawn Shan ein Tool, das Künstler:innen besseren Schutz vor dem Zugriff auf ihre Werke durch KI ermöglichen sollte. Bereits im ersten Monat nach Release verzeichnete das Programm namens Glaze über eine Million Downloads. Seitdem wurde die Anwendung stetig verbessert, eine Webversion wurde eingeführt und mit Nightshade erschien Anfang 2024 eine Erweiterung. Glaze schützt vor allem den individuellen Stil eines Bildes vor Nachahmung durch KI, während Nightshade die Generierung neuer Werke stört – beides Funktionen, die generative KI unzuverlässiger machen können. Aber wie funktioniert das genau?

Du weißt nicht genau, was generative KI bedeutet? Auf unserer Website findest du einen Überblick über die Grundlagen des Themas KI.

Das Datensatzdilemma

Generative KI kann im Grunde eigentlich nichts Neues erschaffen. Vielmehr erzeugen ihre Algorithmen ein Bild auf der Grundlage von Datensätzen. Diese können aus Texten oder, wie in unserem Fall, aus Bildern bestehen. In solchen Datensätzen sind die Daten klassifiziert, das heißt, mit einem Label versehen. Einfach erklärt: Wenn einer KI Bilder von Gänseblümchen gezeigt werden und ihr gesagt wird, dass es sich um Gänseblümchen handelt, dann wird die KI daraus lernen, wie ein Gänseblümchen aussieht. Wird die KI dann darum “gebeten”, ein Gänseblümchen zu zeigen (“Prompt”), wird sie auf Basis der ihr verfügbaren Bilder von Gänseblümchen und der Muster, die sie in ihnen erkannt hat, ein Bild von Gänseblümchen erzeugen.

Insofern klingt KI vielleicht erst einmal etwas ähnlich wie eine heruntergebrochene Version des menschlichen Lernens. Ein wesentlicher Unterschied liegt jedoch darin, dass KI nicht selbst ergänzen kann. Menschliche Vorstellung ermöglicht es beispielsweise, Gänseblümchen aus einer Perspektive zu zeichnen, für die der:die Zeichner:in keine Referenz hat oder die er:sie überhaupt nicht einnehmen kann (z.B. ein Gänseblümchen von seinen Wurzeln aus gesehen). Fehlt einer KI eine Perspektive in ihrem Datensatz, so wird sie diese auch nie abbilden können.

Eine Teillösung liegt darin, der KI einfach möglichst viele Daten als Basis zu geben – also statt hundert Bildern von Gänseblümchen tausende. Problem nur: Woher sollen diese Daten kommen?

Viele KI-Begeisterte wenden sich hierfür an das Internet – immerhin gibt es hier Bilder in Hülle und Fülle. Sowohl Künstler:innen als auch Fotograf:innen sind mehr als gewillt, ihre Werke online zu teilen. Da kann man sich doch einfach bedienen (also “Scraping” betreiben) – oder?

Rechtlich gesehen gibt es hierzu noch keinen Konsens. Fest steht allerdings: Viele Urheber:innen dieser Bilder sehen das gar nicht gern. Vor allem dann nicht, wenn KI dazu verwendet wird, um Bilder in ihrem persönlichen Stil zu generieren – eine Leistung, die normalerweise Geld kosten würde. Doch auch die Möglichkeit, überhaupt Bilder mittels KI nahezu ohne menschlichen Input zu generieren, bereitet Kreativen (und Fans) mittlerweile Sorge.

KI kann also nicht ohne Datenbasis funktionieren. Die dafür verwendeten Daten werden jedoch oft auf eine Weise gewonnen, die als ethisch fragwürdig bezeichnet werden kann. Zudem stellt KI eine potentielle Bedrohung für Arbeitsstellen in einer sowieso schon hart umkämpften und teils von ausbeuterischen Verhältnissen geprägten Branche dar. Der Datensatz ist also die Achillesferse generativer KI.

Eine Achillesferse, zwei Möglichkeiten

Sowohl Glaze als auch Nightshade nutzen zur Bekämpfung unerwünschten Scrapings genau diese Schwachstelle, indem sie eine Art individuellen Filter über ein Bild legen. Dieser wird mit ähnlichen Algorithmen, wie sie auch für generative KI verwendet werden, erstellt, wobei die Analysedaten statt für die Generierung neuer Bilder für die Erstellung des Filters verwendet wird. Für das menschliche Auge ist dieser – zumindest ohne sehr genaues Hinsehen und Vergleichsmaterial – nahezu unsichtbar. Die KI bringt er jedoch durcheinander: Sie “sieht” anders als wir Menschen. Für alle, die das sowie die Funktionsweise der Programme genauer interessiert, stellen die Entwickler:innen auf ihrer Website übrigens auch entsprechende wissenschaftliche Papiere frei zur Verfügung.

Glaze zielt weniger auf die Inhalte eines Bildes als auf die Art, wie diese dargestellt werden und somit auf spezifische Prompt-Kombinationen. Um das zu verdeutlichen: Wird eine KI beauftragt, ein Gänseblümchen im Stil von Mickie Musterkünstler:in abzubilden, so wird sie die ihr verfügbaren Daten über Gänseblümchen und den Stil Mickie Musterkünstler:ins kombinieren. Sie errechnet dann Daten, die einem Gänseblümchen im Stil von Mickie Musterkünstler:in entsprechen könnten und setzt diese in Bildform um.
Sind die Werke eines:einer Künstler:in (z.B. Mickie Musterkünstler:in) jedoch mit Glaze versehen, so wird dieser persönliche Stil verzerrt. Statt eines Gänseblümchens im Stil von Mickie Musterkünstler:in generiert die KI dann beispielsweise das Bild eines Gänseblümchens im Stil eines Animes. Glaze gaukelt der KI also einen Stil vor, der gar nicht dem Zeichenstil des Bildes entspricht.

Nightshade hingegen verzerrt die Inhalte eines Bildes. Ein mit Nightshade versehenes Bild eines Gänseblümchens könnte für eine KI also beispielsweise wie eine Kuh aussehen, während Menschen nach wie vor ein Gänseblümchen erkennen. Enthält ein Datensatz genug mit Nightshade versehene Bilder von Gänseblümchen, so könnte die KI für den Prompt “Gänseblümchen” stattdessen ein Bild von einer Kuh generieren.

Glaze und Nightshade lassen sich auch kombinieren – wobei sie sich dann unter Umständen gegenseitig beeinflussen. So oder so werden KI-Modelle durch die Anwendung der Tools, oder vielmehr die Einspeisung von mit ihnen verzerrten Daten, unzuverlässiger.

Rechtlich gibt es bei solchen Gegenmaßnahmen noch keinen Konsens. Die Entwickler:innen von Glaze haben jedoch laut eigener Aussage mit mehreren im Recht Tätigen gesprochen und vertreten ihren Standpunkt im Q&A auf der Website des Projekts: “I am not a lawyer, so I […] have talked to plenty of lawyers, none of them have any concerns about legality of me creating NS, or anyone using NS to protect their own art. One accurate analogy for using Nightshade is like putting hot sauce in your lunch that is clearly labeled „DO NOT EAT/SCRAPE.“ Someone stealing your food is doing so against your express wishes, and if they get sick from the hot sauce, you are not liable.” Dies gilt jedoch nur für die USA. Für die deutsche Rechtssprechung stellt sich die Frage, ob in diesem Fall der Tatbestand der Sachbeschädigung greift.

Die aktuelle Situation zeigt, dass beim Umgang mit generativer KI noch viel Klärungsbedarf besteht. Die Entwicklung von Schutztools wie Glaze und Nightshade sowie die erste KI-Richtlinie der EU sind zwar wichtige Schritte, doch es bedarf klarer rechtlicher Rahmenbedingungen, um Künstler:innen langfristig zu schützen. Gleichzeitig könnte eine verstärkte Zusammenarbeit zwischen Technikentwickler:innen und der Kunstszene neue Wege eröffnen, wie KI kreativ und ethisch eingesetzt werden kann. Da KI-Technologie auch in Zukunft weiter voranschreiten und eine Rolle in der Gesellschaft spielen wird, ist es wichtig, einen ausgewogenen Ansatz zu finden, der sowohl Innovationen fördert als auch die Rechte und die Kreativität der Künstler:innen respektiert und schützt.

Autor:in: Cassandra Haas