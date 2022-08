Dass ihr Trainingsmaterial nicht unproblematisch ist, wissen auch die Macher von Stable Diffusion. In einem Begleittext zur Veröffentlichung schrieb Emad Mostaque, sein System könnte »gesellschaftliche Vorurteile reproduzieren«, weil in seine Entwicklung im Internet gefundene Bild-Text-Paare geflossen seien. Gemeint ist in diesem Fall übrigens ohnehin nur der englischsprachige Teil des Internets. Das (en) im Namen des 2,3 Milliarden Bilder großen Trainingspakets spielt darauf an, dass es sich primär um Motive handelt, die mit englischsprachiger Bildbeschriftung aufgefunden wurden.

Auf einer Überblicksseite zu Stable Diffusion heißt es , Texte und Bilder aus Gemeinschaften und Kulturen, die andere Sprachen als Englisch verwenden, würden von dem System »wahrscheinlich nur unzureichend berücksichtigt«: Dies wirke sich auf die Gesamtleistung des Modells aus, da weiße und westliche Kulturen oft gewissermaßen »als Standard eingestellt« seien.

Bedenklich findet es Andy Baio auch, dass es die Standardversion von Stable Diffusion anders als Tools wie Dall-E 2 erlaubt, Bilder mit Prominenten und markenrechtlich geschützten Charakteren zu generieren. Auch Nacktheit werde bei der lokal laufenden Version zugelassen, schreibt Baio und verweist auf Foren, die Reddit gesperrt hat, nachdem dort Pornobilder gepostet wurden , die aus KI-Generatoren stammten.