artificial-intelligence-3706562_1280 ©pixabay.com

ChatGPT ist in aller Munde. Das neue Wunderwerk, das dem Nutzer alle Arbeit abnimmt, wird in den letzten Monaten stark benutzt. Aber auch die anderen künstlichen Intelligenzen, ob zur Bild- oder Musikerstellung oder Übersetzungen, werden derzeit rege getestet. Sind diese Werkzeuge nun zum Wohle der Menschheit oder nicht?


Musikerzeugung braucht nicht einmal eine KI. Musik ist genau genommen pure Mathematik. Das meiste, was der Harmonielehre und der Chromatik entspricht, lässt sich leicht in Formeln übersetzen und von daher ist es keine große Kunst, das in Akustik zu wandeln. Freilich bleibt die Frage bestehen, ob das, was mathematisch sinnvoll ist, dann auch den Ohren schmeichelt. Ob das eventuell sogar ein Hit wird, ist dann wieder eine andere Sache.


Sprachübersetzungen, wie sie beispielsweise DeepL anbietet, ist dann schon mehr als pures Interpretieren von Vokabeln. DeepL versucht ganze Sätze zu verstehen und sie sinngemäß in die andere Sprache zu bringen. Jeder, der einmal Texte übersetzte, weiß, wie schwer das sein kann und es bedarf oft profunden Kenntnissen in beider Sprachen, um eine adäquate Übersetzung hinzubekommen. Aber auch hier ist letztlich der Wissensstand der Datenbank das Ausschlaggebende. Je mehr darin steht, umso besser kann das Programm arbeiten. Somit schrumpft auch hier wieder der Intelligenzquotient zusammen.


Ich selbst habe die letzten Monate häufig mit KIs gearbeitet und mir deren Funktionsweise angesehen. Dabei habe ich mich vor allem mit der bildgebenden „Stable Diffusion" beschäftigt. Ähnlich wie Dall-E, Midjourney oder Majesty Diffusion, erstellt diese KI aufgrund von Texteingaben Bilder. So weit, so schön. Doch wie erkennt die KI, was der Nutzer möchte? Intelligenz kommt ja von Erkennen und Erkenntnis erhält man oft nur durch Wissen. Das ist bei den Künstlichen Intelligenzen vorerst auch nicht anders. Der Wissenshintergrund der bildgebenden KIs ist in den meisten Fällen der LAION-Datensatz. Eine riesige Datenbank, in der Millionen von Bildern gespeichert werden, aus denen die KI ihr Wissen bezieht. Jedoch liegt hierin auch der große Nachteil der Sache, denn die KI selbst erstellt nichts. Sie generiert und collagiert. Dabei verdreht, staucht und drückt sie Bildteile, die sie aus dem LAION bezieht so, dass es der Eingabe mehr oder weniger entspricht. Mir selbst kam es aber häufiger vor, dass nicht alles meiner Eingaben auch im Bild auftauchte. Sicherlich war mein Prompt auch nicht immer so geschrieben, dass die KI damit was anfangen konnte. Dazu gibt es mittlerweile sogar Hilfsmittel, die einem in einer Art „Click&Play"-Verfahren helfen, Prompts zu erstellen, die dann die umwerfenden Ergebnisse erzeugen. Ja, da kann man schon lange spielen und ich gebe zu, dass diese KIs eine gewisse Faszination ausüben. Sie können durchaus ein Hilfsmittel sein um zum Beispiel eine Arbeitsgrundlage für ein Bild zu erschaffen.


Nun kommt das große Aber. Solange diese KIs nur aus vorhandenen Bildern etwas collagieren, spreche ich ihnen die Intelligenz ab. In vielen meiner Eingaben fand ich Signaturen bekannter Künstler oder andere Artefakte. Dafür fand ich dann bestimmte Dinge, die in meinem Prompt gefordert wurden, nicht mehr. Ein Pool, gefüllt mit Bier? Nein, Stable Diffusion schaffte es nicht, meine Eingabe umzusetzen. Ich bekam zwar einen Pool, der aber nur mit Wasser gefüllt war. Ab und zu stand ein Bierglas am Beckenrand oder man sah neben dem Pool eine Bar. Ab und zu schwamm eine Bierflasche im Pool. Nur das Becken mit Bier füllen, was für eine intelligente Umsetzung meiner Eingabe sprechen würde, fand nicht statt. Dabei wäre das noch nicht einmal eine schwere Aufgabe gewesen.


An dieser Stelle springe ich noch auf das Überwerkzeug ChatGPT, welches von OpenAI entwickelt wurde. Dieser intelligente ChatBot stellt eine native Mensch-Maschine-Kommunikation dar, wodurch der Mensch der KI seine Wünsche ähnlich einer normalen Konversation mitteilt. Inklusive Freundlichkeitsfloskeln. Man merkt allerdings auch diesem Werkzeug an, dass es auf Bausteine zurückgreift, die in seinem Wissensschatz abgelegt wurden. Fragt man ChatGPT beispielsweise, wie es ihm ginge, erhält man folglich als Antwort, dass ChatGPT nur ein Programm sei und deshalb kein Befinden nach menschlichen Maßstäben hat. Man kann diesem Bot aber Aufgaben stellen, die einem ganze Codeabschnitte in gewissen Programmiersprachen liefert und dergleichen mehr und ChatGPT ist in der Lage den Konversationsverlauf zu merken und auf zurückliegende Fragen im richtigen Kontext zu antworten. Es ist, als ob man ein allwissendes Wesen nur fragen müsste und sofort alle Antworten erhält. Doch dabei ist Vorsicht geboten, denn ChatGPT ist keineswegs fehlerfrei. So schluderte die KI beispielsweise bei der Lösung einer Mathematikaufgabe aus einer deutschen Abiturprüfung. Da war sowohl der Lösungsweg, wie dann logischerweise auch das Ergebnis falsch. Solange diese KIs noch am Anfang stehen, wird es solche Fehlinterpretationen häufig geben, aber das ist ein Umstand des Lernverhaltens der KIs. Dem eigentlichen intelligenten Teil. Man trainiert diese KIs auch dadurch, dass man ihnen sagt, ob man mit einer Lösungen zufrieden ist oder sie zum Beispiel auch als falsch markieren kann. Dieses Finetuning macht am Ende dann die Treffergenauigkeit der KIs aus.


Ich möchte nun nicht weiter auf den technischen Hintergrund dieser neuzeitlichen Werkzeuge eingehen, sondern vielmehr auf den menschlichen und ethischen Aspekt davon. Gerade gegen den LAION-Datensatz regt sich Widerstand von vielen Künstlern, deren Werke zum Teil ungefragt in diesem Trainingssatz landeten. Ebenso sind Portraits und Fotos von lebenden Personen in LAION enthalten, die keinerlei Authorisierung erfuhren. Schlimmer noch war der Fall, als eine Nutzerin der KI sich selbst in einem der generierten Bilder wiederfand. Erstens hatte sie keine Bilder von sich eingestellt und zweitens stammte dieses Bild auch noch aus einer Krankenakte von ihr, von der sich keiner erklären konnte, wie diese überhaupt in die Datenbank gelangen konnte. Hier werden also Persönlichkeitsrechte schlicht übergangen und an die Einhaltung eines Urheberrechts schien auch niemand gedacht zu haben. Was also auch die Verwendung KI-generierter Bilder in ein anderes, fragwürdiges Licht stellt. Kein Wunder also, dass Künstler sich wehren und eine Aufnahme ihre Arbeiten in diese Datenbank verbieten. Dazu sollte man im Hinterkopf behalten, dass man den KIs auftragen kann, einen bestimmten Stil zu imitieren. Lässt man beispielsweise ein Alien mit einem Smartphone im Stile Hieronymus Bosch's generieren, dann würde man wohl kaum glauben, dass der große Meister das wirklich gemalt hätte. Selbst wenn es so aussieht. Naja, und selbst wenn, würde man Bosch damit auch nicht schaden, schließlich ist der schon ein paar Tage nicht mehr unter uns. Wie sieht das aber mit lebenden Künstlern aus, die sich einen eigenen unverwechselbaren Stil erschufen und der letztlich ihre Existenzgrundlage ist? Wenn jeder binnen Sekunden Bilder im Stile eines Mark Ryden generieren lassen kann, die täuschend echt aussehen, beauftragt niemand mehr den Künstler, der diesen Stil geschaffen hat. Man schadet ihm also dadurch und nicht zuletzt schadet man so dann einer ganzen Branche. Hierin liegt die ethische Crux nicht nur der bildgebenden künstlichen Intelligenzen.


Auch ChatGPT kann das natürlich, wobei das Programm da zum Teil oder sogar gänzlich auf diese Werkzeuge zugreift. Nur, dass man ChatGPT weitreichender nutzen kann. So erstellt dieser ChatBot mit Leichtigkeit ganze Geschichten. Man muss ihm nur ein paar Eckpunkte vorgeben und nach kurzer Zeit spuckt er eine mehr oder weniger lange Geschichte aus. Selbstverständlich in perfekter Semantik und Interpunktion, aber leider auch in erkennbaren Textbausteinen. Dazu später mehr. Solche Automatismen sind allerdings schon in der Presse angekommen. Sportberichte, vor allem Kurzberichte, werden schon heute nicht mehr von Menschen verfasst. Es werden lediglich nur noch Namen und ein paar Daten in feste Schablonen gesetzt und schon ist der Spielbericht über die Fussballbegegnung 1. HFC Hintersalatblatthausen gegen die Steakfreunde Worms fertig. Solange kein investigativer Journalismus vonnöten ist, kann man solche Mittel verwenden, aber das bedeutet auch, dass ein Arbeitsplatz weniger ist.


Damit komme ich auf die Kernfrage der Ethik zu sprechen. Schafft sich der Mensch, bzw. der menschliche Genius damit ab, dass er nicht mehr selbst etwas erdenkt und erschafft, sondern diese Aufgabe an eine seelenlose Maschine abgibt? Liegt die Faszination der kreativen Arbeit nicht gerade darin, dass ein Mensch dazu in der Lage ist? Wer nicht zeichnen oder malen kann, hat ein Problem sich Bilder zu machen. Entweder man lernt das dann (was ja im Grunde die Intelligenz ist) oder man beauftragt einen Menschen, der das für einen tun kann. Somit sichert man diesem dann beispielsweise sein Einkommen. Bislang ist das der Stand der Dinge und meiner Meinung nach ist der noch lange nicht überholt. Klar bieten die neuen Mittel zunächst eine Faszination, wenn man sieht, was heraus kommt, wenn man die KI ein Bild vom letzten Selfie auf Erden generieren lässt. Aber wenn generierte Bilder dann in Galerien auftauchen oder zu Kunstwettbewerben eingereicht werden und diese perverserweise auch noch gewinnen, dann läuft was falsch. Alleine schon dadurch, dass es eben nicht mehr die Menschen sind, die diese Leistung brachten. Vielmehr benutzen sie die Leistung anderer und schmücken sich so genaugenommen mit fremden Federn, sollten sie nicht auf die Quelle verweisen. Mir persönlich wäre auch nicht wohl in meiner Haut, wenn ich ChatGPT auftrage, mir eine Geschichte zu generieren und diese dann als meine ausgeben würde. Für mich würde sich das wie Raub an geistigem Eigentum anfühlen, auch wenn es dieses Eigentum zumindest in dieser Kombination ja nicht gibt. Ich ließ vor geraumer Zeit mit OnceUponABot eine kleine bebilderte Geschichte generieren. Komplett durch eine KI erstellt. Diese Geschichte gab ich nicht als meine aus, sondern verwies deutlich auf deren Herkunft. Die Weitergabe der Geschichte diente nur zu Demonstrationszwecken. Spätestens jetzt verblasst die Faszination an den KIs. Plötzlich fühlt es sich falsch an, diese Ergebnisse zu nutzen. Zumindest in vollem Umfang zu nutzen. Als weitere Inspiration kann und darf man das gerne tun, jedoch sollte das Generationsergebnis nicht der endgültige Schritt sein.


Auch der Deutsche Ethikrat hat sich diesem Thema angenommen und versucht zu eruieren, inwieweit man KIs in die Arbeitswelt lassen darf. Denn wenn es am Ende dazu kommt, dass man auf den menschlichen Genius aufgrund von künstlichen Intelligenzen verzichten kann, dann hat sich der Mensch wirklich abgeschafft und nimmt sich einen wichtigen Teil seiner Existenz. Wollen wir das wirklich? Wollen wir uns das Denken und Lernen abgewöhnen? Ist nicht ein Teil der menschlichen Freude auch die Freude über eigenes Gelingen? Freude darüber, dass man selbst etwas geschaffen hat? Und nimmt man nicht immer etwas in seiner Persönlichkeit durch den Lernprozess auf? Wollen wir - also die Menschen - uns wirklich zu einem Amanuensis einer Maschine machen?


So sehr mich das Thema der KI interessiert und fasziniert und ich in einigen Teilen großes Potenzial für die Menschheit sehe (bspw. in der Medizin, wenn es um Früherkennung geht), habe ich auch Angst davor, dass vor allem der kreative Mensch sich abschafft und dadurch etwas sehr Wichtiges für die Menschheit verloren geht. Denn unser Sozialwesen fußt nicht zuletzt auf dem Miteinander, das dadurch wuchs, weil sich kreative Geister zusammenschlossen und jeder durch seine individuellen Fähigkeiten eine starke Gemeinschaft bildete. Und gerade diese Grundpfeiler unserer sozialen Ordung sehe ich persönlich durch ChatBots und KIs in Gefahr.


Weiter in die Tiefe der Thematik möchte ich mit diesem Blog gar nicht stoßen, aber es würde mich freuen, wenn ich in den Kommentaren eure Meinung und Gedanken zu diesem Thema lesen darf.