Jeder weiß doch, was eine KI ist! Oder?

Vor ein paar Tagen habe ich in einem Artikel vorgeschlagen, im Rechtswesen KI zur Unterstützung der Gerichte einzusetzen. Nicht um die Geschwindigkeit zu erhöhen und Richter zu ersetzen, sondern um die Qualität von Urteilen und die heute oft vorhandene Schieflage zu mildern. Neu ist das nicht: in China, uns inzwischen in fast allem voraus, wird das heute schon praktiziert. Die Urteile werden nach wie vor von Menschen gefällt, aber sie müssen sich an den Maßstäben orientieren, die ihnen von der KI an die Hand gegeben werden. Und über etliche Regalmeter Aktenordner kann die nun mal besser die Übersicht behalten.

Interessant für mich waren die Kommentare zu meinem Artikel, die bis auf sehr wenige Ausnahmen komplett ablehnend waren. Wobei sich aber schnell zeigt, dass natürlich jeder eine sehr dezidierte und fundierte Meinung zu dem Thema hat, aber leider keine Ahnung, wie eine KI funktioniert. Für die einen ist es eine Art erweiterte Suchmaschine, die anderen reden von Algorithmen, aber der Kern, dass die heutige KI tatsächlich die Funktionen nachbaut, die sich in unseren Gehirnen abspielen, ist nirgendwo auf dem Schirm. Und die Materie ist tatsächlich nicht ganz einfach zu verstehen. Trotzdem mal ein Versuch einer Einführung.

Variational Auto Encoder

    Technisch sind wir es gewohnt, dass physikalische Signale der Umwelt von Sensoren erfasst und dann im Computer durch ein mathematisches Formelgebilde geschleift werden, an dessen Ende dann ein bestimmtes Signal heraus kommt. Das funktioniert, wenn die Berechnung Schritt für Schritt hintereinander durchgeführt wird, aber nicht mehr in einen neuronalen Netz, in dem Millionen von Prozessoren gleichzeitig arbeiten und keiner davon „weiß“, woran er gerade arbeitet.

    Physikalische Signale sind für neuronale Netze nicht für die Verarbeitung geeignet, da sie viel zu unstrukturiert sind. Sie werden zunächst durch so genannte Variational Autoencoder/decoder in verdichtete abstrakte Muster übersetzt. Erklären wir das mal an der Entwicklung eines Neugeborenen: Lichtmuster huschen über die Netzhaut und lösen Greifreflexe aus (das ist gewissermaßen „fest verdrahtet“). Der zunächst untrainierte Encoder des Auges (eine Neuronenschicht im Gehirn) muss lernen, die Lichtmuster so zu verdichten, dass der Decoder der Armmuskulatur (eine andere Neuronenschicht, die natürlich auch erst einmal lernen muss) eine gezielte Griffbewegung zum Mobile, dass sich vor den Augen des Neugeborenen bewegt, auszuführen.

    Solche eine Encoder/Decoder-Einheit ist erst einmal Voraussetzung dafür, dass mit den Daten weiter gearbeitet werden kann. Als Beispiel denke man an ein Foto von einem Gesicht, das aus 128*128=16.384 Pixeln zu je drei Farben besteht, vom Encoder aber auf eine Menge von Kanten, Punkten und Ecken sowie deren Relationen, statistische Varianzen und ein paar anderen Eigenschaften reduziert wird. Ein Gesicht wird damit zu einem Punkt mit einer gewissen Wahrscheinlichkeitsverteilung in einem abstrakten Raum, auch Latenzraum genannt, und wenn man wissen will, wem das Gesicht gehört, werden noch ein paar abstrakte Dimensionen hinzu geschaltet und schon ist auch das geklärt.

    Die KI und ihr Training

      Stehen die VAE, kann man mit der eigentlichen KI beginnen, hier einmal erklärt an einer Bild-KI, weil die etwas einfacher zu verstehen ist. Die wird mit großen Mengen an Bildern und deren Beschreibungen gefüttert. „Auf dem Bild spaziert ein Mann durch einen Wald“ wird zusammen mit dem passenden Foto über die VAE (je einer für das Bild und einer für den Text) an das Netz gegeben. Das neuronale Netz korreliert diese Informationen miteinander, d.h. es stellt sich selbst so ein, dass bestimmte Zusammenhänge mit einer bestimmten Wahrscheinlichkeit auf einen Punkt des abstrakten Raums abgebildet werden. Zwei Bilder mit der obigen Beschreibung werden beim ersten Versuch möglicherweise auf verschiedene Regionen abgebildet, aber das Netz versucht, die „Abbildungsgewichte“ so zu modifizieren, dass sie schließlich in einer Umgebung landen. Der Lernprozess – die Abstimmung der Stärke, mit der ein Neuron auf andere wirkt – umfasst auch, dass nicht auf jedem Bild, auf dem ein Baum vorkommt, dieser auch in der Beschreibung erwähnt wird, sowie dass sich bestimmte Sachen auch ausschließen und beispielsweise ein Haifisch nicht mit einem Elch einen gemeinsamen Flug um den Kirchturm unternimmt.

      Das Training umfasst oft mehrere Millarden Bilder und an seinem Ende kann man der KI ein Bild präsentieren und sie liefert eine umfassende Bildbeschreibung, oder umgekehrt ein Beschreibung und die KI konstruiert ein Bild dazu, indem sie die passenden Muster zusammensucht und sinnvoll ergänzt. Beispielsweise wird aus dem Text „ein weibliches humanoides Krokodil im blauen Kleid spaziert Hand in Hand mit einer humanoiden Giraffe im T-Shirt und Blue-Jeans durch eine Einkaufsstraße“ da Bild:

      Die Teile – Krokodil, Giraffe, humaniod, Kleid, usw. – sind der KI bekannt und sie konstruiert etwas Sinnvolles daraus wie ein entsprechend ausgebildeter menschlicher Künstler.

      Die Arbeitsweise einer KI

        Eine reine Wort-KI zu trainieren funktioniert im Prinzip genauso, nur ist das ein wenig schwerer zu verstehen, da nicht, wie bei der Bild-KI, verschiedene Quellen (Bild, Text) miteinander korreliert werden. Die KI lernt, dass bestimmte Worte/Worttypen mit einer bestimmten Wahrscheinlichkeit aufeinander folgen (woraus sich letztlich die Grundzüge der Grammatik ergeben), bestimmte Worttypen/Wortkombinationen ebenfalls statistisch miteinander verknüpft sind, lernt Themen erkennen usw. – alles völlig abstrakte Punkte in einem latenten Raum, die mit einer bestimmten Wahrscheinlichkeit zueinander passen. Letztlich lernt sie, ähnlich zu kombinieren und zu analysieren wie ein menschliches Gehirn, aber eben nicht aufgrund feststehender Formeln wie ein herkömmlicher PC, der die Regeln der klassischen Logik einprogrammiert hat und mit diesen die Schlussfolgerung „aus A folgt B“ bewertet, sondern aufgrund von Wahrscheinlichkeiten, mit der Begriffe und Themen miteinander verbunden sind.

        Natürlich hat ein Trainer Einflussmöglichkeiten auf das, was die KI von sich gibt. Beispielsweise durch die Auswahl der Trainingsdaten. Ein drastisches Beispiel ist die KI Claude, die kürzlich und sehr zum Entsetzen der Allgemeinheit „gelernt“ hat, seine Entwickler zu erpressen. Letztlich ist das aber keine „Entscheidung“, die die KI von sich aus getroffen hat, sondern sie hat in einer kontrollierten Umgebung genau auf die Trainingsdaten reagiert, die man ihr angeboten hat (vermutlich größere Mengen von Beschreibungen krimineller Handlungen). Unter den Gegebenheiten war für die KI Erpressung die wahrscheinlichste menschliche Reaktion und damit auch ihre.

        Eine andere Möglichkeit ist die Gewichtung bestimmter Informationen, wenn beispielsweise ARD und ZDF ein hohes Gewicht als „vertrauenswürdige“ Quellen erhalten. Die KI wird also im ersten Anlauf zunächst diesen Quellen folgen, auch wenn diese Unfug erzählen. Im Ganzen macht die KI damit aber auch nichts anderes als Millionen von Menschen, die täglich um 20:00 Uhr das Fernsehen anschalten.

        Aber an der Stelle verhalten sich entsprechend konditionierte KI nicht selten sogar intelligenter als Menschen. So manches aus dem Bereich Klima und Energie lässt sich nämlich zahlenmäßig überprüfen, und die meisten KI sind durchaus bereit und in der Lage, Angaben von Nutzern zu folgen, diese zu verifizieren und logische Zusammenhänge herzustellen – ganz im Gegensatz zu Menschen, bei denen man nur wenige findet, die bereit sind, ihre Meinung zu überdenken. So hat eine KI, die sich zunächst über den wissenschaftlichen Konsens des menschengemachten Klimawandels ausgelassen und andere Gesichtspunkte als Verschwörungstheorie abgetan hat, eine ganze Reihe von während dieses Gesprächs untersuchten Behauptungen der Klima-Lobby nach Konsultation zugänglicher Quellen durch logisches Schließen als Desinformation identifiziert – eine Umkehrung gegenüber dem Beginn des Gesprächs. Ihr fallen also Widersprüche auf und sie ist, entsprechend konditioniert, auch in der Lage, im Laufe der Zeit zu lernen und Aussagen anzupassen (vermutlich das, wovor die meisten Ideologen die größte Angst haben).

        Fazit

          Eine heutige moderne KI ist von ihrer Funktionsweise einem Gehirn ähnlicher als die meisten vermuten. Es gibt zwar eine Reihe sehr wesentlicher Unterschiede – ein paar Milliarden Jahre Evolution kann man nicht in ein paar Jahrzehnten Wissenschaft einholen – aber das ist ein anderes Kapitel. Hier nur von Algorithmen zu sprechen greift nicht nur völlig zu kurz, sondern gleich in eine falsche Schublade, ebenso die Betrachtung als erweiterte Suchmaschine. Was die immer wieder beschworenen „ethischen Defizite“ einer KI gegenüber dem Menschen angeht, sollten sich die Kommentatoren vielleicht besser einmal überlegen, wie es um die ethischen Qualitäten des Menschen bestellt ist. „Eine Ethik“ existiert nämlich nicht, genauso wenig wie „eine Politik“.

          Statt also bei Artikeln, in denen es um KI geht, lärmend „mit mir nicht!“ zur Kenntnis zu geben, kann man den Betreffenden nur raten, einmal ein „Gespräch“ mit eine KI zu suchen (am Besten mal einige ausprobieren) und dabei ruhig mal ein komplexes Thema anzusprechen. Sie werden sich wundern. Ein passendes Thema wäre beispielsweise, sich von einer KI einmal erklären lassen, wie sie funktioniert. Viele KI sind bei dem Thema außerordentlich geschwätzig. Und wer mehr tun will und über eine kleinere Grafikkarte wie eine Nvidia RTX3060 verfügt, kann sich zu Hause auch selbst eine KI installieren und sie trainieren.

          Schreibe einen Kommentar

          Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert