Einführung in die Bild-KI (Teil 2)

Wer selbst zu Hause was produzieren und sich austoben will, braucht einen PC. Der muss nicht unbedingt neu sein (meiner ist ca. 10 Jahre alt), aber ein bisschen aufrüsten sollte man ihn vielleicht schon. Das Betriebssystem ist eher nebensächlich. Ich habe MX Linux, aber wer Windows oder MacOS hat, kann das gleiche machen. Im Zweifelsfall noch mal der Rat von Gestern: eine Sprach-KI fragen, was bei einem bestimmten System zu machen ist.

Fangen wir mit der Hardware an: wenn freie RAM-Steckplätze vorhanden sind, sollten die gefüllt werden. Manche können maximal 16 GB, aber wer 32 GB oder noch mehr bestücken kann, sollte das tun. Das Zeug kostet nicht die Welt. Aber darauf achten, ob der zum Rechner passt! Die Sprach-KI kann sagen, was man braucht, wenn man ihr sagt, welches Motherboard ihr habt.

Für die Versuche sollten 500 GB auf der Platte vorhanden sein. Auch das ist nicht der Preistreiber, falls man sich noch eine weitere Festplatte anschaffen muss. Wer mehr als 1 PCIe-Steckplatz hat, kann auch eine PCI-SSD-Festplatte nehmen. Die sind den SATA-Platten in der Geschwindigkeit um einiges überlegen. Aber nur, wenn wirklich mehr als 1 Steckplatz da ist! Einen brauchen wir für etwas anderes.

RAM und SWAP-Bereich sollen zusammen 40 – 50 GB groß sein. Wer 16 GB RAM hat, sollte also so um die 30 GB SWAP reservieren. Falls eine PCI-Festplatte eingesetzt wird, darauf achten, dass der SWAP auf der liegt. Sonst war die Platte eine Fehlinvestition.

So, im Prinzip kann man jetzt anfangen. Die CPU ist durchaus in der Lage, die meisten Berechnungen alleine durch zuführen. Man muss nur Geduld haben. Ein Bild zu berechnen dauert auf der CPU 1 – 3 Stunden (wenn das Bild nicht zu groß ist) und mit einem Versuch kommt man in der Regel nicht hin. Trotzdem sollten Sie das erst mal tun. Einmal um zu sehen, ob das überhaupt läuft, und zum Zweiten, ob es wirklich Spaß macht. Wenn doch nicht, haben sie bis jetzt ein paar Euro invesiert, die nicht weh tun.

Wenn es schneller werden soll, also von 1h auf <1 min, braucht mal spezielle Hardware. Eine so genannte GPU (oder Grafikkarte), die Parallelrechnen erlaubt. Für die brauchen wir den PCI-Steckplatz. Jetzt wird es leider ein wenig teurer, wenn man den Schritt gehen will. Die Dinger brauchen viel Strom und zunächst sollte man schauen, ob das Netzteil noch mitspielt. Empfehlenswert sind ca. 850 W (oder mehr), aber auch die sind noch preiswert zu haben, falls man tauschen muss.

Eine Einsteiger-GPU ist die NVidia RTX3060 mit 12 GB VRAM.

In der gleichen Preisklasse liegt die RTX4060, die schneller ist, aber nur über 8 GB VRAM verfügt, was für vieles doch etwas knapp ist. Danach ist alles dem Geldbeutel überlassen: die RTX4090 mit 24 GB dürfte außer bei Videoerzeugung keine Engpässe aufweisen, schlägt aber gleich mit ca. 3.500 € zu Buche. Dazwischen gibt es noch ein paar andere, die ähnlich der RETX3060 konfiguriert sind, und wer auf Nummer sicher gehen will, kann auch sein E-Auto verkaufen und sich eine A100 zulegen:

Je höher die Anforderungen an die Qualität der generierten Bilder und Videos ist, desto höher sollte der VRAM der GPU ein. Aber man kann ja langsam anfangen und sich später steigern. Grundsätzlich kann man auch mehrere Graphikkarten zusammen schalten, d.h. nachrüsten.

P.S.: wer schon eine Grafikkarte hat, weil er der Spielszene angehört,sollte die Sprach-KI fragen, ob die für die Bild-KI geeignet ist. Die muss nämlich eine bestimmte Programmiertechnik namens CUDA unterstützen, sonst läuft nicht. Das gilt auch, wenn man etwas anderes als die Karten einsetzen will, die ich hier genannt habe: grundsätzlich nichts kaufen, was weniger als 8 GB VRAM hat und bei dem Rest die Bild-KI fragen, ob das Ding geeignet ist. Außer NVidia gibt es auch von AMD passendes Spielzeug, aber das ist in der gleichen Preisklasse.

Das war es erst mal, was die Hardware betrifft. Im nächsten Teil installieren wir die Software und legen los.