{"id":11845,"date":"2025-05-03T09:26:00","date_gmt":"2025-05-03T07:26:00","guid":{"rendered":"https:\/\/gilbertbrands.de\/blog\/?p=11845"},"modified":"2025-05-02T10:21:49","modified_gmt":"2025-05-02T08:21:49","slug":"einfuehrung-in-die-bild-ki-teil-3","status":"publish","type":"post","link":"https:\/\/gilbertbrands.de\/blog\/2025\/05\/03\/einfuehrung-in-die-bild-ki-teil-3\/","title":{"rendered":"Einf\u00fchrung in die Bild-KI (Teil 3)"},"content":{"rendered":"\n<p>Kommen wir zur Installation der Software. Zun\u00e4chst einmal mit der \u00fcblichen Bedienmethode: man hat eine grafische Oberfl\u00e4che, mit der man alles steuern kann. Um m\u00f6glichst flexibel zu sein, bietet sich das Paket &#8222;StabilityMatrix&#8220; an.<\/p>\n\n\n\n<!--more-->\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"810\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-5-1024x810.png\" alt=\"\" class=\"wp-image-11846\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-5-1024x810.png 1024w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-5-300x237.png 300w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-5-768x607.png 768w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-5.png 1146w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption><a href=\"https:\/\/lykos.ai\/\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\" (\u00f6ffnet in neuem Tab)\">https:\/\/lykos.ai\/<\/a><\/figcaption><\/figure>\n\n\n\n<p>Dabei handelt es sich um eine Verwaltungsebene, nicht um die eigentlichen Weboberfl\u00e4chen f\u00fcr die Bildgenerierung. Angeboten werden mehr als 10 Weboberfl\u00e4chen, die die eigentliche Arbeit \u00fcbernehmen, so genannte Packages. Die (und weitere) kann man nat\u00fcrlich auch selbst installieren, aber mit StabilityMatrix ist es einfacher.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"998\" height=\"724\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-6.png\" alt=\"\" class=\"wp-image-11847\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-6.png 998w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-6-300x218.png 300w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-6-768x557.png 768w\" sizes=\"auto, (max-width: 998px) 100vw, 998px\" \/><\/figure>\n\n\n\n<p>Man w\u00e4hlt ein Package aus und installiert es. Oder auch mehrere. Sie k\u00f6nnen auch jederzeit wieder gel\u00f6scht werden, wenn man mit ihnen nicht zurecht kommt. Zwei Packages sind empfehlenswert: StableDiffusion WebUI (Automatic1111) und ComfyUI. Die erste ist die Standardoberfl\u00e4che, die zweite bietet viele Steuerungsm\u00f6glichkeiten und f\u00f6rdert auch das Verst\u00e4ndnis, wie was abl\u00e4uft.<\/p>\n\n\n\n<p>Hat man ein Package installiert, sollte man noch ein paar Einstellungen in den Launch-Options vornehmen: wer keine A100-GPU hat (also z.B. mit der RTX3060 anf\u00e4ngt), sollte &#8222;low vram&#8220; aktivieren, damit die Modelle nicht bei jeder Gelegenheit vor ein Speicherproblem fahren. Au\u00dferdem sollte in den allgemeinen Umgebungsvariablen<\/p>\n\n\n\n<p class=\"has-text-align-center\">PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True<\/p>\n\n\n\n<p>vorgegeben werden. Wie ihr das auf euren System macht, erkl\u00e4rt euch die Sprach-KI. Wer noch keine Grafikkarte hat, sollte auch &#8211; so weit verf\u00fcgbar &#8211; &#8222;Use CPU only&#8220; aktivieren. Und schon geht&#8217;s los. Wir klicken auf &#8222;Stable Diffusion WebUI&#8220; und nach kaum einer Tasse Kaffer \u00f6ffnet sich ein Browser Fenster (bei ComfyUI muss man abwarten, bis &#8222;Open WebUI&#8220; erscheint und das dann anklicken, weil der Browser nicht automatisch ge\u00f6ffnet wird). Das sieht dann so aus:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"608\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-7-1024x608.png\" alt=\"\" class=\"wp-image-11848\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-7-1024x608.png 1024w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-7-300x178.png 300w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-7-768x456.png 768w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-7.png 1236w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Fangen wir oben links im Bild mit Stable Diffision Checkpoint an. Das sind die Modelle, von denen man mindestens eins haben muss. Automatic1111 bringt in der Regel was mit, aber wenn das System nichts findet und meckert, muss man etwas aus dem Internet besorgen. Das ist relativ einfach. Basismodelle sind<\/p>\n\n\n\n<p><a href=\"https:\/\/huggingface.co\/stable-diffusion-v1-5\/stable-diffusion-v1-5\">https:\/\/huggingface.co\/stable-diffusion-v1-5\/stable-diffusion-v1-5<\/a><\/p>\n\n\n\n<p><a href=\"https:\/\/huggingface.co\/stabilityai\/stable-diffusion-xl-base-1.0\">https:\/\/huggingface.co\/stabilityai\/stable-diffusion-xl-base-1.0<\/a><\/p>\n\n\n\n<p>Man liest sich erst mal die Beschreibung durch und klickt dann &#8222;Files and Version&#8220; an, um sich die Modelle, die in der Regel auf die Dateierweiterung &#8222;safetensors&#8220; (manchmal auch &#8222;ckpt&#8220;) h\u00f6ren. F\u00fcr Automatic1111 geh\u00f6ren die in den Ordner<\/p>\n\n\n\n<p class=\"has-text-align-center\">~\/StabilityMatrix\/Data\/Models\/StableDiffusion\/<\/p>\n\n\n\n<p>Keine Bange vor der Gr\u00f6\u00dfe der Dateien. 4 &#8211; 10 GB sind normal, Flux und andere kommen auch schon mal mit 23 GB daher. Wenn es irgendwelche Probleme gibt, fragt die Sprach-KI. Immer dazu sagen, dass ihr die und die WebUI unter StabilityMatrix verwendet, damit die KI die richtigen Pfade findet.<\/p>\n\n\n\n<p>Fangen wir mit &#8222;Text2Image&#8220; an, das ist die aktive Arbeitsoberfl\u00e4che, wenn das System startet. Es gibt zwei Eingabebl\u00f6cke, die auszuf\u00fcllen sind: <\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Prompt &#8211; hier wird eingetragen, was man sehen will,<\/li><li>Negative Prompt &#8211; hier kommt das hin, was man nicht sehen will.<\/li><\/ul>\n\n\n\n<p>Die Prompts sind am Besten auf Englisch abzufassen. Also Google-Translator einschalten. 1. Versuch:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\"><p>a beautiful and powerful mysterious sorceress, smile, sitting on a rock, lightning magic, hat, detailed leather clothing with gemstones, dress, castle background, photorealistic, best quality<\/p><\/blockquote>\n\n\n\n<p>Ergebnis mit SD-XL:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"713\" height=\"1024\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-8-713x1024.png\" alt=\"\" class=\"wp-image-11849\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-8-713x1024.png 713w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-8-209x300.png 209w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-8.png 752w\" sizes=\"auto, (max-width: 713px) 100vw, 713px\" \/><\/figure>\n\n\n\n<p>Der Anfang sieht doch schon viel versprechend aus, oder? <\/p>\n\n\n\n<p>Auf der Basis k\u00f6nnt ihr jetzt erst mal eigene Versuche machen. Dazu noch ein paar Webseiten mit hilfreichen Tips:<\/p>\n\n\n\n<figure class=\"wp-block-embed-wordpress wp-block-embed is-type-wp-embed is-provider-stable-diffusion-art\"><div class=\"wp-block-embed__wrapper\">\n<blockquote class=\"wp-embedded-content\" data-secret=\"6G20nVf10b\"><a href=\"https:\/\/stable-diffusion-art.com\/prompt-guide\/\">Stable Diffusion prompt: a definitive guide<\/a><\/blockquote><iframe loading=\"lazy\" class=\"wp-embedded-content\" sandbox=\"allow-scripts\" security=\"restricted\" style=\"position: absolute; visibility: hidden;\" title=\"&#8220;Stable Diffusion prompt: a definitive guide&#8221; &#8212; Stable Diffusion Art\" src=\"https:\/\/stable-diffusion-art.com\/prompt-guide\/embed\/#?secret=k09yzIvs1V#?secret=6G20nVf10b\" data-secret=\"6G20nVf10b\" width=\"600\" height=\"338\" frameborder=\"0\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\"><\/iframe>\n<\/div><\/figure>\n\n\n\n<figure class=\"wp-block-embed-wordpress wp-block-embed is-type-wp-embed is-provider-stable-diffusion-art\"><div class=\"wp-block-embed__wrapper\">\n<blockquote class=\"wp-embedded-content\" data-secret=\"eOlLGhXBBM\"><a href=\"https:\/\/stable-diffusion-art.com\/automatic1111\/\">Stable Diffusion WebUI AUTOMATIC1111: A Beginner&#8217;s Guide<\/a><\/blockquote><iframe loading=\"lazy\" class=\"wp-embedded-content\" sandbox=\"allow-scripts\" security=\"restricted\" style=\"position: absolute; visibility: hidden;\" title=\"&#8220;Stable Diffusion WebUI AUTOMATIC1111: A Beginner&#8217;s Guide&#8221; &#8212; Stable Diffusion Art\" src=\"https:\/\/stable-diffusion-art.com\/automatic1111\/embed\/#?secret=BfBvNTYfvN#?secret=eOlLGhXBBM\" data-secret=\"eOlLGhXBBM\" width=\"600\" height=\"338\" frameborder=\"0\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\"><\/iframe>\n<\/div><\/figure>\n\n\n\n<figure class=\"wp-block-embed-wordpress wp-block-embed is-type-wp-embed is-provider-stable-diffusion-art\"><div class=\"wp-block-embed__wrapper\">\n<blockquote class=\"wp-embedded-content\" data-secret=\"vtb7xkW3PB\"><a href=\"https:\/\/stable-diffusion-art.com\/comfyui\/\">Beginner&#8217;s Guide to ComfyUI<\/a><\/blockquote><iframe loading=\"lazy\" class=\"wp-embedded-content\" sandbox=\"allow-scripts\" security=\"restricted\" style=\"position: absolute; visibility: hidden;\" title=\"&#8220;Beginner&#8217;s Guide to ComfyUI&#8221; &#8212; Stable Diffusion Art\" src=\"https:\/\/stable-diffusion-art.com\/comfyui\/embed\/#?secret=O9nD5aR20f#?secret=vtb7xkW3PB\" data-secret=\"vtb7xkW3PB\" width=\"600\" height=\"338\" frameborder=\"0\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\"><\/iframe>\n<\/div><\/figure>\n\n\n\n<p>Man muss dazu sagen, dass Prompts ein kleines Problem sind. Die Modelle sind auf bestimmte Sachen trainiert und kommen mit manchen Kombinationen nicht klar, beispielsweise wenn man die Kanone eines Panzers durch einen Besen ersetzen will. Wenn man nach einigen Versuchen nicht so richtig weiterkommt, bekommt man von den Sprach-KI auch wieder Tips, wie ein passender Prompt aussehen k\u00f6nnte. Allerdings ohne Gew\u00e4hr: manchmal wird&#8217;s besser, manchmal leider nicht.<\/p>\n\n\n\n<p>Man kann sich auch weitere Modelle laden, die von den o.g. abgeleitet sind und von anderen Nutzern weiter trainiert worden sind. Auf HuggingFace und CivitAI findet man jede Menge und l\u00e4dt sich bei Bedarf die Safetensors-Dateien herunter. Auch hier kann man die Sprach-KI nach Empfehlungen oder Details fragen. Allerdings werfen die ziemlich schnell mit Begriffen wie &#8222;Impainting&#8220; oder &#8222;ControlNet&#8220; um sich, worauf man sie erst mal energisch darauf hinweisen sollte, dass man die Techniken einstweilen noch nicht nutzen will.<\/p>\n\n\n\n<p>So, erst mal viel Spa\u00df. Wer m\u00f6chte, kann auch Comfy ausprobieren. Die Turorial-Seite erkl\u00e4rt schon eine ganze Menge.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kommen wir zur Installation der Software. Zun\u00e4chst einmal mit der \u00fcblichen Bedienmethode: man hat eine grafische Oberfl\u00e4che, mit der man alles steuern kann. Um m\u00f6glichst flexibel zu sein, bietet sich das Paket &#8222;StabilityMatrix&#8220; an. Download Artikel als PDF<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-11845","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts\/11845","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/comments?post=11845"}],"version-history":[{"count":1,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts\/11845\/revisions"}],"predecessor-version":[{"id":11850,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts\/11845\/revisions\/11850"}],"wp:attachment":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/media?parent=11845"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/categories?post=11845"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/tags?post=11845"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}