{"id":11829,"date":"2025-05-01T10:09:13","date_gmt":"2025-05-01T08:09:13","guid":{"rendered":"https:\/\/gilbertbrands.de\/blog\/?p=11829"},"modified":"2025-05-01T10:09:14","modified_gmt":"2025-05-01T08:09:14","slug":"einfuehrung-in-die-bild-ki-teil-1","status":"publish","type":"post","link":"https:\/\/gilbertbrands.de\/blog\/2025\/05\/01\/einfuehrung-in-die-bild-ki-teil-1\/","title":{"rendered":"Einf\u00fchrung in die Bild-KI (Teil 1)"},"content":{"rendered":"\n<p>In der letzten Zeit habe ich h\u00e4ufiger von einer KI generierte Bilder in meinen Beitr\u00e4gen verwendet. Die Wissenschaft arbeitet schon eine ganze Weile an solchen Techniken und die Grundlagen f\u00fcr die Bild-KI reichen bis ins 19. Jahrhundert in die statistische Thermodynamik zur\u00fcck. So richtig los gegangen ist das mit der Technik aber erst von knapp 10 Jahren und heute hat sich das Ganze zu etwas entwickelt, was jeder einsetzen und nutzen kann.<\/p>\n\n\n\n<!--more-->\n\n\n\n<p>Um die Theorie soll es in dieser Serie nicht gehen. Wer sich das antun m\u00f6chte, findet auf den weiter unten genannten Seite Verweise zu den theoretischen Artikeln oder man geht gleich hier hin:<\/p>\n\n\n\n<p><a rel=\"noreferrer noopener\" aria-label=\" (\u00f6ffnet in neuem Tab)\" href=\"https:\/\/arxiv.org\/search\/?query=stablediffusion&amp;searchtype=all&amp;source=header\" target=\"_blank\">https:\/\/arxiv.org\/search\/?query=stablediffusion&amp;searchtype=all&amp;source=header<\/a><\/p>\n\n\n\n<p>Weniger m\u00fchsam und schneller erhellend ist eine Frage-und-Antwort-Runde mit einer KI wie Grok (X), Gemini (Google), Copilot (Microsoft), ChatGTP und weiteren. Die verf\u00fcgen \u00fcber die notwendigen Daten und sind auch wendig genug, auf Fragen einzugehen, wenn man was nicht verstanden hat (oder man sicher gehen m\u00f6chte, dass man etwas verstanden hat). Die Kameraden kann ich generell jedem ans Herz legen, der sich aktiv mit der Technik besch\u00e4ftigen will. Sie k\u00f6nnen Tipps geben, wo man etwas findet, wie man etwas bedient und &#8211; besonders wichtig, wenn man weiter vorst\u00f6\u00dft &#8211; auch etwas installiert und zum Laufen bringt.\u00b9\u207e Und sie erstellen auch Bilder in begrenzter Anzahl.<\/p>\n\n\n\n<p>Um mal einen ersten Eindruck zu bekommen, kann man &#8222;Bild KI Generator&#8220; in der Suchmaschine eingeben und bekommt jede Menge Links auf Seiten, die Bildgeneratoren anbieten (oder man l\u00e4sst sich von einer der o.g. KI eine Auswahl vorschlagen). Das funktioniert so, dass man beschreibt, was man auf einem Bild (oder in einem Video) sehen will und die Bild-KI generiert dazu etwas. Oder man gibt ein Bild vor und sagt, was der Generator damit machen soll. Beispielsweise die Person in eine Gruppe einf\u00fcgen oder anders anziehen (oder auch ausziehen). Die Seiten haben Vor- und Nachteile:<\/p>\n\n\n\n<ol class=\"wp-block-list\"><li><strong>Vorteil: <\/strong>Die Unternehmen haben nat\u00fcrlich sehr leistungsf\u00e4hige Hardware und gro\u00dfe Modelle und liefern daher hoch aufgel\u00f6ste gute Qualit\u00e4t ab.<\/li><li><strong>Nachteil: <\/strong>Man muss sich erst mal anmelden (kann man ruhig machen; so lange die keine Kontonummer haben, kann nichts passieren) und hat dann ein paar Freiversuche. Wenn man meint, jetzt hat man&#8217;s raus und will loslegen, kommt ein Fenster, in dem man zu einem Abo aufgefordert wird, d.h. dann kostet es Geld. <\/li><\/ol>\n\n\n\n<p>Wer nur gelegentliche Versuche machen will, ohne sich um irgendetwas selbest k\u00fcmmern zu m\u00fcssen, f\u00fcr den ist das vielleicht schon das Richtige. Da das Angebot gro\u00df ist, ist es ratsam, sich zu \u00fcberlegen, was man eigentlich machen m\u00f6chte und kann sich dann auf den Seiten umsehen, ob die das auch liefern und was es kostet. Auch hier gilt wieder: die Sprach-KI kann hierbei gut weiter helfen. Mehr kann ich dazu hier aber auch nicht sagen, weil ich solche Dienste nicht nutze.<\/p>\n\n\n\n<p>Wenn man sich einen \u00dcberblick verschaffen will, was auf dem Gebiet \u00fcberhaupt so los ist und was andere machen, kann man diese Seite besuchen:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"543\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1024x543.png\" alt=\"\" class=\"wp-image-11830\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1024x543.png 1024w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-300x159.png 300w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-768x408.png 768w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik.png 1334w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption><a href=\"https:\/\/civitai.com\/\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\" (\u00f6ffnet in neuem Tab)\">https:\/\/civitai.com\/<\/a><\/figcaption><\/figure>\n\n\n\n<p>Hier pr\u00e4sentieren Hobby-KI-ler und Profis ihre Ergebnisse. Sie beschreiben, was sie im Sinn hatten und man kann meist auch die Ergebnisse &#8211; Modelle oder Workflows oder beides &#8211; herunterladen und sie in eigenen Anwendungen ausprobieren. Die gr\u00f6\u00dfte Quelle ist die hier:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"456\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1-1024x456.png\" alt=\"\" class=\"wp-image-11831\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1-1024x456.png 1024w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1-300x134.png 300w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1-768x342.png 768w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1-604x270.png 604w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-1.png 1501w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption><a href=\"https:\/\/huggingface.co\/\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\" (\u00f6ffnet in neuem Tab)\">https:\/\/huggingface.co\/<\/a><\/figcaption><\/figure>\n\n\n\n<p>Insbesondere Hugging-Face bietet auch die M\u00f6glichkeit, auf &#8222;Spaces&#8220; ein paar Sachen auszuprobieren, also \u00e4hnlich wie die kommerziellen Anbieter:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"511\" src=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-2-1024x511.png\" alt=\"\" class=\"wp-image-11832\" srcset=\"https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-2-1024x511.png 1024w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-2-300x150.png 300w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-2-768x383.png 768w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-2-1536x767.png 1536w, https:\/\/gilbertbrands.de\/blog\/wp-content\/uploads\/2025\/05\/grafik-2.png 1731w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption><a href=\"https:\/\/huggingface.co\/spaces\/bytedance-research\/UNO-FLUX\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\" (\u00f6ffnet in neuem Tab)\">https:\/\/huggingface.co\/spaces\/bytedance-research\/UNO-FLUX<\/a><\/figcaption><\/figure>\n\n\n\n<p>Klar, dass da letztlich auch wieder kommerzielle Anbieter dahinter stehen, die ihre Produkte einer bestimmten Clientel anbieten. Es ist aber auch so, dass sehr viele Entwicklungen mit geringen Einschr\u00e4nkungen frei gegeben werden und kostenlos genutzt werden k\u00f6nnen. Das weckt Neugier und wenn es professionell werden soll, beispielsweise in Unternehmensbrosch\u00fcren, haben die Entwickler ihre Kunden gefunden.<\/p>\n\n\n\n<p>Bei Civit-AI und HuggingFace kann man sich \u00fcbrigens ohne Probleme als Nutzer anmelden, ohne das Kosten entstehen. Kosten entstehen erst, wenn man selbst etwas hochladen will.<\/p>\n\n\n\n<p>Was tun, wenn man Geschmack an der Sache findet und selbst \u00fcber das hinaus, was die Spaces anbieten, aktiv werden will und mehr Kontrolle \u00fcber die Bilder bekommen m\u00f6chte, die man generiert? Wenn man so weit ist, muss man sich die notwendige Software eben auf Systemen installieren, \u00fcber die man volle Kontrolle hat. Dazu gibt es zwei M\u00f6glichkeiten:<\/p>\n\n\n\n<ol class=\"wp-block-list\"><li>Man installiert alles auf seinem eigenen PC. Dann fallen ein paar Investitionen an und der Stromverbrauch als laufende Kosten. <\/li><li>Man mietet ein &#8222;Notebook&#8220; bei Google, Amazon, Microsoft oder wem auch immer. Dann fallen Nutzungsgeb\u00fchren f\u00fcr die genutzte Rechenzeit an, abh\u00e4ngig von den bestellten Hardware-Optionen.<\/li><\/ol>\n\n\n\n<p>Im Grunde ist die Arbeit auf beiden Systemen mehr oder weniger identisch: man hat eine Maschine mit einem bestimmten Betriebssystem, auf dem man nun die gew\u00fcnschte Software installiert und bedient. Der Vorteil bei so einem &#8222;Notebook&#8220; ist, dass man das virtuelle System beliebig konfigurieren kann. 64 GB Hauptspeicher und 48 GB VRAM auf einer GPU? Oder gar das Doppelte? Kein Problem, abgesehen vom Preis. Die eigene Maschine muss man in der Regel erst aufp\u00e4ppeln. <\/p>\n\n\n\n<p>Lohnt es sich, \u00fcber so ein virtuelles &#8222;Notebook&#8220; nachzudenken? Wenn man Bilder oder Videos in h\u00f6chster Aufl\u00f6sung haben will, sicher. Man muss schon einiges in die eigene Hardware investieren, um da ran zu kommen. Ich selbst habe mich mit der Sache nicht n\u00e4her besch\u00e4ftigt. Wenn man beispielsweise bei <a rel=\"noreferrer noopener\" aria-label=\"Amazon-Web-Spaces nachschaut (\u00f6ffnet in neuem Tab)\" href=\"https:\/\/aws.amazon.com\/de\/workspaces-family\/workspaces\/pricing\/\" target=\"_blank\">Amazon-Web-Spaces nachschaut<\/a>, ist das alles erst mal verwirrend. Hier kann ich auch nur empfehlen, einer (oder mehreren) Sprach-KI zu beschreiben, was man m\u00f6chte, und dann deren Antworten nach zugehen. <\/p>\n\n\n\n<p>Wie man den eigenen Rechner verwenden kann, beschreibe ich im n\u00e4chsten Teil. Wer mit virtuellen gemieteten Maschinen arbeitet, wird meist \u00e4hnliche Handgriffe ausf\u00fchren m\u00fcssen, falls man nicht ein komplettes Paket bucht, in dem das Meiste schon drin ist. Wir lesen uns in Teil 2 wieder.<\/p>\n\n\n\n<hr class=\"wp-block-separator\"\/>\n\n\n\n<p>\u00b9\u207e Wenn man schon einige Versuche gemacht hat, merkt man aber auch: die Jungs tun so, als ob sie alles w\u00fcssten, aber in manchen F\u00e4llen wissen sie es nur besser und mit ein wenig t\u00fcftelei kommt man manchmal schneller voran, als wenn man alles so macht, wie die vorschlagen. Aber das nur am Rande.<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In der letzten Zeit habe ich h\u00e4ufiger von einer KI generierte Bilder in meinen Beitr\u00e4gen verwendet. Die Wissenschaft arbeitet schon eine ganze Weile an solchen Techniken und die Grundlagen f\u00fcr die Bild-KI reichen bis ins 19. Jahrhundert in die statistische Thermodynamik zur\u00fcck. So richtig los gegangen ist das mit der Technik aber erst von knapp &hellip; <a href=\"https:\/\/gilbertbrands.de\/blog\/2025\/05\/01\/einfuehrung-in-die-bild-ki-teil-1\/\" class=\"more-link\"><span class=\"screen-reader-text\">Einf\u00fchrung in die Bild-KI (Teil 1)<\/span> weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-11829","post","type-post","status-publish","format-standard","hentry","category-allgemein"],"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts\/11829","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/comments?post=11829"}],"version-history":[{"count":1,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts\/11829\/revisions"}],"predecessor-version":[{"id":11833,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/posts\/11829\/revisions\/11833"}],"wp:attachment":[{"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/media?parent=11829"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/categories?post=11829"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gilbertbrands.de\/blog\/wp-json\/wp\/v2\/tags?post=11829"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}