Community › Forum › Dicussioni generali, News, Presentazioni › Off Topic › Installazione Stable Diffusion Taggato: stable diffusion python AI LoRA Seaart prompt Questo topic ha 28 risposte, 4 partecipanti ed è stato aggiornato l'ultima volta 2 mesi fa da hunter81 (IlBlenderistascarso). Stai visualizzando 29 post - dal 1 a 29 (di 29 totali) Autore Post hunter81 (IlBlenderistascarso)Partecipante @hunter81 19 Settembre 2023 alle 8:52 #879984 Domanda sull’installazione di Stable Diffusion Ora: seguivo questo tutorial Stable Diffusion richiederebbe 8 GB di Ram video dedicata (io ne ho 6) tuttavia ho visto che anche con 6 gb di ram video DOVREBBE partire https://stablediffusionxl.com/sdxl-system-requirements/ Ho installato python 3.11.5 ma funge con la 3.10.6 (che ho installato e ho sistemato il path per posizionarla sopra le altre installazioni) tuttavia mi da questo errore si riesce a capire l’inghippo? Grazie andcampModeratore @andcamp 19 Settembre 2023 alle 12:51 #879987 hai installato pip prima di procedere? HarvesterModeratore @harvester 19 Settembre 2023 alle 13:11 #879988 Il problema che stai riscontrando potrebbe essere dovuto al fatto che stai installando nella tua cartella utente, con tutti i controlli di accesso al sistema che Windows effettua e che possono creare problemi. Non saprei dirti perchè non riesce ad installare la libreria Torch; tieni aperta la finestra di gestione risorse per vedere se vengono esaurite RAM o VRAM durante il processo di installazione. Ti consiglio di installare SD Web UI di Automatic1111 (ma vale anche per altri strumenti simili) in una cartella a sè stante, per esempio in C:\sd-webui (ma puoi nominare la cartella come preferisci). Il requisito primario, come hai potuto scoprire è la versione di Python raccomandata, la 3.10.6, e poi GIT for Windows. SD Web UI di Automatic1111 è sicuramente interessante per la quantità di Estensioni e Script disponibili, il che ne fa una piattaforma interessante per la sperimentazione delle ultime novità e di funzionalità complesse. Per quanto riguarda la “quotidianità” dell’uso di un IA Generativa, non trascurare di valutare altri strumenti come, per esempio, InvokeAI (node based), ComfyUI (node based), AInodes (node based), Stable Studio. Esistono inoltre alcuni add-on per Blender come: DreamTextures, AI Render, Stability AI for Blender add-on, per citarne alcuni. Se non si dispone delle risorse hardware necessarie e si desidera addestrare modelli di inferenza o effettuare la messa a punto di modelli di linguaggio LLM, che richiedono risorse non indifferenti, si possono usare dei servizi esterni di computing in cloud (a pagamento), tra i quali RunPod e Paperspace sono quelli maggiormente utilizzati. hunter81 (IlBlenderistascarso)Partecipante @hunter81 19 Settembre 2023 alle 21:49 #879996 Allora, riprocediamo con ordine 1) ho disinstallato TUTTE le versioni di Python, reinstallando SOLO la 3.10.6 2) ho installato il PIP col Python 3) GIT scaricato e installato correttamente 4) l’avvio del file di Automatic1111 non conclude l’installazione e non ci sono stati picchi di Ram / Vram tranne che per la parte conclusiva dell’installazione di Python HarvesterModeratore @harvester 20 Settembre 2023 alle 11:51 #879999 L’errore è relativo all’installazione di Python che Windows non riesce a trovare. Hai seguito attentamente le istruzioni nel video tutorial che hai segnalato sopra? Una cosa che va fatta durante le primissime fasi di installazione di Python è mettere la spunta su una casella realtiva all’inclusione di Python nelle variabili d’ambiente di Windows (PATH). Hai i diritti di amministratore per l’account utente che usi in Windows 10? Se non li hai devi eseguire certi comandi da una console di Windows con diritti amministrativi (è una delle opzioni di avvio di CMD). hunter81 (IlBlenderistascarso)Partecipante @hunter81 21 Settembre 2023 alle 21:05 #880016 Si, infatti l’ultima installazione l’ho fatta “due volte”: dopo la disinstallazione di massa la prima “nuova” installazione della 3.10.6 NON AVEVA il Path spuntato. Rifatto tutto da zero. La seconda è corretta E ci sono i permessi di amministratore (ma per scrupolo, dove li controllo?) hunter81 (IlBlenderistascarso)Partecipante @hunter81 23 Settembre 2023 alle 17:31 #880053 vediamo se inizio a capirci qualcosa: 1) Installazione di Pytorch Ora: seguendo queste istruzioni https://saturncloud.io/blog/how-to-install-pytorch-in-windows/ Ho scaricato e installato Pytorch. Dal prompt di comandi che ho dato, esce questo Inoltre appena mi ci rimetto, mi hanno consigliato questo video per usare Stable Diffusion con poca memoria Vram HarvesterModeratore @harvester 24 Settembre 2023 alle 18:58 #880082 In realtà, le dipendenze come Torch vengono scaricate durante il processo di installazione e creazione dell’ambiente virtuale Python, specifico per la tua installazione, quindi non capisco perché lo stai facendo manualmente. Inoltre, stai installando Torch nella versione di sistema di Python, mentre queste dipendenze vanno installate dopo aver attivato l’ambiente virtuale Python dedicato (solitamente è una cartella nominata .venv all’interno della cartella di installazione del programma). Le istruzioni nel repository di Automatic1111 SD Web UI: Install Python 3.10.6 (Newer version of Python does not support torch), checking “Add Python to PATH”. Install git. Download the stable-diffusion-webui repository, for example by running git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git. Run webui-user.bat from Windows Explorer as normal, non-administrator, user. A titolo di esempio, ho due installazioni di SD Web UI di A1111, in C:\sd-web-ui (v1.52) ed in C:\sd-webui (v1.6.0) per sfruttare il disco SSD di sistema, mentre i modelli, VAE e quant’altro sono creati usando collegamenti simbolici ai relativi file salvati su un secondo disco fisso, per risparmiare spazio sul disco C: visto che ho anche altri programmi di IA che usano gli stessi file/modelli. Può accadere che qualcosa vada storto durante un aggiornamento o l’installazione di uno script o una estensione per SDWebUI tale da non riuscire più ad avviare il programma, nel qual caso (dopo aver esaurito altre opzioni) la soluzione più drastica è quella di cancellare la cartella dell’ambiente virtuale (.venv) e riavviare il programma webui-user.bat che ricostruirà l’ambiente virtuale scaricando le varie dipendenze. hunter81 (IlBlenderistascarso)Partecipante @hunter81 26 Settembre 2023 alle 18:36 #880110 Domanda Off-topic: qualcuno conosce dei tool che da un’immagine AI riesca a risalire al prompt che l’ha generata? tipo questo per capirci (ci sto ancora smanettando) https://huggingface.co/spaces/pharmapsychotic/CLIP-Interrogator Se non ho capito male, si può lasciare all’ AI la “libertà creativa” di completare l’immagine (luci, background etc..) che NON ESSENDO NEL PROMPT, NON VIENE RILEVATO DAL TOOL (infatti i prompt che crea, sono abbastanza striminziti rispetto alla complessità dell’immagine) hunter81 (IlBlenderistascarso)Partecipante @hunter81 10 Febbraio 2024 alle 20:53 #883579 Stavo studiando le AI generatrici di immagini e mi sono imbattuto in Fooocus https://github.com/lllyasviel/Fooocus Ho provato la funzione COLLAB invece del Download e mi compare questa scritta. Lo avete provato? Qualcuno sa cosa è andato storto? Grazie fenixPartecipante @fenix64 11 Febbraio 2024 alle 11:10 #883593 ciao io lo uso da terminal Mac e mi trovo bene hunter81 (IlBlenderistascarso)Partecipante @hunter81 11 Febbraio 2024 alle 16:44 #883606 io non ho Mac e non ho una gran scheda video, per quello mi appoggiavo alla versione “collab” che però non è stata eseguita correttamente e non ne capivo il motivo più avanti provo a installarla su pc per vedere se funzia HarvesterModeratore @harvester 11 Febbraio 2024 alle 17:42 #883607 Dal messaggio sembra un problema di connettività al repository di Huggingface. Riprova, magari c’era un problema sulla rete o sui server. Personalmente, utilizzo prevalentemente Invoke AI come strumento di generazione e modifica immagini, lo trovo molto più “artist friendly” e l’interfaccia è anche in Italiano. Non ho mai utilizzato Fooocus nè tantomeno in Google Colab, quindi non so quanto potrei esserti d’aiuto. Quale versione Colab stai provando, quella di Illiasviel o quella di Camenduru? HarvesterModeratore @harvester 11 Febbraio 2024 alle 18:15 #883611 Ho appena provato a lanciare il Google Colab di Illyasviel e tutto funziona correttamente, ha installato Fooocus e scaricato i modelli necessari (Juggernaut XL) e l’interfaccia Gradio è accessibile online. Riprova a lanciare il programma dal sito di Illyasviel: 🙂 hunter81 (IlBlenderistascarso)Partecipante @hunter81 12 Febbraio 2024 alle 22:52 #883644 guarda io per il COLLAB seguivo questo tutorial @elvi5belvi5 🤩FUNZIONAAA🤩 ✅Ecco come possiamo creare un influencer, presente su tutti i social media, con l’intelligenza artificiale . 🤖Grazie all’intelligenza artificiale infatti saremo in grado, in pochissimi clic, di creare un intero volto che non assomiglia a nessuno che abbia le caratteristiche richieste da noi. Quello che faremo infatti è sfruttare l’intelligenza artificiale per creare una nuova influencer così da poter aprire un nuovo profilo e poter attirare interessi e follower in pochissimi clic . 🟡Tutto ciò infatti lo possiamo fare in maniera totalmente gratuita e facendo veramente pochissimi clic in quanto a tutto il resto ci pensa l’intelligenza artificiale. In questo caso infatti sfrutteremo la potenza di calcolo di Google collab così da poter creare un nuovo volto e successivamente utilizzare lo stesso volto per la creazione delle immagini successive, così che la nostra influencer sia sempre identica da foto in foto. ✅quello che infatti saremo in grado di fare è quello di mantenere le proporzioni del volto, lo sguardo, il viso, il colore degli occhi e i capelli in tutte le foto, in quanto l’intelligenza artificiale sarà in grado di ricordarsi perfettamente tutte quelle che sono le caratteristiche create da noi, così da poter avere un profilo veritiero e che rappresenti la stessa persona. facendo tutto ciò infatti saremo in grado di creare un influencer da zero, senza alcun costo, e sfruttando anche la potenza di calcolo di Google, ovviamente come sempre l’intelligenza artificiale farà la maggior parte del lavoro per noi, in quanto in pochissimi clic saremo in grado di creare un volto in pochissimi istanti . 🆗L’esperimento che abbiamo condotto ci ha portato a confermare la possibilità della creazione di un’influencer in pochissimi grazie all’intelligenza artificiale, così da poter emulare i più famosi profili che adesso stanno prendendo la scena social in quanto stanno diventando veramente tanto grossi come profili. 🤩Provare per credere! #ai #openai #aiinfluencer #influencerai #imgcreatorai #aiimages #faceai #influencerartificiale #artificialinfluencer #aitanalopez #emilypellegrini #aiemily #artificialintelligence #intelligenzaartificiale #deepfake #elvistusha #googlecollab #collab #cloneai #aihuman #humanai #chatgpt #chatgpt4 #chatgpt3 #chatgpthack #gptsrocks🤟🏻 ♬ Storytelling – Adriel e sono finito con quel problema. Ora l’ho avviato nuovamente SENZA CAMBIARE NULLA di ciò che facevo prima ED E’ PARTITO TUTTO, HarvesterModeratore @harvester 13 Febbraio 2024 alle 10:11 #883646 Mi fa piacere sapere che hai in qualche modo risolto. Tieni presente che una volta disattivato il Colab perdi tutti i dati, incluse le immagini generate, a meno che tu non le scarichi prima su una tua risorsa locale o nel cloud. hunter81 (IlBlenderistascarso)Partecipante @hunter81 13 Febbraio 2024 alle 19:01 #883659 visto, grazie. Ogni volta che smanetto sulle AI mi segno fisso il prompt, le varie modifiche che l’ai genera automaticamente, Seed, Negative Prompt, etc… è uno sbattimento, ma catalogare sia il prompt che i risultati ottenuti, mi aiuta a capire come viene interpretato il prompt (so che è una scemenza, ma mi capita di provare uno stesso prompt su più AI, ) per l’installazione resta un mistero, ho solo rifatto tutto da capo… HarvesterModeratore @harvester 13 Febbraio 2024 alle 19:20 #883660 Ogni modello di inferenza produce risultati diversi con lo stesso prompt, variabili di generazione e risoluzione dell’immagine, quindi testare sia diversi modelli con lo stesso prompt aiuta a comprenderne meglio i limiti e quali modelli producono il risultato che ti interessa ottenere. In Automatic1111 SD Web UI (ma forse anche in ComfyUI) è possibile generare dei lotti di immagini in base a diversi parametri variabili (modello, CFG, Steps ecc) mostrandone i risultati in un formato a griglia XY, per una più facile lettura. hunter81 (IlBlenderistascarso)Partecipante @hunter81 14 Febbraio 2024 alle 14:36 #883695 ovviamente notavo anche che la sintassi di certe AI è diversa, anche se per generare un’immagine “basta descriverla in forma discorsiva”, per SEAART c’è una sorta di “gerarchia” sui soggetti o sugli elementi dell’immagine a cui l’AI deve prestare più cura e infatti stavo cercando qualcuno che mi aiutasse a capirla HarvesterModeratore @harvester 14 Febbraio 2024 alle 15:28 #883698 La sintassi del prompt dipende da come viene interpretato e da che tipo di modello e sistema di generazione stai usando. L’attenzione del modello è a scalare dall’inizio del prompt e dipende dalla sequenza dei termini che vengono prima convertiti in vettori tramite tokenizer e CLIP e successivamente dati in pasto al modello per la generazione. Certe sintassi per aumentare o ridurre l’attenzione del modello verso una parola o gruppo di parole nel prompt, possono differire da un sistema all’altro, o essere presenti o meno a secondo di come e se sono implementate dagli sviluppatori. Bisogna leggere la documentazione del sistema che usi per generare immagini per capire come utilizzarlo al meglio. hunter81 (IlBlenderistascarso)Partecipante @hunter81 14 Febbraio 2024 alle 21:17 #883711 lo supponevo, infatti per SEAART usano molto la sintasi che reca (masterpiece) per eempio e ho notato che ciò che è racchiuso in quella parola, viene creato con maggiore attenzione, però vado in palla quando devo creare persone, spesso usano (body 1:1) per evitare che alcune parti del corpo escano sproporzionate creando un funkopop HarvesterModeratore @harvester 15 Febbraio 2024 alle 9:55 #883714 Questi modelli hanno appreso da una moltitudine di immagini e relative etichette descrittive o tag, dove per la maggior parte si tratta di descrittori in lingua inglese (trovi anche immagini descritte in altre lingue ma sono una minoranza e non producono spesso buoni risultati quando usate in un prompt), pertanto la conoscenza della lingua inglese aiuta e non poco, ma abbiamo ora dei traduttori che possono aiutarci in questo. Se, come immagino, hai già esplorato siti come Civitai.com e Lexica.art avrai potuto notare la diversità dei prompt e la loro più o meno complessità. Questo è un buon punto di partenza per esplorare come si comporta il modello in base ai prompt che gli sottoponi. Ricorda che tutti i modelli che trovi in circolazione si fondano su un paio di modelli base, cioè Stable Diffusion v1.5 e SDXL, il resto viene costruito sopra di essi. L’enfasi nel prompt aiuta, ma non sempre è la soluzione o l’unica soluzione, specialmente se vuoi esercitare un certo controllo sui risultati della generazione. In questi casi si tratta di trovare una buona combinazione di modello (non usi un modello specializzato in fotografie se stai generando immagini non foto realistiche), prompt, in aggiunta ad altri strumenti come Controlnet, IP Adapter e T2i Adapter, per citare quelli più noti. Esistono molte risorse online sul Prompt Engineering e tecniche di prompting, pertanto se non l’hai già fatto ti suggerisco di cercare informazioni su questo argomento e poi sperimentare. A titolo puramente orientativo, questa può essere una sintassi utile per creare un prompt: per SD 1.5: [STYLE] of a [SUBJECT], [IMPORTANT FEATURE], [MORE DETAILS], [POSE OR ACTION], [FRAMING], [SETTING/BACKGROUND], [LIGHTING], [CAMERA ANGLE], [CAMERA OR STYLE PROPERTIES] per SDXL: usa il linguaggio naturale (inglese) o lo schema precedente. hunter81 (IlBlenderistascarso)Partecipante @hunter81 15 Febbraio 2024 alle 16:30 #883727 guarda nella mia immensa ignoranza ho provato la combo PROMPT AI+ CHAT GPT, semplicemente ho chiesto all’AI di spiegarmi la sintassi del prompt generatore di immagini. appena riesco mi leggo anche il resto della documentazione hunter81 (IlBlenderistascarso)Partecipante @hunter81 25 Febbraio 2024 alle 21:02 #883934 La mia immensa ignoranza si sta arricchendo di nuovi elementi. Per ora sto smantellando prompt altrui come se non ci fosse un domani per provare a capirli. Ora, partiamo dall’IDEA DELL’IMMAGINE DI PARTENZA (non ho usato l’immagine in sè come reference, ma ho smantellato il prompt per capirne la sintassi Sto iniziando con SeaArt.ai e sto cercando di seguire le basi peri i tutorial e la LoRA (ma devo ancora trovare un “metodo” per studiarlo come si deve senza smanettare troppo a casaccio) – la prima cosa che ho notato è l’abuso di parentesi tonde e grafe (che da quanto ho capito permettono all’AI di concentrarsi meglio sulla creazione del soggetto) 1_0_Prompt_Reference_Female_cyborg la cosa strana è che nonostante nel Negative prompt abbia specificato di NON VOLERE DUE SOGGETTI, in un tentativo me lo ha creato cmq (questi i risultati) fenixPartecipante @fenix64 26 Febbraio 2024 alle 0:03 #883939 se prendi un immagine e la inserisci in immagini e poi analizzi l’immagine ti produce il prompt HarvesterModeratore @harvester 26 Febbraio 2024 alle 9:44 #883950 Fai attenzione ed evitare incongruenze o termini conflittuali nel prompt positivo. I modelli di diffusione generativi non sono efficienti nel valutare elementi quantitativi come due persone, ma questo verrà corretto in modelli futuri (come Stable Diffusion 3), inoltre dipende dal modello stesso e da come è stato addestrato o affinato. Tutta quella roba nel prompt negativo non è strettamente necessaria e non è detto che serva o funzioni, inoltre un termine può risultare associato a diversi concetti, pertanto rimuoverlo come prompt negativo influenzerà il risultato anche in modi imprevisti. Una possibile causa del problema “doppioni” nelle immagini generate è la risoluzione a cui stai generando l’immagine che se è troppo distante dalla risoluzione di addestramento del modello può generare immagini doppie, come due persone, due teste, cose del genere. Per evitare questo problema puoi generare alla risoluzione del modello (per esempio 512×512 per i modelli basati su SD 1.5, oppure 1024×1024 o altre risoluzioni compatibili con i modelli basati su SDXL) e successivamente ampliare l’immagine (upscale) ad una risoluzione maggiore, oppure utilizzare (se presente nel programma) l’opzione High Resolution Fix (o correzione alta risoluzione) che genera l’immagine in due tempi, prima ad una risoluzione minore di quella finale e compatibile con il modello e poi questa viene ampliata alla risoluzione finale. Circa l’uso o abuso di parentesi o meglio di enfatizzazioni nel prompt, queste sono utili certamente e andrebbero utilizzate con cognizione di causa, in quanto un loro utilizzo eccessivo nel prompt ne può alla fine ridurre o vanificare l’efficacia. hunter81 (IlBlenderistascarso)Partecipante @hunter81 26 Febbraio 2024 alle 20:07 #883964 quindi se ho capito qualcosa è che la risoluzione (o l’ampiezza) dell’immagine che voglio generare, rischia di essere “riempita arbitrariamente) dall’AI (ecco perchè uscivano capigliature foltissime, sovramuscolatura etc..che rendevano il soggetto affascinante quanto lo erano gli Sgorbions trent’anni fa) per le parentesi, spesso ho visto qualcosa di simile – (masterpiece) + descrizione soggetto – (masterpiece + descrizione soggetto) quindi tutto ciò che E’ DENTRO LE PARENTESI TONDE verrà generato con più attenzione dall’IA – (Super detailed CG: 1.2) – indica la qualità dei dettagli (oltre ai vari UHD, photorealistic, etc..) perchè non tutte le AI riconoscono gli stessi input – (body 1:1) – credo indichi le proporzioni di un corpo umano, perchè cambiandole mi sono saltati fuori degli abomini assurdi Infine sulle LoRA e sui Modelli, ho visto che quelli preconfezionati rischiano di entrare in conflitto: cioè uso un Modello REALISTICO ma la LoRA la scelgo con le sembianze di un cartone animato e mi crea l’ennesima poltiglia di carne non meglio identificata. Ci smanetterò sopra, grazie HarvesterModeratore @harvester 27 Febbraio 2024 alle 10:44 #883965 Fai attenzione quando esegui un copia incolla da Word o altri programmi perché ti sei portato dietro una valanga di testo non necessario, che mi sono permesso di rimuovere per rendere il testo più leggibile. hunter81 (IlBlenderistascarso)Partecipante @hunter81 27 Febbraio 2024 alle 14:10 #883970 ma in realtà avevo scritto la frase sulle parentesi tonde METTENDO SOLO DUE PARENTESI TONDE alla fine non ho copiato nulla da nessuna parte. poi durante il caricamento si era bloccato firefox, ma ho dato per scontato che il post fosse stato inserito come al solito e non hi più ricontrollato Chiedo Scusa Autore Post Stai visualizzando 29 post - dal 1 a 29 (di 29 totali) Devi essere connesso per rispondere a questo topic. Accesso Nome utente: Password: Mantienimi connesso Accesso