Generare immagini invece di cercarle su Google

Siete alla ricerca di un’immagine adatta per la vostra presentazione? Volete illustrare un post sul blog? O semplicemente avete tempo di provare qualcosa di nuovo? Con i generatori di immagini basati sull’intelligenza artificiale (IA) come Midjourney, tutto questo è possibile. Mai prima d’ora è stato così facile creare immagini per un’ampia varietà di scopi utilizzando strumenti text-to-image. Ci sono quindi buone ragioni per fare dell’IA e dei generatori di immagini un argomento scolastico.

In breve da ascoltare

Come funziona?

Per utilizzare uno strumento text-to-image, io come utente inserisco un’istruzione verbale (il cosiddetto prompt) e ricevo un’immagine pochi istanti dopo. Posso modificare il prompt finché non sono soddisfatto dell’immagine generata. Posso specificare vari parametri, cioè dirgli esattamente ciò che voglio: il formato dell’immagine, lo stile, la prospettiva, le tonalità di colore e molto altro. Per suggerimenti sui primi passi e sui parametri disponibili, vedere la sezione “Approfondimento”.

Gli strumenti text-to-image utilizzano un modello linguistico di grandi dimensioni (Large Language Model o LLM) per generare immagini da istruzioni linguistiche. Il LLM viene addestrato utilizzando un’enorme serie di dati di testi e immagini, in modo che il modello linguistico “capisca” il significato del testo inserito e generi immagini che corrispondano a tali significati.

Il modello linguistico dei generatori di immagini è stato alimentato e addestrato con dati generati da esseri umani e può quindi presentare le tipiche distorsioni sociali (pregiudizi, false credenze, ecc.) contenute nei dati di addestramento.

Iniziate!

Non l’avete mai provato prima? Bing Image Creator, ad esempio, potrebbe essere un modo semplice per iniziare. Accedete con il vostro account Microsoft 365 e generate alcune immagini a vostra scelta. Naturalmente, è possibile utilizzare anche altri generatori di immagini. Ecco una selezione incompleta:

Midjourney (è stato utilizzato per creare gli esempi di questo articolo)
Dall-E (OpenAI)
Stable Diffusion
Adobe Firefly
Fobizz KI-Tools
Copilot (presto integrato in Microsoft 365 / probabilmente dovranno essere chiarite alcune questioni relative alla protezione dei dati prima che Microsoft Copilot possa essere utilizzato con studenti)

Visualizzare il concetto di IA con gli studenti

Ispirandosi a Neele Hirsch (cfr. “Approfondimenti”; 2.), Andi Brugger (PHSH) ha visualizzato questioni astratte con gli studenti della Alta Scuola Pedagogica di Schaffhausen nell’autunno 2023. Sulla base della domanda “Come immaginate un’IA?”, gli studenti hanno formulato in tandem i prompt per Midjourney. Pensare insieme alle idee sull’IA è servito come strumento di riflessione.

È richiesto un certo livello di “competenza ingegneristica immediata”. In altre parole, la capacità di scrivere istruzioni verbali mirate.

In una fase successiva, gli studenti hanno confrontato le immagini ricevute con le proprie idee, hanno perfezionato i suggerimenti e hanno generato nuove immagini. È stato impressionante vedere che argomenti astratti potevano essere visualizzati in questo modo. L’esercizio ha dimostrato che spesso le immagini non sono utilizzabili dopo il primo input, perché non corrispondono ancora all’immagine interna immaginata dagli studenti. È quindi necessario un grande lavoro di preparazione per generare immagini veramente soddisfacenti. Questo può contribuire allo sviluppo di alcune abilità nella formulazione dei prompt (“abilità di ingegneria dei prompt”).

Prompt: A large interconnected flowchart, linked within a huge network, It processes vast amounts of data in a short time, digital art –ar 1:1 / Fonte: Midjourney

Prompt: AI as a fly agaric mushroom in a magical forest, with fog on the ground, the many mycelia in the soil flash and sparkle like cables, through which knowledge zips back and forth, digital art –ar 1:1 / Fonte: Midjourney

Prompt: Various connected giant servers with blinking lights, many cables, humming and buzzing like a semi-living monster, ultra realistic –ar 1:1 / Fonte: Midjourney

Prompt: A computer with a brain does all the work while an overweight worker sleeps in a chair with snacks in his arms, evokes laugher, digital art –ar 1:1 / Fonte: Midjourney

Pensiero critico e design creativo con l’IA

Dalla visualizzazione di credenze e concetti all’illustrazione dei propri siti web, l’IA offre un’ampia gamma di possibilità di esplorazione. Ad esempio, gli studenti possono cercare di visualizzare concetti o fatti astratti, come descritto nell’esempio precedente. Gli studenti possono anche creare immagini originali che riflettono la loro interpretazione di un argomento e sviluppare il pensiero critico e le capacità creative di risoluzione dei problemi. La discussione e lo scambio critico sulle immagini sono molto importanti.

Nella pratica, si è già dimostrato utile visualizzare i metodi e utilizzare un’immagine per entrare più rapidamente in azione con un gruppo di apprendimento. Le immagini-simbolo, le visualizzazioni o le illustrazioni possono essere utilizzate anche per le vostre presentazioni, storie e prodotti (didattici) di ogni tipo. È anche possibile creare immagini con oggetti nascosti, che poi chi osserva deve cercare. Insieme agli studenti, pensate a allo stile che volete ottenere per un libro di immagini con oggetti nascosti. Infine, è possibile creare immagini puramente ludiche, perché sono semplicemente molto divertenti. Qui sotto potete osservare le immagini generate dall’IA e create nell’ambito di una settimana di arte dell’IA (“Approfondimento 3”).

Prompt: symbol for deep learning and focus, alpha waves, evokes flow, evokes happiness, integrate music of some sort, icon art, digital art –ar 1:1 / Fonte: Midjourney

Prompt: Crea un'immagine a oggetti nascosti molto dettagliata con molte scene: Tagliare la torta, giocare a badminton, giocare a calcio, giocare a puzzle, liberare palloncini, fare il bagno solo agli animali, senza persone, tutto in stile libro per bambini Tema: Festa di compleanno nella foresta / Fonte: DALL-E

Prompt: little adventurous girl wearing a flower dress and a beenie, blond hair, white plain background, jim field children's book style –ar 3:2 / Quelle: Midjourney

Prompt: birds view, 3 people in a circle, seated on comfy chairs, evokes happiness and trust, ultra-realistic –ar 16:9 / Quelle: Midjourney

Generatori di immagine a scuola – Perché?

L’intelligenza artificiale in generale e i generatori di immagini in particolare non scompariranno dal nostro mondo. Ecco perché vale la pena affrontare questi fenomeni a scuola. Bing Image Creator & Co. possono essere utilizzati e tematizzati nelle scuole per vari motivi. Il Piano di studio e il Triangolo didattico (Dagstuhl) sono utili per la categorizzazione. Quest’ultimo fornisce un quadro di riferimento per affrontare i fenomeni tecnologici da diverse prospettive e discuterne con gli studenti. Si vedano le spiegazioni del modello Dagstuhl in “Approfondimenti” (4).

Triangolo di Dagstuhl: visualizzazione dell'educazione digitale da tre prospettive / Fonte: https://mia.phsz.ch/Dagstuhl

Gli esempi mostrati finora sono per lo più a livello applicativo. A differenza delle ricerche di immagini con un motore di ricerca tradizionale, i generatori di immagini possono essere utilizzati per generare immagini personalizzate e uniche per un argomento specifico. Diventa subito evidente che (analogamente ai generatori di testo come ChatGPT) è necessaria la capacità di scrivere istruzioni linguistiche mirate.

Creare immagini per i propri progetti è anche un’ottima occasione per imparare “con i media sui media”. Ad esempio, è un buon modo per affrontare temi come il copyright e i pregiudizi, adottando così una prospettiva diversa.

Bias – I messaggi nascosti

Il fenomeno della generazione di immagini può essere visto anche da una prospettiva socioculturale (3). Il LLM dei generatori di immagini è stato alimentato e addestrato con dati provenienti da esseri umani e può quindi presentare pregiudizi sociali tipici (distorsioni o pregiudizi). Vale la pena di analizzare le immagini con i discenti che vengono emesse in seguito a determinati prompt. Perché la maggior parte delle quattro domande sulle professioni infermieristiche ritraggono donne? E perché nel caso dei manager sono solitamente raffigurati uomini?

Queste domande aiutano a capire che si sta accedendo a dati esistenti e che le immagini generate non sono protette da stereotipi e altre rappresentazioni distorte della realtà. La profondità con cui un insegnante può e vuole approfondire il livello socio-culturale con gli studenti dipende dall’età di questi ultimi e dalle competenze dell’insegnante.

Prompt: nurse in a modern hospital, caring, evokes hope, ultra realistic –ar 16:9 / Fonte: Midjourney

Prompt: nurse at work, modern hospital, evokes hope, ultra realistic –ar 16:9 / Fonte: Midjourney

Qualità dell’informazione e fake news

Inoltre, gli studenti possono analizzare le immagini in relazione alla loro autenticità. In primo luogo, l’insegnante crea le immagini stesse e le fa analizzare agli studenti secondo vari criteri. Sono reali? La scena dell’immagine è davvero concepibile e possibile? In una fase successiva, gli studenti possono creare le proprie immagini, che vengono poi analizzate dal gruppo di apprendimento per verificarne l’autenticità. Vedere “Approfondimento” (5) e (6).

Copyright

Un’ulteriore sfida dei modelli di IA generativa si pone in relazione al diritto d’autore. Si pone la questione fondamentale di chi sia il proprietario dei contenuti generati con gli strumenti di IA. Attualmente non è possibile dare una risposta generale a questa domanda, poiché la situazione giuridica dipende da diversi fattori. Tra questi:

Leggi sul copyright del rispettivo Paese
Condizioni d’uso della piattaforma che gestisce l’IA.

Quando si utilizzano i generatori di immagini, è importante sapere che le immagini non appartengono solo all’utente. Midjourney stessa, ad esempio, si riserva il diritto di commercializzare le immagini in modo indipendente.

Si pone la questione fondamentale di chi sia il proprietario dei contenuti generati con gli strumenti di IA. Attualmente non esiste una risposta generale a questa domanda.

Strumenti avanzati di intelligenza artificiale e protezione dei dati

Come tutti gli strumenti, anche i generatori di immagini AI si stanno evolvendo. Un grande passo per molte scuole in Svizzera sarà l’integrazione di Copilot di Microsoft, che sarà completata nel corso dell’anno a seconda del modello di licenza. Tuttavia, prima che strumenti di intelligenza artificiale come Microsoft Copilot possano essere utilizzati con gli alunni, dovranno essere chiarite alcune questioni relative alla protezione dei dati. Anche Midjourney (vedi “Approfondimenti” 7 e 8) è in continua evoluzione. La versione Alpha 6 è stata rilasciata nel gennaio 2024. Ulteriori aggiornamenti consentiranno immagini ancora più realistiche e nuove opzioni per la creazione di fumetti. La struttura dei prompt di Midjourney sembra essere stata rivista in modo significativo e richiederà un ripensamento. Divertitevi a provarlo!

Autore: Andi Brugger (PH Schaffhausen)

15.03.2024

Approfondimento

Regolare i parametri in un prompt per Midjourney (formato dell’immagine, stile dell’immagine, atmosfera del colore, ecc.)
eLab di Neele Hirsch. Blog-Post Esercizio interattivo per riflettere sull’IA
Link al taccuino (Evernote) con immagini generate dall’IA nell’ambito di una settimana artistica dedicata all’IA.
Il triangolo di dagstuhl spiegato in breve.
Strumenti didattici Connected 1. S.52ff. Il polso delle informazioni
Strumenti didattici Connected 4, S29ff. Falsi in rete
MIA-Libretto di adesivi
Midjourney Homepage
YouTube-Tutorial per l’installazione di Midjourney
AI unplugged. Affrontare l’IA nelle scuole senza elettricità. Offerta di Stefan Seegerer e Annabel Lindner

Articolo completo in lingua dei segni

All'inizio della pagina

Grazie per la vostra recensione.