Siete alla ricerca di un’immagine adatta per la vostra presentazione? Volete illustrare un post sul blog? O semplicemente avete tempo di provare qualcosa di nuovo? Con i generatori di immagini basati sull’intelligenza artificiale (IA) come Midjourney, tutto questo è possibile. Mai prima d’ora è stato così facile creare immagini per un’ampia varietà di scopi utilizzando strumenti text-to-image. Ci sono quindi buone ragioni per fare dell’IA e dei generatori di immagini un argomento scolastico.
In Kürze zum Hören
Come funziona?
Per utilizzare uno strumento text-to-image, io come utente inserisco un’istruzione verbale (il cosiddetto prompt) e ricevo un’immagine pochi istanti dopo. Posso modificare il prompt finché non sono soddisfatto dell’immagine generata. Posso specificare vari parametri, cioè dirgli esattamente ciò che voglio: il formato dell’immagine, lo stile, la prospettiva, le tonalità di colore e molto altro. Per suggerimenti sui primi passi e sui parametri disponibili, vedere la sezione “Approfondimento”.
Gli strumenti text-to-image utilizzano un modello linguistico di grandi dimensioni (Large Language Model o LLM) per generare immagini da istruzioni linguistiche. Il LLM viene addestrato utilizzando un’enorme serie di dati di testi e immagini, in modo che il modello linguistico “capisca” il significato del testo inserito e generi immagini che corrispondano a tali significati.
Il modello linguistico dei generatori di immagini è stato alimentato e addestrato con dati generati da esseri umani e può quindi presentare le tipiche distorsioni sociali (pregiudizi, false credenze, ecc.) contenute nei dati di addestramento.
Iniziate!
Non l’avete mai provato prima? Bing Image Creator, ad esempio, potrebbe essere un modo semplice per iniziare. Accedete con il vostro account Microsoft 365 e generate alcune immagini a vostra scelta. Naturalmente, è possibile utilizzare anche altri generatori di immagini. Ecco una selezione incompleta:
- Midjourney (è stato utilizzato per creare gli esempi di questo articolo)
- Dall-E (OpenAI)
- Stable Diffusion
- Adobe Firefly
- Fobizz KI-Tools
- Copilot (presto integrato in Microsoft 365 / probabilmente dovranno essere chiarite alcune questioni relative alla protezione dei dati prima che Microsoft Copilot possa essere utilizzato con studenti)
Visualizzare il concetto di IA con gli studenti
Ispirandosi a Neele Hirsch (cfr. “Approfondimenti”; 2.), Andi Brugger (PHSH) ha visualizzato questioni astratte con gli studenti della Alta Scuola Pedagogica di Schaffhausen nell’autunno 2023. Sulla base della domanda “Come immaginate un’IA?”, gli studenti hanno formulato in tandem i prompt per Midjourney. Pensare insieme alle idee sull’IA è servito come strumento di riflessione.
È richiesto un certo livello di “competenza ingegneristica immediata”. In altre parole, la capacità di scrivere istruzioni verbali mirate.
In una fase successiva, gli studenti hanno confrontato le immagini ricevute con le proprie idee, hanno perfezionato i suggerimenti e hanno generato nuove immagini. È stato impressionante vedere che argomenti astratti potevano essere visualizzati in questo modo. L’esercizio ha dimostrato che spesso le immagini non sono utilizzabili dopo il primo input, perché non corrispondono ancora all’immagine interna immaginata dagli studenti. È quindi necessario un grande lavoro di preparazione per generare immagini veramente soddisfacenti. Questo può contribuire allo sviluppo di alcune abilità nella formulazione dei prompt (“abilità di ingegneria dei prompt”).
Pensiero critico e design creativo con l’IA
Dalla visualizzazione di credenze e concetti all’illustrazione dei propri siti web, l’IA offre un’ampia gamma di possibilità di esplorazione. Ad esempio, gli studenti possono cercare di visualizzare concetti o fatti astratti, come descritto nell’esempio precedente. Gli studenti possono anche creare immagini originali che riflettono la loro interpretazione di un argomento e sviluppare il pensiero critico e le capacità creative di risoluzione dei problemi. La discussione e lo scambio critico sulle immagini sono molto importanti.
Nella pratica, si è già dimostrato utile visualizzare i metodi e utilizzare un’immagine per entrare più rapidamente in azione con un gruppo di apprendimento. Le immagini-simbolo, le visualizzazioni o le illustrazioni possono essere utilizzate anche per le vostre presentazioni, storie e prodotti (didattici) di ogni tipo. È anche possibile creare immagini con oggetti nascosti, che poi chi osserva deve cercare. Insieme agli studenti, pensate a allo stile che volete ottenere per un libro di immagini con oggetti nascosti. Infine, è possibile creare immagini puramente ludiche, perché sono semplicemente molto divertenti. Qui sotto potete osservare le immagini generate dall’IA e create nell’ambito di una settimana di arte dell’IA (“Approfondimento 3”).
Generatori di immagine a scuola – Perché?
L’intelligenza artificiale in generale e i generatori di immagini in particolare non scompariranno dal nostro mondo. Ecco perché vale la pena affrontare questi fenomeni a scuola. Bing Image Creator & Co. possono essere utilizzati e tematizzati nelle scuole per vari motivi. Il Piano di studio e il Triangolo didattico (Dagstuhl) sono utili per la categorizzazione. Quest’ultimo fornisce un quadro di riferimento per affrontare i fenomeni tecnologici da diverse prospettive e discuterne con gli studenti. Si vedano le spiegazioni del modello Dagstuhl in “Approfondimenti” (4).
Gli esempi mostrati finora sono per lo più a livello applicativo. A differenza delle ricerche di immagini con un motore di ricerca tradizionale, i generatori di immagini possono essere utilizzati per generare immagini personalizzate e uniche per un argomento specifico. Diventa subito evidente che (analogamente ai generatori di testo come ChatGPT) è necessaria la capacità di scrivere istruzioni linguistiche mirate.
Creare immagini per i propri progetti è anche un’ottima occasione per imparare “con i media sui media”. Ad esempio, è un buon modo per affrontare temi come il copyright e i pregiudizi, adottando così una prospettiva diversa.
Bias – I messaggi nascosti
Il fenomeno della generazione di immagini può essere visto anche da una prospettiva socioculturale (3). Il LLM dei generatori di immagini è stato alimentato e addestrato con dati provenienti da esseri umani e può quindi presentare pregiudizi sociali tipici (distorsioni o pregiudizi). Vale la pena di analizzare le immagini con i discenti che vengono emesse in seguito a determinati prompt. Perché la maggior parte delle quattro domande sulle professioni infermieristiche ritraggono donne? E perché nel caso dei manager sono solitamente raffigurati uomini?
Queste domande aiutano a capire che si sta accedendo a dati esistenti e che le immagini generate non sono protette da stereotipi e altre rappresentazioni distorte della realtà. La profondità con cui un insegnante può e vuole approfondire il livello socio-culturale con gli studenti dipende dall’età di questi ultimi e dalle competenze dell’insegnante.
Qualità dell’informazione e fake news
Inoltre, gli studenti possono analizzare le immagini in relazione alla loro autenticità. In primo luogo, l’insegnante crea le immagini stesse e le fa analizzare agli studenti secondo vari criteri. Sono reali? La scena dell’immagine è davvero concepibile e possibile? In una fase successiva, gli studenti possono creare le proprie immagini, che vengono poi analizzate dal gruppo di apprendimento per verificarne l’autenticità. Vedere “Approfondimento” (5) e (6).
Copyright
Un’ulteriore sfida dei modelli di IA generativa si pone in relazione al diritto d’autore. Si pone la questione fondamentale di chi sia il proprietario dei contenuti generati con gli strumenti di IA. Attualmente non è possibile dare una risposta generale a questa domanda, poiché la situazione giuridica dipende da diversi fattori. Tra questi:
- Leggi sul copyright del rispettivo Paese
- Condizioni d’uso della piattaforma che gestisce l’IA.
Quando si utilizzano i generatori di immagini, è importante sapere che le immagini non appartengono solo all’utente. Midjourney stessa, ad esempio, si riserva il diritto di commercializzare le immagini in modo indipendente.
Si pone la questione fondamentale di chi sia il proprietario dei contenuti generati con gli strumenti di IA. Attualmente non esiste una risposta generale a questa domanda.
Strumenti avanzati di intelligenza artificiale e protezione dei dati
Come tutti gli strumenti, anche i generatori di immagini AI si stanno evolvendo. Un grande passo per molte scuole in Svizzera sarà l’integrazione di Copilot di Microsoft, che sarà completata nel corso dell’anno a seconda del modello di licenza. Tuttavia, prima che strumenti di intelligenza artificiale come Microsoft Copilot possano essere utilizzati con gli alunni, dovranno essere chiarite alcune questioni relative alla protezione dei dati. Anche Midjourney (vedi “Approfondimenti” 7 e 8) è in continua evoluzione. La versione Alpha 6 è stata rilasciata nel gennaio 2024. Ulteriori aggiornamenti consentiranno immagini ancora più realistiche e nuove opzioni per la creazione di fumetti. La struttura dei prompt di Midjourney sembra essere stata rivista in modo significativo e richiederà un ripensamento. Divertitevi a provarlo!
Autore: Andi Brugger (PH Schaffhausen)
Approfondimento
- Regolare i parametri in un prompt per Midjourney (formato dell’immagine, stile dell’immagine, atmosfera del colore, ecc.)
- eLab di Neele Hirsch. Blog-Post Esercizio interattivo per riflettere sull’IA
- Link al taccuino (Evernote) con immagini generate dall’IA nell’ambito di una settimana artistica dedicata all’IA.
- Il triangolo di dagstuhl spiegato in breve.
- Strumenti didattici Connected 1. S.52ff. Il polso delle informazioni
Strumenti didattici Connected 4, S29ff. Falsi in rete - MIA-Libretto di adesivi
- Midjourney Homepage
- YouTube-Tutorial per l’installazione di Midjourney
- AI unplugged. Affrontare l’IA nelle scuole senza elettricità. Offerta di Stefan Seegerer e Annabel Lindner
Feedback
Grazie per la vostra recensione.