{"id":11075,"date":"2025-01-18T08:46:24","date_gmt":"2025-01-18T07:46:24","guid":{"rendered":"https:\/\/digibasics.ch\/italiano\/?post_type=diba_ltt_post&#038;p=11075"},"modified":"2026-03-16T17:12:37","modified_gmt":"2026-03-16T16:12:37","slug":"come-ho-dato-ad-ai-il-mio-voto","status":"publish","type":"diba_ltt_post","link":"https:\/\/digibasics.ch\/italiano\/lerntechtrends\/come-ho-dato-ad-ai-il-mio-voto\/","title":{"rendered":"Come ho dato la mia voce all\u2019IA"},"content":{"rendered":"\n<div class=\"wp-block-digibasics-lerntechtrends-content\">\n<div class=\"wp-block-digibasics-lerntechtrends-content-lead\">\n<p>Aiuto, mi stanno sostituendo! O sono stato sollevato? Sto facendo un esperimento personale con uno strumento vocale AI. In qualit\u00e0 di produttore multimediale e voice-over artist specializzato in produzione video e audio, mi addentrer\u00f2 nelle profondit\u00e0 delle voci generate dall&#8217;intelligenza artificiale. Voglio scoprire se l&#8217;IA mette sotto pressione la mia professione o se mi libera da compiti spiacevoli.<\/p>\n<\/div>\n\n\n    <figure class=\"diba-ltt-post__thumbnail-figure\">\n        <img loading=\"lazy\" decoding=\"async\" width=\"760\" height=\"467\" src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/Studio-U7_angepasst-.png\" class=\"attachment-post-thumbnail size-post-thumbnail wp-post-image\" alt=\"Studio U7, PH Z\u00fcrich\" srcset=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/Studio-U7_angepasst-.png 760w, https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/Studio-U7_angepasst--300x184.png 300w\" sizes=\"auto, (max-width: 760px) 100vw, 760px\" \/>        <figcaption>Bild: Oliver M\u00fcller, PHZH<\/figcaption>\n    <\/figure>\n\n\n<h2>In breve da ascoltare (Parlo anche italiano &#8211; creato con AI)<\/h2>\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/LTT-KI-Stimme_AIOli_ITA.mp3\"><\/audio><\/figure>\n\n\n\n\n<div class=\"wp-block-digibasics-lerntechtrends-content-main\">\n<p>Per decenni, le voci generate sembravano quelle del computer vocale di Stephen Hawkins o del sistema vocale \u201cAnna\u201d di Apple. Ma da quando gli strumenti di intelligenza artificiale sono spuntati come funghi, sono stati fatti grandi progressi anche in questo campo. Sto testando uno strumento di linguaggio AI sviluppato da ElevenLabs (1). ElevenLabs perch\u00e9 lo strumento offre la \u201cclonazione della voce\u201d (2) oltre a una variet\u00e0 di voci. Ci\u00f2 significa che il suono della mia voce pu\u00f2 essere modellato e riprodotto (3).<\/p>\n\n\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/1_Text-Apple-Speech.mp3\"><\/audio><figcaption class=\"wp-element-caption\">Voce con uscita vocale Apple \u00abAnna\u00bb (in tedesco)<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Generare voti in modo semplice<\/strong><\/h2>\n\n\n\n<p>\u00c8 possibile scegliere tra due opzioni: <em>Clonazione vocale istantanea<\/em> e <em>Clonazione vocale professionale<\/em>. Se voglio ottenere un risultato il pi\u00f9 rapidamente possibile, scelgo \u00abClonazione vocale istantanea\u00bb. Tutto ci\u00f2 che devo fare \u00e8 caricare un file audio con la mia voce e aspettare un po&#8217;. Un&#8217;ora dopo torno sul sito e la \u00abmia\u00bb voce \u00e8 pronta per essere utilizzata.<\/p>\n\n\n\n<p>Poich\u00e9 al momento mi sto divertendo con l&#8217;IA, lascer\u00f2 che sia ChatGPT a creare un piccolo testo poetico: \u00ab<em>La primavera port\u00f2 una leggera brezza e i fiori cominciarono a risplendere in colori gloriosi.<\/em> <em>Quando il sole sal\u00ec pi\u00f9 in alto nel cielo, gli uccelli si svegliarono con un canto allegro e riempirono l&#8217;aria con il loro cinguettio\u00bb.<\/em><\/p>\n\n\n\n<p>Nel mondo di ChatGPT, gli uccelli si svegliano solo quando il sole \u00e8 alto. &#8211; Comunque, copio la poesia in codice binario nel campo di testo e faccio clic su \u201cGenerate Speech\u201d. Quattro secondi pi\u00f9 tardi, la mia voce digitale risuona dall&#8217;altoparlante. Affascinante e sconcertante allo stesso tempo: non sono pi\u00f9 di Zurigo, ma della Germania settentrionale. Nella mia testa compare un&#8217;immagine di me: con la barba folta, la pipa da tabacco e il cappello di lana, al timone di una barca nel porto di Amburgo. Moin moin.<\/p>\n\n\n\n<p>Lascio il mio gioco mentale stereotipato e riascolto la registrazione. Il risultato non mi convince del tutto. \u00c8 in grado di imitare il suono della mia voce, ma la pronuncia, il ritmo e l&#8217;idioma sono distorti.<\/p>\n\n\n\n<p>Considerando che fino a poco tempo fa una cosa del genere non era possibile, o lo era solo con uno sforzo enorme, siamo gi\u00e0 nell&#8217;era della Si-Fi. Basti pensare a <em>Terminator 2<\/em>: \u00abI tuoi genitori adottivi sono morti\u00bb.<\/p>\n\n\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/1_Text-ElevenLabs-Oliver-einfach.mp3\"><\/audio><figcaption class=\"wp-element-caption\">Voce con Elevenlabs \u00abInstant Voice Cloning\u00bb (si tratta della poesia scritta sopra in italiano qui in tedesco)<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Pu\u00f2 essere anche pi\u00f9 professionale<\/strong><\/h2>\n\n\n\n<p>Provo la seconda opzione <em>\u00abClonazione vocale professionale\u00bb<\/em>. Affinch\u00e9 ElevenLabs possa sintetizzare la mia voce, questa volta \u00e8 necessario fornire almeno tre ore di materiale vocale, cinque (!) sarebbe meglio. Nella mia mente mi vedo parlare al microfono <em>de Il Signore degli Anelli<\/em>&#8230; Per fortuna ci sono gi\u00e0 molte mie registrazioni vocali che posso recuperare dall&#8217;archivio. Carico quattro ore di materiale audio e chiamo la mia copia vocale digitale \u201cAIoli\u201d. La mia voce \u00e8 ora sintetizzata grazie al deep learning. Ora inizia l&#8217;attesa. Elevenlabs promette il risultato in circa quattro settimane. <\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Quello che esce dal mio altoparlante mi lascia senza fiato. Sono davvero io! Un&#8217;inquietudine metafisica mi assale.<\/p>\n<\/blockquote>\n\n\n\n<p>Poi l&#8217;e-mail di Elevenlabs: \u00abLa tua voce \u00e8 pronta\u00bb. Non vedo l&#8217;ora! Poesia AI nel campo di testo e via. Quello che esce dal mio altoparlante mi lascia di stucco. Sono davvero io! Un&#8217;inquietudine metafisica mi assale: tutto ci\u00f2 che avevo criticato della versione semplice ora \u00e8 (spaventosamente) ben implementato. Mi colpisce soprattutto il fatto che l&#8217;accento svizzero in alto tedesco sia chiaramente riconoscibile. Sono entusiasta e spaventato. Dovr\u00f2 costruire nuove aree di resistenza\u2026<\/p>\n\n\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/1_Text-ElevenLabs-AIoli.mp3\"><\/audio><figcaption class=\"wp-element-caption\">Voce con Elevenlabs \u00abProfessional Voice Cloning\u00bb (in tedesco)<\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/1_Text-Oliver-Echt.mp3\"><\/audio><figcaption class=\"wp-element-caption\">Voce originale (umana) dell&#8217;oratore (e autore) Oliver M\u00fcller &#8211; testo Poesia generata dall&#8217;intelligenza artificiale. (in tedesco)<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Fine della corsa?<\/h2>\n\n\n\n<p>L&#8217;intelligenza artificiale mi sostituir\u00e0? I miei giorni come relatore finiranno presto? &#8211; Beh, io lo vedo pi\u00f9 come un sollievo e come un&#8217;opportunit\u00e0 per sviluppare ulteriormente la mia professionalit\u00e0. Posso concentrarmi su lavori di speakeraggio impegnativi in produzioni mediatiche a lungo termine. E in qualche modo la concorrenza delle voci generate dall&#8217;intelligenza artificiale mi sprona anche a sviluppare ulteriormente le mie capacit\u00e0 oratorie.<\/p>\n\n\n\n<p>La domanda di voci umane per le produzioni mediatiche semplici \u00e8 destinata a diminuire, il che potrebbe diventare un problema per i doppiatori che guadagnano principalmente con i lavori di voiceover. Tuttavia, le voci umane professionali continueranno a essere richieste nel prossimo futuro. La tonalit\u00e0 dei testi generati \u00e8 buona, ma ogni registrazione suona simile. Le opzioni di impostazione dell&#8217;emotivit\u00e0 sono molto limitate. Non sono adatte, ad esempio, a un&#8217;opera radiofonica.<\/p>\n\n\n\n<p>Un&#8217;altra cosa che noto durante i test intensivi \u00e8 che a volte alcune parole vengono pronunciate in modo errato. Continuo il test e tormento il mio gemello linguistico con un testo pieno di elvetismi: \u00ab<em>Ich fahre mit dem Zug von Luzern nach Aarau mit dem Halbtax und einem Sparbillett. Dort treffe ich Beat Zgraggen. Ich will ihm eine Garette, eine Gelte und e<strong>inen Harass<\/strong> abkaufen. Er z\u00fcgelt und muss <strong>ausmisten.<\/strong> Auf der H\u00f6he Ebikon ruf ich ihn auf dem Natel an. Er sitzt gern in der Beiz oder im Bahnhofsbuffet. Vor allem bei der <strong>Metzgete<\/strong>, da nimmt er auch gerne einen Pfl\u00fcmli zum Ap\u00e9ro.<\/em>\u00bb Qui c&#8217;\u00e8 chiaramente un \u00abmargine di miglioramento, alcune parole per chi legge il tedesco sono errate.\u00bb.<\/p>\n\n\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/6_Helvetismen-AIoli.mp3\"><\/audio><figcaption class=\"wp-element-caption\">La voce con Elevenlabs \u00abProfessional Voice Cloning\u00bb lotta contro gli elvetismi. (in tedesco)<\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-audio\"><audio controls src=\"https:\/\/digibasics.ch\/italiano\/wp-content\/uploads\/sites\/9\/2025\/01\/6_Helvetismus-Oliver-Echt.mp3\"><\/audio><figcaption class=\"wp-element-caption\">Voce originale (umana) del relatore (e autore) Oliver M\u00fcller &#8211; testo con elvetismi. (in tedesco)<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Dove porta questo?<\/strong><\/h2>\n\n\n\n<p>Sono riluttante a prevedere il futuro. Spesso proiettiamo nel futuro l&#8217;entusiasmo o le paure del momento, il che pu\u00f2 portare a previsioni errate. Tuttavia, la riproduzione vocale basata sull&#8217;intelligenza artificiale rappresenta un notevole passo avanti e i cambiamenti sono molto probabili. Ad esempio, la funzione \u00abtext to speech\u00bb ha un grande potenziale e viene gi\u00e0 utilizzata, ad esempio per leggere gli articoli di giornale. Le voci generate dall&#8217;intelligenza artificiale sono pi\u00f9 economiche e veloci da produrre. In futuro, quindi, molte cose saranno probabilmente svolte dall&#8217;IA.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>A chi appartiene la voce? Come per le creazioni intellettuali, si pongono questioni legali ed etiche.<\/p>\n<\/blockquote>\n\n\n\n<p>Dove user\u00f2 sicuramente la mia voce generata dall&#8217;intelligenza artificiale: Per semplici video esplicativi o relazioni con poche voci fuori campo. In questo modo i miei colleghi della produzione multimediale potranno \u00abusarmi\u00bb senza disturbarmi. Un vantaggio per tutti, in qualche modo, no?<\/p>\n\n\n\n<p>Dovr\u00e0 essere chiarita una questione centrale: A chi appartiene la voce? Come per le creazioni intellettuali, sorgono questioni legali ed etiche, come dimostra questo esempio: La star di Hollywood Scarlett Johansson chiede a OpenAI di chiarire perch\u00e9 la voce dell&#8217;intelligenza artificiale utilizzata da ChatGPT \u00e8 straordinariamente simile alla sua (4).<\/p>\n\n\n\n<p>Per quanto mi riguarda. Sono tranquillo e sono fiducioso che in futuro potr\u00f2 svolgere ancora incarichi di relatore interessanti.<\/p>\n\n\n\n<p>Autore: Oliver M\u00fcller, Produttore multimediale PHZH<\/p>\n\n\n\n<p>15.12.2024<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Approfondimento<\/h2>\n\n\n\n<ol class=\"wp-block-list\">\n<li><a href=\"https:\/\/elevenlabs.io\/about\" target=\"_blank\" rel=\"noreferrer noopener\">Elevenlabs <\/a>&#8211; Text-to-Speech AI-Tool<\/li>\n\n\n\n<li>Elevenlabs <a href=\"https:\/\/elevenlabs.io\/voice-cloning\" target=\"_blank\" rel=\"noreferrer noopener\">Voice Cloning <\/a><\/li>\n\n\n\n<li>Wikipedia <a href=\"https:\/\/it.wikipedia.org\/wiki\/Sintesi_vocale\" target=\"_blank\" rel=\"noreferrer noopener\">Sintesi Vocale<\/a><\/li>\n\n\n\n<li>Watson Articolo di giornale in tedesco <a href=\"https:\/\/www.watson.ch\/digital\/kuenstliche-intelligenz\/209372981-chatgpt-stimme-scarlett-johansson-schaltet-ihre-anwaelte-gegen-openai-ein\" target=\"_blank\" rel=\"noreferrer noopener\">ChatGPT-Stimme: Scarlett Johansson schaltet ihre Anw\u00e4lte gegen OpenAI ein<\/a> <\/li>\n<\/ol>\n<\/div>\n<\/div>\n","protected":false},"featured_media":11074,"template":"","diba_ltt_hashtag":[12],"class_list":["post-11075","diba_ltt_post","type-diba_ltt_post","status-publish","has-post-thumbnail","hentry","diba_ltt_hashtag-kunstlicheintelligenz"],"acf":[],"_links":{"self":[{"href":"https:\/\/digibasics.ch\/italiano\/wp-json\/wp\/v2\/diba_ltt_post\/11075","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/digibasics.ch\/italiano\/wp-json\/wp\/v2\/diba_ltt_post"}],"about":[{"href":"https:\/\/digibasics.ch\/italiano\/wp-json\/wp\/v2\/types\/diba_ltt_post"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/digibasics.ch\/italiano\/wp-json\/wp\/v2\/media\/11074"}],"wp:attachment":[{"href":"https:\/\/digibasics.ch\/italiano\/wp-json\/wp\/v2\/media?parent=11075"}],"wp:term":[{"taxonomy":"diba_ltt_hashtag","embeddable":true,"href":"https:\/\/digibasics.ch\/italiano\/wp-json\/wp\/v2\/diba_ltt_hashtag?post=11075"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}