mercoledì 22 febbraio 2017

Il peso degli accenti regionali

 
Le pronunce locali italiane rappresentano un grosso punto di incertezza per i sistemi di riconoscimento del parlato. In fin dei conti, esistono numerose pronunce diverse, con caratteri al tempo stesso marcati e molto diversi tra di loro. Inoltre, le pronunce locali sono più la regola che l’eccezione: ancora oggi è spesso possibile individuare l’origine di un italiano semplicemente sentendolo parlare – e con la possibilità a volte di individuare non solo la regione di provenienza, ma anche la città o addirittura il quartiere.
 
Interpretare l’italiano regionale è quindi molto importante per un qualunque sistema basato sul riconoscimento del parlato. Per fortuna, mi sembra che i sistemi attuali funzionino molto bene da questo punto di vista e il corpus CLIPS permette di verificare la cosa. Per esempio, una frase con un marcato accento napoletano come questa (audio CLIPS DGmtA02N, dopo 0:03) viene comunque interpretata correttamente:
 
 
Questa capacità è notevole, e si mostra tale anche in punti in cui sarebbe del tutto naturale avere problemi. Alcuni studenti del mio corso di Linguistica italiana II hanno individuato registrazioni del corpus CLIPS in cui il mancato riconoscimento da parte di Google o Dragon sembrava direttamente collegato alle caratteristiche della pronuncia. Tuttavia questi errori sono molto rari e, soprattutto, a volte dipendono forse da problemi di audio: quando ho tentato, non sono mai riuscito a replicarli.


 
Per esempio, nella registrazione LMp2A02N (Napoli) Alessandro Giosi aveva notato che la sequenza “camion rosso”, pronunciato con pesante accento per chiusura metafonetica, veniva interpretata da Google come “camion russo” (da 0:25). La sequenza è questa:
 
 
Tuttavia, quando ho provato a controllare, né Google né Dragon hanno dato la stessa risposta: in entrambi i casi la trascrizione è stata “camion rosso”.
 
Nella registrazione DGmtA04E (Parma) Sofia Ghisellini ha notato che alla pronuncia “all’esterno” diventava “ha le stanno” in evidente rapporto col fatto che la -r- veniva pronunciata con la caratteristica pronuncia uvulare emiliana (da 4:11):
 
 
Neanche qui sono stato in grado di riprodurre il problema: tanto Google quanto Dragon mi hanno fornito la trascrizione “all’esterno”.
 
In opportune circostanze, una pronuncia marcata potrebbe quindi forse indurre in errore i sistemi di riconoscimento. Nella pratica, questo non succede quasi mai... anche perché le situazioni di ambiguità fonetica sono molto poche. Parole come automobbile, per quanto marcate, non possono confondere perché non ci sono parole simili ad automobile che Google o Dragon possano scambiare in questo modo.
 
Tuttavia, è difficile precisare quanto debba essere marcata la pronuncia, per un’ottima ragione: non esistono modi per misurare sinteticamente quanto un accento regionale sia diverso dallo standard. Le differenze possono per esempio collocarsi su piani diversi: nel ritmo, nell’intonazione, nella pronuncia delle vocali o in quella delle consonanti, e così via. Due accenti locali possono sembrare ugualmente lontani dallo standard a un ascoltatore, e al tempo stesso esserlo per ragioni molto diverse. Quanto contano i diversi piani, o la loro interazione, per i sistemi di riconoscimento del parlato? Non esistono informazioni pubblicate, e sospetto che nemmeno le aziende che li sviluppano abbiano dati del genere.