rotate-mobile
Martedì, 18 Giugno 2024
Utile per le intercettazioni

Arriva “Intrepido”: riconosce le voci e potrebbe ridurre gli errori giudiziari

Un ricercatore e un docente dell'Università del Salento hanno ideato un software che si propone come il sistema più affidabile di identificazione del parlante in campo forense

LECCE – Se uno dei temi di più stringente attualità nel panorama politico è rappresentato dalle intercettazioni, con l’acceso dibattito sulla possibilità di limitarne l’uso e la divulgazione sui media, uno strumento progettato da un ricercatore e un docente dell’Università del Salento, vorrebbe porsi come caposaldo, nel futuro, nell’ambito del riconoscimento vocale. E l’obiettivo principale è presto detto: limitare al massimo gli errori in ambito giudiziario. Le intercettazioni, infatti, spesso sono disturbate da fattori esterni e le voci non del tutto riconoscibili.

Il sistema, ribattezzato Intrepido, si basa sull’intelligenza artificiale e sull’addestramento di una rete neurale a riconoscere se la voce di un indagato sia la stessa fra quelle intercettate durante le captazioni. Per sciogliere ogni dubbio, spiegano i suoi ideatori, Intrepido applica un modello scientifico che compara le caratteristiche delle due voci, lo stesso metodo biometrico utilizzato per confrontare le tracce di Dna presenti sulla scena di un crimine.

Intrepido è stato concepito presso il Cril (Centro di ricerca interdisciplinare sul) del Dipartimento di studi umanistici diretto da Mirko Grimaldi, docente di Linguistica generale, che vi ha lavorato con il ricercatore Francesco Sigona. E la ricerca è stata appena pubblicata sulla rivista internazionale Speech Communication.

Ovviamente, ci sono voluti anni perché Sigona e Grimaldi appuntassero un software in grado di offrire uno strumento all’avanguardia nel campo della comparazione forense della voce. E, alla fine, Grimaldi n’è convinto: nessuno strumento, oggi, è più affidabile di Intrepido.

“Mai più perizie affidate al caso”

“Nel sistema attuale – commenta il docente – la figura del perito fonico non è prevista dal legislatore e la riforma Cartabia non ha colmato la lacuna. L’identificazione del parlante in ambito forense è spesso lasciata al fai da te, assegnata cioè a figure che non hanno nessuna formazione specifica. Per questo, ogni perito si sente libero di usare il metodo che preferisce, raramente basato su presupposti scientifici, e la sorte dell’indagato può finire nelle mani del caso”.

“Ciò non dovrebbe mai avvenire nelle aule dei Tribunali – ammonisce Grimaldi –, dove invece sono richieste evidenze oggettive, al di là di ogni ragionevole dubbio. I risultati ottenuti dal sistema che abbiamo sviluppato sono migliori di tutti gli altri attualmente in uso. Pertanto – conclude –, Intrepido si propone come il sistema più affidabile di identificazione del parlante in campo forense e, grazie a questo strumento, magistrati, avvocati e periti hanno ora uno strumento in più per applicare i principi del giusto processo”.

Mirko Grimaldi e, nel riquadro, Francesco Sigona

Al contrario del Dna, spiegano gli ideatori del software, la voce ha una elevata variabilità: chi parla può alzare o abbassare la voce, parlare in modo veloce o lento (variabilità intra-parlatore); inoltre, l’anatomia del tratto vocale è diversa da individuo a individuo, si parlano italiani regionali e dialetti diversi, i parlanti sono di età e sesso differenti (variabilità inter-parlatore). A complicare il processo di identificazione ci sono poi altri fattori che caratterizzano le intercettazioni telefoniche e ambientali: rumori di fondo o del canale di trasmissione della voce, voci di altri parlanti in lontananza, riverberi, la radio accesa di un’auto su cui è collocato il sistema di captazione, e così via. I passi avanti compiuti dall’intelligenza artificiale posso essere di grande aiuto a risolvere questi problemi, di cui non sempre le parti in causa in un processo sono consapevoli.

Usata la rete neurale SpeechBrain

L’idea dei ricercatori salentini è stata quella di utilizzare una rete neurale, già scientificamente testata per altri scopi e a disposizione della comunità scientifica internazionale: SpeechBrain. La rete è stata “addestrata” a identificare le voci, estratte da YouTube, di oltre 7mila parlanti diversi (uomini e donne di età differente), i quali hanno prodotto oltre 1 milione di frasi, per circa 2mila ore di registrazioni audio-video. Le lingue utilizzate sono state prevalentemente l’inglese (britannico e americano), il tedesco, il francese e l’indiano. I segnali audio utilizzati per addestrare la rete neurale sono stati degradati introducendo disturbi (rumore) caratteristico del mondo reale, come voci di sottofondo, risa, parlato sovrapposto, e altre tipologie di rumore: in questo modo le performance del sistema sono state migliorate. A queste gli studiosi del CRIL hanno aggiunto una banca dati di voci rappresentative dell’italiano, ma anche di alcune varietà dell’arabo.

Francesco Sigona e Mirko Grimaldi hanno testato il loro sistema seguendo un modello di validazione internazionale sviluppato da Geoffrey Morrison (Aston University, Birmingham) e da Ewald Enzinger (Stanford Research Institute, Silicon Valley). Sulla base di questo modello, la rivista Speech Communication ha pubblicato nel 2016 un numero speciale dedicato alla validazione di tutti i software attualmente disponibili a livello internazionale.

LeccePrima è anche su Whatsapp. Seguici sul nostro canale.

Si parla di

In Evidenza

Potrebbe interessarti

Arriva “Intrepido”: riconosce le voci e potrebbe ridurre gli errori giudiziari

LeccePrima è in caricamento