El projecte Aina publica la primera solució de text a veu que incorpora variants dialectals del català

Per

24 d'abril de 2024

El projecte Aina ha publicat el primer model lingüístic en obert que ofereix interpretació de text a veu (Text To Speech/TTS) en català central, nord-occidental, balear i valencià. Es tracta de ‘Matxa’, un nou recurs lingüístic desenvolupat per Aina, el projecte d’intel·ligència artificial i tecnologies del llenguatge que impulsa el Govern, i ho desenvolupa el Barcelona Supercomputing Center (BSC), per potenciar el català en el món digital.

El nou model ‘Matxa’ manté la naturalitat i les característiques de les veus escollides per a entrenar-lo, procedents de parlants de diversos dialectes, i suposa un pas endavant en termes de rendiment, amb temps d’execució molt baixos a través de xarxes neuronals.

Aquest avenç tecnològic obre la porta a diverses aplicacions pràctiques per a la interpretació de text a veu en català. En aquest sentit, des del projecte Aina es treballa amb empreses i institucions amb l’objectiu de desenvolupar solucions específiques basades en aquesta tecnologia d’intel·ligència artificial.

Publicitat

A més, els principals avantatges de disposar d’una solució de text a veu que incorpora variants dialectals són, d’una banda, que permet adaptar la síntesi de veu al dialecte específic d’un usuari o regió, millorant la comprensió i la rellevància del missatge. Això pot augmentar la implicació de l’usuari i fer que la comunicació sigui més rellevant i personalitzada. I d’altra, que facilita l’accés a la tecnologia de síntesi de veu a una àmplia gamma de parlants, inclosos aquells que parlen diferents variants dialectals. Això promou la inclusió i garanteix que un major nombre de persones puguin beneficiar-se de les aplicacions i serveis que utilitzen aquesta tecnologia, independentment de la seva regió o dialecte nadiu.

El model ‘Matxa’ ja està disponible a la plataforma Hugging Face, la comunitat d’IA amb recursos de codi obert, des d’on es poden fer proves amb les veus a través d’una demo pública, i conèixer els detalls tècnics de la solució.

Aquest model de síntesi de veu s’entrena amb diferents datasets o conjunts de dades, com ara Frescat, creat recentment. Aquest nou conjunt de dades és un desenvolupament pioner en l’àmbit dels recursos digitals en català, ja que incorpora quatre variants dialectals i 8 parlants amb diferents característiques. En total, inclou dues veus per a cadascun dels dialectes. Frescat estarà disponible per a la seva descàrrega i ús per part de tots els usuaris properament.

Sobre el projecte Aina

El projecte Aina genera i posa a l’abast de tothom recursos lingüístics, corpus i models informàtics perquè desenvolupadors/es d’aplicacions basades en IA puguin fer-ho fàcilment en català. Tot amb l’objectiu de poder relacionar-nos i viure plenament en català també en l’àmbit digital.

Liderat per la Generalitat de Catalunya, a través de la Secretaria de Polítiques Digitals, en col·laboració amb el Barcelona Supercomputing Center (BSC), el projecte Aina s’emmarca en l’Estratègia d’Intel·ligència Artificial de Catalunya (Catalonia.AI), impulsada pel Govern per enfortir l’ecosistema català de la IA, promoure la generació de coneixement en aquest àmbit i fomentar la creació de solucions basades en aquesta tecnologia per millorar la vida de les persones