El Dicodòc inclou definicions de paraules i també eines conjugació, sinònims, expressions, terminologia o toponímia (Sofia Cabanes)

L'aranès formarà part del diccionari occità de referència en línia

El Consell General i Lo Congrès Permanent de la Lenga Occitana firmen un conveni per impulsar d'eines digitals en la llengua pròpia d'Aran
Corresponsal de 3CatInfo a la Vall d'Aran
2 min

L'aranès formarà part del diccionari occità de referència en línia i també disposarà eines per impulsar la llengua pròpia d'Aran en l'entorn digital, com la generació de subtítols de forma automàtica.

Les desenvoluparà Lo Congrès Permanent de la Lenga Occitana --l'organisme regulador de la llengua occitana--, a partir d'un conveni amb el Conselh Generau d'Aran. Per fer-ho possible, es digitalitzarà un corpus d'entre 20.000 i 30.000 paraules del lèxic aranès, amb les seves definicions i correspondències al català i el castellà.

Un fet paradoxal, segons el director de Lo Congrés, Benazet Dazeas, és que, tot i que l'aranès és l'única variant occitana amb estatus d'oficialitat, és, alhora, la menys desenvolupada digitalment:

És la variant de la que menys dades disposem i per poder desenvolupar eines amb tecnologies de la llengua ens cal molta informació i moltes paraules que serveixin per alimentar les màquines.

Er aranés formarà part deth diccionari occitan de referéncia en linha

23 min

Això servirà perquè, ja aquest 2026, els parlants d'aranès puguin fer consultes al Dicodòc, el diccionari digital de referència de l'occità, com ja pot fer-se amb altes variants, com el provençal o el llenguadocià, per posar alguns exemples.

Aquest conveni estableix que és Lo Congrès, amb una gran experiència en aquestes qüestions, qui s'encarregarà de la redacció i desenvolupament del lèxic, mitjançant processos tècnics i lexicogràfics avançats. Entre les actuacions previstes hi és l'extracció automàtica d'informacions i parells de mots a partir de lèxics ja existents, així com la creació d'un primer lèxic català–occità referencial i aranès, cap a les dues direccions, amb un volum estimat d'entre 20.000 i 30.000 entrades per a cada una.

El projecte inclou també la creació d'una plataforma en línia per la redacció i gestió de lèxics, dotada d'una base de dades i d'una interfície específica. Les dades s'integraran en plataformes com Apertium, Revirada i Dicodòc, per facilitar-ne la consulta pública. Per al desenvolupament d'aquest projecte la màxima institució aranesa donarà a aquest organisme de 30.000 euros.

El Diccionari castellà-aranès de Frederic Vergés servirà per bastir aquest corpus digital de lèxic en aranès (Sofia Cabanes)

Apropar la llengua a la ciutadania

Que l'aranès s'obri pas en l'entorn digital és bàsic per la supervivència de la llengua, segons la síndica, Maria Vergés: "l'objectiu és apropar la llengua a la ciutadania amb els instruments de l'àmbit digital. És un pas més que important per normalitzar l'aranès de la mà de l'occità".

En una segona fase, cofinançada pel programa europeu LINGUATEC IA, es desenvoluparan eines de reconeixement, transcripció i doblatge de veu que es preveu que estaran llestes el 2027.

Amb aquest nou conveni, totes dues institucions consoliden una col·laboració iniciada el 2020 i aposten per un lèxic occità–català i català–occità en la varietat aranesa, que serà consultable a la plataforma de Lo Congrès, la web de l'aranès (aranes.conselharan.org) I des de l'aplicació 'En aranés' del Conselh Generau d'Aran.

Temes relacionats

Avui és notícia

Més sobre Aran

Mostra-ho tot