Notícies > Inici de la Internet Catalana: De Softcatalà al Google Assistant en català

Inici de la Internet Catalana: De Softcatalà al Google Assistant en català

23 octubre 2020
L'ús del català a Internet ha crescut molt els darrers anys. FONT: Pixabay

Google i Apple ultimen els seus assistents de veu, en català

El català és viu a la Internet des que aquesta va arribar a Catalunya, el 1995. Tot i que els primers programaris no permetien ser configurats en la nostra llengua. Més de vint anys després, plataformes com Apple o Google preparen les versions catalanes dels seus auxiliars de veu, mentre Google Assistant ja entén català. Anem tard?

Segons Web Technology Services (W3Techs) –que aporta informació sobre usos d’Internet arreu del món– menys del 0,1 dels llocs web estan en català. Al rànquing de les llengües més usuals a la Internet, ocupem la posició número 40 (de 180). Calma! No ens estirem dels cabells per aquest percentatge. Cal tenir en compte que més del 60% de tots els webs del món són en anglès. A banda, per ser la desena de milions de parlants que som, hi ha més webs en català que en idiomes parlats per molta més gent com ara el tagal (de Filipines) o l’urdú (es parla a l’Índia i el Pakistan).

Els Webcreadors independents de webs en català (WICCAC) resumeixen al seu baròmetre mensual que el percentatge global d’ús del català a Internet és alt, del 65,79%. Jordi Mas, membre i fundador de Softcatalà –la comunitat digital que fomenta l’ús del català a Internet– resumeix la situació actual del català a la xarxa així: “El cas català és un cas d’èxit. En comparació a la majoria de llengües minoritzades, sense el suport d’un Estat, la llengua catalana a Internet té bona salut”.

El 63,8% de la població que ha consultat Internet ha visitat pàgines en català, el 92,2 % ho ha fet en castellà i el 42,2 % en altres llengües.

Les grans plataformes han anat adoptant progressivament l’ús de la llengua catalana a les seves interfícies. Dels 10 webs més visitats d’Internet, Google, YouTube, Facebook, Twitter i Wikipedia estan adaptats al català.

D’altra banda, segons dades de l’Enquesta de participació cultural a Catalunya 2019 del Departament de Cultura, el 63,8% de la població que ha consultat Internet ha visitat pàgines en català, el 92,2 % ho ha fet en castellà i el 42,2 % en altres llengües.

UNA COMUNITAT D’USUARIS I DE CREADORS

Són dades, números i percentatges freds. Ens ajuden a entendre que tot i representar un col·lectiu de parlants relativament petit dins la xarxa de xarxes, la salut i l’ús del català a Internet no deixa de millorar, any rere any. Però per saber d’on ve tot i com comença la nostra llengua a Internet, cal tornar enrere al temps, a la tercera edat d’Internet, que no fa tant.

Anem al tombant del segle XX. Per al primer viquipedista català i actual coordinador digital de l’Institut Ramon Llull, Àlex Hinojo, el que més ha evolucionat des d’aleshores són les comunitats i l’ús de les plataformes: “La societat catalana, que sempre ha tingut uns valors cívics molt actius, anava fent, de mica en mica, i ja creava aleshores continguts, blocs, podcasts i plataformes en llengua catalana; cosa que no passava amb els webs institucionals.”

Només un 0,5% de tot el catàleg de Netflix està gravat, doblat o subtitulat al català, segons denuncia el Consell de l’Audiovisual de Catalunya (CAC).

Un bon exemple n’és el portal informatiu VilaWeb, que neix l’any 1996 i esdevé el projecte pioner d’informació i blogging en català a Internet. Jordi Mas recorda aquells temps, en què Softcatalà va ser creat el 1997: “Era un moment en què sorgien moltes iniciatives en el sentit de normalitzar l’ús del català a la xarxa. La comunitat digital catalana sempre ha estat molt activa, la gent de seguida es va engrescar amb els blocs, amb la Viquipèdia, amb el programari lliure. Si ens donen les eines, ens engresquem.”

A principis de segle, abans de les xarxes socials, ja es podia fer de tot per Internet, hi havia un escenari format per moltes comunitats, amb poca regulació, i moltes ganes d’aprofitar les possibilitats d’Internet. El que no hi havia era massa suport institucional. D’aquesta manera, i sempre amb la intenció d’anar fent via, el 1997 neix el projecte Softcatalà, una organització sense ànim de lucre que desenvolupa i tradueix programari en català, uns 150 programes en 20 anys: “Vam començar traduint al català programari que fos gratuït, érem quatre persones i ens vam passar un any traduint”, explica Mas.

Una tasca gegantina, que dura fins al dia d’avui. Per a Àlex Hinojo, el gran èxit de Softcatalà va més enllà dels 150 programes traduïts: “Ha estat un col·lectiu bàsic per crear la consciència que pots, i que és normal, tenir explorador, el navegador, el paquet d’ofimàtica en català. Per crear consciència -resumeix Àlex Hinojo-, dels drets lingüístics en l’apartat d’Internet [i de software] de la comunitat catalanoparlant”.

La tasca que Softcatalà duu a terme amb el català a Internet va ser reconeguda per la Generalitat amb el Premi Nacional d’Internet 2004. FONT: Wikimedia Commons.

 

Amb el pas dels anys, en bona part a causa de l’aparició de les xarxes socials, i independentment que les plataformes no estiguessin en català, la gent es va habituar a publicar els seus continguts en català: “En àmbit comercial i institucional costava més que les plataformes adaptessin la seva infraestructura per adoptar la llengua catalana”. Per la part de continguts més comercials com ara el vídeo, l’ús s’està normalitzant a poc a poc. En el sector audiovisual, si parlem de plataformes com ara Netflix, la situació és dolenta: només un 0,5% de tot el catàleg està gravat, o doblat, o subtitulat al català, segons denunciava el Consell de l’Audiovisual de Catalunya (CAC) en un informe publicat el passat mes de maig.

El problema amb aquestes grans plataformes i l’ús del català és l’ens regulador. Si no estan obligats, és més difícil. A Dinamarca, Netflix subtitula i dobla al danès perquè ho han de fer per entrar en aquell mercat i l’ens regulador així els hi obliga; això a Catalunya no passa. Com que el català no és llengua oficial a Europa, la UE no regula la seva existència en aquestes plataformes.

“A banda -assenyala Àlex Hinojo-, cal tenir en compte que el cost econòmic de doblar un producte audiovisual és major al de traduir un llibre al català, per exemple. Però el problema amb aquestes plataformes no és de mercat, és de regulació”. En resum, si en comptes de 24 idiomes a la Unió Europea, fossin 25 (o més, que seria el més desitjable), per operar al territori de parla catalana l’empresa distribuïdora estaria obligada a subtitular o doblar en català. Mentre no sigui així, la presència de productes en català en aquestes grans plataformes seguirà sent una qüestió de voluntat política. Certament, com apunta Àlex Hinojo, “reconèixer les llengües minoritzades a la UE no és pas un tema neutral.”

Recuperem el baròmetre mensual del WICCAC. Aquí podem consultar l’evolució, mes a mes i des de l’any 2002, de l’ús del català a Internet per part d’un seguit de webs, classificades per sectors. Una anàlisi ràpida ens aporta dues dades importants. Les webs de sectors culturals, d’ensenyament o institucionals fan servir majoritàriament el català. Ara bé, les webs de sectors comercials com ara electrodomèstics, perfumeria o automobilisme a penes arriben al 17% de percentatge d’ús del català. Per què? “Crec que de vegades el consumidor català no és prou exigent i no fem prou discriminació positiva a Internet, com sí que fem a un bar, o a un establiment, quan no ens atenen, o no ens entenen, en català -respon al dubte Àlex Hinojo-. Hi ha molta feina a fer en aquest sentit, el codi de consum també hauria d’incloure el dret a ser atesos en català en línia”.

SIRI I ALEXA PARLARAN CATALÀ

Les grans plataformes estan adoptant les seves interfícies a la presència del català. Empreses com Apple o Google ja han anunciat que hi estan treballant, i Google Assistant ja entén el català, tot i que no en parla. Podria semblar anecdòtic avui dia, però que aquests gegants ja tinguin preparat el motor de reconeixement de veu de la llengua catalana és un pas important.

Cada cop està més clar que la veu serà la interfície comuna per relacionar-se amb la tecnologia i la xarxa: “Quan se’n generalitzi l’ús de les assistents vocals, en veurem la importància -assenyala Àlex Hinojo-. Sembla que totes les tecnologies de xarxes neuronals i massive learning que s’està desenvolupant per l’aprenentatge de robots i de traducció assistida fan pensar que en mig termini l’evolució que està fent aquesta tecnologia en llengües com l’anglès, el castellà o el rus; es podrà aplicar al català. Aleshores tot dependrà de la decisió política d’adoptar-la o no. La tecnologia no és i no ha de ser el fre”.

Però no tot ha de passar per les grans companyies. En aquesta línia destaca el projecte Common Voice, en què Softcatalà treballa amb Mozilla per crear un corpus de veus en català: “Ja tenim més de 700 hores enregistrades de parlants catalans de diferents gèneres, edats i accents”, explica Jordi Mas. Per poder fer realitat un sistema de reconeixement de veu es necessiten, sobretot, dades, i resulta molt car accedir-ne. El projecte #CommonVoiceCAT, que ja ha fet servir Facebook, enregistra milers de talls de veu de manera col·laborativa, que després es revisen de manera anònima. La participació encara és oberta i ja hi han participat més de 5.100 persones.

Tota una generació que ara té 15 o 20 anys va néixer i ha crescut amb programari en català, i ho veu normal.

En l’àmbit estatal, només un 3% de les lectures a Internet són en català, quan hauria de ser d’entre el 15% i el 18%, segons ús lingüístic. La raó és un petit detall, del que hom no és ni conscient: la gent té els seus dispositius configurats en castellà. Si busques per veu o teclejant el nom d’una persona o un lloc i tens el mòbil o Google configurat en castellà, et sortirà la Wikipedia en castellà. Això limita la quantitat de webs en català si no s’hi accedeix des d’una plataforma configurada en català.

Sigui teclejant o parlant, l’ús del català a Internet i la seva evolució els darrers vint anys respon a un fet natural com és el d’expressar-se i rebre coneixement en la teva llengua materna, però també és una història, en certa manera, d’activisme: “Com diu la Maria del Carme Junyent, ‘el català és la llengua marcada’ -cita Àlex Hinojo-, sembla que per parlar en la nostra llengua hem de fer un plus més, sempre. I així ho fem, perquè tenim incorporat aquest activisme per la llengua, però l’ideal seria no ser una llengua marcada, i fer del parlar català un fet natural i no una qüestió d’activisme. Al carrer i a Internet”.

Com veiem, en vint anys la manera d’elaborar programari i crear continguts ha evolucionat molt, actualment els softwares passen més per aplicacions per a mòbil. Gràcies, però, a la feina duta a terme pels projectes citats en aquest article i tants d’altres, disposem ja d’una consciència col·lectiva de l’ús normalitzat del català a Internet i, el que és encara més important: tota una generació que ara té 15 o 25 anys ha crescut amb programari en català, i ho veu normal.

Subscriu-te al butlletí

Subscriu-te al butlletí de la Fundació .cat per rebre les últimes notícies al teu correu.

Notícies relacionades