Inicio de la Internet Catalana: De Softcatalà en Google Assistant en catalán
El catalán está vivo en Internet desde que ésta llegó a Cataluña, en 1995. Aunque los primeros softwares no permitían ser configurados en nuestra lengua. Más de veinte años después, plataformas como Apple o Google preparan las versiones catalanas de sus auxiliares de voz, mientras Google Assistant ya entiende catalán. Vamos tarde?
Según Web Technology Services (W3Techs) -que aporta información sobre usos de Internet en todo el mundo- menos del 0,1 de los sitios web están en catalán. En el ranking de las lenguas más usuales en Internet, ocupamos la posición número 40 (de 180). Calma! No nos estiramos del pelo por este porcentaje. Hay que tener en cuenta que más del 60% de todas las webs del mundo son en inglés. Aparte, por ser la décima de millones de hablantes que somos, hay más webs en catalán que en idiomas hablados por mucha más gente como el tagalo (de Filipinas) o el urdu (se habla en la India y Pakistán ).
Los Webcreadors independientes de webs en catalán (WICCAC) resumen en su barómetro mensual que el porcentaje global de uso del catalán en Internet es alto, del 65,79%. Jordi Mas, miembro y fundador de Softcatalà -la comunidad digital que fomenta el uso del catalán en Internet- resume la situación actual del catalán en la red así: «El caso catalán es un caso de éxito. En comparación a la mayoría de lenguas minorizadas, sin el apoyo de un Estado, la lengua catalana en Internet tiene buena salud «.
El 63,8% de la población que ha consultado Internet ha visitado páginas en catalán, el 92,2% lo ha hecho en castellano y el 42,2% en otras lenguas.
Las grandes plataformas han ido adoptando progresivamente el uso de la lengua catalana en sus interfaces. De los 10 sitios más visitados de Internet, Google, YouTube, Facebook, Twitter y Wikipedia están adaptados al catalán.
Por otra parte, según datos de la Encuesta de participación cultural en Cataluña 2019 del Departamento de Cultura, el 63,8% de la población que ha consultado Internet ha visitado páginas en catalán, el 92,2% lo ha hecho en castellano y el 42,2% en otras lenguas.
UNA COMUNIDAD DE USUARIOS Y DE CREADORES
Son datos, números y porcentajes fríos. Nos ayudan a entender que a pesar de representar un colectivo de hablantes relativamente pequeño dentro de la red de redes, la salud y el uso del catalán en Internet no deja de mejorar, año tras año. Pero para saber de dónde viene todo y cómo comienza nuestra lengua en Internet, se debe regresar al tiempo, a la tercera edad de Internet, que no hace tanto.
Vamos a finales del siglo XX. Para el primer viquipedista catalán y actual coordinador digital del Instituto Ramon Llull, Àlex Hinojo, el que más ha evolucionado desde entonces son las comunidades y el uso de las plataformas: «La sociedad catalana, que siempre ha tenido unos valores cívicos muy activos, iba haciendo, poco a poco, y ya creaba entonces contenidos, blogs, podcasts y plataformas en lengua catalana; algo que no ocurría con las webs institucionales.»
Sólo un 0,5% de todo el catálogo de Netflix está grabado, doblado o subtitulado al catalán, según denuncia el Consejo del Audiovisual de Cataluña (CAC).
Un buen ejemplo es el portal informativo VilaWeb, que nace en 1996 y se convierte en el proyecto pionero de información y blogging en catalán en Internet. Jordi Mas recuerda aquellos tiempos, en que Softcatalà fue creado en 1997: «Era un momento en que surgían muchas iniciativas en el sentido de normalizar el uso del catalán en la red. La comunidad digital catalana siempre ha sido muy activa, la gente enseguida se animó con los bloques, con la Wikipedia, con el software libre. Si nos dan las herramientas, nos animamos.»
A principios de siglo, antes de las redes sociales, ya se podía hacer de todo por Internet, había un escenario formado por muchas comunidades, con poca regulación, y muchas ganas de aprovechar las posibilidades de Internet. Lo que no había era demasiado apoyo institucional. De este modo, y siempre con la intención de ir haciendo vía, en 1997 nace el proyecto Softcatalà, una organización sin ánimo de lucro que desarrolla y traduce software en catalán, unos 150 programas en 20 años: «Empezamos traduciendo al catalán software que fuera gratuito, éramos cuatro personas y nos pasamos un año traduciendo», explica Mas.
Una tarea gigantesca, que dura hasta el día de hoy. Para Àlex Hinojo, el gran éxito de Softcatalà más allá de los 150 programas traducidos: «Ha sido un colectivo básico para crear la conciencia de que puedes, y que es normal, tener explorador, el navegador, el paquete de ofimática en catalán. Para crear conciencia -resume Àlex Hinojo-, los derechos lingüísticos en el apartado de Internet [y de software] de la comunidad catalanoparlante».
Con el paso de los años, en buena parte debido a la aparición de las redes sociales, e independientemente de que las plataformas no estuvieran en catalán, la gente se habituó a publicar sus contenidos en catalán: «En ámbito comercial e institucional costaba más que las plataformas adaptaran su infraestructura para adoptar la lengua catalana «. Por la parte de contenidos más comerciales como el vídeo, el uso está normalizando poco a poco. En el sector audiovisual, si hablamos de plataformas como Netflix, la situación es mala: sólo un 0,5% de todo el catálogo está grabado, o doblado, o subtitulado al catalán, según denunciaba el Consejo del Audiovisual de Cataluña ( CAC) en un informe publicado el pasado mes de mayo.
El problema con estas grandes plataformas y el uso del catalán es el ente regulador. Si no están obligados, es más difícil. En Dinamarca, Netflix subtitula y dobla al danés porque deben hacerlo para entrar en ese mercado y el ente regulador así les obliga; esto en Cataluña no pasa. Como el catalán no es lengua oficial en Europa, la UE no regula su existencia en estas plataformas.
«Aparte -señala Àlex Hinojo-, hay que tener en cuenta que el coste económico de doblar un producto audiovisual es mayor al de traducir un libro en catalán, por ejemplo. Pero el problema con estas plataformas no es de mercado, es de regulación «. En resumen, si en vez de 24 idiomas en la Unión Europea, fueran 25 (o más, que sería lo más deseable), para operar en el territorio de habla catalana la empresa distribuidora estaría obligada a subtitular o doblar en catalán. Mientras no sea así, la presencia de productos en catalán en estas grandes plataformas seguirá siendo una cuestión de voluntad política. Ciertamente, como apunta Àlex Hinojo, «reconocer las lenguas minorizadas en la UE no es un tema neutral.»
Recuperamos el barómetro mensual del WICCAC. Aquí podemos consultar la evolución, mes a mes y desde el año 2002, del uso del catalán en Internet por parte de una serie de webs, clasificadas por sectores. Un análisis rápido nos aporta dos datos importantes. Las webs de sectores culturales, de enseñanza o institucionales utilizan mayoritariamente el catalán. Ahora bien, las webs de sectores comerciales tales como electrodomésticos, perfumería o automovilismo apenas llegan al 17% de porcentaje de uso del catalán. ¿Por qué? «Creo que a veces el consumidor catalán no es lo suficientemente exigente y no hacemos lo suficiente discriminación positiva en Internet, como sí hacemos en un bar, o en un establecimiento, cuando no nos atienden, o no nos entienden, en catalán -responde a la duda Àlex Hinojo-. Hay mucho trabajo por hacer en este sentido, el código de consumo también debería incluir el derecho a ser atendidos en catalán en línea «.
SIRI Y ALEXA hablado CATALÁN
Las grandes plataformas están adoptando sus interfaces a la presencia del catalán. Empresas como Apple o Google ya han anunciado que están trabajando, y Google Assistant ya entiende el catalán, aunque no habla. Podría parecer anecdótico hoy en día, pero que estos gigantes ya tengan preparado el motor de reconocimiento de voz de la lengua catalana es un paso importante.
Cada vez está más claro que la voz será la interfaz común para relacionarse con la tecnología y la red: «Cuando se generalice el uso de las asistentes vocales, veremos la importancia -señala Àlex Hinojo-. Parece que todas las tecnologías de redes neuronales y massive learning que se está desarrollando para el aprendizaje de robots y de traducción asistida hacen pensar que en medio plazo la evolución que está haciendo esta tecnología en lenguas como el inglés, el castellano o el ruso; se podrá aplicar al catalán. Entonces todo dependerá de la decisión política de adoptar o no. La tecnología no es y no debe ser el freno «.
Pero no todo tiene que pasar por las grandes compañías. En esta línea destaca el proyecto Common Voice, en el que Softcatalà trabaja con Mozilla para crear un corpus de voces en catalán: «Ya tenemos más de 700 horas grabadas de hablantes catalanes de diferentes géneros, edades y acentos», explica Jordi Mas. Para poder hacer realidad un sistema de reconocimiento de voz se necesitan, sobre todo, datos, y resulta muy caro acceder de él. El proyecto #CommonVoiceCAT, que ya ha utilizado Facebook, registra miles de cortes de voz de manera colaborativa, que luego se revisan de manera anónima. La participación es aún abierta y ya han participado más de 5.100 personas.
Toda una generación que ahora tiene 15 o 20 años nació y ha crecido con software en catalán, y lo ve normal.
En el ámbito estatal, sólo un 3% de las lecturas en Internet son en catalán, cuando debería ser de entre el 15% y el 18%, según uso lingüístico. La razón es un pequeño detalle, de lo que uno no es ni consciente: la gente tiene sus dispositivos configurados en castellano. Si buscas por voz o tecleando el nombre de una persona o un lugar y tienes el móvil o Google configurado en castellano, te saldrá la Wikipedia en castellano. Esto limita la cantidad de webs en catalán si no se accede desde una plataforma configurada en catalán.
Sea tecleando o hablando, el uso del catalán en Internet y su evolución en los últimos veinte años responde a un hecho natural como es el de expresarse y recibir conocimiento en tu lengua materna, pero también es una historia, en cierto manera, de activismo: «Como dice Maria del Carmen Junyent, ‘el catalán es la lengua marcada’ -cita Àlex Hinojo-, parece que para hablar en nuestra lengua tenemos que hacer un plus más, siempre. Y así lo hacemos, porque tenemos incorporado este activismo por la lengua, pero lo ideal sería no ser una lengua marcada, y hacer del hablar catalán un hecho natural y no una cuestión de activismo. En la calle y en Internet «.
Como vemos, en veinte años la manera de elaborar software y crear contenidos ha evolucionado mucho, actualmente los softwares pasan más por aplicaciones para móvil. Sin embargo, gracias al trabajo llevado a cabo por los proyectos citados en este artículo y tantos otros, disponemos ya de una conciencia colectiva del uso normalizado del catalán en Internet y, lo que es aún más importante: toda una generación que ahora tiene 15 o 25 años ha crecido con software en catalán, y lo ve normal.