Plataforma EASIER, una ayuda en la comprensión de los textos

Logotipo Plataforma EASIER

EASIER es una plataforma que ayuda a las personas a comprender mejor los textos y funciona apoyándose en métodos de inteligencia artificial. Básicamente proporciona simplificación léxica de los textos en español ofreciendo distintas ayudas a la comprensión.

Es el resultado de un trabajo de investigación de un equipo multidisciplinar y dirigido por la investigadora Lourdes Moreno en el área de Accesibilidad y Procesamiento de Lenguaje Natural del grupo Human Language and Accessibility Technologies (HULAT) del Departamento de Informática de la Universidad Carlos III de Madrid (UC3M).

El objetivo de esta línea de investigación es desarrollar soluciones tecnológicas innovadoras que favorezcan el acceso a contenidos claros, sencillos y de fácil comprensión para las personas con discapacidad intelectual de manera específica, y a todas las personas en general.

El trabajo de investigación ha contado con la financiación de la empresa Indra y la Fundación Universia. El proyecto fue seleccionado como uno de los premiados en la “Convocatoria 2019 de ayuda a proyectos de investigación en Tecnologías accesibles Indra-Fundación Universia”.

¿Cómo se usa?

A partir de un texto en español introducido por el usuario en una página web, EASIER detecta las palabras complejas del texto y ofrece ayudas al usuario para mejorar la lectura y comprensión del texto como son ofrecer sinónimos, una definición y un pictograma para cada palabra compleja detectada. Además, se proporciona definiciones de las palabras en Lectura Fácil o del diccionario de la Real Academia de la Lengua (RAE). Las definiciones de Lectura Fácil se obtienen del “Diccionario fácil” gracias a la colaboración con Plena Inclusión Madrid. Para proporcionar pictogramas, se utiliza los recursos ofrecidos por ARASAAC.

A la plataforma web EASIER se puede acceder desde entorno escritorio, pero también desde escenario tablet y móvil. Además, se ofrece una extensión para el navegador (Chrome y Firefox) que detecta las palabras complejas ofreciendo un sinónimo.

 

¿Cómo funciona?

Se sigue un enfoque de combinar métodos de las disciplinas de Inteligencia Artificial junto con la Interacción Hombre Máquina para generar interfaces accesibles con textos simplificados.

El sistema de EASIER clasifica si una palabra es compleja o no lo es en un texto mediante la utilización de técnicas de Aprendizaje Automático y Procesamiento de Lenguaje Natural, así como del uso recursos del lenguaje en Lectura Fácil y Lenguaje Sencillo (Plain Language).

  • Se ha hecho un entrenamiento del modelo de aprendizaje automático, utilizando distintas colecciones de textos anotadas por expertos, entre ellos, un corpus creado en el marco del trabajo de investigación en el que han trabajado expertos en Lectura Fácil y Lenguaje Sencillo (Plain Language) en español. Este sistema ha sido validado en competiciones en congresos de Procesamiento de Lenguaje Natural sobre la tarea de simplificar utilizando el mismo corpus obteniendo resultados positivos.
  • Para la generación y selección de sinónimos teniendo en cuenta su contexto se han utilizados diccionarios y técnicas de similitud semántica, así como recursos de paráfrasis.
  • Para la tarea de ofrecer las definiciones de la palabra compleja en su contexto, se ha hecho un proceso de desambiguación utilizando modelo de vectores de palabras llamado BERT (Bidirectional Encoder Representations from Transformers).

Esta contribución es un avance en procesos sistemáticos de simplificación, pero siempre teniendo en cuenta que los modelos utilizados aprenden sobre recursos del lenguaje creados por las personas y es importante tener presente que las máquinas tienen una capacidad limitada.

Accesibilidad cognitiva

La herramienta EASIER además de proporcionar soporte a la accesibilidad cognitiva a los textos, ofrece accesibilidad cognitiva en los interfaces de usuario. La herramienta ha sido creada con el requisito de que sea una herramienta muy sencilla de utilizar.

Por un lado, la interfaz de usuario de la herramienta es accesible según marco regulador con el estándar de accesibilidad Web Content Accessibility Guidelines (WCAG) 2.1 del W3C; y por otro lado su diseño ha sido optimizado siguiendo buenas prácticas en accesibilidad cognitiva y pautas en Lectura Fácil teniendo en cuenta documentos del grupo de trabajo de Making Content Usable for People with Cognitive and Learning Disabilities (COGA) (July 2020) del W3C y norma UNE 153101:2018 de Lectura Fácil.

Participación de las personas

En este trabajo de investigación las personas se han considerado esenciales. Nuestra premisa es “sin participación de las personas en el proceso de diseño y desarrollo de productos y servicios, no se consigue un impacto social real”.

Por ello, personas con discapacidad intelectual y personas mayores han participado en pruebas de usuario para evaluar la accesibilidad cognitiva de la interfaz y evaluar la idoneidad de la funcionalidad del sistema.

A pesar de que la plataforma se apoya en algoritmos de aprendizaje automático pudiendo dar en algunos casos resultados erróneos, las evaluaciones han dado resultados satisfactorios. Se ha contado con la valiosa colaboración para estas pruebas del organismo de personas con discapacidad intelectual Grupo AMAS.

Política de compartir

El uso de la plataforma EASIER es gratuito para los usuarios finales. La solución es open source, es decir, es código de programación abierto. Así, apoyamos el avance en herramientas que ayuden en la comprensión de los textos.

Descarga en https://github.com/lurmoreno/EASIER (Léase README)

Seguimos trabajando

Se lanza una primera versión beta, en la que seguir trabajando y mejorando resultados.

Nuestro trabajo en proceso es:

  • Uso de nuevos algoritmos y recursos del lenguaje que nos permitan mejorar resultados.
  • Post procesado del corpus creado en el marco del proyecto con anotadores expertos en Lectura Fácil. Este corpus proporciona un conjunto de datos que consta de instancias que proveen una palabra objetivo y su correspondiente clasificación de compleja o no compleja; además dicho recurso ofrece sinónimos sencillos de cada palabra compleja según los anotadores. El objetivo es ponerlo a disposición de la comunidad científica para que se pueda utilizar para entrenar algoritmos para simplificación de textos.
  • El dominio en el que se ha trabajado a pesar de su complejidad ha sido un dominio genérico y en español, se contempla adaptar los modelos y recursos a otros ámbitos como el de las administraciones públicas y salud.
  • Trabajar con otro tipo de términos, como las abreviaturas y acrónimos que dificultan la comprensión de textos, sobre todo si son específicos de un dominio (por ejemplo, médico, legal, etc.)
  • Explorar otras técnicas que contribuyen a la accesibilidad al contenido, como son la generación automática de resúmenes cuando se trabaja con textos largos y se requiere extraer las ideas principales.
  • Utilizando las soluciones existentes del proyecto EASIER y junto con las que vayan apareciendo, se está diseñando un panel que facilite la tarea de los profesionales y validadores en Lectura Fácil, ofreciendo distintos recursos como detección de palabras complejas, frecuencias, sinónimos más sencillos, definiciones y métricas de legibilidad.

Colaboración e innovación con empresas

La financiación en investigación suele ser insuficiente y por ello, desde aquí, hacemos una llamada a empresas y organismos que quieran trabajar con nosotros usando nuestra tecnología con las metas de desarrollar productos y servicios con distintos fines y dominios.

REFERENCIAS

  • Rodrigo Alarcón, Lourdes Moreno, Paloma Martínez. Word-Sense disambiguation system for text readability. 9th International Conference on Software Development and Technologies for Enhancing Accessibility and Fighting Info-exclusion. DSAI 2020
  • Lourdes Moreno, Rodrigo Alarcón, Paloma Martínez: EASIER system. Language resources for cognitive accessibility. ASSETS '20: The 22nd International ACM SIGACCESS Conference on Computers and Accessibility, Virtual Event, Greece, October 26-28, 2020. ACM 2020, ISBN 978-1-4503-7103-2 VÍDEO: https://youtu.be/fnVnhPpbJ0w
  • Rodrigo Alarcon, Lourdes Moreno, Paloma Martínez: Hulat - ALexS CWI Task - CWI for Language and Learning Disabilities Applied to University Educational Texts. IberLEF@SEPLN 2020: 24-30
  • Rodrigo Alarcón, Lourdes Moreno, Isabel Segura-Bedmar, Paloma Martínez: Lexical simplification approach using easy-to-read resources. Procesamiento del Lenguaje de Natural 63: 95-102 (2019)
  • Lourdes Moreno, Rodrigo Alarcón, Isabel Segura-Bedmar, Paloma Martínez: Lexical simplification approach to support the accessibility guidelines. Proceedings of the XX International Conference on Human Computer Interaction, Interacción 2019, Donostia, Gipuzkoa, Spain, June 25-28, 2019. ACM 2019, ISBN 978-1-4503-7176-6