Isabel Segura Bedmar (Proyectos)

Gracias a la investigación biomédica, se ha generado una gran cantidad de conocimiento sobre enfermedades raras en los últimos años. El elevado coste de los análisis moleculares y la existencia de una bibliografía reducida, en ocasiones inaccesible o dispersa, dificulta el avance en el diagnóstico y tratamiento de estas patologías. Frecuentemente, los pacientes afectos, a pesar de que sus condiciones son mortales o crónicamente incapacitantes, carecen de tratamiento. Aunque las bases genéticas hayan sido dilucidadas, en muchos casos la pérdida de función de los genes causantes no explica la complejidad fenotípica observada. Este es el caso de genodermatosis como la Epidermólisis bullosa distrófica (EBDR), síndrome de Kindler (SK) o Xeroderma pigmentoso (XPC). Estas enfermedades comparten manifestaciones clínicas y predisposición al cáncer, a pesar de tener diferentes bases genéticas. El proyecto tiene como objetivo aplicar técnicas de Procesamiento de Lenguaje Natural (PLN) para analizar la literatura biomédica con el fin de aumentar el conocimiento relativo a las enfermedades raras y desvelar relaciones complejas presentes en estas enfermedades. En concreto, esperamos identificar biomarcadores precisos, dianas terapéuticas de estas patologías, así como facilitar su diagnóstico a clínicos no especialistas. Además, se plantea como caso de uso, el análisis en estas tres genodermatosis (EBDR, KS y XPC) con el fin de correlacionar la información obtenida mediante PLN con los patrones de expresión génica provenientes de arrays moleculares de dichas enfermedades, publicados previamente por el grupo TERMeG.  La trayectoria conjunta de los integrantes del proyecto, su experiencia en los campos del PLN y enfermedades raras, así como su carácter multidisciplinar sumado al interés de los consorcios de investigación especializados (CIBERER) y de las asociaciones de pacientes implicadas (DEBRA), garantizan la viabilidad y el impacto de la propuesta.

  • Referencia: NPL4RARE-CM-UC3M
  • Financiación: Convocatoria del Programa de Apoyo a la Realización de Proyectos Interdisciplinares de I+D para jóvenes investigadores de la UC3M 2019-2020
  • Tipo de proyecto: Público
  • Estado: Activo
  • Investigador principal: Isabel Segura Bedmar, Sara Guerrero Aspizua
  • Otros investigadores: Lourdes Moreno, Cristóbal Colón Ruiz, Rodrigo Alarcón, Carlos León Canseco , Lucía Martínez Santamaría , José Bonafont Aragó, Esteban Chacón Solano
  • Duración: -

El objetivo es el desarrollo de un sistema para procesamiento del texto libre de las historias clínicas electrónicas (HCE) del Hospital Universitario Fundación de Alcorcón (HUFA) utilizando técnicas de procesamiento de lenguaje natural y métodos de deep learning. HUFA fue uno de los primeros hospitales de la Comunidad de Madrid en disponer de HCE, desde su apertura a finales de 1997. En la actualidad la Comunidad de Madrid tiene integradas más 5 millones de HCE de las que sólo se procesan los metadatos estructurados. El resto de la información, en formato no estructurado (texto libre), a día de hoy permanece sin ser poder ser explotada por procesos automáticos. El desarrollo de tecnología capaz de procesar y explotar información no estructurada en texto libre de la HCE en el contexto actual de big data, puede tener muchas aplicaciones tanto en la mejora de la práctica clínica (generación automática de resúmenes de episodios relacionados con un paciente, sistemas de ayuda a la decisión clínica para personalizar diagnósticos y tratamiento de enfermedades, alertas de enfermedades infecciosas, mejora de los sistemas de farmacovigilancia, etc.) como en investigación (semi-automatización de los estudios epidemiológicos, por ejemplo en la identificación de los cohortes de pacientes). En concreto, la realización de estudios epidemiológicos implica una ardua labor en la revisión manual de un elevado número de HCE, lo que a su vez conlleva un gran número de recursos humanos y una ingente cantidad de horas de trabajo. Por tanto es crucial promover el desarrollo de técnicas automáticas que permitan obtener información de forma más ágil, convirtiendo la información no estructurada en estructurada y procesable por algoritmos automáticos, y facilitando así la toma de decisiones estratégicas.
El objetivo del proyecto es el desarrollo de técnicas de PLN y método de deep learning para el análisis de la información no estructurada de la HCE, con el fin último del de reducir el coste, en tiempo y recursos, de los estudios epidemiológicos. El proyecto tiene dos centros participantes: (Subproyecto 1) Grupo LABDA de la UC3M que desarrollará el sistema automático para el procesamiento de la HCE y (Subproyeto 2) HUFA cuyo equipo está formado por especialistas de la unidad de Alergología, que serán los encargados de llevar a cabo un estudio epidemiológico a partir de los datos obtenidos de la HCE mediante al uso de PLN y métodos de deep learning. En concreto, el estudio epidemiológico tendrán como principal objetivo estudiar la prevalencia de la anafilaxia en la población definida como caso de uso de aplicación. Varios profesionales del servicio de informática de HUFA serán los encargados de anonimizar las HCE para garantizar la protección de datos de los pacientes.
Aunque el sistema será desarrollado sobre la HCE del HUFA, la tecnología que se pretende desarrollar en el proyecto solicitado, podría ser aplicada directamente a la HCE de cualquier otro hospital. Además, su adaptación al estudio epidemiológico de otras patologías distintas a la anafilaxia (cáncer de mama, ictus, etc) es relativamente sencilla ya que los enfoques (deep learning) que se quieren abordar durante el proyecto son independientes del problema a tratar.

  • Referencia: TIN2017-87548-C2-1-R
  • Financiación:
  • Tipo de proyecto: Público
  • Estado: Activo
  • Investigador principal: Paloma Martínez Fernández, Isabel Segura Bedmar
  • Otros investigadores: Jose Luis Lopez Cuadrado, Israel González Carrasco, José Luis Martínez Fernández, Lourdes Moreno, Belén Ruiz-Mezcua
  • Duración: -

El proyecto EASIER, del Grupo Human Language and Accessibility Technologies (HULAT), del departamento de Informática de la Universidad Carlos III de Madrid (UC3M) tiene como objetivo desarrollar una solución que mejore la accesibilidad a la información digital favoreciendo el acceso a las personas con discapacidad intelectual.

Las tecnologías de la información y la comunicación (TIC) en la sociedad de la información presentan barreras de accesibilidad, que afectan en mayor grado a las personas que tienen algún tipo de discapacidad. Son más conocidas las necesidades de las personas con discapacidad de tipo sensorial y física, pasando por alto las barreras cognitivas causadas por la difícil comprensión de los textos que afectan principalmente a las personas con discapacidad intelectual y personas mayores.

Con esta motivación se quiere proporcionar, por un lado, tecnología que dé soporte a los procesos de simplificación automática de contenido textual en español para mejorar la facilidad de lectura y, por otro lado, tecnología que genere interfaces de usuario accesibles que incluyan este contenido textual simplificado a los usuarios.

Para la simplificación léxica del contenido textual en español se tendrán en cuenta las pautas de accesibilidad (WCAG) relativas al lenguaje siguiendo legislación en España, así como las pautas de Lectura Fácil (UNE 153101: Lectura fácil. Pautas y recomendaciones para la elaboración de documentos) y Pautas de Lenguaje Llano (Plain Language). Como espacio de solución, se van a utilizar métodos de disciplinas que puedan dar soporte al cumplimiento sistemático de estos requisitos de accesibilidad cognitiva, tal es el caso de la disciplina de Procesamiento del Lenguaje Natural (PLN) y la Inteligencia Artificial.

Las administraciones públicas avanzan rápidamente hacia la provisión a través de la Web de servicios para el ciudadano básicos y extendidos (Informe eGovernment de la UE de 2014). Además de la disminución de los costos, este esfuerzo apoya el derecho de acceso a los servicios públicos para todas las personas (incluyendo personas con discapacidad y de edad avanzada). La UE ha lanzado iniciativas para "Satisfacer nuevas necesidades de la sociedad mediante el uso de las nuevas tecnologías en el sector público" con el fin de "promover servicios públicos eficientes y abiertos, centrados en los ciudadanos". Se han hecho esfuerzos para mejorar la usabilidad y accesibilidad de los sitios web de las administraciones, pero diversos estudios han revelado que no es suficiente. También se requieren otros factores tales como la calidad del contenido y la seguridad.
El objetivo general es una arquitectura de software basado en modelos para el desarrollo metodológico de eServicios inclusivos personalizados que permitan a cualquier usuario interactuar de una manera satisfactoria, sin importar el dispositivo utilizado. Esto requiere la integración en los modelos de técnicas apropiadas de perfilado de usuario para adaptar los eServicios a las características de los usuarios, a la tecnología disponible y a la funcionalidad del servicio. Por ello, este proyecto tiene un carácter multidisciplinar y se abordará mediante la colaboración entre investigadores en tecnologías de la información y expertos de eAdministración, combinando diversas disciplinas científicas: Modelado de servicios para eGovernment; minería de datos; interacción adaptada al usuario (incluyendo accesibilidad universal y acceso multidispositivo); procesamiento de lenguaje natural; y arquitecturas de software basado en modelos.
Se estructura en dos subproyectos:
Subproyecto 1, liderado por la UPV/EHU, explotará datos reales de interacción de usuario con eServicios prestados por la Diputación de Gipuzkoa (DFG) para extraer patrones de uso, uso anormal de los servicios y barreras de accesibilidad. Se construirán modelos de eServicios mediante la inclusión en el grupo de trabajo de expertos en eAdministración (Quality Institute Netherlander Municipalities, Servicio de Modernización de DFG, e IZFE, un desarrollador de aplicaciones para la eAdministración). A partir de estos modelos se proporcionará acceso a la Web adaptado al usuario por medio de adaptaciones de presentación, contenido y navegación.
Subproyecto 2, liderado por la UC3M, creará una arquitectura de software para el desarrollo basado en modelos de aplicaciones de eAdministración con soporte para la accesibilidad y el uso de múltiples dispositivos (con la asistencia de expertos de la Universidad de Lisboa). La definición de una arquitectura de software basado en modelos se hará en colaboración con el equipo de investigación de la UCLM LoUISE, que actualmente está elaborando un marco que se puede ampliar para adaptarse a nuestras necesidades.
Los resultados del proyecto incluirán modelos de: aplicaciones de eAdministración, usuarios de eServices y adaptaciones web para la accesibilidad universal y multidispositivo que se integrarán en la arquitectura basada en modelos para la creación de herramientas de desarrollo de aplicaciones de eAdministración accesibles y de calidad. Así el proyecto contribuirá a aumentar la participación de los ciudadanos, a producir ahorro a los gobiernos y las empresas y a reducir la carga administrativa.

  • Referencia: TIN2014-52665-C2-2-R
  • Financiación: Ministerio de Economía y Competitividad
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Lourdes Moreno, Isabel Segura Bedmar, José Luis Martínez Fernández, Belén Ruiz-Mezcua, Victor Suarez Paniagua, Israel González Carrasco, Jose Luis Lopez Cuadrado
  • Duración: -
  • https://egovernability.wordpress.com

The recent massive growth in online media and the rise of user-authored content (e.g weblogs, Twitter, Facebook) has lead to challenges of how to access and interpret these strongly multilingual data, in a timely, efficient, and affordable manner. Scientifically, streaming online media pose new challenges, due to their shorter, noisier, and more colloquial nature. Moreover, they form a temporal stream strongly grounded in events and context. Consequently, existing language technologies fall short onaccuracy, scalability and portability. The goal of this project is to deliver. innovative, portable open-source real-time methods for cross-lingual mining and summarisation of large-scale stream media. TrendMiner will achieve this through an inter-disciplinary approach, combining deep linguistic methods from text processing, knowledge-based reasoning from web science, machine learning, economics, and political science. No expensive human annotated data will be required due to our use of time-series data (e.g. financial markets, political polls) as a proxy. A key novelty will be weakly supervised machine learning algorithms for automatic discovery of new trends and correlations. Scalability and affordability will be addressed through a cloud-based infrastructure for real-time text mining from stream media. Results will be validated in two high-profile case studies: financial decision support (with analysts, traders, regulators, and economists) and political analysis and monitoring (with politicians, economists, and political journalists). The techniques will be generic with many business applications: business intelligence, customer relations management, community support. The project will also benefit society and ordinary citizens by enabling enhanced access to government data archives, summarisation of online health information, and tracking of hot societal issues.

  • Referencia: FP7-ICT 287863
  • Financiación: European Commission
  • Tipo de proyecto: Público
  • Estado: Activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Lourdes Moreno, Isabel Segura Bedmar, Julián Moreno Schneider, María González García, María Herrero Zazo, Ricardo Revert Arenaz
  • Duración: -
  • https://cordis.europa.eu/project/id/287863

El proyecto tiene como objetivo la definición y desarrollo de técnicas de extracción y búsqueda de información a partir de textos en el dominio biomédico, en particular, en dos líneas especiales: en primer lugar, el tratamiento de documentación científica en inglés sobre farmacología y en segundo lugar, el procesamiento de textos divulgativos sobre salud en idiomas como español y árabe. Estas técnicas de extracción incluyen el reconocimiento de entidades propias del dominio, aplicación de patrones y aprendizaje automático a la extracción de relaciones semánticas de interés, la integración de recursos léxicos específicos de sanidad (UMLS, SNOMED, etc.) para la mejora de aplicaciones. Por otro lado, la información extraída debe organizarse para su utilización en las herramientas de búsqueda e integración de información. Así, para mostrar la viabilidad de las técnicas propuestas se desarrollarán tres prototipos para búsqueda de información: el primero de ellos una aplicación orientada a farmacéuticos para extraer conocimiento sobre interacciones entre fármacos a partir de publicaciones científicas; el segundo prototipo será una herramienta orientada al público en general para buscar información sobre enfermedades y medicamentos; el tercero aplicará la extracción terminológica al corpus paralelo español-árabe para la enseñanza de la terminología en el dominio biomédico.

  • Referencia: TIN2010-20644-C03-01
  • Financiación: Plan Nacional de I+D, Ministerio de Ciencia e Innovación
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández, Julián Moreno Schneider, Daniel Sánchez Cisneros, María Herrero Zazo
  • Duración: -
  • http://labda.inf.uc3m.es/multimedica/

BUSCAMEDIA es un proyecto que trata la investigación en múltiples líneas paralelas para la consecución de un verdadero buscador multimedia semántico, basado en una ontología multilingüe, multidominio y multimedia revolucionaria definida en el proyecto que permita adaptarse dinámicamente a cualquier red, terminal, contexto y usuario, ya sea profesional o simplemente un usuario que quiera compartir sus fotos, vídeos o blog con su red social. El grupo de Bases de Datos Avanzadas es OPI de la empresa DAEDALUS y nuestro papel en el paquetes de trabajo PT5:Búsqueda semántica con interacción en lenguaje natural y en concreto en las tareas 5.1:Sistemas de búsqueda basados en lenguaje natural y 5.2: Interpretación de consultas multilingües por voz. BUSCAMEDIA cuenta con un consorcio con amplia experiencia y con una contrastada trayectoria en la investigación a realizar, compuesta por grandes empresas, PYMES y OPIs. En BUSCAMEDIA participan empresas líderes en su sector como: ATOS, ACTIVA MULTIMÈDIA, GFI, INDRA, DAEDALUS, FRACTALIA, BMAT, ISID, ISOCO, CCMA y BILBOMÁTICA, con la colaboración de los organismos públicos de investigación: UPM, ROBOTIKER, UPF, UC3M, UNED, UPC, FUNDACIÓN MEDIA BARCELONA UPF y Fundación CTIC.

  • Referencia: CEN-20091026
  • Financiación: DAEDALUS S.A dentro del SUBPROGRAMA DE APOYO A CONSORCIOS ESTRATÉGICOS NACIONALES DE INVESTIGACIÓN TÉCNICA (CENIT-E), CEN-20091026
  • Tipo de proyecto: Público
  • Estado: Activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Dolores Cuadra Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Francisco Javier Calle Gómez, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, David del Valle Agudo, José Luis Martínez Fernández, Jesica Rivero Espinosa, Daniel Sánchez Cisneros, María González García, María Herrero Zazo
  • Duración: -
  • http://www.cenitbuscamedia.es

El proyecto Thuban persigue la realización de un acompañante virtual capaz de interaccionar con el usuario mientras este se mueve en un entorno, proporcionándole acceso a un conjunto de servicios preestablecidos. Entre estos servicios figuran aquellos que tienen en cuenta la posición y trayectoria del usuario (p.e., avisos), los orientados a dirigir esos parámetros (p.e. establecimiento de rutas y guiado hacia determinados puntos de interés fijos o móviles) o explicarlos (descripción de situación y/o trayectoria), y en general cualquier servicio disponible en el sistema.

El posicionamiento y guiado del usuario, así como el de todos los elementos del entorno, se realizará gracias al desarrollo de un sistema de Bases de Datos Espacio Temporales, capaz de generar y gestionar eventos para situaciones espacio-temporales. Por otro lado, la interacción del sistema con el usuario deberá estar orientada a la imitación de la interacción humana (interacción natural) de modo que cualquier persona no entrenada tecnológicamente pueda disfrutar de la facilidad desarrollada.

La integración de ambas tecnologías (BBDD espacio-temporales e IN) son los cimientos de la plataforma de interacción que posibilita una generación de Acompañantes Virtuales sobre entornos diversos y de múltiples aplicaciones para las Sociedades de Información para todos, ya sea orientado a los entornos culturales y de interés social, o en entornos meramente comerciales (realidad aumentada).

  • Referencia: TIN2007-66660
  • Financiación: Ministerio de Educación y Ciencia
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Dolores Cuadra Fernández
  • Otros investigadores: Francisco Javier Calle Gómez, Harith Al-Jumaily, Isabel Segura Bedmar, David del Valle Agudo, Juan Ignacio Perea Moraleda, David Rodríguez Álvarez, Jack Mario Mingo Postiglioni, Manuel Velasco de Diego, Jesica Rivero Espinosa
  • Duración: -

El proyecto BRAVO está dedicado a investigar en tecnologías para mejora la búsqueda de respuestas tanto con entrada en texto como en voz y cuyo principal resultado es una plataforma para un sistema de búsqueda de respuestas modular que permita medir la mejora de distintas técnicas para clasificación de preguntas, extracción de respuestas, recuperación de pasajes, etc. Entre las técnicas desarrolladas en este proyecto se encuentra SPINDEL, un reconocedor de entidades independiente del idioma que aplica aprendizaje automático basado en boostraping.
En el marco del proyecto BRAVO, una de las áreas específicas en las que el equipo de UC3M en la actualidad es en la localización de principios activos de medicamentos e interacciones entre ellos en la literatura médica haciendo uso de UMLS, diccionarios y reglas USAN de denominación de fármacos. Como resultado de este trabajo se dispone de un corpus anotado automática con nombres de fármacos genéricos y otros conceptos biomédicos utilizando la herramienta DrugNer desarrollada en el grupo y manualmente revisado por un experto farmacológico. DrugNer combina información obtenida de UMLS, el programa MetaMap Transfer (MMTx) y las reglas de nomenclatura recomendadas por la Organización Mundial de la Salud (OMS) para identificar y clasificar sustancias farmacológicas

  • Referencia: TIN2007-67407-C03-01
  • Financiación:
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández, Belén Ruiz-Mezcua, Julián Moreno Schneider, Mario Crespo
  • Duración: -

El Consorcio MAVIR es una red de investigación co-financiada por la Comunidad de Madrid dentro del IV Plan Regional de Investigación Científica e Innovación Tecnológica (IV PRICIT) y formada por un equipo multidisciplinar de científicos, técnicos, lingüistas y documentalistas para desarrollar un esfuerzo integrador en las áreas de investigación, formación y transferencia de tecnología.
Las líneas de investigación que desarrollan los integrantes de MAVIR son tecnologías del lenguaje humano y comunicación científica a traves de la web. La red temática propuesta incluye 25 doctores organizados en 6 grupos de investigación (UNED, UAM, UC3M, UEM, UPM y CINDOC) de la CM que desde una perspectiva pluridisciplinar se complementan en varias dimensiones: académica vs. profesional, investigación vs. servicios, generación de recursos vs. aplicaciones. Además hay otros 6 grupos de investigación nacionales e internacionales asociados al proyecto así como, entre otras, las siguientes entidades colaboradoras: RAE, Instituto Cervantes, Hospital de Fuenlabrada, Agencia EFE y DAEDALUS

  • Referencia: S-505/TIC/0267
  • Financiación: IV Plan Regional de Investigación Científica e Innovación Tecnológica (IV PRICIT), Comunidad de Madrid
  • Tipo de proyecto: publico
  • Estado: terminado
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Dolores Cuadra Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Francisco Javier Calle Gómez, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, David del Valle Agudo, Jesica Rivero Espinosa, Doaa Samy, Mario Crespo, Daniel Sánchez Cisneros, María Herrero Zazo
  • Duración: -
  • http://www.mavir.net

El objetivo del proyecto es investigar en tecnología basada en tratamiento automático del lenguaje para localización y extracción de información a partir de textos médicos y otros recursos (informes, historia clínica electrónica, documentación científica, etc.) haciendo especial hincapié en el idioma español. Para ello se trabajará en buscadores con distintos niveles de complejidad que integren recursos y terminología específicos del dominio médico (UMLS, SNOMED, etc) y con distinto tratamiento de los niveles sintáctico y semántico. Una de las áreas específicas en las que investigams en la actualidad es en la localización de principios activos de medicamentos e interacciones entre ellos en la literatura médica hciendo uso de UMLS, diccionarios y reglas USAN de denominación de fármacos.

  • Referencia: FIT-350300-2007-75
  • Financiación: Ministerio de Industria, Comercio y Turismo
  • Tipo de proyecto: publico
  • Estado: terminado
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Dolores Cuadra Fernández, Elena Castro Galán, Ana M. Iglesias Maqueda, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández
  • Duración: -