José Luis Martínez Fernández (Proyectos)

El objetivo es el desarrollo de un sistema para procesamiento del texto libre de las historias clínicas electrónicas (HCE) del Hospital Universitario Fundación de Alcorcón (HUFA) utilizando técnicas de procesamiento de lenguaje natural y métodos de deep learning. HUFA fue uno de los primeros hospitales de la Comunidad de Madrid en disponer de HCE, desde su apertura a finales de 1997. En la actualidad la Comunidad de Madrid tiene integradas más 5 millones de HCE de las que sólo se procesan los metadatos estructurados. El resto de la información, en formato no estructurado (texto libre), a día de hoy permanece sin ser poder ser explotada por procesos automáticos. El desarrollo de tecnología capaz de procesar y explotar información no estructurada en texto libre de la HCE en el contexto actual de big data, puede tener muchas aplicaciones tanto en la mejora de la práctica clínica (generación automática de resúmenes de episodios relacionados con un paciente, sistemas de ayuda a la decisión clínica para personalizar diagnósticos y tratamiento de enfermedades, alertas de enfermedades infecciosas, mejora de los sistemas de farmacovigilancia, etc.) como en investigación (semi-automatización de los estudios epidemiológicos, por ejemplo en la identificación de los cohortes de pacientes). En concreto, la realización de estudios epidemiológicos implica una ardua labor en la revisión manual de un elevado número de HCE, lo que a su vez conlleva un gran número de recursos humanos y una ingente cantidad de horas de trabajo. Por tanto es crucial promover el desarrollo de técnicas automáticas que permitan obtener información de forma más ágil, convirtiendo la información no estructurada en estructurada y procesable por algoritmos automáticos, y facilitando así la toma de decisiones estratégicas.
El objetivo del proyecto es el desarrollo de técnicas de PLN y método de deep learning para el análisis de la información no estructurada de la HCE, con el fin último del de reducir el coste, en tiempo y recursos, de los estudios epidemiológicos. El proyecto tiene dos centros participantes: (Subproyecto 1) Grupo LABDA de la UC3M que desarrollará el sistema automático para el procesamiento de la HCE y (Subproyeto 2) HUFA cuyo equipo está formado por especialistas de la unidad de Alergología, que serán los encargados de llevar a cabo un estudio epidemiológico a partir de los datos obtenidos de la HCE mediante al uso de PLN y métodos de deep learning. En concreto, el estudio epidemiológico tendrán como principal objetivo estudiar la prevalencia de la anafilaxia en la población definida como caso de uso de aplicación. Varios profesionales del servicio de informática de HUFA serán los encargados de anonimizar las HCE para garantizar la protección de datos de los pacientes.
Aunque el sistema será desarrollado sobre la HCE del HUFA, la tecnología que se pretende desarrollar en el proyecto solicitado, podría ser aplicada directamente a la HCE de cualquier otro hospital. Además, su adaptación al estudio epidemiológico de otras patologías distintas a la anafilaxia (cáncer de mama, ictus, etc) es relativamente sencilla ya que los enfoques (deep learning) que se quieren abordar durante el proyecto son independientes del problema a tratar.

  • Referencia: TIN2017-87548-C2-1-R
  • Financiación:
  • Tipo de proyecto: Público
  • Estado: Activo
  • Investigador principal: Paloma Martínez Fernández, Isabel Segura Bedmar
  • Otros investigadores: Jose Luis Lopez Cuadrado, Israel González Carrasco, José Luis Martínez Fernández, Lourdes Moreno, Belén Ruiz-Mezcua
  • Duración: -

Las administraciones públicas avanzan rápidamente hacia la provisión a través de la Web de servicios para el ciudadano básicos y extendidos (Informe eGovernment de la UE de 2014). Además de la disminución de los costos, este esfuerzo apoya el derecho de acceso a los servicios públicos para todas las personas (incluyendo personas con discapacidad y de edad avanzada). La UE ha lanzado iniciativas para "Satisfacer nuevas necesidades de la sociedad mediante el uso de las nuevas tecnologías en el sector público" con el fin de "promover servicios públicos eficientes y abiertos, centrados en los ciudadanos". Se han hecho esfuerzos para mejorar la usabilidad y accesibilidad de los sitios web de las administraciones, pero diversos estudios han revelado que no es suficiente. También se requieren otros factores tales como la calidad del contenido y la seguridad.
El objetivo general es una arquitectura de software basado en modelos para el desarrollo metodológico de eServicios inclusivos personalizados que permitan a cualquier usuario interactuar de una manera satisfactoria, sin importar el dispositivo utilizado. Esto requiere la integración en los modelos de técnicas apropiadas de perfilado de usuario para adaptar los eServicios a las características de los usuarios, a la tecnología disponible y a la funcionalidad del servicio. Por ello, este proyecto tiene un carácter multidisciplinar y se abordará mediante la colaboración entre investigadores en tecnologías de la información y expertos de eAdministración, combinando diversas disciplinas científicas: Modelado de servicios para eGovernment; minería de datos; interacción adaptada al usuario (incluyendo accesibilidad universal y acceso multidispositivo); procesamiento de lenguaje natural; y arquitecturas de software basado en modelos.
Se estructura en dos subproyectos:
Subproyecto 1, liderado por la UPV/EHU, explotará datos reales de interacción de usuario con eServicios prestados por la Diputación de Gipuzkoa (DFG) para extraer patrones de uso, uso anormal de los servicios y barreras de accesibilidad. Se construirán modelos de eServicios mediante la inclusión en el grupo de trabajo de expertos en eAdministración (Quality Institute Netherlander Municipalities, Servicio de Modernización de DFG, e IZFE, un desarrollador de aplicaciones para la eAdministración). A partir de estos modelos se proporcionará acceso a la Web adaptado al usuario por medio de adaptaciones de presentación, contenido y navegación.
Subproyecto 2, liderado por la UC3M, creará una arquitectura de software para el desarrollo basado en modelos de aplicaciones de eAdministración con soporte para la accesibilidad y el uso de múltiples dispositivos (con la asistencia de expertos de la Universidad de Lisboa). La definición de una arquitectura de software basado en modelos se hará en colaboración con el equipo de investigación de la UCLM LoUISE, que actualmente está elaborando un marco que se puede ampliar para adaptarse a nuestras necesidades.
Los resultados del proyecto incluirán modelos de: aplicaciones de eAdministración, usuarios de eServices y adaptaciones web para la accesibilidad universal y multidispositivo que se integrarán en la arquitectura basada en modelos para la creación de herramientas de desarrollo de aplicaciones de eAdministración accesibles y de calidad. Así el proyecto contribuirá a aumentar la participación de los ciudadanos, a producir ahorro a los gobiernos y las empresas y a reducir la carga administrativa.

  • Referencia: TIN2014-52665-C2-2-R
  • Financiación: Ministerio de Economía y Competitividad
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Lourdes Moreno, Isabel Segura Bedmar, José Luis Martínez Fernández, Belén Ruiz-Mezcua, Victor Suarez Paniagua, Israel González Carrasco, Jose Luis Lopez Cuadrado
  • Duración: -
  • https://egovernability.wordpress.com

El proyecto tiene como objetivo la definición y desarrollo de técnicas de extracción y búsqueda de información a partir de textos en el dominio biomédico, en particular, en dos líneas especiales: en primer lugar, el tratamiento de documentación científica en inglés sobre farmacología y en segundo lugar, el procesamiento de textos divulgativos sobre salud en idiomas como español y árabe. Estas técnicas de extracción incluyen el reconocimiento de entidades propias del dominio, aplicación de patrones y aprendizaje automático a la extracción de relaciones semánticas de interés, la integración de recursos léxicos específicos de sanidad (UMLS, SNOMED, etc.) para la mejora de aplicaciones. Por otro lado, la información extraída debe organizarse para su utilización en las herramientas de búsqueda e integración de información. Así, para mostrar la viabilidad de las técnicas propuestas se desarrollarán tres prototipos para búsqueda de información: el primero de ellos una aplicación orientada a farmacéuticos para extraer conocimiento sobre interacciones entre fármacos a partir de publicaciones científicas; el segundo prototipo será una herramienta orientada al público en general para buscar información sobre enfermedades y medicamentos; el tercero aplicará la extracción terminológica al corpus paralelo español-árabe para la enseñanza de la terminología en el dominio biomédico.

  • Referencia: TIN2010-20644-C03-01
  • Financiación: Plan Nacional de I+D, Ministerio de Ciencia e Innovación
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández, Julián Moreno Schneider, Daniel Sánchez Cisneros, María Herrero Zazo
  • Duración: -
  • http://labda.inf.uc3m.es/multimedica/

BUSCAMEDIA es un proyecto que trata la investigación en múltiples líneas paralelas para la consecución de un verdadero buscador multimedia semántico, basado en una ontología multilingüe, multidominio y multimedia revolucionaria definida en el proyecto que permita adaptarse dinámicamente a cualquier red, terminal, contexto y usuario, ya sea profesional o simplemente un usuario que quiera compartir sus fotos, vídeos o blog con su red social. El grupo de Bases de Datos Avanzadas es OPI de la empresa DAEDALUS y nuestro papel en el paquetes de trabajo PT5:Búsqueda semántica con interacción en lenguaje natural y en concreto en las tareas 5.1:Sistemas de búsqueda basados en lenguaje natural y 5.2: Interpretación de consultas multilingües por voz. BUSCAMEDIA cuenta con un consorcio con amplia experiencia y con una contrastada trayectoria en la investigación a realizar, compuesta por grandes empresas, PYMES y OPIs. En BUSCAMEDIA participan empresas líderes en su sector como: ATOS, ACTIVA MULTIMÈDIA, GFI, INDRA, DAEDALUS, FRACTALIA, BMAT, ISID, ISOCO, CCMA y BILBOMÁTICA, con la colaboración de los organismos públicos de investigación: UPM, ROBOTIKER, UPF, UC3M, UNED, UPC, FUNDACIÓN MEDIA BARCELONA UPF y Fundación CTIC.

  • Referencia: CEN-20091026
  • Financiación: DAEDALUS S.A dentro del SUBPROGRAMA DE APOYO A CONSORCIOS ESTRATÉGICOS NACIONALES DE INVESTIGACIÓN TÉCNICA (CENIT-E), CEN-20091026
  • Tipo de proyecto: Público
  • Estado: Activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Dolores Cuadra Fernández, Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, Francisco Javier Calle Gómez, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, David del Valle Agudo, José Luis Martínez Fernández, Jesica Rivero Espinosa, Daniel Sánchez Cisneros, María González García, María Herrero Zazo
  • Duración: -
  • http://www.cenitbuscamedia.es

El objetivo principal del proyecto es el diseño y desarrollo de un sistema que implemente un proceso de generación automática de subtítulos para grabaciones de vídeo o audio acompañadas de una transcripción fiel (guión).
Se quiere desarrollar un prototipo para una herramienta de soporte al subtitulado de contenidos audiovisuales en diferido (películas, documentales, series, etc.) para diversos medios: televisión, Internet y dispositivos móviles. En este contexto, se denomina subtitulado en diferido, off-line (fuera de línea) o enlatado porque no se trata de un proceso en tiempo real sino que se realiza previamente, en principio sin necesidades temporales.
Este soporte consiste en la automatización del proceso de sincronización del guión con el audio mediante la adición de marcas de tiempo, así como el tratamiento de revisión de errores y la segmentación del texto en subtítulos conformes a la normas de calidad establecidas.

  • Referencia: Proyecto Avanza - TSI-020100-2010-184
  • Financiación: Ministerio de Industria, Turismo y Comercio (proyecto AVANZA)
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Lourdes Moreno
  • Otros investigadores: Paloma Martínez Fernández, Lourdes Moreno, Ana M. Iglesias Maqueda, José Luis Martínez Fernández, Belén Ruiz-Mezcua, María González García
  • Duración: -
  • http://labda.inf.uc3m.es/sagas

El proyecto BRAVO está dedicado a investigar en tecnologías para mejora la búsqueda de respuestas tanto con entrada en texto como en voz y cuyo principal resultado es una plataforma para un sistema de búsqueda de respuestas modular que permita medir la mejora de distintas técnicas para clasificación de preguntas, extracción de respuestas, recuperación de pasajes, etc. Entre las técnicas desarrolladas en este proyecto se encuentra SPINDEL, un reconocedor de entidades independiente del idioma que aplica aprendizaje automático basado en boostraping.
En el marco del proyecto BRAVO, una de las áreas específicas en las que el equipo de UC3M en la actualidad es en la localización de principios activos de medicamentos e interacciones entre ellos en la literatura médica haciendo uso de UMLS, diccionarios y reglas USAN de denominación de fármacos. Como resultado de este trabajo se dispone de un corpus anotado automática con nombres de fármacos genéricos y otros conceptos biomédicos utilizando la herramienta DrugNer desarrollada en el grupo y manualmente revisado por un experto farmacológico. DrugNer combina información obtenida de UMLS, el programa MetaMap Transfer (MMTx) y las reglas de nomenclatura recomendadas por la Organización Mundial de la Salud (OMS) para identificar y clasificar sustancias farmacológicas

  • Referencia: TIN2007-67407-C03-01
  • Financiación:
  • Tipo de proyecto: publico
  • Estado: activo
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Lourdes Moreno, Elena Castro Galán, Ana M. Iglesias Maqueda, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández, Belén Ruiz-Mezcua, Julián Moreno Schneider, Mario Crespo
  • Duración: -

El objetivo del proyecto es investigar en tecnología basada en tratamiento automático del lenguaje para localización y extracción de información a partir de textos médicos y otros recursos (informes, historia clínica electrónica, documentación científica, etc.) haciendo especial hincapié en el idioma español. Para ello se trabajará en buscadores con distintos niveles de complejidad que integren recursos y terminología específicos del dominio médico (UMLS, SNOMED, etc) y con distinto tratamiento de los niveles sintáctico y semántico. Una de las áreas específicas en las que investigams en la actualidad es en la localización de principios activos de medicamentos e interacciones entre ellos en la literatura médica hciendo uso de UMLS, diccionarios y reglas USAN de denominación de fármacos.

  • Referencia: FIT-350300-2007-75
  • Financiación: Ministerio de Industria, Comercio y Turismo
  • Tipo de proyecto: publico
  • Estado: terminado
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, Dolores Cuadra Fernández, Elena Castro Galán, Ana M. Iglesias Maqueda, Harith Al-Jumaily, César De Pablo Sánchez, Isabel Segura Bedmar, María Teresa Vicente-Díez, José Luis Martínez Fernández
  • Duración: -

El objetivo del proyecto MIRACLE ha sido poner en marcha un sistema de Recuperación de Información que integrara diversas técnicas y recursos disponibles (tanto procedentes del campo de la estadística como del campo de la tecnología lingüística) con el fin de mejorar la calidad de la recuperación en el ámbito de la recuperación de información multilingüe. Este sistema que se ha llevado a cabo conjuntamente con la Universidad Politécnica de Madrid y se ha validado con éxito en el foro de competición europea CLEF (Cross Language Evaluation Forum) en las ediciones del 2003 y 2004. En particular MIRACLE ha participado en las tareas multilingüe, bilingüe, monolingüe y en la tarea de recuperación de imágenes. Además en la edición del 2004 se ha participado también en la tarea de búsqueda de respuestas (Question Answering).
Este proyecto fue el germen del sistema para las futuras ediciones del CLEF y otros foros en los que el grupo MIRACLE (formado por el grupo de Sistemas Inteligentes de la UPM, por el grupo de Bases de Datos Avanzadas de la UC3M y por la empresa DAEDALUS) ha participado en distintas tareas de recuperación de información y búsqueda de respuestas.

  • Referencia: 07T/0055/2003 2
  • Financiación: Comunidad de Madrid
  • Tipo de proyecto: publico
  • Estado: terminado
  • Investigador principal: Paloma Martínez Fernández
  • Otros investigadores: Paloma Martínez Fernández, César De Pablo Sánchez, José Luis Martínez Fernández
  • Duración: -