RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN

Arquitectura de los sistemas QA


Los primeros sistemas de Question-Answering se desarrollaron en torno a 1960 y básicamente eran interfaces de lenguaje natural para sistemas expertos centradas en dominios específicos. En contraste, los sistemas de question-answering actuales utilizan documentos de texto como base de conocimiento y combinan diversas técnicas de procesamiento del lenguaje natural.

Es posible reconocer una secuencia de operaciones comunes a todos los sistemas de Question-Answering las cuales permitirían definir una arquitectura genérica para estos sistemas basada en los siguientes componentes:

  • Análisis de la pregunta

    Para poder responder a una pregunta es necesario disponer de ciertas características entre las que, en casi todos los casos, se encuentra el tipo de pregunta y el tipo esperado para la respuesta. El tipo de pregunta determina si se quiere localizar un hecho concreto (por ejemplo, ¿qué país ganó el mundial de fútbol de 2006?), en cuyo caso se habla de preguntas factuales, o si se quiere obtener una definición de un concepto (por ejemplo, ¿qué es la osteoporosis?), donde se habla de preguntas de definición. Dependiendo del sistema considerado se incluyen otros factores como si es una pregunta de tipo lista, es decir, si se espera una lista de valores como respuesta (por ejemplo, ¿qué países forman la Unión Europea?). También se determina en esta fase el tipo esperado en la respuesta que, básicamente, viene a indicar si se está buscando un nombre de persona, una organización, una fecha concreta, etc.

  • Recuperación de la información

    Los sistemas de búsqueda de respuestas que trabajan sobre contenidos web necesitan de algún mecanismo que facilite una lista de páginas web que puedan contener la respuesta buscada. A estos sistemas se les denomina "sistemas de recuperación de información" y entre ellos se encuentran los buscadores de todos conocidos.

  • Selección de pasajes

    Una vez se dispone de documentos con posibilidades de contener una respuesta, es necesario estudiarlos para seleccionar aquellas frases o conjuntos de frases (pasajes) que pueden contener una repuesta a la pregunta efectuada. Los pasajes seleccionados serán los que se empleen como entrada del siguiente componente.

  • Extracción de respuestas

    Por último, queda recorrer las frases que contienen las respuestas para proceder a extraer la respuesta precisa que solicita el usuario. En esta fase se hace uso del tipo esperado en la respuesta, así como del tipo de pregunta, para seleccionar las palabras concretas que forman la respuesta o, en su caso, la frase o pasaje que la constituye.

  • Arquitectura Sistemas de Question-Answering
Recuperacion y Acceso a la Información - 2008
[Valid RSS] [Valid Atom 1.0] Valid XHTML 1.0 Strict ¡CSS Válido! Test TAW AAA