|
Arquitectura de los sistemas QA
Los primeros sistemas de Question-Answering se desarrollaron en torno a 1960 y básicamente eran
interfaces de lenguaje natural para sistemas expertos centradas en dominios específicos.
En contraste, los sistemas de question-answering actuales utilizan documentos de texto como
base de conocimiento y combinan diversas técnicas de procesamiento del lenguaje natural.
Es posible reconocer una secuencia de operaciones comunes a todos los sistemas de Question-Answering
las cuales permitirían definir una arquitectura genérica para estos sistemas basada en los siguientes
componentes:
- Análisis de la pregunta
Para poder responder a una pregunta es necesario disponer de ciertas características
entre las que, en casi todos los casos, se encuentra el tipo de pregunta y el tipo esperado
para la respuesta. El tipo de pregunta determina si se quiere localizar un hecho concreto
(por ejemplo, ¿qué país ganó el mundial de fútbol de 2006?), en cuyo caso se habla de
preguntas factuales, o si se quiere obtener una definición de un concepto (por ejemplo,
¿qué es la osteoporosis?), donde se habla de preguntas de definición.
Dependiendo del sistema considerado se incluyen otros factores como si es una
pregunta de tipo lista, es decir, si se espera una lista de valores como respuesta
(por ejemplo, ¿qué países forman la Unión Europea?). También se determina en esta fase
el tipo esperado en la respuesta que, básicamente, viene a indicar si se está buscando
un nombre de persona, una organización, una fecha concreta, etc.
- Recuperación de la información
Los sistemas de búsqueda de respuestas que trabajan sobre contenidos web necesitan de
algún mecanismo que facilite una lista de páginas web que puedan contener la respuesta buscada.
A estos sistemas se les denomina "sistemas de recuperación de información" y entre ellos se
encuentran los buscadores de todos conocidos.
- Selección de pasajes
Una vez se dispone de documentos con posibilidades de contener una respuesta, es necesario
estudiarlos para seleccionar aquellas frases o conjuntos de frases (pasajes) que pueden contener
una repuesta a la pregunta efectuada. Los pasajes seleccionados serán los que se empleen como
entrada del siguiente componente.
- Extracción de respuestas
Por último, queda recorrer las frases que contienen las respuestas para proceder a extraer
la respuesta precisa que solicita el usuario. En esta fase se hace uso del tipo esperado en la
respuesta, así como del tipo de pregunta, para seleccionar las palabras concretas que forman
la respuesta o, en su caso, la frase o pasaje que la constituye.
|