google, seo, maquina, lenguaje |
soldado, computadora, rayo, orden |
El principio de todo
Conseguir que las máquinas entendieran las lenguas de las personas fue uno de los primeros objetivos de los científicos que empezaron a desarrollar ordenadores. La traducción automática ruso-inglés se consideró fundamental durante la Guerra Fría, y el primer sistema se construyó en el año 1954. Aun así, 10 años después la búsqueda quedó encallada: se cortaron las subvenciones y la investigación en este campo fue abandonada.
El interés por el procesamiento del lenguaje natural renació años después, cuando se empezó a investigar en tareas más básicas para la comprensión de textos. A medida que los componentes de base se fueron haciendo disponibles, se pudieron atacar problemas reales más grandes. Hoy en día existe un gran número de programas que realizan procesamiento del lenguaje natural: traductores, resumidores, buscadores de respuesta... Aunque la tecnología es bastante joven, se pueden obtener buenos resultados si se restringe el tema de los documentos.
Traducción automática
Existen muchos sistemas de traducción automática funcionando en entornos administrativos y empresariales. Así, la Comisión Europea utiliza SYSTRAN desde el año 1976 para traducir documentos oficiales entre 18 pares de idiomas. Por otro lado, tenemos un ejemplo más actual: la edición bilingüe del Periódico utiliza un sistema automático de traducción entre castellano y catalán.
En Internet, el traductor más popular es BabelFish, que traduce entre el inglés y otras lenguas. Google también ofrece un servicio potente de traducción. Más recientemente, ha aparecido el sistema OpenTrad (ver imagen inferior) para realizar traducciones entre las lenguas oficiales de España. Antes, la Universidad de Alicante ya había puesto en marcha Internostrum, una herramienta muy útil para traducir textos de catalán (valenciano) a castellano y viceversa. Todos estos sistemas son bastante efectivos; aun así, una vez realizada la traducción siempre es necesaria una revisión posterior.
Resumen automático
El resumen automático tiene como objetivo dar una versión abreviada de uno o varios documentos que hablan de un cierto tema. Quizás el ejemplo más próximo es la función de auto resumen de Microsoft Word.
Un sistema disponible online para resumir más de un documento (en inglés) es MEAD, desarrollado por un grupo de investigadores de todas las partes del planeta. Por su parte, SWESUM (ver imagen de la izquierda) es un sistema para resumir páginas web de noticias.
Búsqueda de respuesta
Los sistemas de búsqueda de respuesta intentan encontrar una respuesta concreta a una pregunta concreta. Así, si queremos saber cuál es la altura de la Torre Eiffel, en vez de buscar "Torre Eiffel" en un buscador y tratar de encontrar esta información entre los documentos que aparecen, podemos usar un sistema de búsqueda de respuesta y preguntarle "¿Cuál es la altura de la Torre Eiffel?"
Hay varios sistemas de búsqueda de respuesta que se pueden probar online como el de la empresa americana Language Computer, Answerbus (un proyecto de la Universidad de Saarbrücken), Brainboost (imagen izquierda) y por último, el sistema START, hecho por el famoso MIT (Massachusetts Institute of Technology) de Boston. Todos estos sistemas sólo funcionan en inglés.
Recursos
Traductores :
- SYSTRAN: http://www.systransoft.com/
- BABELFISH : http://espanol.babelfish.yahoo.com/
- OPENTRAD: http://www.opentrad.org/
- INTERNOSTRUM: http://www.internostrum.com/
Resumidores:
- MEAD: http://tangra.si.umich.edu/clair/md/demo.cgi
- SWESUM: http://swesum.nada.kth.se/
- LIBOTS: http://libots.sourceforge.net/
Búsqueda de respuesta:
- BRAINBOOST: http://www.brainboost.com/
- ANSWERBUS : http://answerbus.coli.uni-saarland.de/index.shtml
- START: http://start.csail.mit.edu/