La Inteligencia Artificial aprende inglés

 

Jonathan Tennembaum*

Desde el inicio, el lenguaje ha sido fundamental para los esfuerzos de la Inteligencia Artificial (IA) en imitar la mente humana.

 

El mismo concepto de “mente” en sí es nebuloso y escurridizo. Sin algún tipo de escritura, la IA no tiene nada con que trabajar, nada que “roer”.

 

Es aquí donde el lenguaje entra en escena. Las lenguas contienen sonidos, letras u otros símbolos, colecciones de palabras y frases, reglas gramaticales y construcciones; es decir, muchas estructuras de ese tipo con los que puede jugar la computadora.

 

Se puede esperar, entonces, que el lenguaje humano ofrezca un punto de partida ideal para que la IA asuma la mente humana en general. El raciocinio lógico y matemático, que también incluye muchas estructuras, ofrecería otro flanco de abordaje –tema que trataré en un artículo posterior.

 

La IA ha hecho progresos sorprendentes en la forma de trabajar con las lenguas humanas (llamadas también “lenguajes naturales”, en comparación con los lenguajes artificiales, como los inventados para la programación de computadores).

 

¡El día de hoy la gente ya conversa con los ordenadores! Los Chatbots (programas que simulan la conversación humana) con voces amigables nos ayudan en servicios bancarios, reservas de viajes, comercio electrónico, reclamaciones en las asignaciones públicas, emergencias médicas y hasta en la ayuda siquiátrica. Existen, igualmente, aplicaciones más o menos utilizables, que combinan reconocimiento de voz, síntesis de voz y traducción automática, que pueden servir de intérpretes simultáneos, lo que permite que personas conversen en diferentes idiomas.

 

Aunque sería un gran error caer en la conclusión, por esos ejemplos, de que la IA ya ha logrado simular los procesos del lenguaje que ocurren realmente en la mente humana. ¡Todo lo contrario! Lo que la IA ha conseguido hasta ahora se puede caracterizar como una forma útil de chapucería. Explicaré lo que quiero decir.

 

El “significado” es la llave de todo el problema de la IA, la “x” de la cuestión. Considérese el problema de la traducción automática (machine translation –MT, en inglés) entre dos lenguas naturales. Este es uno de los primeros problemas que enfrentan los creadores de la inteligencia artificial –una tarea práctica bien definida que presenta muchas de las cuestiones fundamentales a las que la IA se enfrenta todavía hoy.

 

Si consideramos esto, resulta fascinante leer los artículos presentados en la histórica Conferencia sobre traducción automática, realizada en el Instituto de tecnología de Massachusetts (MIT) en junio de 1952 (véase el link: http://mt-archive.info/MIT-1952-TOC .htm).

 

Entre los 18 participantes había personas que luego desempeñaría papeles destacados en el desarrollo de la técnica de la computación, de la IA y de la lingüística moderna. Las instituciones relacionadas con la defensa estuvieron bien representadas, dada la relevancia obvia del tema (por ejemplo, traducción ruso-inglés).

 

En 1952 ya se experimentaba con programas de traducción de computadoras rudimentarios y había un gran surtido de pensamiento creador, en particular, por parte de los especialistas en lenguaje. Los lingüistas reconocieron claramente la naturaleza fundamental de la tarea representada por la traducción automática y hubo muchas ideas interesantes al respecto.

 

La mayoría de los participantes veía la traducción 100 por ciento automática como una perspectiva muy lejana, si es que fuese posible algún día. En ese ínterin, la obtención de resultados utilizables y confiables exigiría la post-edición de la salida de la máquina y, posiblemente, también una pre-edición humana, por ejemplo, para reformular construcciones gramaticales complejas que el computador no consigue digerir.

 

(Una observación: confiabilidad y precisión eran requisitos primordiales para las aplicaciones que los patrocinadores de la traducción automática tenían en mente en aquella época, y lo mismo ocurre hoy en día. Por más útiles que sean el Traductor Google y otros sistemas semejantes en el plano informal, sería tonto emplearlos en negociaciones diplomáticas, por ejemplo, o en cualquier otro campo en el que la precisión sea insustituible y donde los errores o mal entendidos pudieran tener consecuencias graves.)

 

A mi parecer, fueron particularmente interesantes y perspicaces las contribuciones de Yehoshua Bar-Hillel, encargado de la organización de la conferencia del MIT y una de las figuras más influyentes del periodo inicial de la traducción automática. Más tarde, Bar-Hillel hizo grandes contribuciones a la lingüística y a la filosofía del lenguaje. Sus escritos son un ejemplo de cómo la lucha contra el problema de la traducción automática estimuló el pensamiento creador en una gran variedad de direcciones.

 

Bar-Hillel subrayó desde el inicio la “sociedad cerebro-máquina” como la única forma práctica de tratar el problema, y argumentó contra las expectativas irrealistas de que las computadoras podrían sustituir totalmente a los humanos en la traducción de lenguas naturales.

 

Más tarde, con el aumento de las expectativas exageradas en la traducción automática y la inteligencia artificial en general, sus advertencias fueron más enfáticas. En 1960 escribió un artículo controvertido titulado “Una demostración de la inviabilidad de la traducción totalmente automática de alta calidad”, en el que, entre otras cosas, anticipaba el retroceso conocido como “invierno de la IA”, la suspensión radical del financiamiento del sector, a causa de las promesas exageradas respecto a la traducción automática, que se inició seis años después (ver Parte 10 de esta serie).

 

En el párrafo inicial habla de la “reluctancia de muchos profesionalesde la traducción automática a reconocer que la idea de inventar un método de traducción totalmente automática de alta calidad es tan sólo un sueño que no será realidad en un futuro previsible. Por no percibir la futilidad práctica de ese objetivo se engañaron a sí mismos y a las agencias que patrocinaron sus investigaciones, con lo que hicieron que no quedaran satisfechas con un mecanismo de traducción totalmente automatizado, cuyos principios son bien comprendidos hoy, y, en lugar de eso, esperar que surgiera la cosa real en la que creían, con lo hicieron pensar en que estaba tan sólo a la vuelta de la esquina”.

 

La demostración de Bar-Hillel es tan relevante para el tema de esta serie que no me resisto a citarlo brevemente aquí.

 

Para demostrar su argumento, presenta el problema de cómo un sistema de traducción automática se las vería con la frase inglesa “The box in the pen.” El problema inmediato es, claro, que la palabra inglesa “pen” tiene más de un significado. Entre otros, puede significar “pluma” o “corralito” para niños. Para hacer una traducción correcta a otro idioma, es obvio que el computador tiene que determinar cuál de los dos significados es el más apropiado. Bar-Hillel da un ejemplo:

 

“Little John was looking for his toy box. Finally he found it. The box was in the pen. John was very” happy (Juanito buscaba su caja de juguetes. La encontró por fin. La caja estaba en el corralito. Juan quedó muy feliz).

 

Bar-Hillel escribe:

“Afirmo ahora que ningún programa existente o imaginable permitirá que un computador electrónico determine que la palabra pluma, en la frase dada dentro del contexto dado, tiene el segundo de los significados de arriba, mientras que todo lector con conocimiento suficiente de inglés hará eso “automáticamente”.

 

“¿Porque una máquina con capacidad de memoria suficiente para lidiar con un párrafo entero cada vez, y el programa sintáctico-semántico que va a ser necesario, más allá de los límites de una frase o de un párrafo entero, es todavía incapaz de determinar el significado de “pen” en nuestra frase de muestra, dentro del párrafo dado? La explicación es extremadamente simple, y es nada menos que sorprendente que, hasta donde sé, esta cuestión nunca haya sido señalada antes, en el contexto de la traducción automática. (…)”.

 

Un lector humano inteligente (vamos a parafrasear el argumento de Bar-Hillel) comprenderá naturalmente que la palabra “pen”, en el pasaje de arriba, se refiere a un corralito, y no a una pluma para escribir. ¿Por qué? La primera frase señala “caja” como una caja que contiene juguetes. Ya que el lector está consciente de que tal caja es mucho mayor que una pluma, la primera interpretación se excluye de forma automática, sin que el lector tenga que pensar conscientemente sobre eso.

 

Es evidente que existen incontables casos análogos en los que la selección correcta entre los significados diferentes de una palabra o frase depende de un conocimiento que está contenido en el texto, en particular las frases vecinas y hasta párrafos.

 

Bar-Hillel observa:

“Siempre que presentaba este argumento a uno de mis colegas que trabajaba con traducción automática, su primera reacción era: “Pero ¿por qué no concebir un sistema que coloque ese conocimiento a disposición de la máquina de traducción?” (…) Y ya que la idea de una máquina con conocimiento enciclopédico surgió también en otras ocasiones, permítanme agregar algunas palabras sobre este asunto.

 

“El número de hechos que nosotros, los seres humanos conocemos, es, de cierta forma, infinito. Si sabemos que en determinado momento hay exactamente ocho sillas, menos de nueve, de diez, de once, de doce, y así sucesivamente ad infinitum, sillas en aquella sala. Conocemos todos esos datos extras por inferencias que somos capaces de realizar, por lo menos en este caso particular, instantáneamente, y es claro que no están, en ningún sentido serio, almacenados en nuestra memoria.

*MSIA Informa

Foto: GTRES