¿Pueden hablar las máquinas? Comparación de ELIZA con los sistemas de conversación modernos
Un sábado por la mañana del año 1966, el vicepresidente de BBN llegó pronto para hacer una demostración de un servicio de la empresa. Al no ver a su programador jefe y encontrar el ordenador encendido, decidió emplearlo para escribirle. Pasados unos minutos y viendo que su empleado parecía que evitara sus preguntas, decidió llamarle. Informado por su sorprendido trabajador, descubrió que había estado hablando con un programa de ordenador. Era una versión de ELIZA, un bot de conversación creado poco tiempo antes por Joseph Weizenbaum, investigador del MIT.
Transcurridos 50 años, Huma Shah, Kevin Warick, Defeng Wu y yo mismo (Jordi Vallverdú) nos planteamos si realmente las máquinas habían mejorado su capacidad de conversación y cuáles eran los motivos pendientes que les impedían superar de forma completa el Test de Turing. Los profesores Shah y Warwick han estado organizando anualmente del Test de Turing durante los últimos años. Hay que remarcar que en el año 2014 un bot llamado Eugene Goostman superó, no sin controversia, este célebre test celebrado en la Royal Society de Londres. Consideramos necesario reflexionar sobre las virtudes y defectos de estos bots iniciando un estudio comparativo comparando cinco bots muy bien valorados en los últimos Tests de Turing: Cleverbot, Elbot, Eugene Goostman, JFred y Ultra Hal con una versión online de ELIZA.
El análisis comparativo, en el que participaron estudiantes de varias universidades europeas (incluida la UAB) y una china, demostró que, efectivamente, los sistemas conversacionales en lenguaje natural o coloquial han mejorado. Y no sólo han mejorado, porque si ELIZA simplemente capturaba datos menores del usuario con el que interactuaba, los actuales bots aprenden literalmente en cada conversación. Estas habilidades están permitiendo que varios bots formen parte de servicios empresariales (piénsese en el de IKEA, por ejemplo) o incluso en entornos educativos. Estas máquinas hablan, como lo haría un ser humano, incluso vagando, expresando opiniones o expresando estados de ánimo cambiantes.
Ciertamente queda mucho trabajo por hacer para alcanzar bots ideales como los de la película Her, como hemos demostrado en anteriores investigaciones (Vallverdú, Jordi; Shah, Huma; Casacuberta, David. Chatterbox Challenge as a Testbed for Synthetic Emotions. International Journal of Synthetic Emotions. 2010, vol. 1, num. 2, p. 57-86). El reciente caso del bot por twitter Tay, de Microsoft, que en 24 horas expresó comentarios racistas y de tipo nazi hacen que nos planteamos cómo deben aprender los bots y realmente lo que significa ser persona. Porque hay gente que no lo es. Está en la nuestras manos hacer que las máquinas saquen lo mejor nosotros.
Referencias
Shah, Huma; Warwick, Kevin; Vallverdú, Jordi; Wud, Defeng. Can machines talk? Comparison of Eliza with modern dialogue systems. Computers in Human Behavior. 2016, vol. 58, p. 278-295. doi: 10.1016/j.chb.2016.01.004.