Las tecnologías de Inteligencia Artificial han avanzado mucho en los últimos 3-5 años. Pero cada día que pasa se alcanza un nuevo logro, especialmente en los servicios cognitivos, que es de lo que quiero hablar hoy.
Dentro de las capacidades de utilizar sistemas de inteligencia artificial para resolver problemas complejos, hay toda una rama dedicada a construir modelos y tecnologías que resuelvan los problemas cognitivos que resolvemos los humanos con relativa facilidad en nuestro motor de inteligencia – el cerebro – utilizando nuestros sensores de entrada y salida de datos: la vista, la voz, el oído, el tacto y el gusto.
Son estas disciplinas de visión, habla y escucha, las que han estado desarrollándose durante los últimos años a una velocidad increíble. Y por una razón, que incluso nosotros mismos en Telefónica tomamos como guía:
“Durante muchos años los humanos hemos aprendido los interfaces de la tecnología y ya es hora de que la tecnología aprenda los interfaces de los humanos.”
Y por supuesto, lo han hecho. Existe una unidad de medición de la calidad de los modelos de Inteligencia Artificial para servicios cognitivos que se llama “paridad humana”. Es decir, utilizamos la paridad humana como tasa de error, por lo que, si un servicio cognitivo se equivoca menos que un humano en uno de los problemas, decimos que ese servicio ya ha superado al ser humano.
Imaginemos un servicio de atención de llamadas telefónicas para los Estados Unidos. Imaginemos ahora que tenemos un equipo de humanos con servicios cognitivos de reconocimiento del habla en inglés para todos los ciudadanos que hablan en esa lengua en ese país. La tasa de veces que ese equipo de humanos falla al reconocer una frase de otros humanos es superior al que tendríamos si pusiéramos una Inteligencia Artificial a reconocerlos. Y es que la paridad humana en voice recognition en lengua inglesa se superó ya en el año 2017.
Ejercicios similares han ido pasando a lo largo de los últimos tres años. Fue ya en el año 2015 cuando los servicios cognitivos de visión artificial superaron la paridad humana en reconocimiento de objetos. Y hace poco más de un año, en enero de 2018 se superó la paridad humana en comprensión lectora. Sí, puedes dar un texto a una Inteligencia Artificial y hacer todo tipo de preguntas que se pueden extraer de ese texto en base a la información que en él existe y empezar a preguntarle. Su tasa de error es menor que la de los seres humanos.
En marzo de 2018 se consiguió superar la paridad humana en traducción, y supongo que a todos os emociona ver el uso de esta capacidad en Skype para que en tiempo real dos niñas de México y Estados Unidos se comuniquen sin barrera de idioma de por medio.
Y este año se ha batido otra marca. Una Inteligencia Artificial ha superado la paridad humana en lectura de labios, como si en “2001: Una odisea del espacio” lo hubieran visto venir. El “pobre” HAL 9000 ya ha sido superado por el proyecto de MIT Lab “Alter Ego” https://www.media.mit.edu/projects/alterego/overview/.
Y esto se está masificando y comoditizando. Por ejemplo, los jóvenes ya no se sorprenden de los sistemas de visión artificial que se usan en SnapChat para ponerte orejas de gatito, o que usan los sistemas de vídeo conferencia para difuminar el fondo. O de que se reconozca a la gente en las fotografías.
Figura: Foto de Chema Alonso y Kevin Mitnick reconocida por Microsoft Azure
http://www.elladodelmal.com/2019/04/cuando-me-converti-en-una-celebritie.html
En el caso de Microsoft Azure, hay servicios de visión artificial para reconocer a celebrities, y ni el propio Kevin Mitnick ni yo, cambiando sus gafas por mi gorro, fuimos capaces de engañarle. Y solo estamos en 2019. ¿Qué habrá en 2030?
Imaginemos lo que imaginemos para el 2030, está claro que debe contar con sistemas de Inteligencia Artificial con servicios cognitivos muy superiores a los humanos, y probablemente tendrán incluidas cosas que nos parecen tan nuestras como “el instinto”, “la intuición” o la “imaginación”, que al final tienen un poco o un mucho de analítica predictiva de datos. El futuro lo construimos – por ahora – nosotros, así que mientras que estas Inteligencias Artificiales no tengan sueños, soñemos nosotros con un mundo en el que la tecnología nos hace mejores humanos.