DEV Community

Baltasar García Perez-Schofield
Baltasar García Perez-Schofield

Posted on • Edited on

Breve repaso a la investigación en inteligencia artificial

Según nos están vendiendo continuamente, la IA (inteligencia artificial) ha conseguido un hito importantísimo, de tal manera que la IAG (inteligencia artificial general), está a la vuelta de la esquina... ¿es esto cierto?

Los comienzos

La investigación en IA comenzó en los años 40 del siglo XX. aunque el término IA no se acuñaría hasta 1956. El trabajo se centraría en la creación de máquinas inteligentes.

Lo primero que se debatió fue... ¿qué es la inteligencia? ¿cómo puede definirse? Como no se llegó a ningún acuerdo o avance sobre este tema, Alan Turing crea su famoso Test de Turing. No se sabe qué es la inteligencia, pero si interactuando con un programa de computador este resulta ser indistinguible de un ser humano, entonces es inteligente. La idea es interactuar a través de un terminal, sin ver con quién estamos hablando en cada momento, por ejemplo, estando en habitaciones separadas.

Algoritmos inteligentes

Un primer paso fue el desarrollo de algoritmos que incorporan heurísticas (reglas obtenidas a partir de la experiencia), de manera que pueden resolver puzles como por ejemplo el 8-puzle (mover cuadrados de forma que siempre queda un hueco), y otros. La gran aportación de este desarrollo es sin duda el algoritmo A*.

Redes de neuronas

También desde el principio, se persiguió la emulación del funcionamiento del cerebro mediante redes de neuronas. Estas redes de neuronas emulan el comportamiento de las neuronas cerebrales humanas. Estas son entrenadas con un juego de datos de entrada, para una vez entrenada poder lograr emplearla fuera de dicho juego. Las neuronas adaptan los pesos de sus relaciones con el resto de neuronas, hasta que las entradas y salidas coinciden plenamente.

Por ejemplo, una red de neuronas pensada para sumar puede entrenarse con varios casos, como 1, 4 y 5; 20, 30, 50; o incluso 21 21 42. Cuanto más grande sea el conjunto de entrada, más precisión se obtendrá en las respuestas posteriores fuera del conjunto de entrenamiento. Así, para lograr una máquina sumadora serían necesarios miles de casos de entrada.

Op1, Op2, Resultado
 1,   1,      2
 1,   2,      3
 1,   3,      4
 1,   4,      5
...
Enter fullscreen mode Exit fullscreen mode

Una de las muchas aplicaciones es la de visión artificial, de manera que tras entrenarla con muchas fotos de ejemplo, la red es capaz de encontrar las caras de los humanos en una fotografía.

Sistemas expertos

Los sistemas expertos fueron un importante intento de modelar comportamiento inteligente. La investigación se centraba sobre un experto en algún campo que se quisiera modelar, por ejemplo, porque no existen muchos expertos en dicho campo. Así, un sistema experto de medicina (como Mycin), se crea (a muy grandes rasgos), entrevistando a un experto (en este caso, un médico), extrayendo del mismo el conocimiento sobre el campo para plasmarlo en reglas, e incluyendo dichas reglas en un sistema de razonamiento. Estas reglas se modelan mediante lógica de segundo orden, de manera que, por ejemplo, una regla que indique que las mujeres desarrollan osteporosis por encima de los cincuenta años, se podría definir como:

persona(x) y mujer(x) y mayor_que(edad(x, y), edad(x, 50)) -> padece(x, osteoporosis).
Enter fullscreen mode Exit fullscreen mode

Así, para una mujer llamada Laura la regla se dispararía de la siguiente forma:

persona(Laura) y mujer(Laura) y mayor_que(edad(Laura, y), edad(Laura, 50) -> padece(Laura, osteoporosis).
Enter fullscreen mode Exit fullscreen mode

Así, suponiendo que tenemos en la base de conocimiento los siguientes hechos:

persona(Laura)
mujer(Laura)
edad(Laura, 54)
Enter fullscreen mode Exit fullscreen mode

Al dispararse la regla se añadirá a la base de conocimiento:

padece(Laura, osteoporosis)
Enter fullscreen mode Exit fullscreen mode

El gran problema del sistema experto es que se basa enormemente en un tipo de encaje de los hechos completamente sintáctico. Es decir, si en lugar de los hechos requeridos para que se dispare la regla mostrados más arriba, tenemos:

persona(Laura)
hembra(Laura)
edad(Laura, 54)
Enter fullscreen mode Exit fullscreen mode

No se dispararía la regla, ya que precisamos mujer(Laura), y este hecho no existe. Sí, por sentido común sabemos que si tenemos hembra(Laura), pues es lo mismo. El problema es que no hay forma de modelar el sentido común, así como que el lenguaje natural es muy vago e impreciso. Por ejemplo, "Laura es ciclista" significa que a) es ciclista profesional, o quizás b) tiene licencia de ciclista, pero no es profesional, o también que c) monta en bici de vez en cuando.

Otro enorme problema es cómo depurar el programa una vez que el conjunto de reglas excede una determinada cantidad; teniendo en cuenta, además, que muchas de ellas deben relacionarse entre sí.

Finalmente, es difícil determinar el momento en el que ya se ha extraído toda la información necesaria del experto, por lo que ya no sería necesaria ninguna regla más.

CBR

Para terminar, tenemos los CBR (Case Based Reasoning, o razonamiento basado en casos), que se basa en técnicas estadísticas para generar conclusiones. Por ejemplo, para un sistema que sea capaz de predecir la temperatura del día siguiente, podríamos entrenarlo con un conjunto de entrada como el siguiente:

temperatura_ayer, litros_lluvia, velocidad_viento, temperatura
40,                      0,           5,            41
15,                     15,          45,             9
... 
Enter fullscreen mode Exit fullscreen mode

Como siempre, cuanto mayor sea el conjunto de datos de entrada, más precisión tendrá el sistema en predecir la temperatura del día siguiente. Estos datos podrían obtenerse de una agencia meteorológica, de manera que quizás podría alimentarse el sistema con los datos de todos los días desde enero de 1900. Con toda esta información, el sistema podría predecir la temperatura de días futuros con suficiente precisión.

Puede parecer que es como una red de neuronas, pero es que con esta técnica el razonamiento consiste en buscar un conjunto de entradas que se parezca estadísticamente a la situación a la que se quiere responder, y generar una respuesta acorde, de nuevo desde un punto de vista estadístico.

Big Blue

Un caso particular que merece una mención aparte es Deep Blue, una máquina jugadora de ajedrez, que en 1997 fue capaz de derrotar a Kasparov, el por entonces campeón mundial de ajedrez. El prototipo había sido mejorado desde 1996, cuando sucedió lo contrario: la máquina fue derrotada.

Este superordenador contenía un conocimiento básico de las reglas del juego (cómo mover las fichas), y una base de datos de jugadas recogidas de numerosísimas partidas. Muy básicamente, funcionaba tomando de su base de datos la situación más parecida a la actual, y realizando entonces la jugada ganadora. La ventaja es que su por entonces masiva potencia de cálculo hacía que realmente pudiese filtrar de su enorme base de datos las situaciones más parecidas a la actual, en un tiempo realista.

Conclusiones

De acuerdo, pero entonces, ¿dónde se sitúa Chat GPT? Pues resulta que se basa fuertemente en una red de neuronas, aunque incorpora otros mecanismos tomados de los CBR.

Personalmente, creo que, al igual que Deep Blue fue más o menos el reconocimiento de que no se podía enseñar a una máquina a jugar al ajedrez como un gran campeón, optando entonces por dotarla de una base de datos de partidas enorme, Chat GPT discurre por el mismo camino.

Chat GPT compara la entrada con una enorme base de datos de información extraída de internet, obtiene la más parecida, y devuelve el texto más probable que suele acompañar a continuación. Es decir, Ghat GPT no razona en absoluto. Su capacidad está en función de la cantidad de datos de entrada, y también de la calidad de los mismos (estos dos parámetros suelen estar reñidos). La posibilidad de que Chat GPT exista se basa en la capacidad de procesamiento y de almacenamiento que ha alcanzado el hardware hoy en día.

Así que, ¿se está cerca, o es inminente, como afirman algunos, de la creación de una Inteligencia Artificial General?

No.

No se está más cerca que hace algunos años para lograr la IAG. Chat GPT puede ser un paso más, pero desde luego no es el hito previo a la consecución de este logro.

Top comments (2)

Collapse
 
canro91 profile image
Cesar Aguirre

Ok, entonces no nos va a exterminar...todavia? :)

Collapse
 
baltasarq profile image
Baltasar García Perez-Schofield

¡Alégrate de que estamos a salvo! ;-)