La explosión de la inteligencia artificial.

Se entiende por inteligencia artificial la disciplina que intenta replicar y desarrollar la inteligencia y sus procesos implícitos. Siguiendo esta línea, durante los últimos años han surgido gran multitud de inteligencias artificiales que intentan emular comportamientos humanos.

Por ende, en los últimos tiempos dos IA han sido muy famosas (y, casi por consiguiente, polémicas); DALL-E 2 y ChatGPT, las dos productos de una empresa dedicada específicamente al desarrollo de inteligencias artificiales llamdas OpenAI; además, no ha sido poco el impacto de otras IA como Midjourney, Stable Diffusion, Perplexity AI, etc.

Pero, ¿son realmente las IA el futuro? ¿Pueden llegar al nivel de la mente humana? Y, lo más importante, ¿sustituirán a la mente humana?

El protagonista, OpenAI.

OpenAI es una empresa de investigación y desarrollo de inteligencias artificiales fundada por Sam Altman y Elon Musk (dueño de Twitter, Tesla, SpaceX, entre otros, además de ser la persona más rica del mundo). Además, se han involucrado fundadores de empresas como LinkedIn y PayPal, extrabajadores de Google, y empresas como Amazon Web Services (subsidiara de Amazon) e Infosys (firma india). Según su página web, su misión es asegurar que la inteligencia artificial beneficie a toda la humanidad.

OpenAI Logo.svg

OpenAI ha desarrollado varias inteligencias artificiales. Una de ellas es Codex, que traduce lenguaje humano a líneas de código; otra es Whisper, que es una tecnología basada en inteligencia artifical de reconocimiento de voz especializada en el inglés; pero sin duda, las dos más importantes han sido GPT y Dall - E.

Para empezar, GPT es un generador de textos capaz de completar, editar y revisar textos en diferentes idiomas. Cuenta con tres versiones, siendo la más reciente GPT-3. Por otro lado, Dall-E es una IA capaz de generar imágenes utilizando como base una descripción en lenguaje natural. Actualmente se encuentra en su versión 2.

Basada en la tecnología GPT-3, ChatGPT es el más reciente producto de inteligencia artificial de OpenAI, y, sin duda, el que más opiniones ha generado. ChatGPT es un chatbot (es decir, una conversación con una máquina, o 'bot') de inteligencia artificial. Pero, a pesar de que los chatbot son bastante comunes (se vienen desarrollando desde los años 60), la mayoría de ellos están a años luz de ChatGPT.

ChatGPT cuenta con la mayor red neuronal creada hasta ahora, con más de 175.000 parámetros de aprendizaje automatizado. Esto significa que ChatGPT puede mantener conversaciones con un lenguaje natural, muy similar al del ser humano; y puede hacer infinidad de cosas, desde generar líneas de código hasta escribir poemas.

ChatGPT - Wikipedia

Esta inteligencia artificial tomó gran parte de su información de Internet; sin embargo, no está conectada a ella, por lo que no puede dar respuestas en tiempo real. El hecho de que haya sacado gran parte de su información de Internet es una navaja de doble filo, pues, aunque por un lado se nutrió de una grandísima cantidad de información, también absorbió lados negativos de Internet, como ciertas conductas violentas y consideradas incorrectas que tuvo que "desaprender".

Precisamente ese "desaprendizaje" ha sido una de las más recientes críticas, no tanto a ChatGPT en sí, sino a su empreza matriz, OpenAI. Según investigaciones, OpenAI subcontrató a miles de personas por medio de una empreza llamada Sama.

Esta empresa, Sama, emplea a personas principalmente de países subdesarrollados como Keina, Uganda y la India, y se describe a sí misma como una "empresa de inteligencia artifical ética". Sama trabaja con grandes tecnológicas como Meta, Google y Microsoft, y asegura que ha sacado a más de 50.000 personas de la pobreza.

Sin embargo, según una investigación de la revista Time, a los trabajadores de Sama subcontratados por OpenAI para etiquetar datos que la IA de ChatGPT obviase, se les pagó entre 1,32 y 2 dólares por hora. Además, muchos trabajadores expresaron que quedaron trastornados, pues los datos a etiquetar incluían contenido fuerte, como suicido, tortura, autolesiones, bestialidad, asesinato, etc.

Este tipo de declaraciones llevó a Sama a cancelar el trabajo con OpenAI 8 meses antes de lo planeado. Partnership for AI, un consorcio de empresas de inteligencia artificial al cual pertenece OpenAI, expresó que "a pesar del papel fundamental que desempeñan estos profesionales de enriquecimiento de datos, un creciente cuerpo de investigación revela las condiciones laborales precarias que enfrentan estos trabajadores".

Otro punto de críticas hacia ChatGPT ha sido la poca precisión que puede llegar a tener su información. Por ejemplo, han ocurrido casos en los que la IA se "raja" en cosas como programación, sugieriendo códigos erróneos, o incluso ciencias naturales, llegando en una ocasión a afirmar que el oso perezoso era el animal más veloz del mundo, ya que podía llegar a 48 kilómetros por hora.

Pero, ¿ChatGPT sirve realmente? Es decir, ¿puede mantener conversaciones que se sientan realmente naturales y dar informaciones verídicas, así como hacer todo lo que ha prometido? Para dar una respuesta, en Mente Computacional la hemos probado.

ChatGPT: la IA estrella de las últimas semanas.

Después de completar el proceso de registro (ingresar el correo electrónico o con Google o Microsoft), tenemos acceso a ChatGPT.

Lo primero es que nos indica los ejemplos de uso, las capacidades y las limitaciones. Entre estas últimas encontramos que puede generar información falsa o incorrecta, y que tiene un conocimiento limitado de eventos posteriores a 2021.

Primero le vamos a preguntar sobre él mismo. En este apartado, le hicimos dos preguntas: "¿Qué eres exactamente?" y "¿Puedes sustituir a Google?".

Sobre esta última pregunta, ChatGPT y, en general, la inteligencia artificial, se ha posicionado como un fuerte rival para el buscador de Google, pues sus respuestas pueden ser más naturales, cercanas y fáciles de comprender que las que da el buscador. ChatGPT específicamente, no tiene acceso a Internet (por ello el conocimiento limitado de eventos recientes); sin embargo, otras IA como Perplexity (de la que hablaremos más adelante) sí lo tienen; y Microsoft ha llegado ya a acuerdos con OpenAI para integrar inteligencia artifical en sus servicios (se espera que se integre ChatGPT en Bing, el buscador de Microsoft que lleva años intentando ser una alternativa a Google sin los resultados esperados).

Antes de continuar, cabe resaltar que, a pesar de que su interfaz está en inglés, ChatGPT puede "hablar" perfectamente en muchos idiomas (incluido el español). Teniendo esto en cuenta, comencemos con los resultados. Ante la primera pregunta, "¿Qué eres exactamente?", la IA respondió:

Soy un modelo de lenguaje grande entrenado por OpenAI. Mi función es generar texto y responder preguntas basadas en el idioma natural.

La segunda pregunta era, a priori, más interesante y un poco más desafiante para la IA. Cuando se le preguntó "¿Puedes sustituir a Google?", ChatGPT dio por respuesta:

Mi capacidad es limitada comparada con Google ya que Google tiene una gran cantidad de información indexada y herramientas para buscar y procesar esa información. Sin embargo, puedo proporcionar respuestas detalladas y precisas a preguntas específicas dentro de mi conocimiento.

Ahora bien, preguntémosle sobre eventos históricos. Primero, le pediremos que haga un resumen de la disolución de la Unión Soviética, con una longitud de 200 palabras. El resultado fue el siguiente: 

La Unión Soviética fue un estado federal socialista compuesto por 15 repúblicas soviéticas independientes. Fue fundada en 1922 y existió hasta su disolución en 1991. Durante su existencia, la Unión Soviética fue liderada por un partido comunista y un sistema político autoritario.

La disolución de la Unión Soviética comenzó en 1985 con la llegada al poder de Mikhail Gorbachev, quien introdujo políticas de perestroika y glasnost. Estas políticas permitieron una mayor libertad de expresión y una mayor participación en la economía, pero también llevaron a un aumento de la corrupción y una creciente insatisfacción con el gobierno. 

En 1991, varias repúblicas soviéticas, lideradas por Rusia, declararon su independencia de la Unión Soviética. En un intento de salvar el estado, un golpe de estado fue intentado contra Gorbachev en agosto de ese año, pero fracasó. El 8 de diciembre de 1991, el presidente de Rusia, Boris Yeltsin, firmó un acuerdo con los líderes de Ucrania y Bielorrusia para crear la Comunidad de Estados Independientes (CEI), que marcó el fin de la Unión Soviética. 

La disolución de la Unión Soviética tuvo un gran impacto en el mundo. El fin de la Guerra Fría y el colapso del comunismo en Europa del Este permitió una mayor estabilidad en Europa y en el mundo. Sin embargo, también llevó a una gran incertidumbre en Rusia y en las repúblicas independientes, ya que se enfrentaron a la tarea de construir nuevas economías y sistemas políticos.

El resumen es bastante bueno, pero la instrucción de 200 palabras la obvió, pues contando las palabras totales, se encuentran 239 palabras. Ahora, le podemos pedir que nos enseñe a crear y agregar cadenas a un arreglo en C#. La pregunta, textual, es "¿Cómo utilizo los arreglos de strings en C#?"

Ante ello, nos da una breve explicación de los arreglos de strings (cadenas) en C#, y da algunos ejemplos de su uso.

En C#, los arreglos de strings son similares a los arreglos de otros tipos de datos, pero contienen cadenas en lugar de números u otros tipos de datos. Aquí te doy algunos ejemplos de cómo utilizar arreglos de strings en C#:

1. Declaración de un arreglo de strings vacío:

string[] arr = new string[5];

2. Inicialización de un arreglo de strings con vaores:

string[] arr = new string[] { "item1", "item2", "item3" };

3. Acceso a un elemento del arreglo de strings:

string val = arr[2];

4. Asignar un valor a un elemento del arreglo de strings:

arr[3] = "new value";

5. Recorrer un arreglo de strings:

for (int i = 0; i < arr.Length; i++)
{
Console.WriteLine(arr[i]);
}

6. Utilizar un bucle foreach:

foreach (string item in arr)
{
Console.WriteLine(item);
}

Estos son sólo algunos ejemplos básicos de cómo utilizar arreglos de strings en C#. Hay muchas otras formas de trabajar con ellos, como utilizando métodos de las clases de arreglos o de la clase String.

Si le pedimos que escriba un código específico en otro lenguaje de programación, como Python, el resultado es el siguiente (le pedimos crear un sistema de registro e inicio de sesión para múltiples usuarios):

Aquí te presento un ejemplo básico de un sistema de registro e inicio de sesión en Python para múltiples usuarios:

(código en Python)

Ten en cuenta que este ejemplo es básico y no incluye medidas de seguridad adicionales, como el almacenamiento de contraseñas encriptadas o la verificación de correo electrónico.

El código que generó ChatGPT lo puedes ver aquí. El código, al ejecutarlo, efectivamente funciona correctamente.

Hablemos ahora de las capacidades de ChatGPT al hablar sobre eventos más cercanos. Pidámosle que nos dé un breve resumen de la historia del grupo musical El Cuarteto de Nos desde 2004 hasta el presente.

El Cuarteto de Nos es un grupo de rock uruguayo fundado en 1980. Han lanzado varios álbumes y han realizado numerosos conciertos en Uruguay y otros países de América Latina. A partir de 2004, el grupo experimentó un resurgimiento en popularidad y tuvo varios éxitos en las listas de popularidad. Han lanzado varios álbumes desde entonces y han realizado giras en América Latina y España. En 2018, hicieron una gira por Estados Unidos y Europa, y en 2020 lanzaron un nuevo álbum llamado "En la ciudad de la furia". El Cuarteto de Nos se ha mantenido como uno de los principales exponentes del rock uruguayo y sigue siendo muy popular en la región.

Aquí comienzan los problemas de precisión de ChatGPT. Para empezar, no hay registro de que El Cuarteto de Nos se haya fundado en 1980; su primer álbum fue lanzado en 1984, pero ninguno de sus integrantes recuerda con exactitud el año de fundación.

Por otro lado, tampoco hay constancia de una gira en 2018 en Estados Unidos (sí en Europa); y el grupo no lanzó ningún álbum, ni siquiera un sencillo o EP, en 2020. Además, "En la ciudad de la furia" no tiene nada que ver con El Cuarteto de Nos; es una canción del grupo argentino de rock Soda Stereo.

Si hablamos de sus capacidades creativas, le podemos pedir, por ejemplo, que escriba un poema sobre la vida y obra de Franz Kafka. El resultado es el siguiente:

La vida de Kafka fue un laberinto oscuro,
llena de incertidumbre y soledad,
sus escritos reflejaban su estado interior,
una mente en constante lucha.

En un mundo absurdo y sin sentido,
el escribió sobre la burocracia y el poder,
sobre la alienación y la lucha del individuo
temas que todavía resuenan hoy.

Sus historias son como espejos,
que reflejan nuestros miedos y nuestras dudas,
y nos hacen cuestionar nuestra propia existencia,
en un mundo cada vez más complejo.

Sus personajes son atrapados en una red,
de reglas y normas que no pueden entender,
luchando contra un sistema opresivo,
que los devora sin piedad.

A pesar de la oscuridad de sus escritos,
su legado sigue vivo y presente,
en cada palabra que escribió,
hay una verdad universal que trasciende el tiempo.

Así que recordemos a Franz Kafka,
como un maestro de la literatura,
que nos enseñó a mirar más allá de lo aparente,
y a cuestionar lo que creemos saber.

A pesar de que hay algunas palabras que no riman, el escrito es bastante bueno, y una clara demostración de las facultades literarias de la IA.

Pero quizá el punto más interesante sea compararlo con buscadores de internet: en concreto, Google y Bing. Recordemos que Bing es propiedad de Microsoft, que ya llegó a un acuerdo con OpenAI para integrar inteligencia artificial en éste y otros productos.

Por otra parte, en Google al parecer el impacto de ChatGPT ha sido fuerte, ya que, según rumores, Google está trabajando intensivamente en integrar su buscador con inteligencias artificiales; esto por el miedo de perder el monopolio con ChatGPT u otras alternativas con IA.

Lo primero que haremos será preguntarle a Google, Bing y ChatGPT sobre los detalles del fallecimiento de Diego Armando Maradona.

ChatGPT:

Diego Maradona murió el 25 de noviembre de 2020, a los 60 años de edad. Su muerte se debió a un paro cardiorrespiratorio en su domicilio en San Andrés, Buenos Aires, Argentina. Maradona fue considerado como uno de los mejores jugadores de fútbol de todos los tiempos, ganando la Copa del Mundo con Argentina en 1986 y jugando para varios equipos de clubes exitosos a lo largo de su carrera, incluyendo Napoli y Barcelona. Su muerte fue sentida en todo el mundo, con homenajes y condolencias de jugadores de fútbol, entrenadores, fanáticos y líderes políticos.

Google:

El 25 de noviembre de 2020, a la edad de 60 años, murió por la reagudización de una insuficiencia cardíaca crónica que derivó en un edema de pulmón, en su casa de Tigre, provincia de Buenos Aires, Argentina.

Bing:

La muerte de Diego Maradona, exfutbolista y entrenador argentino, se produjo el 25 de noviembre de 2020 en su residencia privada en Dique Luján, provincia de Buenos Aires, siendo el principal motivo de su deceso, según el informe preliminar de la autopsia, una insuficiencia cardíaca crónica reagudizada, con miocardiopatía dilatada, que desembocó en un edema pulmonar, lo que le produjo una muerte súbita mientras dormía.

Mientras que Google y Bing se limitan a colocar un fragmento del artículo "Muerte y funeral de Diego Maradona" de Wikipedia, dando únicamente detalles de la causa de su muerte (y, en el caso de Bing, con dialecto médico), ChatGPT dice la causa de su muerte, un resumen de su carrera y lo que implicó su fallecimiento.

LaTeX es un sistema de composición de textos, es decir, casi un archivo de código utilizado para crear documentos que presenten una alta calidad tipográfica, siendo muy utilizado para artículos y libros científicos que, por lo general, incluyen fórmulas y ecuaciones matemáticas.

Si preguntamos a Google, Bing y ChatGPT como insertar una ecuación simple (de primer grado) en LaTeX, las respuestas son:

ChatGPT:

Google:


Bing:


La diferencia es apreciable. Primero, por el formato, pues ChatGPT da la respuesta completa con resaltado de sintaxis; Google y Bing sólo usan negrita en las palabras destacadas. Segundo, ChatGPT ofrece dos métodos y recuerda incluir un componente necesario para la creación de la ecuación; Bing y Google sólo colocan un fragmento de una página web, sin utilizar formato ni dar el código.

Otro punto fuerte de ChatGPT es que recuerda las preguntas que le hacemos. Si, por ejemplo, le preguntamos "¿Qué sistema operativo lanzó Microsoft en 2001?", nos responderá que fue Windows XP; y si luego le preguntamos "¿Y en 2009?", entenderá que seguimos hablando de los sistemas operativos de Microsoft, y nos responderá que lanzó Windows 7. 

Perplexity AI: el poder de la IA con la función de Google.

Pero quizá la limitación más importante de ChatGPT sea que no está conectado a Internet, por lo que no tiene conocimiento de eventos posteriores a 2021. Si le preguntamos por un fallecimiento reciente, como el de Edson Arantes do Nascimiento "Pelé", su respuesta será la siguiente:

No tengo información actualizada sobre la muerte de Pelé ya que mi conocimiento está cortado en 2021. Sin embargo, puedo decirte que Pelé es considerado uno de los mejores futbolistas de todos los tiempos y es a menudo llamado el "Rey del Fútbol". Ganó tres Copas del Mundo con Brasil en 1958, 1962 y 1970. Durante su carrera, también tuvo éxito en el fútbol de clubes, jugando para Santos y Nueva York Cosmos. Sin embargo, como no tengo una fecha de muerte de Pelé, no puedo dar detalles al respecto.

Si bien se aprecia el detalle de dar algo de inormación sobre su carrera deportiva, no nos puede decir detalles sobre su muerte, ya que ocurrió en diciembre de 2022 y, tal y como nos indica, su conocimiento va hasta 2021.

Para solucionar ese problema ya han surgido buscadores de Internet potenciados por la inteligencia artificial. Uno de ellos es Perplexity AI, un buscador como Google y Bing que da sus respuestas potenciadas por IA.


A diferencia de ChatGPT, Perplexity cuenta con conexión a Internet, lo que permite que podamos "hablar" con ella de sucesos recientes. Si a ChatGPT le preguntamos "¿Cuál es la versión más reciente de Ubuntu?" nos responderá que es la versión 21.04 "Hirsute Hippo". Si, por el contrario, le preguntamos a Perplexity cuál es la versión más reciente de Ubuntu, nos dirá que es la 22.10. La respuesta de Perplexity es la correcta, pues la versión 22.10 fue lanzada en octubre de 2022, mientras que la versión 21.04 fue lanzada en abril de 2021.

Al igual que ChatGPT, Perplexity puede ser utilizada en diferentes idiomas, a pesar de que su interfaz está en inglés, y recuerda lo que le preguntamos. Por ejemplo, le podemos preguntar "¿Cuál es el procesador más potente de Intel?" y luego "¿Y el de AMD?", y entenderá que estamos hablando de los procesadores más rápidos de ambas compañías.

Una ventaja que tiene Perplexity es que nos indica las fuentes de información, con lo que podemos verificar si la información es correcta, verificando qué tan confiables son los sitios web de donde extrae su información.

En la imagen de arriba, por ejemplo, podemos ver que Perplexity tomó su información de sitios web "informados", como el sitio web oficial de Ubuntu, el blog en español Muy Linux y el sitio web oficial del fabricante de PC y hardware Dell.

Sin embargo, si le preguntamos por programación, ChatGPT es un claro vencedor. Veamos una comparación entre la misma pregunta sobre programación en ChatGPT y Perplexity.

Perplexity:


ChatGPT:

Perplexity es un buscador, y se nota; ya comete los mismos pecados que Google y Bing frente a ChatGPT.

Capacidades gráficas de la inteligencia artificial.

ChatGPT y Perplexity son IA que permiten tener conversaciones naturales. Pero también existen inteligencias artificiales que son capaces de generar imágenes desde una frase o incluso utilizando como base únicamente un par de palabras clave.

En esta categoría mencionaremos a tres de ellas: DALL-E 2, Stable Diffusion y Craiyon (o DALL-E mini). La primera, DALL-E 2, es otro producto de OpenAI, al igual que ChatGPT.

Para comparar las cuatro inteligencias artificiales, les vamos a pedir dos cosas. La primera, que nos muestren cómo sería Microsoft Windows si utilizase un entorno de escritorio de GNU / Linux, como GNOME. La segunda, que generen la imagen de una persona de color azul ("el gato que está, triste y azul...") y verde ("estoy verde... no me dejan salir"). 

Evidentemente, procesar imágenes es más complicado que generar textos; por ello, cada una tomó entre 1 y 2 minutos para entregar el resultado final. Todas tardaron casi lo mismo.

Lo primero es la persona azul y verde. Los resultados son los siguientes:

Stable Diffusion 2.1:


 DALL-E 2:


 Craiyon:


Teniendo en cuenta que lo que les pedimos fue, textualmente, "A photo of a blue and green person" (la
fotografía de una persona azul y verde), creo que el que más se apega a lo que le pedimos fue DALL-E.

Respecto al pedido de Windows con un entorno de escritorio de Linux, el entorno específico fue GNOME. Los resultados:

Stable Diffusion 2.1:


DALL-E 2:


Craiyon:

Si bien las imágenes son un poco más "abstractas" en esta ocasión, creo que la imagen de la parte superior izquierda de Craiyon es la que más se acerca a Windows y a GNOME. El pedido explícito fue "A screenshot of Microsoft Windows using GNOME 40" ("Una captura de pantalla de Microsoft Windows utilizando GNOME 40").

Los resultados, sobre todo de DALL-E 2 en la imagen de la persona verde y azul, pueden llegar a ser, incluso, inquietantes. La IA puede llegar a un nivel de detalle que hace confundir entre qué imágenes son verdaderas y qué imágenes son generadas artificialmente. Si le pedimos, por ejemplo, una fotografía de una presentación en vivo del grupo mexicano Caifanes a DALL-E 2, el resultado es el siguiente.


Sólo pequeños detalles, como la apariencia borrosa de los músicos en el escenario, hacen que se pueda más o menos discernir que se trata de una imagen generada por IA.

Conclusiones (o quizá no).

La inteligencia artificial es un tema amplísimo, tanto por el avance tecnológico que supone, como por los dilemas éticos que conlleva. Ya se ha tratado en obras literarias, como Yo robot de Isaac Asimov, casos en los que es imposible diferenciar una máquina de una persona. En este caso, todavía no es tan así, pero sí puede llegar a serlo, dado lo difícil que puede llegar a ser saber si una obra es creada por inteligencia artificial o por inteligencia natural.

¿Puede la IA sustituir a la mente humana? Quizá, como ya lo han dicho muchos, estamos en un proceso de humanización de la tecnología... y deshumanización de la humanidad. Quizá llege un día en el que sean más inteligentes las máquinas que nosotros. ¿Y qué pasará ese día?

Por el momento, podemos decir que la inteligencia artificial es sorprendente; y, todavía lo es la mente humana, de poder replicar su estructura y procesos hacia objetos inanimados. Mientras se maneje bien, y todas las implicaciones que tiene tanto por su utilización como por su desarrollo (el caso del entrenamiento de ChatGPT con trabajadores de Keina, Uganda y la India), es muy probable que quizá no tenga nada de malo. Tampoco la vamos a satanizar.

Comentarios

  1. WOW! gracias no tenía conocimiento de muchas cosas! muy interesante.

    ResponderBorrar
  2. Buena entrada, bien documentada. Habría que hacer seguimiento a los avances y a las implicaciones éticas.

    ResponderBorrar
  3. Muy buen artículo, si bien tenía conocimiento de algunas cosas, bastante superficiales, leyendo lo que desarrollas en el artículo y lo buen documentado que estás me sirvió en gran medida para “empaparme”más en el tema, espero pronto más artículos de este tipo para poder seguir aprendiendo.

    ResponderBorrar

Publicar un comentario