jueves. 02.02.2023
Listas musicales

Una IA dibuja diferentes animales como si fuesen estrellas del rap

La Inteligencia Artificial ha cambiado mucho en los últimos años, sobre todo la relacionada con el lenguaje natural. Para los que no tenéis relación con este tipo de términos, el lenguaje natural es todo aquel lenguaje que ha sido creado para la comunicación humana (inglés, español, lenguaje de signos, etc). En los últimos años se ha intentado que la inteligencia artificial logre comprender y procesar este tipo de lenguajes. 

Por otra parte, la Inteligencia Artificial dedicada al procesamiento de imágenes lleva mejorando de manera exponencial desde hace algo más de tiempo. Durante el año pasado hemos visto como varios modelos como Midjourney, Stable Diffusion o Dall-E combinaban ambas casuísticas, es decir, se puede introducir un texto en lenguaje natural y la IA dibuja una interpretación de lo que ha entendido.

Breve historia de los modelos de inteligencia artificial

Los modelos de inteligencia artificial se remontan a décadas, sobre todo los basados en modelos matemáticos como la regresión lineal, K-Neigbours o Naive Bayes. Estos modelos se han utilizado históricamente para varias herramientas, por ejemplo, en el filtrado de spam. Las redes neuronales, también existían teóricamente, pero tenían bastante menos calado.

Todo esto cambio en 2012, cuando en una competición se propuso como ejercicio la clasificación de ImageNet. Si no lo sabéis, ImageNet es un conjunto de datos compuesto por imágenes diferentes, la competición trataba de encontrar la mejor estrategia para la clasificación de estas imágenes. Ganó un algoritmo compuesto por redes neuronales, a partir de ahí, inicio el boom del deep learning, es decir, las Inteligencias artificiales compuestas por redes neuronales.

Sobre todo empezó a haber diferentes modelos para clasificar o agrupar imágenes, utilizando sobre todo redes neuronales convolucionales. Sin embargo, años más tarde surgiría una nueva revolución en los modelos de inteligencia artificial, los centrados en aplicar estrategias a texto. Aquí es donde surgen grandes modelos pre entrenados como Word2Vec (desarrollado por Google), GloVe (desarrollado por Oxford), FastText (desarrollado por Facebook) y BERT (desarrollado por Google).

Este tipo de modelos fueron aplicados para un montón de herramientas que utilizamos hoy en día, como gestores de sugerencia, reconocimiento de entidades, bots de preguntas y respuestas, generación de texto y multitud de tareas más. Uno de los hitos más sonados en los últimos años ha sido ChatGPT creado por la empresa OpenAI.

Modelos mixtos y controversia

En los años más recientes se han creado modelos mixtos, como decíamos al comienzo, son modelos que buscan comprender el lenguaje natural basado en texto y además poder "dibujar" o recrear imágenes basándonos en el texto introducido (el prompt). Estos modelos han incrementado su calidad de manera excepcional en el último año, creando imágenes ultra realistas y permitiendo un montón de parámetros en sus prompts.

Sin embargo, también han generado su parte de controversia. En parte, porque para que estos modelos puedan ser entrenados requieren un conocimiento base de artistas. Explicándolo con un ejemplo, si tú quieres que te dibujen un gato comiendo una pizza en estilo cubista, el modelo ha tenido que ser entrenados con diferentes imágenes del cubismo para reconocer este token. 

Aquí es donde llega la controversia, ¿se ha pedido permiso a todos esos artistas? Bueno, aquí es donde se genera una duda razonable, si tú como persona vas a un museo y ves una exposición y pintas un cuadro cubista, también te has inspirado en ellos, pero tampoco has tenido que pedir permiso a nadie. Aquí podríamos llegar un debate bastante filosófico que sería si las máquinas pueden inspirarse a la hora de entrenar.

También por supuesto se ha hablado de la eliminación del trabajo humano, aquí tendríamos que poner de ejemplo la revista Cosmopolitan que en uno de sus números utilizo una portada creada completamente por una inteligencia artificial. De todas maneras, esto a título de opinión personal, nos parece que todavía este tipo de modelos están demasiado en pañales para poder quitarle el trabajo a nadie, pues aunque han mejorado muchísimo en estos últimos años, todavía les queda mucho por pulir.

Eso sí, para poder dibujar unos animales vestidos de raperos y pasar un buen rato, ya están más que suficientemente dotadas. Esperemos que disfrutéis de este artículo y si es así haremos alguno más relacionado con las IA.

Una IA dibuja diferentes animales como si fuesen estrellas del rap