Boletin del Día
Mundial News Tecnología

DALL-E Mini es la máquina de memes de IA favorita de Internet

 Hugging Face , una empresa que aloja proyectos de inteligencia artificial de código abierto , vio cómo se disparaba el tráfico hacia una herramienta de generación de imágenes de IA llamada DALL-E Mini .

La aplicación aparentemente simple, que genera nueve imágenes en respuesta a cualquier mensaje de texto escrito, fue lanzada hace casi un año por un desarrollador independiente. Pero después de algunas mejoras recientes y algunos tweets virales, su capacidad para esbozar crudamente todo tipo de visiones surrealistas, hilarantes e incluso de pesadilla de repente se convirtió en un meme mágico. Contempla sus interpretaciones de ” Thanos buscando a su madre en Walmart”, ” chicos borrachos sin camisa deambulando por Mordor”, ” imágenes de cámaras de circuito cerrado de televisión de Darth Vader bailando breakdance ” y ” un hámster Godzilla con sombrero atacando Tokio “.

A medida que más personas creaban y compartían imágenes de DALL-E Mini en Twitter y Reddit , y llegaban más usuarios nuevos, Hugging Face vio cómo sus servidores estaban abrumados por el tráfico. “Nuestros ingenieros no durmieron la primera noche”, dice Clément Delangue, director ejecutivo de Hugging Face, en una videollamada desde su casa en Miami. “Es realmente difícil servir estos modelos a escala; Tuvieron que arreglar todo”. En las últimas semanas, DALL-E Mini ha estado entregando alrededor de 50 000 imágenes al día.

Imágenes generadas por IA de demogorgon rápido en el DMV

El momento viral de DALL-E Mini no solo anuncia una nueva forma de crear memes. También proporciona una visión preliminar de lo que puede suceder cuando las herramientas de IA que crean imágenes por encargo estén ampliamente disponibles, y un recordatorio de las incertidumbres sobre su posible impacto. Los algoritmos que generan fotografías y obras de arte personalizadas pueden transformar el arte y ayudar a las empresas con el marketing, pero también pueden tener el poder de manipular y engañar. Una advertencia en la página web de DALL-E Mini advierte que puede “reforzar o exacerbar los sesgos sociales” o “generar imágenes que contienen estereotipos contra los grupos minoritarios”.

DALL-E Mini se inspiró en una herramienta de creación de imágenes de IA más potente llamada DALL-E (una combinación de Salvador Dalí y WALL-E), revelada por la empresa de investigación de IA OpenAI en enero de 2021. DALL-E es más potente pero no lo es. abiertamente disponible, debido a las preocupaciones de que será mal utilizado.

Se ha vuelto común que los avances en la investigación de IA se reproduzcan rápidamente en otros lugares, a menudo en cuestión de meses, y DALL-E no fue una excepción. Boris Dayma , un consultor de aprendizaje automático con sede en Houston, Texas, dice que estaba fascinado con el trabajo de investigación original de DALL-E. Aunque OpenAI no lanzó ningún código, pudo armar la primera versión de DALL-E Mini en un hackathon organizado por Hugging Face y Google en julio de 2021. La primera versión produjo imágenes de baja calidad que a menudo eran difíciles de reconocer. pero Dayma ha seguido mejorando desde entonces. La semana pasada cambió el nombre de su proyecto a Craiyon., luego de que OpenAI le solicitara que cambiara el nombre para evitar confusiones con el proyecto DALL-E original. El nuevo sitio muestra anuncios y Dayma también está planeando una versión premium de su generador de imágenes.

Las imágenes DALL-E Mini tienen un aspecto claramente alienígena. Los objetos a menudo están distorsionados y manchados, y las personas aparecen con caras o partes del cuerpo faltantes o destrozadas. Pero por lo general es posible reconocer lo que está tratando de representar, y comparar la salida a veces desquiciada de la IA con el indicador original suele ser divertido.

El modelo de IA detrás de DALL-E Mini crea imágenes basándose en patrones estadísticos que obtuvo al analizar alrededor de 30 millones de imágenes etiquetadas para extraer conexiones entre palabras y píxeles. Dayma compiló esos datos de entrenamiento de varias colecciones de imágenes públicas recopiladas de la web, incluida una publicada por OpenAI. El sistema puede cometer errores en parte porque carece de una comprensión real de cómo deberían comportarse los objetos en el mundo físico. Los pequeños fragmentos de texto suelen ser ambiguos, y los modelos de IA no captan su significado de la forma en que lo hacen las personas. Aún así, Dayma se ha sorprendido por lo que la gente ha sacado de su creación en las últimas semanas. “Mi propuesta más creativa fue la ‘ Torre Eiffel en la luna ‘”, dice. “Ahora la gente hace locuras, y funciona”.

Stevenson dice que se ha topado con restricciones programadas por OpenAI para evitar la creación de cierto contenido. “A veces me olvido de que hay barreras de seguridad, y tengo que recordarlo con advertencias de la aplicación” que indican que su acceso podría ser revocado. Pero él no ve esto como una limitación de su creatividad porque DALL-E 2 es todavía un proyecto de investigación.

Delangue de Hugging Face dice que es bueno que las creaciones de DALL-E Mini sean mucho más crudas que las hechas con DALL-E 2 porque sus fallas dejan en claro que las imágenes no son reales y fueron generadas por IA. Argumenta que esto ha permitido que DALL-E Mini ayude a las personas a aprender de primera mano sobre las capacidades emergentes de manipulación de imágenes de la IA, que en su mayoría se han mantenido fuera del alcance del público. “El aprendizaje automático se está convirtiendo en la nueva forma predeterminada de desarrollar tecnología, pero existe esta desconexión con las empresas que desarrollan estas herramientas a puerta cerrada”, dice.

El flujo constante de contenido de DALL-E Mini también ayudó a la empresa a solucionar problemas técnicos, dice Delangue, con usuarios que señalan problemas como resultados sexualmente explícitos o sesgos en la salida. Por ejemplo, es más probable que un sistema entrenado con imágenes de la web muestre un género sobre otro en roles particulares, lo que refleja prejuicios sociales profundamente arraigados. Cuando se le pide a DALL-E Mini que represente un “médico”, mostrará figuras que parecen hombres; si se le pide que dibuje una “enfermera”, las imágenes parecen mostrar mujeres.

Sacha Luccioni , científica investigadora que trabaja en ética de IA en Hugging Face, dice que la afluencia de memes DALL-E Mini la hizo darse cuenta de la importancia de desarrollar herramientas capaces de detectar o medir el sesgo social en estos nuevos tipos de modelos de IA. “Definitivamente veo formas en las que pueden ser tanto dañinas como útiles”, dice ella.

Puede volverse cada vez más difícil controlar algunos de esos daños. Dayma, la creadora de DALL-E Mini, admite que es solo cuestión de tiempo antes de que herramientas como la suya, que están más disponibles, también sean capaces de crear imágenes más fotorrealistas. Pero cree que los memes creados por IA que han circulado en las últimas semanas pueden habernos ayudado a prepararnos para esa eventualidad. “Ya sabes, está llegando”, dice Dayma. “Pero espero que DALL-E Mini haga que las personas se den cuenta de que cuando ven una imagen deben saber que no es necesariamente cierta”.

Publicaciones Relacionadas

Estos son los avances científicos más importantes de 2021 según la revista ‘Science’

Boletin del día

La Crew Dragon de SpaceX tendrá una cúpula de cristal para que los turistas observen el espacio

Boletin del día

Convirtiendo la ropa de calle en paneles solares

Boletin del día