OpenAI lanza generación de imágenes realistas en ChatGPT con GPT-4o

GPT-4o permite generar imágenes realistas dentro de ChatGPT, mejorando la precisión y el control creativo sin necesidad de usar DALL-E.

OpenAI lanza generación de imágenes realistas en ChatGPT con GPT-4o

OpenAI ha dado un paso más en la evolución de sus modelos de inteligencia artificial con la introducción de una nueva función en ChatGPT: la generación de imágenes realistas con GPT-4o. Esta actualización permite a los usuarios crear imágenes detalladas directamente desde la plataforma sin necesidad de recurrir a herramientas externas como DALL-E.

ChatGPT ahora puede crear imágenes realistas gracias al nuevo modelo de OpenAI GPT-4o

Imágenes realistas con ChatGPT

GPT-4o ha sido diseñado para ofrecer una generación de imágenes más potente y precisa. Una de sus principales mejoras es la capacidad de interpretar indicaciones complejas de manera más efectiva, asegurando que los atributos y características de los objetos se representen correctamente.

En versiones anteriores, la IA tenía dificultades para mantener la coherencia en imágenes con múltiples elementos. Ahora, GPT-4o puede representar hasta 20 objetos distintos en una misma imagen, superando ampliamente el límite de 5 a 8 objetos de los modelos anteriores. Además, ha mejorado en la renderización de texto dentro de las imágenes, lo que permite generar palabras legibles, algo que históricamente ha sido un reto para la IA.

Generación de imágenes por conversaciones iterativas

Otra novedad clave de GPT-4o es su capacidad de generación multi-turno. Esto significa que los usuarios pueden interactuar con el modelo en varias etapas para refinar las imágenes generadas. Por ejemplo, si alguien está diseñando un personaje o un logotipo, puede solicitar ajustes sucesivos y el modelo mantendrá la coherencia en cada iteración.

Este enfoque es particularmente útil para diseñadores y creadores de contenido, ya que permite afinar detalles sin necesidad de empezar desde cero en cada intento.

Cómo funciona la generación de imágenes realistas en GPT-4o

GPT-4o emplea un enfoque autoregresivo para la creación de imágenes, lo que lo diferencia de modelos de difusión como DALL-E. En lugar de generar la imagen completa de una sola vez, lo hace de manera secuencial, similar a la forma en que ChatGPT genera texto.

Gracias a su entrenamiento en conjuntos de datos de texto e imagen combinados, el modelo entiende mejor la relación entre los elementos dentro de una imagen. Esta capacidad no solo le permite crear imágenes desde cero, sino también transformar y modificar imágenes subidas por los usuarios.

Aplicaciones y casos de uso

OpenAI ha demostrado varias aplicaciones de esta nueva función, incluyendo:

  • Creación de logotipos y pegatinas con fondo transparente
  • Diseño de personajes y escenarios para videojuegos
  • Generación de ilustraciones científicas y visualizaciones con etiquetas precisas
  • Producción de infografías y anuncios para redes sociales

Aunque la precisión del texto en las imágenes ha mejorado, OpenAI advierte que aún pueden aparecer errores en algunos caracteres.

Logo creado con ChatGPT

Cómo acceder a la generación de imágenes realistas en ChatGPT

La función de generación de imágenes realistas de GPT-4o ya está disponible para los usuarios de ChatGPT Plus, Pro y Team. Aquellos que usen la versión gratuita también podrán probarla, aunque con un límite diario similar a los topes anteriores de DALL-E.

OpenAI no ha especificado la cantidad exacta de generaciones permitidas, pero ha señalado que estos límites podrían variar según la demanda.

Medidas de seguridad implementadas

Imágenes realistas con GPT-4o en ChatGPT

Como con cualquier herramienta de inteligencia artificial, OpenAI ha implementado restricciones para evitar el uso indebido de la generación de imágenes. El sistema bloquea solicitudes de contenido inapropiado, como deepfakes sexuales, imágenes violentas o material relacionado con abuso infantil.

Además, todas las imágenes generadas por GPT-4o incluyen metadatos C2PA, que permiten identificar que fueron creadas mediante inteligencia artificial.

Con estas mejoras, OpenAI sigue avanzando en la integración de IA generativa dentro de ChatGPT, ofreciendo nuevas posibilidades para la creación de contenido visual sin necesidad de herramientas adicionales.