Ciencia y Tecnología Internacional

OpenAI anuncia nuevo modelo de inteligencia artificial GPT-4o

–Un nuevo modelo de inteligencia artificial generativa llamado GPT-4o con la capacidad de manejar texto, voz y video, anunció OpenAI desde San Francisco, EE.UU.

La directora de tecnología de OpenAI, Mira Murati, señaló que GPT-4o proporciona inteligencia de «nivel GPT-4», pero mejora las capacidades de GPT-4 en múltiples modalidades y medios.

La «o» hace referencia a «omni», en referencia a la capacidad del modelo para manejar texto, voz y video. Está previsto que sea desplegado de forma iterativa en los productos de la compañía en el transcurso de las próximas semanas, indicó OpenAI.

«GPT-4o razona a través de voz, texto y visión», dijo Murati. «Y esto es increíblemente importante porque estamos apuntando al futuro de la interacción entre nosotros y las máquinas».

GPT-4 Turbo, el anterior modelo puntero de OpenAI, fue capacitado con una combinación de imágenes y texto y puede analizar imágenes y texto, e inclusive describir el contenido de los imágenes. Pero GPT-4o añade la voz a la mezcla, con lo que mejora en gran medida la experiencia del ChatGPT impulsado por inteligencia artificial de OpenAI con voces en «un rango de diferentes estilos emotivos».

GPT-4o también actualiza las capacidades de visión de ChatGPT. Dada una fotografía, ChatGPT puede responder rápidamente preguntas relacionadas, de acuerdo con la presentación.

«Sabemos que estos modelos se están volviendo cada vez más complejos, pero deseamos que la experiencia de interacción en realidad se vuelva más natural y más fácil, y que no se concentren en la interfaz de usuario (UI) en absoluto, sino únicamente en la colaboración con ChatGPT», dijo Murati.

«En el último par de años, nos hemos estado concentrando en mejorar la inteligencia de estos modelos… pero esta es la primera vez que realmente damos un enorme paso hacia delante respecto de la facilidad de uso», añadió.

GPT-4o también es más multilingüe con un desempeño mejorado en alrededor de 50 idiomas, indicó la compañía.

La compañía planea lanzar primero apoyo para las nuevas capacidades de audio de GPT-4o para «un pequeño grupo de socios confiables» en las próximas semanas. (Información Agencia Xinhua).