La startup de inteligencia artificial Galileo Technologies clasifica a Claude 3.5 Sonnet, Gemini de Google y Qwen2-72B-Instruct de Alibaba en los primeros puestos del índice de referencia Hallucination Index.

La empresa emergente de inteligencia artificial Galileo Technologies ha clasificado en un lugar destacado los modelos de lenguaje grandes, de código abierto y de rango medio en una nueva prueba comparativa, el Índice de Alucinaciones. El punto de referencia, que evalúa 22 modelos líderes de IA generativa, midió su precisión en tres colecciones de tareas. Claude 3.5 Sonnet de Anthropic encabezó la clasificación, mientras que Gemini 1.5 Flash de Google obtuvo el mejor desempeño en cuanto a costo. El Qwen2-72B-Instruct de Alibaba fue el modelo de código abierto de mayor rendimiento.

July 29, 2024
3 Artículos