Los investigadores de Apple encuentran que los LLM dependen más de la concordancia de patrones que del razonamiento lógico, luchando con preguntas complejas.
Los investigadores de Apple han expresado su preocupación por las capacidades de razonamiento matemático de los grandes modelos lingüísticos (LLM), encontrando que sus respuestas varían significativamente en función de ligeros cambios de entrada. Esto sugiere que los LLM se basan más en la comparación de patrones probabilistas que en el verdadero razonamiento lógico. Para evaluar mejor estas capacidades, introdujeron el punto de referencia GSM-Symbolic, revelando que los LLM luchan con preguntas complejas, destacando sus limitaciones en el razonamiento confiable.
October 11, 2024
8 Artículos