¡Aprende idiomas de forma natural con contenido fresco y auténtico!

Temas populares

Explorar por región

La startup china de inteligencia artificial DeepSeek introduce un nuevo método para hacer que los modelos grandes sean más eficientes, reduciendo los costos e impulsando la escalabilidad. Chinese AI startup DeepSeek introduces new method to make large models more efficient, reducing costs and boosting scalability.

flag DeepSeek, una startup china de IA, ha presentado un nuevo método de entrenamiento llamado Manifold-Constrained Hyper-Connections, diseñado para hacer que los grandes modelos de IA sean más eficientes y escalables mientras reducen los costos computacionales y de energía. flag DeepSeek, a Chinese AI startup, has unveiled a new training method called Manifold-Constrained Hyper-Connections, designed to make large AI models more efficient and scalable while reducing computational and energy costs. flag La técnica, detallada en un artículo co-escrito por el fundador Liang Wenfeng y publicado en arXiv, aborda la inestabilidad del entrenamiento y los problemas de memoria en modelos anteriores, lo que permite un entrenamiento estable entre 3 mil millones y 27 mil millones de sistemas de parámetros con un mínimo de computación adicional. flag The technique, detailed in a paper co-authored by founder Liang Wenfeng and published on arXiv, addresses training instability and memory issues in prior models, enabling stable training across 3 billion to 27 billion parameter systems with minimal added compute. flag Basándose en el trabajo anterior de ByteDance, el enfoque refleja el impulso de China para la innovación de IA a pesar de las restricciones de semiconductores de Estados Unidos. flag Building on ByteDance’s earlier work, the approach reflects China’s push for AI innovation despite U.S. semiconductor restrictions. flag El lanzamiento alimenta la anticipación para el próximo modelo importante de DeepSeek, posiblemente R2, esperado en torno al Festival de Primavera en febrero. flag The release fuels anticipation for DeepSeek’s next major model, possibly R2, expected around the Spring Festival in February.