Harvard publica masivos conjuntos de datos de libros de dominio público para entrenamiento de IA, financiados por gigantes tecnológicos.
La Universidad de Harvard, con fondos de Microsoft y OpenAI, ha publicado un conjunto de datos de casi un millón de libros de dominio público para la formación de modelos de IA. La Iniciativa de Datos Institucionales tiene como objetivo proporcionar a los desarrolladores más pequeños acceso a datos de alta calidad, normalmente disponibles sólo para gigantes tecnológicos, nivelando así el campo de juego en el desarrollo de la IA. El conjunto de datos incluye libros del proyecto Google Books y puede ser utilizado por cualquier persona para entrenar IA, desde aficionados a corporaciones.
Hace 3 meses
9 Artículos