Apple lanza el modelo MGIE de edición de imágenes de código abierto impulsado por IA con instrucciones en lenguaje natural, en colaboración con investigadores de la UC.
Apple ha lanzado un nuevo modelo de edición de imágenes con IA, MGIE, en colaboración con investigadores de la Universidad de California. MGIE, que significa edición de imágenes guiada por MLLM, utiliza modelos de lenguaje grande multimodal (MLLM) y permite a los usuarios editar imágenes basándose en instrucciones en lenguaje natural. El modelo se presentó en un artículo en la Conferencia Internacional sobre Representaciones del Aprendizaje 2024, mostrando su capacidad para mejorar las métricas automáticas y la evaluación humana mientras se mantiene la eficiencia de la inferencia competitiva.
February 07, 2024
4 Artículos