Google DeepMind lanza Gemma 4 12B, ejecutable localmente en portátiles con 16 GB de RAM

ref · 4 Junio, 2026 03:24

El 3 de junio, Google DeepMind lanzó el modelo de pesos abiertos Gemma 4 12B, con aproximadamente 12 mil millones de parámetros, bajo la licencia Apache 2.0. Solo requiere un mínimo de 16 GB de VRAM o memoria unificada para ejecutarse localmente en una computadora portátil común. Su mayor atractivo es la arquitectura “unificada” sin codificador: las entradas visuales y de audio se inyectan directamente en el tronco del modelo de lenguaje, sin necesidad de un codificador multimodal independiente, convirtiéndose en el primer modelo mediano de Google compatible con entrada de audio nativa. Google afirma que su rendimiento de referencia se acerca al del modelo MoE más grande de 26B, mientras que su uso de memoria es menos de la mitad.

Al momento del anuncio, la serie Gemma 4 ya había superado los 150 millones de descargas. Los pesos del modelo ya están disponibles en Hugging Face y Kaggle, con soporte nativo para frameworks de inferencia populares como vLLM, SGLang, MLX y llama.cpp, y también se pueden ejecutar con un solo clic a través de LM Studio y Ollama. Google también ha lanzado el repositorio de habilidades Gemma Skills como código abierto, que proporciona un conjunto de herramientas estandarizado para agentes de IA basados en Gemma. Además, la aplicación macOS de Google AI Edge Gallery se lanzó el mismo día, permitiendo a los usuarios experimentar flujos de trabajo de agentes multimodales localmente.

Google The Keyword

Tema	Respuestas	Vistas
Gemma 4 tops 120 million downloads since launch as offline demo shows on-device vision and math reasoning on Pixel with no connectivity 常规 ai , google , gemma-4 , open-source , on-device-ai	1	24 Mayo 2026
Gemini Spark 正式向美国所有 AI Ultra 订阅者开放，月费 100 美元起，可后台持续执行跨应用任务常规 google , gemini , spark	1	31 Mayo 2026
MiniMax M3 发布：MSA架构实现1M超长上下文，Coding与多模态能力进入国际前沿常规 ai , coding , 大模型 , minimax	1	1 Junio 2026
Nous Research launches Hermes Desktop in public preview, native app for macOS, Windows, and Linux 常规 ai , open-source , agent , nous-research , hermes	1	3 Junio 2026
三星率先向全球客户交付 HBM4E 样品，引脚速度达 16Gbps，容量 48GB，较上代提升逾 20% 常规半导体 , 三星 , hbm4e	2	29 Mayo 2026

Google DeepMind lanza Gemma 4 12B, ejecutable localmente en portátiles con 16 GB de RAM

Temas relacionados