أعلنت Google DeepMind في 3 يونيو عن إصدار نموذج Gemma 4 12B مفتوح الأوزان، بمعاملات تبلغ حوالي 12 مليارًا، وبموجب ترخيص Apache 2.0. تحتاج تشغيله محليًا على حاسوب محمول عادي إلى 16 جيجابايت على الأقل من ذاكرة الفيديو أو الذاكرة الموحدة. أبرز ما يميز هذا النموذج هو معمارية “موحدة” بلا مُرمِّز (encoder-less)، حيث تُغذى المدخلات البصرية والصوتية مباشرةً إلى العمود الرئيسي لنموذج اللغة دون الحاجة إلى مُرمِّز متعدد الوسائط منفصل، مما يجعله أول نموذج متوسط من Google يدعم الإدخال الصوتي الأصلي. وتذكر Google أن أداءه الأساسي يقترب من أداء نماذج MoE الأكبر بحجم 26B، بينما يستهلك أقل من نصف مساحة الذاكرة.
مع هذا الإصدار، تجاوزت تحميلات سلسلة Gemma 4 حاجز 150 مليون عملية تنزيل. أصبحت أوزان النموذج متاحة على Hugging Face وKaggle، وتدعم بشكل أصلي أطر الاستدلال الرئيسية مثل vLLM وSGLang وMLX وllama.cpp، كما يمكن تشغيلها بنقرة واحدة عبر LM Studio وOllama. بالتزامن، قامت Google بفتح مصدر مستودع مهارات Gemma (Gemma Skills)، وهو يوفر مجموعة أدوات موحدة لوكلاء الذكاء الاصطناعي المبنية على أساس Gemma. بالإضافة إلى ذلك، تم إطلاق تطبيق Google AI Edge على نظام macOS في نفس اليوم، ليتمكن المستخدمون من تجربة سير عمل وكلاء متعدد الوسائط محليًا بشكل مباشر.