Omar Sanseviero, da Google DeepMind, anunciou em 24 de maio que o Gemma 4 ultrapassou 120 milhões de downloads desde seu lançamento, em 2 de abril, sob a licença Apache 2.0. Ele descreveu a tendência de inteligência artificial para dispositivos locais como algo “incrível”. Esse número contribui para o total da família Gemma, que já soma mais de 400 milhões de downloads em todas as suas versões, além de mais de 100.000 variantes criadas pela comunidade no Hugging Face. O Gemma 4 foi lançado em quatro tamanhos: E2B, E4B, uma versão Mixture-of-Experts com 26 bilhões de parâmetros e um modelo denso com 31 bilhões de parâmetros. As duas menores variantes foram desenvolvidas em conjunto com a Qualcomm e a MediaTek para permitir inferência eficiente em dispositivos locais, funcionando com menos de 1,5 GB de memória após quantização de 4 bits.
Esse marco foi celebrado com uma demonstração prática realizada por engenheiros da Google: um aplicativo experimental baseado no Gemma 4 foi levado a uma região remota sem sinal de celular ou Wi-Fi, onde testaram compreensão visual offline, raciocínio matemático por meio de escrita manual e chamada de ferramentas em dispositivos Pixel equipados com protótipos de óculos de realidade aumentada — tudo sem precisar de conexão com servidores. A Google concebeu os modelos E2B e E4B como base para o Gemini Nano 4, a próxima geração de modelos locais para todo o sistema Android, prevista para ser integrada a dispositivos topo de linha ainda este ano; atualmente, o Gemini Nano já está presente em mais de 140 milhões de aparelhos Android. Com sua arquitetura multimodal, capacidade nativa de chamada de funções e operação offline, o Gemma 4 posiciona-se como uma alternativa direta à plataforma de inteligência local da Apple.