米Google DeepMindが開発したオープンソースAIモデル「Gemma(ジェマ) 4」が、リリースからわずか1週間で200万ダウンロードを突破した。前世代の「Gemma 3」が過去1年間で積み上げた670万ダウンロードと比較しても、その立ち上がりの速さは際立っている。トークン価格高騰の傾向が続く中、無料モデルをローカルマシンにインストールすることでトークン出費を抑えたいユーザーに歓迎されているようだ。一方オープンソースでリリースしたのは、コーディングエージェントを売り上げを伸ばす競合AI企業へ打撃を与えようという戦略なのかもしれない。
4サイズ展開、全モデルがマルチモーダル対応Gemma 4は、画像・テキスト・音声の入力に対応したマルチモーダルモデルとして設計されており、E2B(実効2.3B)、E4B(実効4.5B)、31B(密モデル)、26B A4B(Mixture-of-Experts)の4サイズで提供される。すべてのモデルが画像と動画の入力をサポートし、小型のE2B・E4Bでは音声入力にも対応する。コンテキストウィンドウは小型モデルで128K、大型モデルで256Kトークンと大幅に拡張された。ライセンスはApache 2.0で完全オープンであり、商業利用も含めた自由な活用が可能だ。
技術的革新
「ローカル推論」を意識した設計アーキテクチャ面では複数の改良が施されている。ローカルスライディングウィンドウとグローバルフルコンテキストのアテンション層を交互に組み合わせた設計、各デコーダ層に残差信号を注入する「Per-Layer Embeddings(PLE)」、KVキャッシュを再利用して計算効率を高める「Shared KV Cache」などが特徴だ。また、ビジョンエンコーダはアスペクト比を可変に対応し、70〜1120トークンの複数予算でエンコードが可能となっている。Hugging FaceによるLMArenaスコア(テキストのみ)では、31Bモデルが推定1452点、26B MoEモデルが4Bの実効パラメータで1441点を記録しており、テキスト生成とマルチモーダル処理の双方で高水準の性能を示している。
スマートフォンでリアルタイム動作。「エッジAI」の新局面
特に注目を集めたのが、コンシューマー向けデバイスでの高速動作だ。開発者らはiPhone 17 ProでE2BモデルをMLX経由で毎秒約40トークンという速度で動作させることに成功。また「PokeClaw」と呼ばれるプロトタイプアプリは、Gemma 4を用いてAndroidスマートフォンをクラウド不要・完全オンデバイスで自律制御することを実現し、わずか2日で開発されたとして話題を呼んだ。Red Hat AIが量子化版(NVFP4・FP8ブロック形式)のGemma 4 31Bを公開するなど、企業向けの活用も急速に進んでいる。
エコシステムの広がりがカギ
Gemma 4の成功の背景には、リリース時点から広範なエコシステムとの連携が整っていたことがある。Hugging Face、vLLM、llama.cpp、Ollama、NVIDIA、Unsloth、SGLang、Docker、Cloudflareなど多数のプラットフォームが同時にサポートを表明。OllamaはNVIDIA Blackwell GPUをバックエンドとした「Ollama Cloud」上でGemma 4を提供開始し、セルフホスティング不要での利用が可能になった。
「クラウド依存からの解放」——業界への影響
Gemma 4の台頭は、既存の有料AIサービスへの競争圧力という観点でも注目されている。コミュニティからは「ローカルで動くGemma 4があれば、月額制のクラウドAIサービスの必要性が下がる」という声も上がっており、エッジデバイスでのオープンモデル活用という潮流を加速させる可能性がある。一方、ベンチマークでは31Bモデルがあるリーダーボードで上位3位以内に入り、「1回あたり0.20ドル」という低コストでの実行が評価される事例も報告されている。
Googleの戦略的意図
Googleは4月10日(現地時間)に英国・ロンドンでGemma 4の基調講演を予定しており、さらなる詳細の発表が見込まれる。オープンモデルの民主化を推進しながら、より高度なセキュリティを希望したり大規模展開する場合はGoogle Cloud・Vertex AIへと誘導する戦略なのかもしれない。
Gemma 4は単なるモデルのアップグレードにとどまらず、「高性能AIをクラウドに依存せず、手元のデバイスで動かす」という次世代の開発スタイルを先取りする存在として、AI業界に新たな地平を切り開きつつあると言えそうだ。

湯川鶴章
AI新聞編集長
AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。