「Google Gemma 4」の版間の差分

ページの作成:「Google Gemma 4とは、2026年4月にGoogleが公開したオープンウェイトの大規模言語モデルです。 ライセンスはApache 2.0ライセンスとなっており、商用利用や自由なカスタマイズも可能です。 質問応答、要約、高度な推論に加え、自律型エージェントの構築に特化した設計がなされています。 一番しょぼいモデルでも音声認識と音声理解ができます。 Google T…」
 
編集の要約なし
13行目: 13行目:
Gemma 4は、ターゲットとなるハードウェア要件に合わせて最適化された3つの異なるアーキテクチャで構成されています。
Gemma 4は、ターゲットとなるハードウェア要件に合わせて最適化された3つの異なるアーキテクチャで構成されています。


* Effectiveシリーズ(E2B / E4B):超モバイル、エッジデバイス、ブラウザ(Google PixelやChrome等)へのデプロイを想定した小サイズモデルです。有効パラメータ(Effective Parameters)の最適化と、各デコーダーレイヤーに独自の埋め込みテーブルを持つPLE(Per-Layer Embeddings)を採用。計算負荷を抑えつつ、オンデバイスでの表現力を最大化しています。
=== Effectiveシリーズ(E2B / E4B)===
* Denseモデル(31B):310億パラメータを持つ高密度モデルです。サーバーグレードのパフォーマンスとローカル実行の境界線を埋める存在であり、オープンモデルとして最高峰の知能と論理推論能力を提供します。
超モバイル、エッジデバイス、ブラウザ(Google PixelやChrome等)へのデプロイを想定した小サイズモデルです。有効パラメータ(Effective Parameters)の最適化と、各デコーダーレイヤーに独自の埋め込みテーブルを持つPLE(Per-Layer Embeddings)を採用。計算負荷を抑えつつ、オンデバイスでの表現力を最大化しています。
* Mixture-of-Expertsモデル(26B A4B):高スループットと高度な推論を両立させるために設計された効率的なMoEモデルです。生成時にはトークンごとに40億(4B)のパラメータのみをアクティブ化しますが、高速なルーティングを維持するために全260億パラメータをメモリに展開します。
 
=== * Denseモデル(31B)===
310億パラメータを持つ高密度モデルです。サーバーグレードのパフォーマンスとローカル実行の境界線を埋める存在であり、オープンモデルとして最高峰の知能と論理推論能力を提供します。
 
=== Mixture-of-Expertsモデル(26B A4B)===
高スループットと高度な推論を両立させるために設計された効率的なMoEモデルです。生成時にはトークンごとに40億(4B)のパラメータのみをアクティブ化しますが、高速なルーティングを維持するために全260億パラメータをメモリに展開します。


== 主要機能と進化点 ==
== 主要機能と進化点 ==


* 高性能推論(Thinking Mode):構成可能な思考モードを搭載。複雑な課題に対し、論理的な推論ステップを経てから回答を生成します。
=== 高性能推論(Thinking Mode)===
* 拡張されたマルチモーダル:テキスト、動画、画像(可変解像度対応)を処理。特にE2B/E4Bはネイティブ音声処理をサポートしています。
構成可能な思考モードを搭載。複雑な課題に対し、論理的な推論ステップを経てから回答を生成します。
* コンテキスト・ウィンドウ:小規模モデルは128K、中規模モデル(31B/26B)は最大256Kの大規模コンテキストに対応。
 
* エージェント機能の強化:関数呼び出し(Function Calling)をネイティブサポートし、自律型エージェントの構築を強力に支援します。
=== 拡張されたマルチモーダル ===
* システムプロンプト対応:システムロールの組み込みサポートにより、モデルの振る舞いをより構造的に制御可能です。
テキスト、動画、画像(可変解像度対応)を処理。特にE2B/E4Bはネイティブ音声処理をサポートしています。
 
=== コンテキスト・ウィンドウ ===
小規模モデルは128K、中規模モデル(31B/26B)は最大256Kの大規模コンテキストに対応。
 
=== エージェント機能の強化 ===
関数呼び出し(Function Calling)をネイティブサポートし、自律型エージェントの構築を強力に支援します。
 
=== システムプロンプト対応 ===
システムロールの組み込みサポートにより、モデルの振る舞いをより構造的に制御可能です。


== 推論実行に必要なメモリ要件(公式ガイドライン) ==
== 推論実行に必要なメモリ要件(公式ガイドライン) ==