「Google Gemma 4」の版間の差分
Administrator (トーク | 投稿記録) ページの作成:「Google Gemma 4とは、2026年4月にGoogleが公開したオープンウェイトの大規模言語モデルです。 ライセンスはApache 2.0ライセンスとなっており、商用利用や自由なカスタマイズも可能です。 質問応答、要約、高度な推論に加え、自律型エージェントの構築に特化した設計がなされています。 一番しょぼいモデルでも音声認識と音声理解ができます。 Google T…」 |
Administrator (トーク | 投稿記録) 編集の要約なし |
||
| 13行目: | 13行目: | ||
Gemma 4は、ターゲットとなるハードウェア要件に合わせて最適化された3つの異なるアーキテクチャで構成されています。 | Gemma 4は、ターゲットとなるハードウェア要件に合わせて最適化された3つの異なるアーキテクチャで構成されています。 | ||
=== Effectiveシリーズ(E2B / E4B)=== | |||
* | 超モバイル、エッジデバイス、ブラウザ(Google PixelやChrome等)へのデプロイを想定した小サイズモデルです。有効パラメータ(Effective Parameters)の最適化と、各デコーダーレイヤーに独自の埋め込みテーブルを持つPLE(Per-Layer Embeddings)を採用。計算負荷を抑えつつ、オンデバイスでの表現力を最大化しています。 | ||
=== * Denseモデル(31B)=== | |||
310億パラメータを持つ高密度モデルです。サーバーグレードのパフォーマンスとローカル実行の境界線を埋める存在であり、オープンモデルとして最高峰の知能と論理推論能力を提供します。 | |||
=== Mixture-of-Expertsモデル(26B A4B)=== | |||
高スループットと高度な推論を両立させるために設計された効率的なMoEモデルです。生成時にはトークンごとに40億(4B)のパラメータのみをアクティブ化しますが、高速なルーティングを維持するために全260億パラメータをメモリに展開します。 | |||
== 主要機能と進化点 == | == 主要機能と進化点 == | ||
=== 高性能推論(Thinking Mode)=== | |||
構成可能な思考モードを搭載。複雑な課題に対し、論理的な推論ステップを経てから回答を生成します。 | |||
=== 拡張されたマルチモーダル === | |||
テキスト、動画、画像(可変解像度対応)を処理。特にE2B/E4Bはネイティブ音声処理をサポートしています。 | |||
=== コンテキスト・ウィンドウ === | |||
小規模モデルは128K、中規模モデル(31B/26B)は最大256Kの大規模コンテキストに対応。 | |||
=== エージェント機能の強化 === | |||
関数呼び出し(Function Calling)をネイティブサポートし、自律型エージェントの構築を強力に支援します。 | |||
=== システムプロンプト対応 === | |||
システムロールの組み込みサポートにより、モデルの振る舞いをより構造的に制御可能です。 | |||
== 推論実行に必要なメモリ要件(公式ガイドライン) == | == 推論実行に必要なメモリ要件(公式ガイドライン) == | ||