「Google Gemma 4」の版間の差分
Administrator (トーク | 投稿記録) |
Administrator (トーク | 投稿記録) |
||
| 15行目: | 15行目: | ||
=== Effectiveシリーズ(E2B / E4B)=== | === Effectiveシリーズ(E2B / E4B)=== | ||
超モバイル、エッジデバイス、ブラウザ(Google PixelやChrome等)へのデプロイを想定した小サイズモデルです。有効パラメータ(Effective Parameters)の最適化と、各デコーダーレイヤーに独自の埋め込みテーブルを持つPLE(Per-Layer Embeddings)を採用。計算負荷を抑えつつ、オンデバイスでの表現力を最大化しています。E2Bならメモリ4GBくらいで動きます。 | 超モバイル、エッジデバイス、ブラウザ(Google PixelやChrome等)へのデプロイを想定した小サイズモデルです。有効パラメータ(Effective Parameters)の最適化と、各デコーダーレイヤーに独自の埋め込みテーブルを持つPLE(Per-Layer Embeddings)を採用。計算負荷を抑えつつ、オンデバイスでの表現力を最大化しています。E2Bならメモリ4GBくらいで動きます。 | ||
=== Mixture-of-Expertsモデル(26B A4B)=== | |||
高スループットと高度な推論を両立させるために設計された効率的なMoEモデルです。生成時にはトークンごとに40億(4B)のパラメータのみをアクティブ化しますが、高速なルーティングを維持するために全260億パラメータをメモリに展開します。 | |||
=== Denseモデル(31B)=== | === Denseモデル(31B)=== | ||
310億パラメータを持つ高密度モデルです。サーバーグレードのパフォーマンスとローカル実行の境界線を埋める存在であり、オープンモデルとして最高峰の知能と論理推論能力を提供します。 | 310億パラメータを持つ高密度モデルです。サーバーグレードのパフォーマンスとローカル実行の境界線を埋める存在であり、オープンモデルとして最高峰の知能と論理推論能力を提供します。 | ||
== 主要機能と進化点 == | == 主要機能と進化点 == | ||