コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
最近の更新
未作成ページ
おまかせ表示
ヘルプ
MonoBook
検索
検索
ログイン
個人用ツール
ログイン
ログアウトした編集者のページ
もっと詳しく
投稿記録
トーク
「
SINQ
」を編集中
ページ
議論
日本語
閲覧
編集
ソースを編集
履歴表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
編集
ソースを編集
履歴表示
全般
リンク元
関連ページの更新状況
特別ページ
ページ情報
2025年10月9日 (木) 02:41時点における
Administrator
(
トーク
|
投稿記録
)
による版
(
差分
)
← 古い版
|
最新版
(
差分
) |
新しい版 →
(
差分
)
警告: このページの古い版を編集しています。
公開すると、この版以降になされた変更がすべて失われます。
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。
スパム攻撃防止用のチェックです。 けっして、ここには、値の入力は
しない
でください!
'''SINQ''' (SInkhorn Normalized Quantization) とは、[[Huawei]]が2025年に発表した新しい[[オープンソース]]な[[量子化アルゴリズム]]です。[[大規模言語モデル]](LLM)の重みを低精度に変換しつつ、性能をほとんど落とさずに[[メモリ]]使用量を大幅に削減できるのが特徴です。 == 特徴 == * デュアルスケーリング:行方向と列方向に別々のスケールを導入し、外れ値の影響を分散。 * Sinkhorn型正規化:行・列を交互に正規化して分散を均一化し、量子化誤差を抑制。 * 低ビット量子化:3〜4bitでも高精度を維持可能。 * 効果:メモリ使用量を60〜70%削減し、安価なGPUや低性能ハードでも大規模モデルを動作可能に。 == 擬似コード == 人工知能以外でも使えそうなので調べてみた。 <source lang=csharp> // SINQ量子化の擬似コード(C#風) class SinqQuantizer { public int BitWidth { get; set; } = 4; // 量子化ビット幅(例: 3bit, 4bit) public int SinkhornIters { get; set; } = 20; // Sinkhorn反復回数 public float Eps { get; set; } = 1e-6f; // 数値安定用 // 重み行列Wを量子化 public QuantizedMatrix Quantize(float[,] W) { // 1. 行・列スケールをSinkhorn正規化で計算 var (rowScale, colScale) = ComputeDualScaling(W); // 2. スケーリングを適用 float[,] S = ApplyScaling(W, rowScale, colScale); // 3. ブロックごとに量子化(例: 行単位) var blocks = PartitionByRow(S); var qBlocks = new List<QuantizedBlock>(); foreach (var block in blocks) { var stats = ComputeRange(block); // min/maxやscaleを計算 var qBlock = QuantizeBlock(block, stats, BitWidth); qBlocks.Add(qBlock); } return new QuantizedMatrix { RowScale = rowScale, ColScale = colScale, Blocks = qBlocks, BitWidth = BitWidth }; } // Sinkhorn型の行列正規化 private (float[] rowScale, float[] colScale) ComputeDualScaling(float[,] W) { int R = W.GetLength(0); int C = W.GetLength(1); float[] r = Enumerable.Repeat(1f, R).ToArray(); float[] c = Enumerable.Repeat(1f, C).ToArray(); for (int t = 0; t < SinkhornIters; t++) { // 行方向の正規化 for (int i = 0; i < R; i++) { float variance = RowVariance(W, i, c); r[i] = 1.0f / (float)Math.Sqrt(variance + Eps); } // 列方向の正規化 for (int j = 0; j < C; j++) { float variance = ColVariance(W, j, r); c[j] = 1.0f / (float)Math.Sqrt(variance + Eps); } } return (r, c); } // スケーリング適用 private float[,] ApplyScaling(float[,] W, float[] r, float[] c) { int R = W.GetLength(0); int C = W.GetLength(1); float[,] S = new float[R, C]; for (int i = 0; i < R; i++) for (int j = 0; j < C; j++) S[i, j] = r[i] * W[i, j] * c[j]; return S; } // ブロック分割(例: 行単位) private IEnumerable<float[]> PartitionByRow(float[,] S) { int R = S.GetLength(0); int C = S.GetLength(1); for (int i = 0; i < R; i++) { float[] row = new float[C]; for (int j = 0; j < C; j++) row[j] = S[i, j]; yield return row; } } // 範囲計算(min/max) private (float min, float max, float scale) ComputeRange(float[] block) { float min = block.Min(); float max = block.Max(); float scale = (max - min) / ((1 << BitWidth) - 1); return (min, max, scale); } // ブロック量子化 private QuantizedBlock QuantizeBlock(float[] block, (float min, float max, float scale) stats, int bits) { int n = block.Length; byte[] qVals = new byte[n]; for (int i = 0; i < n; i++) { int q = (int)Math.Round((block[i] - stats.min) / stats.scale); qVals[i] = (byte)Math.Clamp(q, 0, (1 << bits) - 1); } return new QuantizedBlock { Values = qVals, Stats = stats }; } } // データ構造 class QuantizedMatrix { public float[] RowScale; public float[] ColScale; public List<QuantizedBlock> Blocks; public int BitWidth; } class QuantizedBlock { public byte[] Values; public (float min, float max, float scale) Stats; } </source> == 外部リンク == * https://www.arxiv.org/abs/2509.22944 * [[category: 大規模言語モデル]] [[category: 量子化アルゴリズム]]
編集内容の要約:
MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MonoBook:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の確認用の質問に回答してください (
詳細
):
1たす1は?(全角で入力してください)
キャンセル
編集の仕方
(新しいウィンドウで開きます)
本文の横幅制限を有効化/無効化