「SINQ」の版間の差分
Administrator (トーク | 投稿記録) ページの作成:「'''SINQ''' (SInkhorn Normalized Quantization) とは、Huaweiが2025年に発表した新しいオープンソースな量子化アルゴリズムです。大規模言語モデル(LLM)の重みを低精度に変換しつつ、性能をほとんど落とさずにメモリ使用量を大幅に削減できるのが特徴です。 == 特徴 == * デュアルスケーリング:行方向と列方向に別々のスケールを導入し、外れ…」 |
Administrator (トーク | 投稿記録) 編集の要約なし タグ: 差し戻し済み |
||
| 1行目: | 1行目: | ||
'''SINQ''' (SInkhorn Normalized Quantization) とは、[[Huawei]]が2025年に発表した新しい[[オープンソース]]な[[量子化アルゴリズム]]です。[[大規模言語モデル]](LLM)の重みを低精度に変換しつつ、性能をほとんど落とさずに[[メモリ]]使用量を大幅に削減できるのが特徴です。 | '''SINQ''' (SInkhorn Normalized Quantization) とは、[[Huawei]]が2025年に発表した新しい[[オープンソース]]な[[行列]]の[[量子化アルゴリズム]]です。[[大規模言語モデル]](LLM)の重みを低精度に変換しつつ、性能をほとんど落とさずに[[メモリ]]使用量を大幅に削減できるのが特徴です。 | ||
== 特徴 == | == 特徴 == | ||