「DeepSeek R1 70B」の変更履歴

差分の選択: 比較したい版のラジオボタンを選択し、Enterキーを押すか、下部のボタンを押します。
凡例: (最新)=最新版との比較、(前)=直前の版との比較、=細部の編集

2025年9月5日 (金)

  • 最新 05:552025年9月5日 (金) 05:55Administrator トーク 投稿記録 1,036バイト +1,036 ページの作成:「'''DeepSeek R1 70B'''とは、DeepSeekが開発した推論特化型モデルDeepSeek-R1をLlama 3.3 70Bモデルに基づいて知識蒸留(Distillation)した派生モデルである。70億のパラメータを持つが、元のDeepSeek-R1の推論能力を高い次元で維持しつつ、より軽量で高速な推論を実現している。 == アーキテクチャ == * ベースモデル:Llama 3.3 70B-Instruct * パラメータ数:70…」