Google Gemma

提供:MonoBook

Google Gemmaとは、Googleが公開しているGoogle Geminiオープンソース版です。

なお、とんでもない勢いでバージョンが上がっている点に注意しましょう。これを書いている時点ではGemma 3ですが、たぶん1〜2週間後には別物になっていることでしょう。

テキストと画像を入力できる[編集 | ソースを編集]

入力としてテキストと画像を利用できます。

テキストと画像を出力できる[編集 | ソースを編集]

出力もテキストだけでなく画像も利用できます。 つまりNano Banana相当(の最新版相当)の画像生成がローカルでできます。 ただしメモリFP32版で108GB以上、BF16版で47GB以上が必要です。

環境構築[編集 | ソースを編集]

GemmaもGeminiと同様にGoogle AI Studioでサクッと試せます。通常はこちらがオススメです。

ローカルに環境構築する場合はメモリ48GBがスタートラインです。まともに動かすにはメモリ128GBが推奨ラインです。

なおメモリ4GBでも動く超軽量バージョンもありますが、こちらはテキスト生成のみで画像生成はできません。