Google Gemma
Google Gemmaとは、Googleが公開しているGoogle Geminiのオープンソース版です。
なお、とんでもない勢いでバージョンが上がっている点に注意しましょう。これを書いている時点ではGemma 3ですが、たぶん1〜2週間後には別物になっていることでしょう。
- https://www.kaggle.com/models?query=gemma3&publisher=google
- https://huggingface.co/collections/google/gemma-3-release
テキストと画像を入力できる[編集 | ソースを編集]
入力としてテキストと画像を利用できます。
テキストと画像を出力できる[編集 | ソースを編集]
出力もテキストだけでなく画像も利用できます。 つまりNano Banana相当(の最新版相当)の画像生成がローカルでできます。 ただしメモリはFP32版で108GB以上、BF16版で47GB以上が必要です。
環境構築[編集 | ソースを編集]
GemmaもGeminiと同様にGoogle AI Studioでサクッと試せます。通常はこちらがオススメです。
ローカルに環境構築する場合はメモリ48GBがスタートラインです。まともに動かすにはメモリ128GBが推奨ラインです。
なおメモリ4GBでも動く超軽量バージョンもありますが、こちらはテキスト生成のみで画像生成はできません。