Google Gemini日本語版で出来ること

2024年2月14日

今月2日（2024年2月2日）に日本語のBardでもGmenini Proが使えるようになりました。また、いままでBardの名称だったGoogleの大規模言語モデルがGeminiに変わりました。そこで今回はGeminiで何が出来るのかを試してみたので感想をお伝えします。

Google Japan Blogのアナウンス記事
https://japan.googleblog.com/2024/02/bard-gemini-pro.html

Geminiで出来ること

テキストを使ったチャット
下書きの提案
画像生成
画像の読み込み
Googleサービスとの連携
ブラウジング機能
ダブルチェック機能

上記の内容が主に無料版のGemini Proで使える機能です。

テキストを使ったチャット

1つ目のテキストを使ったチャットに関しては、大規模言語モデルのAIではおなじみの機能です。回答速度はストレス無い速さで回答してくれます。最近の有料版ChatGPTは利用者が多いせいか激遅です。

下書きの提案

下書きの提案は回答を一度に3つ返してくれます。その中から適切な回答を選んで次のチャットを進めることができます。普段使っているChatGPTでも何度も聞けばいいですが、1回で3つ提案してくれるのはうれしいですね。

画像生成

3つ目の画像生成は現状英語でプロンプトを入力する必要があります。このブログではおなじみの、渋谷のスクランブル交差点に佇む20代の日本人女性で生成してもらった結果、微妙でした。今のところ人物を描いてもらうにはMidjourneyがベストだと感じます。

こちらがGemini（Imagen2エンジン）で生成した画像です。1度に3枚提案してくれます。

Midjourneyと有料版ChatGPT PLUSの画像比較の記事もありますので、今回の画像と比較してみてください。

https://www.weblic.co.jp/google-bard-update-20231219

画像の読み込み

画像をアップしてその内容を認識することができます。試しに弊社のTOPページメインビジュアルに掲載しているキャッチコピーを正しく認識するかやってみます。

結果は以下のとおりです。

正しく認識しているみたいです。また補足説明にある『背景は夜空で、星が輝いて…』の部分も合っていますね。これはスゴイ。

次はいじわるをして手書きで私の名前（丹羽岳人）を聞いてみました。

姓は合っていますが、名は回答してもらえませんでした。

Googleサービスとの連携

これは以前のブログでも書きましたが、Google Workspace、Googleフライト、Googleホテル、Googleマップ、YouTubeとの連携ができます。

詳しく知りたい方は以前のブログも併せてお読みください。

https://www.weblic.co.jp/google-bard-update-20231219

ブラウジング機能

GeminiはGoogleがリリースしているのでブラウジング機能は使い慣れGoogle検索で調べてくれます。

試しに『今日のメタバースのニュースを5件教えて』と入力した結果が以下のとおりです。これらの情報が正しいのか間違っているのか不安ですが、次に紹介する『ダブルチェック機能』でソース元を確認することができます。

ダブルチェック機能

チャット最下部にある『G』のアイコンをクリックすると、ダブルチェック機能を使うことができます。試しに先程調べた『今日のメタバースのニュースを5件教えて』をダブルチェックしてみます。

『G』をクリックすると以下のようにソース元がある場合は、マーカーが引かれます。矢印をクリックして展開するとソース元の内容とURLが確認できます。

まとめ

無料でこれだけの機能を盛り込んでいるのは正直すごいですね。アップロードできるファイルは現状画像のみですが、今後はchatGpt同様、さまざまなファイルをアップして分析もしてくれるようになるでしょう。特に良かったのは『ダブルチェック機能』ですね。普段知っている分野のことを聞く分には間違いに気づきますが、そうでない場合はとても役に立つ機能です。