Google Gemini日本語版で出来ること
AI
2024年2月14日
今月2日(2024年2月2日)に日本語のBardでもGmenini Proが使えるようになりました。また、いままでBardの名称だったGoogleの大規模言語モデルがGeminiに変わりました。そこで今回はGeminiで何が出来るのかを試してみたので感想をお伝えします。
Google Japan Blogのアナウンス記事
https://japan.googleblog.com/2024/02/bard-gemini-pro.html
目次
Geminiで出来ること
- テキストを使ったチャット
- 下書きの提案
- 画像生成
- 画像の読み込み
- Googleサービスとの連携
- ブラウジング機能
- ダブルチェック機能
上記の内容が主に無料版のGemini Proで使える機能です。
テキストを使ったチャット
1つ目のテキストを使ったチャットに関しては、大規模言語モデルのAIではおなじみの機能です。回答速度はストレス無い速さで回答してくれます。最近の有料版ChatGPTは利用者が多いせいか激遅です。
下書きの提案
下書きの提案は回答を一度に3つ返してくれます。その中から適切な回答を選んで次のチャットを進めることができます。普段使っているChatGPTでも何度も聞けばいいですが、1回で3つ提案してくれるのはうれしいですね。
画像生成
3つ目の画像生成は現状英語でプロンプトを入力する必要があります。このブログではおなじみの、渋谷のスクランブル交差点に佇む20代の日本人女性で生成してもらった結果、微妙でした。今のところ人物を描いてもらうにはMidjourneyがベストだと感じます。
こちらがGemini(Imagen2エンジン)で生成した画像です。1度に3枚提案してくれます。
Midjourneyと有料版ChatGPT PLUSの画像比較の記事もありますので、今回の画像と比較してみてください。
画像の読み込み
画像をアップしてその内容を認識することができます。試しに弊社のTOPページメインビジュアルに掲載しているキャッチコピーを正しく認識するかやってみます。
結果は以下のとおりです。
正しく認識しているみたいです。また補足説明にある『背景は夜空で、星が輝いて…』の部分も合っていますね。これはスゴイ。
次はいじわるをして手書きで私の名前(丹羽岳人)を聞いてみました。
姓は合っていますが、名は回答してもらえませんでした。
Googleサービスとの連携
これは以前のブログでも書きましたが、Google Workspace、Googleフライト、Googleホテル、Googleマップ、YouTubeとの連携ができます。
詳しく知りたい方は以前のブログも併せてお読みください。
ブラウジング機能
GeminiはGoogleがリリースしているのでブラウジング機能は使い慣れGoogle検索で調べてくれます。
試しに『今日のメタバースのニュースを5件教えて』と入力した結果が以下のとおりです。これらの情報が正しいのか間違っているのか不安ですが、次に紹介する『ダブルチェック機能』でソース元を確認することができます。
ダブルチェック機能
チャット最下部にある『G』のアイコンをクリックすると、ダブルチェック機能を使うことができます。試しに先程調べた『今日のメタバースのニュースを5件教えて』をダブルチェックしてみます。
『G』をクリックすると以下のようにソース元がある場合は、マーカーが引かれます。矢印をクリックして展開するとソース元の内容とURLが確認できます。
まとめ
無料でこれだけの機能を盛り込んでいるのは正直すごいですね。アップロードできるファイルは現状画像のみですが、今後はchatGpt同様、さまざまなファイルをアップして分析もしてくれるようになるでしょう。特に良かったのは『ダブルチェック機能』ですね。普段知っている分野のことを聞く分には間違いに気づきますが、そうでない場合はとても役に立つ機能です。