電話受付中 平日10:00~19:00 0120-926-227

日本最大級のホームページ制作会社検索サイト

お急ぎの方はお電話で !( 平日10:00〜19:00 )

0120-926-227

無料でWeb発注相談 ! 24時間受付中 !

メールで相談する

Bardで画像の表示が可能に!入力や認識など今後搭載される機能も解説

田邊 竜大

Written by

田邊 竜大

Bardで画像の表示が可能に!入力や認識など今後搭載される機能も解説

「Bardは画像を使った回答ができる?」
「入力・読み込み機能は追加された?」

このような疑問をお持ちではないでしょうか。Bardは2023年5月のアップデートで、画像の提示機能が追加されています。質問に対してテキスト以外を使った回答が可能になったため、ユーザーはより多くの情報を取得できるようになりました。

しかし、Bardの画像表示機能の用途がわからず、どのような場面で使えば良いのか気になっている方もいるのではないでしょうか。本記事では以下の項目について解説していきます。

この記事で解説していること

  • 画像が表示される質問の条件
  • 画像表示機能の活用方法
  • Bardに関するQ&A

    この記事を読めば、Bardの画像表示機能が理解でき、よりBardを効果的に使えるようになります。ぜひ参考にしてください。

    AIチャットで
    コンバージョンを自動化しませんか?

    うちのAIなら
    ChatGPT
    できます。

    Bardで画像の表示が可能に

    Bardは2023年2月に発表された生成AIです。リリース当初は、物語やテキストによる解説などを出力する文章生成AIとして扱われていました。しかし、2023年5月23日のアップデートによって、テキストだけでなく、画像も提示できるようになっています。下記画像は「Peach Image(桃の画像)」と入力した際の結果です。

    bardにPeach Imageと入力した結果

    画像と共に、テキストで桃のルーツなどを解説しています。画像表示機能により、ユーザーはより多くの情報を得られるようになりました。

    画像生成はできない

    Bardは画像の表示ができるようになりましたが、生成はできません。ユーザーの質問に対して最適な画像を、Web上からBardが選択して表示しているだけです。下記の通り、提示されるイメージには全て掲載元が存在します。

    Peach imaeges で表示された画像にリンクされていたページ

    Bardは画像生成を行っているわけではないため、独創性の強いイメージは提示できません。たとえば、「Image of a transparent snail walking on a keyboard(キーボードの上を歩く透明なカタツムリ)」と入力しても、下記の通り指示した要素を含む作品が出力されるだけです。

    Bard独創性の高い画像提示を求めてもずれた画像しか提示してくれない

    ただしBardは、画像生成AIのFireflyと連携が発表されています。実現すれば、Web上のコンテンツを表示するだけでなく、オリジナルのイメージも生成できるようになるでしょう。

    日本語には未対応

    画像表示機能は日本語には未対応です。公式でも「英語での回答に対して画像を表示する」と記載されています。

    Bard に画像を導入
    英語での回答について、Bard が Google 検索から画像を表示できるようになりました。

    引用:試験運用版の最新情報 | Bard

    Bardに尋ねても、日本語の対応時期は未定と回答しています。

    Bardの画像表示機能の日本語対応時期は未定

    実際に日本語と英語それぞれで、同じ内容をBardに指示してみました。

    指示内容

    What are some typical Japanese dishes? Please introduce with images.

    和訳:代表的な日本料理は?画像付きで紹介してください。

    Bardは同じ指示内容でも日本語では画像を表示してくれない

    日本語で入力しても、「画像の説明:〇〇」とテキストが出現するだけで、画像は表示されません。画像を交えた出力を取得したい場合は、英語を利用しましょう。

    画像が表示されない質問もある

    Bardは英語で質問を投げかけても、画像が表示されない場合があります。出現条件に関しては、公式のアップデート情報で次のように述べられています。

    Bard に画像を導入
    更新内容: 英語での回答について、Bard が Google 検索から画像を表示できるようになりました。Bard に直接画像をリクエストすることもできます。Bard は各画像のソースを表示します。

    理由: 画像を使用することでアイデアをより効果的に伝えることができます。コンセプトの具体化や、説得力のある提案などが可能になり、視覚情報が必要なときにより適切な回答が得られます。

    引用:試験運用版の最新情報 | Bard

    視覚情報の必要性に応じて、画像が出現するか判断されているようです。実際にさまざまな指示を入力してみましたが、以下のような、テキストによる説明が重要な質問や指示では画像は提示されませんでした。

    画像が提示されない質問や指示

    • エアコンの最適な設定温度
    • 効果的なSEO対策

      Bardは必要性に応じて画像を表示しない場合もある

      Bardの画像表示機能の活用方法

      画像表示機能が備わったことにより、より便利にBardを利用できるようになりました。以下3つの活用方法を解説していきます。

      Bardの画像表示機能の活用方法

      • 買い物
      • おすすめの映画などの提示
      • 調べ物

        買い物

        どの商品を買えばいいか迷っていれば、Bardを活用してみましょう。おすすめの商品を尋ねると、以下のように、リンク付きの画像と共に特徴などを紹介してくれます。

        指示内容

        What water bottles do you recommend?

        和訳:おすすめの水筒を教えてください。

        Bardの画像表示機能を活用しおすすめの水筒を提示させた

        画像表示により、商品の性能だけでなく見た目も確認できるようになりました。またリンク付きのため、おすすめされた商品が気に入れば、手軽に購入ページに移動できるのも魅力です。

        おすすめの映画などの提示

        おすすめの映画などを聞くと、概要の解説だけでなくメインビジュアルも確認できるようになりました。

        指示内容

        What films do you recommend for release in 2015?

        和訳:2015年公開のおすすめの映画を教えてください。

        Bardの画像表示機能を活用し2015年公開のお勧めの映画を提示させた

        普段のGoogle検索と同じ要領で、AIがおすすめする映画などの情報が得られます。「おすすめのホラー映画」「〇〇が出ている映画」など、簡単に情報のフィルタリングができる点も、Bardを利用するメリットです。

        調べ物

        Bardを調べ物に利用すれば、Google検索よりも簡単に情報を収集できます。

        指示内容

        What is the fastest animal? Tell me with a picture.

        和訳:最も足の速い動物は?画像付きで教えてください。

        Bardの画像表示機能を調べ物に活用し足の早い動物を提示させた

        足の速い動物を問う質問に対して、ランキング形式で回答してくれました。今まではWebページに訪問しないと得られなかった情報が、質問するだけで確認できるようになりました。

        自社サイトにChatGPTを導入できる?

        簡単2ステップで無料診断

        Bardで画像入力・認識も可能に

        2023年7月のアップデートで、Bardに画像入力・画像認識機能が追加されました。公式では、アップデートに関して以下のように述べられています。

        Bard の Google レンズ

        内容: Bard との会話でテキストと一緒に画像をアップロードできるため、まったく新しい方法で想像力と創造性を高めることができます。これを実現するために、Google レンズの機能を英語から始めて Bard に導入します。

        理由: 画像は想像力を働かせるための基本的な部分であるため、Bard に Google レンズを追加しました。画像についてさらに詳しい情報が必要な場合でも、面白いキャプションのインスピレーションが必要な場合でも、Bard を使用して探索および作成する方法がさらに増えました。

        引用:Bardの最新情報 | Bard

        Bardは画面下部のプラスボタンから画像をアップロードできるようになった

        入力ボックスの左側に表示されているプラスボタンから、画像をアップロードします。画像と共にテキストで指示を出すことで、画像ソースの提示や、画像内に表示されている文章の要約などが可能です。

        ChatGPTよりも早いマルチモーダル化

        Bardは今まで、テキストによる入力と出力のみに対応している画像生成AIでした。しかし、今回のアップデートで、テキストだけでなく、画像の処理も可能になりました。このように、多様な情報処理ができる技術を「マルチモーダル」と呼びます。

        実は、Bardよりも早くにリリースされた文章生成AIの「ChatGPT」も、マルチモーダル化が発表されていました。しかし、画像認識技術の実装に関しては、Bardが一歩リードしたようです。文章生成AIの技術は、ChatGPTを開発しているOpenAI社の方が優れているとの見方が強かったため、ネット上では驚きの声が挙がっています。

        画像認識機能の使い方 | 言語設定を変える

        2023年7月現在、画像認識機能を利用するには言語設定を変える必要があります。以下の手順で変更してください。

        Googleの言語設定の変え方

        1. 右上のアイコンをクリックし、「Googleアカウントを管理」を選択
        2. 「個人情報」から、「言語」を選択
        3. 優先言語を英語に変更
        4. Bardをリロードし、入力ボタンの表示を確認

          まず、画面右上のアイコンをクリックし、「Googleアカウントを管理」を選択します。

          画面右上のアイコンをクリックしGoogleアカウントを管理を選択

          左側のタブから「個人情報」をクリックし、画面をスクロールして「言語」を選択します。

          左側のタブから個人情報をクリックし言語を選択する

          優先言語の右側にあるペンのマークをクリックし、「英語」と入力。「United State」を選択して保存する。

          優先言語を英語United Statesにする

          Bardに戻り、画面をリロードします。画面下部にプラスボタンが表示されていれば、画像をアップロードできます。

          Bardの画像入力・認識機能は英語のみに対応

          Bardの画像入力機能は、英語の指示にのみ対応しています。画像と一緒に日本語を入力しても、以下のようにエラーが表示されてしまいます。

          Bardの画像入力機能は英語にのみ対応しているため日本語入力してもエラーが表示されてしまう

          ただし、アップロードした画像の内容については、日本語でも問題ありません。下記画像は日本の都道府県の面積を、大きい順に並べた表を入力した際の結果です。指示として、「What does this image show?(この画像は何を示していますか?)」と入力しています。

          Bardは画像の内容が日本語でも理解できる

          Bardは「上位10位を示した表です。」と回答していますが、実際には上位5位までを示した表です。しかし、記載されている数は間違えたものの、何について書かれている表かは理解できており、説明も的確です。

          なお、本記事で紹介しているキャプチャは、Google翻訳で画面全体を日本語訳しています。実際には英語で指示を入力しているため、ご注意ください。

          Bardの画像入力・認識機能の活用方法

          Bardの画像入力機能・認識機能について、以下3つの活用方法を解説していきます。

          Bardの画像入力機能・認識機能の活用方法

          • 出典元の明示
          • 画像の説明
          • プロンプトの生成

            出典元の明示

            画像と一緒に、ソースや作成者などを尋ねる質問をすると、出典元を明示させられます。たとえば、Photoshopのロゴと、「Which service is this logo for?(このロゴはどのサービスのものですか?)」と入力すると、次の返答が得られました。

            Bardを利用して入力したロゴがどのサービスのものか特定した

            正確にロゴを特定し、サービス名を答えられました。インターネット上で見つけた漫画の1コマの出典元が知りたい時などにも活用できそうです。

            画像の読み取り・説明

            Bardは、数字や文字が含まれた画像も読み取れます。以下は、天気予報をアップロードして「What can you read from this image?(この画像から何が読み取れますか?)」と入力した結果です。

            Bardは入力した天気予報の画像を理解し的確に説明できる

            Bardは天気予報の画像だと理解でき、最高・最低気温など記載されていない文字も、補完して説明できました。応用すれば、図表の読み取りなどにも活用できます。

            プロンプトの生成

            認識機能を利用して、画像生成AIで使えるプロンプトを生成できます。画像と共に「Please describe this image in detail.(この画像を詳細に説明してください。)」と入力すると、以下の結果が得られました。

            Bardの画像認識機能を活用してプロンプトを生成した

            内容を詳細に記述しています。コピーして、画像生成AIのFireflyとAdobe Image Creatorで出力してみました。

            Bardで作成した画像のキャプションを画像生成AIに入力したら雰囲気の近い画像が生成できた

            インテリアの配置や色など、元の特徴を掴んだ画像が生成できています。参考にしたいイメージのプロンプトが公開されていない場合などに活用してみましょう。

            BardはFireflyの導入で、画像生成も可能に

            BardはAdobeの「Firefly」との連携が発表されています。Fireflyは商用利用に特化した画像生成AIで、著作権侵害の恐れがないとして現在注目されています。

            Fireflyについてくわしく知りたい方はこちらの記事をご覧ください。

            BardとAdobeの連携に関して、Adobeは次のように述べています。

            本日、アドビのAdobe FireflyとGoogleの会話型AIサービスであるGoogle Bardとの連携を発表しました。Adobe Expressで、大勢の皆様が、コンテンツ制作をより早く、より効率的にできるようになります。今後数か月以内に、Adobe Fireflyは、Google BardのジェネレーティブAIの筆頭パートナーとして、同サービスの「テキストベースの画像生成 (Text to image)」機能の強化を支え、機能向上を図ります。これにより、あらゆるスキルレベルのユーザーが、自分の言葉を使用してGoogle Bardに自分のビジョンを伝えるだけで、その場で直接Adobe Fireflyが画像を生成してくれるようになります。

            引用:Google Bardとの連携により、数百万人のGoogleユーザーのもとに Adobe FireflyとAdobe Expressを | Adobe Blog

            現在Bardから提示されるイメージは、Web上にアップロードされている画像のみです。しかし、Fireflyとの連携が始まれば、オリジナルのコンテンツを生成できるようになります。時期はまだ未定ですが、実現すれば、よりBardの活用の幅が広がるでしょう。

            Bing AIはすでに画像生成ができる

            MicrosoftのBingに搭載されているAIチャットには、すでに画像生成機能が搭載されています。独創的な指示にも対応しており、公開されている多くの画像生成AIと同じように使用できます。以下は「キーボードの上を歩く蟹」とチャットした際の結果です。

            BingAIにキーボードの上を歩く蟹と日本語で指示を入力した結果指示通りに出力できた

            Bing AIは指示内容に対応した画像を生成するだけでなく、「もっと大きな蟹を描いて」など、イメージに関連した質問も用意してくれます。試しに「他にどんな動物が面白そうですか?」を選択し、提示された内容に沿ってチャットを続けました。

            BingAIはチャットの流れにしたがって適宜画像を生成してくれる

            チャットの流れを汲み取って、「キーボードの上の」という要素を含めたまま、新たな画像を生成しています。また、用意されたチャットだけでなく、任意の指示でイメージに要素を付け加えられます。下記画像のように、「透明だとかわいいですね」といった感想を入力するだけでも、イメージを生成してくれました。

            BingAIは用意された質問だけでなく任意のチャットで画像生成ができる

            Bardに関するQ&A

            画像入力や読み込み、アップロードはできる?

            Bardは2023年7月現在、画像の入力・読み込み機能は搭載されていません。

            Bardは2023年7月13日のアップデートで、画像の入力、識別機能が追加されました。指示は英語しか受け付けていませんが、アップロードする画像内に日本語が含まれていても問題ありません。

            画像認識はできるようになる?

            Bardが画像認識できるようになるという情報は、今のところありません。導入が発表されているFireflyは、テキストから画像を生成したり、画像の一部分を編集したりできます。しかし、画像からテキストを生成するといった機能は搭載されていません。そのため、Fireflyとの連携が始まっても、Bardが画像認識機能を備えるとは考えづらいです。

            Bardは2023年7月13日のアップデートで画像の認識が可能となりました。

            画像入力・画像認識ができない時は?

            画像入力は、ボックスの左側に表示されているプラスボタンから行なえます。表示されていない場合は、言語設定が日本語のままの可能性があります。Googleの設定から言語を英語(United State)に変更しましょう。くわしい解説は画像認識機能の使い方 | 言語設定を変えるをご覧ください。

            画像が表示されない時は?

            Bardの回答で画像が表示されない場合、以下2つの原因が考えられます。

            Bardで画像が表示されない原因

            • 英語以外の言語で入力している
            • 画像を表示しても有益性に繋がらない

              Bardは英語の指示に対する回答にのみ、画像を提示するとアナウンスされています。日本語入力しても画像は表示されないため、注意してください。また、英語で質問を入力しても、テキストによる解説などがユーザーの求めている情報だと判断されれば、画像は表示されません。ただし、「Please include a picture.(画像付きでお願いします)」と入力すれば、表示してくれます。必要に応じて指示に追加してみてください。

              画像表示機能で、より便利になったBardを使いこなそう

              本記事では、以下の項目について解説しました。

              この記事で解説したこと

              • 画像が表示される質問の条件
              • 画像表示機能の活用方法
              • Bardに関するQ&A

                Bardの回答に画像が表示されるかは、「ユーザーにとって有益かどうか」で判断されているようです。そのため、おすすめの映画や商品を尋ねる質問などでは、積極的に画像が出現します。現在は、Web上の画像を提示するだけですが、Fireflyが導入されれば、オリジナルの画像も生成できようになります。

                本記事を参考に、Bardの画像表示機能を利用して、調べ物やネットショッピングを効率化させていきましょう。

                ChatGPTを御社の営業マンや接客スタッフに

                この記事を書いたライター

                田邊 竜大

                田邊 竜大

                運営元のJetB株式会社メンバー。YouTubeやTikTokなど、さまざまなSNS運用をしていた経験を買われて優良WEBに参画。「難しいことをシンプルに」をテーマに記事を執筆。休日はフットサルかゲームをして過ごしている。神奈川県出身。

                このライターの記事一覧

                この記事を監修した人

                藤澤 尚也

                藤澤 尚也

                優良WEB編集長・JetB株式会社メディア事業部SV。前職の大手IT企業の同僚から誘いを受け、2018年に営業として入社。その後Webディレクターに転身し、3年以上経験を積む。多様な経験からくる幅広いWebリテラシーと持ち前の文章力を買われて優良WEBの編集長に抜擢。ベースとラーメン二郎をこよなく愛する。

                この監修者の記事一覧

                Share

                関連記事

                Share

                sp_mail_icon

                メールで問い合わせる

                bot1

                AIに相談する

                1