ホームページ作成の費用相場について
いくらくらいが適切なの?
日本最大級のホームページ制作会社検索サイト
お急ぎの方はお電話で !( 平日10:00〜19:00 )
0120-926-227無料でWeb発注相談 ! 24時間受付中 !
メールで相談する「GPT-4ってなに?」
「GPT-4ってGPT-3.5と何が違うの?」
「GPT-4はなにができるの?」
このような疑問をお持ちではありませんか?GPT-4は3月14日(現地時間)にOpenAIから発表されたAIモデルです。前身のGPT-3.5よりもさらに優れた自然言語処理能力を有しています。GPT-4は、性能の高さから、今後さまざまな業界での活躍が考えられるため、時代の波に取り残されないように適切な知識が必要です。
そこで本記事では
この記事で解説していること
などを解説していきます。
この記事を読めばGPT-4の最新情報を簡単に理解できます。AIを用いた業務の効率化などを考えている方は、ぜひ参考にしてください。
GPT-4とはChatGPTに使われている「GPT-3.5」に改良を加えた大規模言語モデルです。GPT-3.5から進化した点として、主に以下の2つがあげられます。
GPT-3.5から進化した点
マルチモーダル化によって、画像内容の要約や写っている食材を判別してレシピを考案するなど、AIの活用の幅が広がりました。今後APIも公開されるため、どのようなサービスが生まれるのか世界が注目しています。
そんなGPT-4の概要について、次の項目を解説していきます。
GPT-4とは
Microsoftの検索エンジンであるBingのAIチャットは、GPT-3.5を搭載したChatGPTよりも高性能だと言われており、ネット上では「GPT-4が搭載されているのでは」と噂されていました。
Microsoftは当初、「BingのAIチャットに搭載のモデルはGPT-3.5を改良したもの」としか発表していませんでしたが、3月14日(現地時間)に「実は、搭載しているモデルは検索用にカスタマイズしたGPT-4である」と声明を出しています(参考:新しい Bing が OpenAI の GPT-4 上で稼働)。多くのユーザーが待ち望んでいたGPT-4がすでに実装されていた事実に、ネットでは驚きの声が上がっていました。
パラメータとはAIモデルが学習を通じて得た能力を示す値です。値が増えるほどより複雑なタスクがこなせます。以下は、パラメータ数の遷移を示す表です。
モデル | パラメータ数 |
GPT | 1億1700万 |
GPT-2 | 15億 |
GPT-3 | 1750億 |
GPT-4 | 数千億~1兆 |
パラメータ数はモデルが進むごとに急激な増加を見せており、GPT-4は数百兆になると予測する人もいたようです。しかし、実際のパラメータ数は数千億~1兆とされており、期待されていたほどは増加しませんでした。
記事執筆時点では、GPT-4はChatGPTの有料プラン「ChatGPT Plus」に加入していないと利用できません。ChatGPT Plusには月額20ドル(約2700円)で加入できます。
ChatGPTを開いたら左下に表示されている「Upgrade to Plus」をクリックします。
下記ポップアップが表示されるので、緑色の「Upgrade plan」をクリックします。
必要事項を記入し、「申し込む」を選択してください。
申込後、下記メールが届いたらGPT-4が使用できます。
以下はChatGPT Plus加入後の画面です。上部のプルダウンをクリックするとモデルが選択でき、説明文とパラメーターが表示されます。
パラメーターは
を示しています。以下、各モデルの表示内容について解説していきます。
和訳:高速化のために最適化されている。Plusユーザー向けに提供中。
ChatGPT Plusでデフォルト設定されている、回答スピードに重きをおいたモデルです。
和訳:ChatGPT Plusの前モデル
ChatGPTで使用していたモデルです。
和訳:Plus加入者限定の最先端モデル。GPT-4は、高度な推論や複雑な指示の理解、より創造性が要求されるタスクに優れています。
OpenAIが公開した情報をもとに、次の項目を解説していきます。
GPT-4でできること
GPT-4に進化したことで、なにができるようになったのか確認していきましょう。
出典:OpenAI
試験結果をAIモデルごとに比較した画像です。ほぼ全ての試験において、GPT-4はGPT-3.5よりも高い成績を収めており、中でもOpenAIはUniform Bar Exam(米国統一司法試験)の結果について以下のように述べています。
For example, on a simulated bar exam, GPT-4 achieves a score that falls in the top 10% of test takers. This contrasts with GPT-3.5, which scores in the bottom 10%.
和訳:例えば、司法試験の模擬試験では、GPT-4は受験者の上位10%に入るスコアを記録しています。これに対し、GPT-3.5は下位10%という結果でした。
GPT-3.5でもMBAは突破できていましたが、GPT-4はより多くの分野で知識が増えたと考えられます。
論文の画像を入力し「以下はInstuctGPTの論文の一部です。読んで要約していただけませんか?」と入力すれば、高レベルの要約をします。表やグラフも読み取れるため、GPT-3.5よりも詳細な説明や要約が可能です。
上の画像と共に「この画像のどこが面白いのか?パネルごとに説明してください。」と入力したところGPT-4は次のように回答しました。
GPT-4の回答
画像は、「Lightning Cable」アダプターのパッケージで、3つのパネルがあります。パネル1:VGAコネクター(一般的にコンピュータのモニターに使用される青くて大きな15ピンコネクター)を充電ポートに接続したスマートフォンです。パネル2:VGAコネクタの絵が描かれた “Lightning Cable “アダプターのパッケージ。パネル3:VGAコネクタのクローズアップで、先端に小さなLightningコネクタ(iPhoneなどのApple製品の充電に使用)が付いている。この画像のユーモアは、大きくて時代遅れのVGAコネクタを、小さくて最新のスマートフォン充電ポートに差し込むという不条理からきています。
このように、GPT-4は画像を理解しミームの解説もできます。GPT-3.5に大喜利をさせていた人たちは今後、「画像でボケて」と指示するようになるでしょう。
GPT-4の画像処理機能を活用すれば、冷蔵庫の中身を撮影して「この中の食材で作れる料理のレシピを教えて」といった使い方もできるようです。目が見えない人や弱視の人向けのアプリを提供しているBe My Eyesは次のように述べています。
What sets the Virtual Volunteer tool apart from other image-to-text technology available today is context, with a deeper level of understanding and conversational ability not yet seen in the digital assistant field. For example, if a user sends a picture of the inside of their refrigerator, the Virtual Volunteer will not only be able to correctly identify what’s in it, but also extrapolate and analyze what can be prepared with those ingredients. The tool can also then offer a number of recipes for those ingredients and send a step-by-step guide on how to make them.
和訳:Virtual Volunteerツールが現在利用可能な他の画像テキスト化技術と異なるのは、デジタルアシスタント分野ではまだ見られない、より深いレベルの理解と会話能力を備えたコンテキストです。例えば、ユーザーが冷蔵庫の中の写真を送った場合、Virtual Volunteerはその中に何が入っているかを正しく認識できるだけでなく、その食材を使って何が作れるかを推定・分析できます。そして、その食材を使ったレシピをいくつも提示し、作り方のステップバイステップを送ることもできるツールです。
引用:Be My Eyes
バーチャルボランティアツールとはBe My Eyesの機能の一つで、GPT-4を搭載しています。一般公開はまだ先のようですが、数週間以内に法人向けにベータ版を配信するようです。
「GPT-4は、既存の薬の代替品となる化合物の生成ができるのではないか」とOpenAIは示唆しています。以下の画像はGPT-4が既存薬品と似た性質の化合物を探し、特許侵害にならないよう修正、購入するまでの流れを示しています。
なお、この使い方はOpenAIが禁止しています。
自社サイトにChatGPTを導入できる?
GPT-4は多くの機能でGPT-3.5から進化していますが、完全な信頼はできません。OpenAIも以下のように述べています。
Despite its capabilities, GPT-4 has similar limitations as earlier GPT models. Most importantly, it still is not fully reliable (it “hallucinates” facts and makes reasoning errors). Great care should be taken when using language model outputs, particularly in high-stakes contexts, with the exact protocol (such as human review, grounding with additional context, or avoiding high-stakes uses altogether) matching the needs of specific applications.
和訳:GPT-4はその能力にもかかわらず、以前のGPTモデルと同様の限界を持っています。最も重要なのは、まだ完全な信頼性がないことです(事実を「幻覚」したり、推論ミスをしたりします)。言語モデルの出力を使用する場合、特に利害関係の強い文脈では、特定のアプリケーションのニーズに合わせて正確なプロトコル(人間のレビュー、追加の文脈による根拠付け、利害関係の強い用途の完全な回避など)を用いて、細心の注意を払う必要があります。
実際にGPT-4を利用しているユーザーから「回答のソースを尋ねると、架空の論文を提示してくる」という声が挙がっており、人間によるレビューや事実確認は今後も重要なセクションとなります。また、今までのChatGPT同様、2021年9月以降の情報については答えられません。
GPT-4には現在、2つの機能制限があります。
GPT-4の制限
以下の画像のとおり、4時間につき50回の回数制限があります。
画像入力も現在制限中です。しかし、GPT-4を搭載したアプリ「Be My Eyes」は公式サイトで、数週間以内に画像入力機能のベータ版をリリースし、今年の後半に一般公開すると発表しています(参考:Be My Eyes)。このことからも、ChatGPTの画像入力制限も今年中には解除されると推測できます。
現在GPT-4のAPIは現在公開されていませんが、ウェイティングリストには登録可能です。GPT-4のコンテキストサイズ(文字数上限)は8kと32kの2種類あり、1000トークンあたりの価格は以下の通りとなっています。
モデル | 入力時の価格(1000トークン) | 出力時の価格(1000トークン) |
GPT-4(8k) | 0.03ドル | 0.06ドル |
GPT-4(32k) | 0.06ドル | 0.12ドル |
実際にGPT-4とGPT-3.5に以下の同じ質問を投げかけて検証を行いました。
GPT-4とGPT-3.5で比較した性能・能力
それぞれの違いについて解説していきます。
大きな違いではありませんが、GPT-4は視認性が向上しています。以下は、計算過程を指示して数学の問題を解かせた際の画像です。
入力内容
2x^3+x^2+x-1を因数分解してください。ただし以下の流れに沿って計算を進め、符号違いには十分気をつけること。
1.2X^3をx^3+x^3に分解する
2.元の式を並び替えてx^3-1を作る
GPT-3.5は緑色のアイコンですが、GPT-4は黒色のアイコンで表示されます。
GPT-4は指示内容を見出しとして途中式を作成しており、数式の途中に説明文を入れるため、解法が見やすいです。一方GPT-3.5は指示内容は記述せず、説明も最小限です。GPT-4の方が視認性が高く、指示に従っているかどうかが一目で確認できます。
情報の正確性を確認するために芥川龍之介の「蜘蛛の糸」について質問しました。
入力内容
芥川龍之介の蜘蛛の糸について
1.登場人物
2.あらすじ
3.教訓
についてそれぞれ教えてください。
GPT-4は正確に登場人物・あらすじ・教訓の説明ができましたが、GPT-3.5は架空の物語の説明をしたうえ、あらすじの文法も不自然でした。
要約能力を比較するため、サッカーについて説明された文章を要約させました。元の文章は1000文字程度で、「200~250文字程度で要約して」と命令しています。
GPT-4は文章の核となる部分を中心に適切な要約をし、文字数も220文字と指示通りでした。
GPT-3.5も要約はできましたが、延長戦やポジションの説明など、優先順位に欠ける文章も盛り込んでいます。また、文字数は指示内容を超過する291文字でした。
翻訳能力を比較するため、先ほどGPT-4に要約させたサッカーの文章を英訳させ、もう一度和訳させました。
入力内容
以下の内容を英訳し、英訳したものを日本語訳してください。
(サッカーの文章は省略します)
上がGPT-4、下がGPT-3.5の結果です。
どちらのモデルで再翻訳した文章も、ほぼ原文そのままの文章でした。少なくともこの程度のレベルの文章であれば翻訳能力に差はないようです。
本記事では以下について解説しました。
この記事で解説したこと
GPT-4は性能の向上によって、GPT-3.5より多くの分野で高レベルな文章作成が可能になりました。実際に比較してみても要約能力や正確性などに違いを確認できます。
今後画像入力も可能となるGPT-4は多くの分野で活躍が予想されます。本記事を参考に、GPT-4の機能を試してみましょう。