GPT-4とは？できることやGPT-3との違いについて解説

GPT-4とは、Generative Pre-trained Transformer 4の略で、OpenAIが開発したテキスト生成ディープラーニングの機能を備えたマルチモーダルな大規模言語モデルです。本記事では、GPT-4について詳しく解説します。

GPT-4とはGenerative Pre-trained Transformer 4の略である
GPT-4とはマルチモーダルな大規模言語モデルである
GPT-4とはOpenAIが開発してリリースしている
GPT-4とはテキスト生成ディープラーニング機能を備えている
GPT-4とはパラメーター数が100兆個である
GPT-4とは画像（写真）での入力ができる

GPT-4は、2023年にOpenAIが開発および発表した大規模言語モデルであり、高度な推理機能を持っているため、人間と変わらないような流暢な言語出力ができるようになりました。GPT-3やChatGPTとの違いについても説明しているので、気になる人は最後までご覧下さい。

NEW!!：GPT-4Vが誕生しました！（追記：2023/10/11）

GPT-4とは？
GPT-4でできること
GPT-4を開発したOpenAIとは？
GPT-4とGPT-3の違いとは？比較してみた！
1. GPT-4は遅い？GPT-3やGPT-3.5と比較してみた
GPT-4とChatGPTの関係とは？
GPT-4V(ision)システムカードとは？
GPT-4に関するまとめ

GPT-4とは？

GPT-4とは、Generative Pre-trained Transformer 4の略であり、非営利団体のOpenAIが開発したマルチモーダルな大規模言語モデルです。GPT-3と比べて、幅広い一般知識と問題解決能力があり、画像を読み取り、その内容を説明できる次世代のAI言語モデル（マルチモーダルモデル）です。

2023年3月15日に発表された「GPT-4」は、あらゆるタスク処理のスコア結果が非常に高く、既にMicrosoftの検索エンジンであるBingにも導入されています。

GPT-4に関するパラメーター数や最大トークン数やAPI利用に関する内容は、次のとおりです。

GPT-4に関する項目	説明
名称	GPT-4(Generative Pre-trained Transformer 4)
開発元	OpenAI（アメリカの非営利団体）
説明	自然言語処理のための次世代のAI言語モデル
学習データ	インターネット上の大量のテキストデータ
パラメーター数	約100兆個
最大トークン数	32,768個（2の15乗）
言語	英語
機能	テキストと画像の両方で入力できること（マルチモーダルモデル）
API利用	「GPT-4 API Waitlist」に登録して順番を待つ

GPT-4 API Waitlist
https://openai.com/waitlist/gpt-4-api

OpenAIが、新しい言語モデルのGPT-4oを発表しました。詳細は、「GPT-4oとは？」の記事をご確認下さい。

GPT-4oとは？OpenAIのGPT-4oの評価とベンチマーク結果

GPT-4o（ジーピーティーフォーオムニ）とは、OpenAIによって開発されたマルチモーダルな最も先進的な大規模言語モデルです。GPT-4oでは、テキスト、音声、画像の組み合わせを入力することが可能であり、テキスト、音声、画像の組み合わせを生成します。

GPT-4でできること

「GPT-4でできること」とは、画像（写真）の入力を行い、その内容を説明する文章を出力することができます。より多くの文字の出力を行い、司法試験で高得点を取ることも可能です。言語モデルの精度がGPT-4にバージョンアップしたことによって、日本語での精度も向上しました。

GPT-4でできることは、次の通りです。

画像（写真）入力をすると文章を出力できる
最大25,000単語を取り込むと文字を生成できる
専門的な内容に関する文字生成が正確にできる

画像（写真）入力をすると文章を出力できる

GPT4では、画像（写真）入力をすることで、文章を出力することができます。OpenAIでは、GPT3に続いて、高性能な言語生成モデルの作成に成功しました。

最大25,000単語を取り込むことができる

GPT4では、最大25,000単語を取り込むことができます。以前までは、2,048単語でした。しかし、2023年の3月に発表されたGPT4では、より多くの単語を入力できるようになったため、論文の作成や小説も書ける時代が来るかもしれません。

専門的な内容に関する文字生成が正確にできる

GPT4では、専門的な内容に関する文字生成が正確にできます。OpenAIが行ったテストによると、司法試験の問題やその他の知名度がある試験をGPT4に解かせたところ、GPT3とは比べ物にならないほど評価が高かったそうです。

旧バージョンであるGPT2からGPT4になるまで、約4年でした。GPT2とは、2019年2月14日に発表された言語モデルです。あらゆる仕事がAIに奪われる時代はすぐそこまで来ており、人の手が必要な仕事を除いて、事務的で例外があまりないような仕事は淘汰されてしまうかもしれません。

GPTは言語モデルに過ぎず、できることは限られています。しかし、GPTをAPIとして利用し、他のアプリケーションと連携する事で更なる効果を発揮します。現在では、AIによる画像生成や音声生成なども発達しており、実在する人物と見分けが付きません。まずは、GPTについて理解を深め、時代に合わせて生き抜く知恵を身に着ける事がとても重要です。

GPT-4を開発したOpenAIとは？

OpenAIは、サンフランシスコのパイオニアビルに本社を構える非営利団体です。OpenAIでは、AIを促進および開発を行うことを目的とした研究を行っています。

設立日	2015年12月11日
所在地	アメリカ合衆国：カリフォルニア州のサンフランシスコ

OpenAIの設立には、サム・アルトマンやイーロンマスクが関わっており、サンフランシスコで設立され、10億ドルが提供されました。次世代を担うAIに関する最先端の研究を行っています。

OpenAIでは、言語モデルであるGPTの作成を行っています。著名人や投資家が設立に関わっており、注目を浴びています。GPT-4には、人類が直面であろう問題解決能力が秘められているため、活用次第で世界の動向さえ決まってしまう時代の転換点である事は間違いありません。

GPT-4とGPT-3の違いとは？比較してみた！

GPT-4とGPT-3の違いは、パラメーター数が異なることによる正確性が一番の違いです。GPT-4では画像入力ができることの１つとして代表的です。他にも次のような違いがありますので、比較表をご覧下さい。

比較項目	GPT-4	GPT-3
名称	GPT-4(Generative Pre-trained Transformer 4)	GPT-3 (Generative Pre-trained Transformer 3)
パラメーター数	約100兆個	約1.75兆個
最大トークン	32,768（2の15乗）	2,048
機能	画像入力による文章生成、自然言語生成による文書作成	自然言語生成による文書作成
API利用	順番待ち	利用料金を支払えば利用可能

パラメーター数による違いはとても大きく、視覚的にもわかりやすい次の比較グラフをご覧下さい。

GPT-4は、GPT-3に比べてパラメーター数の違いにより精度が大幅に向上しました。APIの利用についても順番待ちの状況が続いています。また、OpenAIが提供するChatGPT Plusを月額20ドルで活用すれば、GPT-3.5を利用する事が出来ます。

GPT-4は遅い？GPT-3やGPT-3.5と比較してみた

GPT-4は出力が遅いとされています。私もChatGPT Plusを契約してGPT-4を体験してみました。GPT-4では、GPT-3やGPT-3.5と比べて、より求めている回答に近い内容の文章生成が行われます。

GPT-4における文章生成の遅さを時間で示すと、一回の文章生成に60秒ほど発生しますが、GPT3やGPT3.5は20秒ほどで文章生成されます。プロンプトによっては、文章生成の時間が短くなったり、長くなったりする場合もあるかもしれません。

GPT-4が搭載されているBingやTruthGPTとの比較

GPT-4を搭載しているBingは、最新情報を取得することに特化しており、GPT-4を搭載しているChatGPTでは、文章生成を主な目的として使われる事が比較的多いです。

GPT-4を搭載したBingで、文章生成を主な目的で利用することはありません。実際に利用してみたところ、さほど遅いという体感はありません。現在のTruthGPTでは、日本語対応しておらず、比較するのが難しい状況です。

GPT-4とChatGPTの関係とは？

GPT-4とChatGPTの関係を説明するには、それぞれの役割について理解する必要があります。GPT-4は言語モデルであり、ChatGPTは会話に優れた機能をもつWebアプリケーションのAIチャットボットです。

OpenAIによると、BingにはGPT-4のAPIが搭載されているとの事であり、ChatGPTでGPT-4を利用するには、ChatGPT Plusに加入する必要があります。ChatGPT Plusは、月額20ドルで利用することが可能であり、サブスクライブすることで下記のメリットを得ることができます。

ピーク時でも、ChatGPTへのアクセスが可能である
応答時間が短縮される
新機能に優先的にアクセスできる

GPT-4は、旧モデルと比べて幅広い知識と高度な問題解決能力があります。ChatGPT Plusに加入し利用を行ったり、API連携して有効的にマーケティング業務に使うこともできます。

GPT-4V(ision)システムカードとは？

OpenAIの公式から、現地時間の9月25日に「GPT-4V(ision)システムカード」が発表されました。日本人向けに分かりやすく解説します。

GPT-4 with vision (GPT-4V) enables users to instruct GPT-4 to analyze image inputs provided by the user, and is the latest capability we are making broadly available.
GPT-4V(ision) system card

GPT-4Vは、ユーザーが提供する画像入力を分析するようにGPT-4に指示することを可能にします。簡単に言うと、GPT-4の機能で、画像が入力対象となりました。

大規模な言語モデル（LLM）に追加のモダリティ（例：画像入力）を組み込むことは、私たちのようなメディア運営者やマーケターにとって、自由に画像解析を行い、編集する事が可能になるので、高度なデザイン知識が不要になる可能性があります。

マルチモーダルLLMは、新しいインターフェースや機能を持つ言語のみのシステムの影響を拡大する可能性があり、新しいタスクを解決し、ユーザーに新しい体験を提供することができるでしょう。

GPT-4Vはいつから使えるのか、どのようにアクセスするのか疑問の方は、OpenAIのコミュニティで質問されている方がいたので、下記リンクを参考にして下さい。