マスログ

OpenAIの最新モデルChatGPT o3-Proは京都大学に入学できるのか?

公開日

2025年6月18日

更新日

2025年6月17日


2025年6月にOpenAIは最新のAIモデル「ChatGPT O3-Pro」を発表しました。こちらは高度な推論が行えるo3モデルの後継モデルであり、その推論能力と応答精度の高さが特徴です。この記事ではo3-proモデルについて徹底解説します。

O3-Proモデルの概要と進化ポイント

 様々なAIモデルが世にある中で、o3-proモデルは推論が得意なモデルとして設計されています。推論とは数学や物理の問題のように論理的に考える必要がある問題のことを言います。前モデルのo3モデルも推論が得意なモデルとして設計されていましたが、o3-proは前モデルと比べて理由付けや判断力が向上しており、ユーザーの指示を守りながら正確な回答を生成できる点が大きな特徴です。特に回答の正確性を重視した設計となっているので、回答には少し時間がかかりますが、推論が必要な難しい問題に対して以前のモデルよりも良い回答がされることが期待できます。

実際に専門家によるo3-proモデルの評価が以下のように示されています。


OpenAI リリースノート

科学分析、ライティング支援、プログラミング、データ分析といったAI性能を測る主要分野において、o3-proがo3よりも精度が良いことが示されています。(図には、上記の評価指標において、o3-proモデルはのo3モデルに対する勝率が示されています。どの分野もo3-proが約6割以上の勝率を出していることが分かりますね。)

またこの評価は厳格性を重視して、4回実験を行って4回正しく答えられたときに正解したとみなす方法がとられているようです。このような厳しい評価で評価したo3-proは前モデル(o1-proやo3)よりも高い評価となっていることが分かります。

このように、ChatGPT O3-Proは知的作業をサポートする設計となっています。日常的なチャットというより、専門知識を必要とする分析やクリエイティブな思考が必要なタスクでより真価を発揮するでしょう。逆に言えば、単純な問い合わせや単純操作の業務であれば、より安価今までのモデル(4oなど)で十分というケースもあり、用途によって使い分けることが重要です。
※現在ChatGPT O3-Proモデルは、有料プラン(ChatGPT Proプラン加入者およびChatGPT Teamプラン)の加入者が利用できます。

利用上の制限

 O3-Proモデルにはいくつか知っておくべき制約や特徴もあります。まず第一に、応答速度が遅い点です。高い精度を出すために内部で綿密な推論プロセスや複数のツール呼び出しを行うため、従来モデルより回答までの時間が明らかに長くなります。複雑な質問では回答生成に数分要する場合もあるとされており、「すぐ返事が欲しい」という用途には不向きです。
 また、機能面でいくつか未サポートの部分もあります。現時点でO3-Proは画像生成機能と連携できません。ChatGPT4oには画像生成AI(DALL-Eモデル)との連携もありますが、O3-Pro自体はテキストとコードに特化したモデルのため、画像生成AIとの連携は現時点でサポートしていません。また、Canvas(ホワイトボード状のAIワークスペース)にも未対応となっています。これらからわかるように完璧なツールとは言えないかもしれませんが、o3-proモデルは専門分野の推論に特化した特殊なモデルと言えるかもしれません。

実際に使ってみました

 o3-Proモデルを実際にいくらか使ってみました。推論性能が高いということでいくつかの数学の問題を解いてもらいました。
まずは小手調べに京都大学2016年の整数問題を。

素数 \(p, q\) を用いて
\[
p^{q} + q^{p}
\]
と表される素数をすべて求めよ。

こちらの問題はいかにも京大らしい有名な整数問題です。回答のアプローチ(特に受験生が受験会場で考えられる現実的なアプローチ)は、いくつかの事例で実験を行い、そこからわかる規則性から仮説を立案し、それを立証するというものでしょう。

具体的には、
・qとpがともに3以上の奇数なら、与式は偶数になって素数にはならないので、p,qのうち片方は2になるな・・・
・pを2として、qを3, 5, 7, 11, …と実験すれば、q=3より大きいときに与式は3の倍数になりそう・・・
・もしかするとp=2, q=3以外の時には与式は素数になりえないのかも・・・
・ではそれを証明しよう・・・
というような思考の流れを行うような問題となります。実際にo3-proに解いてもらった回答が以下のものです。

o3-proモデルの回答

正しく回答できています。o3-proモデルは京都大学に入学できるほどの数学能力を持っているようです。
ちなみに前モデルo3でも同じ問題を解いてもらいました。

o3モデルの回答

こちらも正しく回答できていますが、回答は短く簡略なものになっています。
このモデルの推論性能を比較するために、推論モデルではない4oモデルでも試してみました。

4oモデルの回答

こちらは答えだけであれば正解ですが、数学の解答としては不十分なものになります。pとqにいくつかの値を入れて実験を行っているところまでは良いのですが、少しの実験の結果のみから、あたかもすべてを調べつくしたような回答を出しています。推論モデルではないモデルでは、このように考える必要がある問題に対処することが難しいのです。

ひっかけ問題にも対処できるのか?

 次はすこし意地悪なひっかけ問題も試してみましょう。以下の問題はMicrosoft社の入試問題として有名な三角形の問題です。

底辺が10で高さが6なので面積は30。こんなの簡単じゃないか、と思われるかもしれませんが、これはひっかけ問題なのです。実はこのような直角三角形は存在しないのです。斜辺が10のとき、どうやっても直角から斜辺にひいた垂線の長さは6にならないのです。つまり、こちらの問題の答えは、このような三角形は存在しないので、面積は求められない、が正解となります。このようなひっかけ問題に対応できるのでしょうか?まずは4oモデルから。

4oモデルの回答

4oモデルでは三角形の存在可能性に触れることなく回答を出しています。

o3-proモデルの回答

o3-proモデルでは三角形の存在可能性に触れています。これは答えを出した後に、その回答が本当に正しいのかどうかを考えることで導き出せたものでしょう。このように推論モデルではひっかけ問題にも正しく回答することができました。ちなみにo3モデルではどうでしょうか?

o3モデルの回答

今回の問題はo3モデルでも解くことができました。

少し気になること

 o3-proモデルは高度な推論が行えることはわかりましたが、1点気になることがあります。それは回答の遅さです。今回の問題ですが、o3-proモデルは他のモデルと比べて回答の長さが非常に長いです。

$$
\begin{array}{|l|c|c|}
\hline
\textbf{モデル} & \textbf{素数問題} & \textbf{三角形問題} \\
\hline
\text{o3-pro} & 8\,\text{分}9\,\text{秒} & 13\,\text{分}1\,\text{秒} \\
\text{o3} & 10\,\text{秒} & 49\,\text{秒} \\
\hline
\end{array}
$$

o3モデルでは難しく、o3-proモデルでしか解けない問題もあるとは思いますが、回答までの時間を考えた場合にはo3モデルが日常使いでは最も実用的なのかと感じました。しかしこの点は今後モデルが改良を重ねていくうちに解消されていくでしょう。

おわりに

 今回は、OpenAIのo3-proモデルについて解説しました。毎週のようにAIツールは進化しており、今後もその進化は止まらないでしょう。
弊社では様々なAIを学べるセミナーを開催していますのでご興味のある方はぜひチェックしてみて下さい。

★ClaudeなどのAIモデルを組み合わせた業務改善アプリを作ろう!★
Difyで始めるAI活用!プログラミング不要のAIエージェント作成入門【基礎編】
Difyで差がつくAI活用術!プログラミング不要のAIエージェント作成入門【実践編】

新着記事

同じカテゴリーの新着記事

同じカテゴリーの人気記事

CONTACTお問い合わせ

個別講義や集団講義、また法人・団体向けの研修を行うスペース紹介です。遠人に在住の方や自宅で講義を受けたい方はオンライン講座をご用意しております。よくある質問はこちら