記事一覧に戻る
GPT-5.5とは?OpenAIの新モデルの性能・料金・Claude Opus 4.7との違いを徹底比較

GPT-5.5とは?OpenAIの新モデルの性能・料金・Claude Opus 4.7との違いを徹底比較

ZenChAIne·
AIGPT-5.5OpenAI

はじめに

2026年4月23日、OpenAI が最新モデル GPT-5.5(一部報道では "Spud" とも呼ばれています)をリリースしました。前モデル GPT-5.4(2026年3月5日公開)から約7週間後という異例のスピードでの発表で、フロンティア AI ラボ間の競争が激化していることを象徴するリリースです。

GPT-5.5 は OpenAI が「最もスマートで直感的に使えるモデル」と位置づけており、Terminal-Bench 2.0 で82.7% という最先端スコアを記録。エージェンティックなコーディング、コンピュータ操作、知的作業、科学研究の領域で特に大きな改善が見られます。

この記事のポイント

  • GPT-5.5 は2026年4月23日にリリースされた OpenAI の新モデルで、Terminal-Bench 2.0 で82.7%(SOTA)を記録
  • SWE-Bench Pro では Claude Opus 4.7(64.3%)に及ばない58.6%だが、外部比較レポートでは公開モデル全体で14ベンチマーク首位と集計されている
  • ChatGPT Plus / Pro / Business / Enterprise で利用可能、API は近日公開予定

GPT-5.5 は何がすごいのか?

GPT-5.5 の最大の強みは エージェンティックな自律作業 です。OpenAI は「データ分析、コード記述・デバッグ、ソフトウェア操作、オンラインリサーチ、ドキュメント・スプレッドシート作成」に優れると発表しており、マルチステップのワークフローをユーザー入力を減らしてこなせるようになっています。

公式ベンチマークの抜粋は以下の通りです。

  • Terminal-Bench 2.0: 82.7%(SOTA)——コマンドラインで計画・反復・ツール連携を要求する複雑ワークフロー
  • SWE-Bench Pro: 58.6%——複数ファイルにまたがる GitHub Issue 解決(Claude Opus 4.7 は64.3%でリード)
  • 一部の外部比較レポートでは、公開モデル全体で 14ベンチマーク SOTA とされ、Claude Opus 4.7 や Gemini 3.1 Pro をリード(Lushbinary のまとめ 等を参照。公式本文には総数の明示がないため比較レポート側の集計値)

効率面の改善 も大きなポイントです。GPT-5.5 は「より少ないトークンで、より速く、より鋭く考える」モデルで、GPT-5.4 と同じトークンあたりのレイテンシを維持しながら大幅に賢くなっています。実運用でトークン消費を抑えられるのは、API 利用者にとって直接的なコスト削減につながります。

OpenAI は「コンピュータ作業のナビゲーション能力が前モデルを上回り、科学的・技術的研究のワークフローで意味のある改善を見せている」として、創薬研究などへの応用可能性にも言及しています(詳細は OpenAI 公式発表 を参照)。

Claude Opus 4.7 や Gemini 3.1 Pro とどう違うのか?

フロンティアモデルは強みの領域が分かれてきています。結論から言えば、エージェンティックワーク→ GPT-5.5、コード品質→ Claude Opus 4.7 という住み分けが鮮明です(Gemini 3.1 Pro の最新スペックは一次ソースで必ず確認してください)。

項目GPT-5.5Claude Opus 4.7
SWE-Bench Pro58.6%64.3%(リード)
Terminal-Bench 2.082.7%(SOTA)
コンテキスト窓1M トークン1M トークン
最大出力128K128K
入力料金(1Mトークン)$5$5
出力料金(1Mトークン)$30$25

少なくとも SWE-Bench Pro では Claude Opus 4.7(64.3%)が GPT-5.5(58.6%)を上回ります。一方、Terminal-Bench 2.0 では GPT-5.5 が82.7% で SOTA を記録しています。個別ベンチマークで勝敗が分かれているため、自分のタスクに近い評価軸を選ぶことが重要です。

Google の Gemini 3.1 Pro も引き続き強力な選択肢ですが、記事執筆時点の一次ソースで確認できた価格・仕様は Gemini 2.5 Pro のものが多く、Gemini 3.1 Pro の最新スペックは Google DeepMind のモデルページ で確認してください。

料金体系はどうなっているのか?

GPT-5.5 の API 料金は $5 / $30 per 1M トークン(入力/出力)と発表されています。GPT-5.5 Pro は 入力 $30 / 出力 $180 per 1M トークン です。API は "very soon" とアナウンスされており、2026年4月時点では ChatGPT アプリ経由で先行利用可能です。

Claude Opus 4.7($5 / $25)と比べると出力料金がやや高く、17% 高価になります。一方で、ワークフローによってはトークン消費が少なく済むため、実行あたりコスト で見ると優位になるケースもあります。

ChatGPT 内での利用プラン別の状況は以下の通りです。

  • GPT-5.5: Plus / Pro / Business / Enterprise
  • GPT-5.5 Pro: Pro / Business / Enterprise
  • ChatGPT 内の Codex: GPT-5.5 搭載で提供

どうやって使い始めるのか?

ChatGPT ユーザーは、2026年4月23日以降モデルセレクターから GPT-5.5 を選択できます(対応プランの場合)。無料プランは対象外なので、試すには Plus 以上へのアップグレードが必要です。

API 経由で使いたい場合は、OpenAI の公式アナウンスを待つ必要があります。現時点では "very soon" とのことで、早期アクセスを希望する場合は OpenAI のパートナーシッププログラム 経由で問い合わせる流れになるでしょう。

API 公開後は、各種 CLI や IDE 拡張でもモデル指定が可能になると想定されますが、正確なモデル ID や対応ツールの詳細は OpenAI の公式リリースノートを待つのが確実です。

よくある質問

Q. GPT-5.4 から何が変わりましたか?

A. 主な変更点は3つです。(1) エージェンティックワークの大幅強化、(2) より少ないトークンで同等以上の品質を実現する効率改善、(3) Terminal-Bench 2.0 で82.7% という SOTA スコア。GPT-5.4 と同じレイテンシを維持しつつ賢くなっています。

Q. Claude Opus 4.7 と比べてどちらを選ぶべきですか?

A. 用途によります。コード品質最優先なら Claude Opus 4.7(SWE-Bench Pro で6.6ポイントリード)、エージェント的自律タスクやターミナル操作を中心に据えるなら GPT-5.5 が優位です。併用してタスクに応じて使い分けるのが最も効率的です。

Q. API はいつ使えますか?

A. OpenAI は "very soon(近日公開)" とアナウンスしており、2026年4月時点ではまだ API 公開されていません。安全要件のパートナー調整中とのことです。公開時期が気になる場合は OpenAI の公式発表をフォローしてください。

Q. 料金は高くなりましたか?

A. API 料金は $5 / $30 per 1M トークンで、前モデル GPT-5.4($2.50 / $15)から倍近く上昇しています。ただしトークン効率が向上しているため、実タスクあたりコストは必ずしも単純な倍増にはなりません。

Q. 無料プランで試せますか?

A. 2026年4月時点では無料プランでは利用できません。ChatGPT Plus($20/月)以上へのアップグレードが必要です。

まとめ

GPT-5.5 は、OpenAI が エージェンティック時代への一歩 として位置づけたモデルです。単なる質問応答を超えてタスク自律実行を重視した設計が特徴で、OpenAI 公式も将来のコンピューティング体験に向けた着実な一歩として紹介しています。

Claude Opus 4.7 のコード品質、GPT-5.5 のエージェント力、各社それぞれの長文・コスト特性——フロンティア AI は完全な勝者ではなく強みの分化が進んでいます。ZenChAIne では引き続き、主要 AI モデルの進化と実務での使い分けをウォッチしていきます。

参考ソース