ChatGPT 5.3 Codex（GPT-5.3-Codex）とは？性能・料金・使い方をわかりやすく解説

Top

記事一覧

2026-03-02

2min

ChatGPT 5.3 Codex（GPT-5.3-Codex）の性能、ベンチマーク結果、料金プラン、導入方法・使い方を徹底解説。25%高速化や自己進化機能など、開発現場と企業業務を変える最新AIエージェントの全貌をお届けします。

GPT-5.3-Codexとは？基本概要と開発背景

GPT-5.3-Codexは、OpenAIが2026年2月5日に発表した最新のエージェント型コーディングモデルです。前世代のGPT-5.2-Codexが持つ最先端のコーディング性能と、GPT-5.2が持つ高度な推論・専門知識能力を1つのモデルに統合し、さらに処理速度を25%向上させています。
従来のCodexシリーズが「コードを書くAI」だったのに対し、GPT-5.3-Codexは「コードをツールとしてコンピュータを操作し、業務をエンドツーエンドで完了できるAIエージェント」へと進化しました。リサーチやツールの活用、複雑な処理を伴う長時間のタスクにも対応でき、まるで同僚のように対話しながら作業を進められる点が大きな特徴です。

OpenAI Codexシリーズの位置づけ

Codexは、OpenAIが提供するソフトウェア開発支援に特化したAIエージェントシステムの総称です。単なるコード生成にとどまらず、プロジェクト全体を把握し、コードの修正・テスト実行・動作確認といった一連の開発作業を自律的に行います。
Codexシリーズの進化を整理すると、以下のとおりです。

モデル名	リリース時期	主な特徴
GPT-5-Codex	2025年7月	長時間タスクの自律的実行に対応
GPT-5.1-Codex-Max	2025年11月	高速・高精度・高効率なエージェント型モデル
GPT-5.2-Codex	2025年12月	4言語対応のSWE-Bench Proで高スコア
GPT-5.3-Codex	2026年2月	コーディング＋推論＋知識労働を統合、25%高速化

GPT-5.3-Codexは、ChatGPTの有料プランに含まれる機能として提供されており、Codexアプリ、CLI（コマンドラインインターフェース）、IDE拡張機能、Codex Cloud（Web版）など複数のチャネルから利用できます。

GPT-5.2-Codexからの主な進化ポイント

GPT-5.3-Codexが前世代モデルから大きく進化したポイントは、主に以下の3つです。
・コーディング性能と推論能力の統合：GPT-5.2では「コーディング特化モデル（Codex）」と「汎用推論モデル（GPT-5.2）」が別々に存在していましたが、GPT-5.3-Codexではこれらを1つに統合しています。これにより、コードを書くだけでなく、ドキュメント作成やデータ分析、資料作成といった知識労働タスクにも対応できるようになりました
・25%の高速化：インフラストラクチャと推論スタックの改善により、前世代比で25%高速に動作します。これはNVIDIA GB200 NVL72システムとの共同設計によるものです
・トークン効率の向上：同じタスクを完了するために必要なトークン数が従来モデルよりも少なくなっています。これにより、利用コストの削減とレスポンス速度の向上が期待できます

GPT-5.3-Codexは「自らの開発に貢献した初のモデル」

OpenAIによれば、GPT-5.3-Codexは「自身の開発に重要な役割を果たした初のモデル」です。具体的には、Codexチームが開発の初期段階からGPT-5.3-Codexの初期バージョンを活用し、以下のような作業を行いました。
・トレーニング中のバグのデバッグ
・デプロイメント（本番環境への展開）の管理
・テスト結果や評価データの診断・分析
これはAIが突然自分自身を構築したという意味ではなく、開発チームがモデルの初期バージョンをツールとして活用することで、開発プロセス全体を加速させたということです。OpenAIのCEOであるSam Altman氏も「5.3-Codexを使って5.3-Codexをより速く出荷できたことに驚いた」とコメントしています。

GPT-5.3-Codexの主な特徴と新機能

コーディング×推論×知識労働を統合した汎用エージェント

GPT-5.3-Codexの最大の特徴は、「コードを書くエージェント」から「コンピュータ上でほぼあらゆる作業を遂行できる汎用エージェント」への進化です。OpenAIは公式ブログで「Codexは、コードの作成とレビューができるエージェントから、開発者やプロフェッショナルがコンピュータ上で行えるほぼすべてのことができるエージェントへと進化した」と述べています。
具体的に対応可能な業務領域は以下のとおりです。
・ソフトウェア開発：コード生成、リファクタリング、デバッグ、テスト設計、デプロイ
・ドキュメント作成：製品ドキュメント、技術仕様書、コピーの編集
・データ分析：スプレッドシートでのデータ集計・分析・グラフ化
・資料作成：PowerPointスライド、レポート、提案書の作成
・リサーチ：ユーザー調査、市場分析、競合調査
OpenAIの評価基準であるGDPvalでは、44の専門職にわたる知識労働タスク（プレゼンテーション作成、スプレッドシート処理など）においても高いスコアを記録しています。

25%の高速化とトークン効率の向上

GPT-5.3-Codexは、インフラストラクチャと推論スタックの最適化により、GPT-5.2-Codex比で25%高速に動作します。この高速化は、NVIDIA GB200 NVL72システム向けに共同設計・トレーニング・提供されたことで実現しました。
さらに、ベンチマークテストにおいて「従来のどのモデルよりも少ないトークンで同等以上の成果を達成している」と報告されています。トークン消費量が少ないということは、同じ予算でより多くのタスクを処理できることを意味し、企業にとっては運用コスト削減に直結します。

リアルタイム対話（ステアリング）機能

GPT-5.3-Codexでは、エージェントが作業中でもリアルタイムで指示や修正を加えられる「ステアリング（Steer）」機能が強化されています。従来のモデルでは、タスクを依頼したら完了を待つしかありませんでしたが、GPT-5.3-Codexでは以下のような対話が可能です。
・作業途中で方針変更を指示する
・進捗状況を確認し、質問や議論を行う
・トレードオフについて相談しながら進め方を調整する
GPT-5.3-Codexは作業中に頻繁に状況を共有してくれるため、最終結果を待つ必要がなく、人間とAIが協働する新しいワークスタイルを実現しています。

Codex Spark：リアルタイム編集に特化した軽量モデル

GPT-5.3-Codexと同時期に、OpenAIは「Codex Spark」という軽量モデルも発表しました。Codex Sparkは、リアルタイムでの対話的な編集作業に特化して設計されており、Cerebras社の推論基盤上で動作することで超低レイテンシーを実現しています。
主な特徴は以下のとおりです。
・ターゲットを絞った最小限の編集に最適化
・128Kのコンテキストウィンドウ（テキストのみ対応）
・ChatGPT Proユーザー向けにリサーチプレビューとして提供
GPT-5.3-Codexが「長時間・大規模タスクの自律実行」に強いのに対し、Codex Sparkは「即座のコード修正・微調整」に適しており、用途に応じた使い分けが推奨されています。

GPT-5.3-Codexのベンチマーク性能を比較

GPT-5.3-Codexは、ソフトウェアエンジニアリング、ターミナル操作、デスクトップ操作、知識労働といった複数の評価基準で、従来モデルを上回る成績を収めています。主要ベンチマークの結果は以下のとおりです（2026年2月時点、OpenAI公表値）。

ベンチマーク	GPT-5.3-Codex	GPT-5.2-Codex	GPT-5.2
SWE-Bench Pro（Public）	56.8%	56.4%	55.6%
Terminal-Bench 2.0	77.3%	64.0%	62.2%
OSWorld-Verified	64.7%	38.2%	37.9%
GDPval（勝率+引分率）	70.9%	—	70.9%
Cybersecurity CTF	77.6%	—	—

※すべてのベンチマークはxhigh（最高推論レベル）設定で実施されています。

SWE-Bench Pro：ソフトウェアエンジニアリング評価

SWE-Bench Proは、実世界のソフトウェアエンジニアリング能力を厳密に評価するベンチマークです。Python限定のSWE-bench Verifiedとは異なり、4つのプログラミング言語をカバーし、データ汚染に強い設計になっています。GPT-5.3-Codexは56.8%のスコアを記録し、GPT-5.2-Codexの56.4%をわずかに上回りました。数値的には小さな差ですが、ポリグロット（多言語）コードベースを扱う開発チームにとっては意味のある向上です。

Terminal-Bench 2.0：ターミナル操作スキル評価

Terminal-Bench 2.0は、コーディングエージェントに必要なターミナル（コマンドライン）操作スキルを測定するベンチマークです。GPT-5.3-Codexは77.3%を記録し、GPT-5.2-Codexの64.0%から13ポイント以上の大幅な向上を達成しました。
この結果は、GPT-5.3-Codexがコマンドの実行、出力の解釈、エラーからの回復、複数ステップにわたるワークフローの管理といった実践的な開発スキルに優れていることを示しています。

OSWorld-Verified：デスクトップ操作評価

OSWorld-Verifiedは、AIエージェントがビジュアルなデスクトップ環境で生産性タスクを遂行する能力を評価するベンチマークです。人間のスコアが約72%とされるなか、GPT-5.3-Codexは64.7%を記録しました。前世代のGPT-5.2-Codexが38.2%であったことを考えると、ほぼ倍増に近い劇的な改善です。
この結果は、GPT-5.3-Codexがコーディングだけでなく、スプレッドシートの編集やプレゼンテーションの作成といった一般的なデスクトップ操作でも高い能力を持つことを意味しています。

GDPval・Cybersecurity CTF：知識労働・セキュリティ評価

GDPvalは、OpenAIが2025年にリリースした評価基準で、44の専門職にわたる知識労働タスクのパフォーマンスを測定します。GPT-5.3-Codexは70.9%の勝率・引分率を達成し、GPT-5.2と同等の高水準を維持しています。コーディング特化モデルでありながら、プレゼンテーション作成やスプレッドシート処理などの業務タスクでも高い能力を発揮している点は注目に値します。
また、サイバーセキュリティ分野のCTF（Capture The Flag）課題では77.6%のスコアを記録しています。GPT-5.3-Codexは脆弱性の検出能力を向上させるために直接トレーニングされた初のモデルであり、OpenAIはこのモデルを自社の「準備態勢フレームワーク」においてサイバーセキュリティ分野で「High」と分類しています。

GPT-5.3-Codexの料金プランと利用条件

ChatGPTプラン別のアクセス条件

GPT-5.3-Codexは、ChatGPTの有料プランに含まれる機能として提供されています。独立した「Codex専用プラン」は存在せず、ChatGPTのサブスクリプションにCodexの利用権が含まれる仕組みです。2026年2月時点での各プランの概要は以下のとおりです。

プラン	月額料金	Codex利用	主な特徴
Free	無料	期間限定で試用可	基本機能のみ、メッセージ数に制限あり
Plus	20ドル	利用可	5時間ごとに30〜150のローカルタスク
Pro	200ドル	利用可（優先）	5時間ごとに300〜1,500のローカルタスク、優先サポート
Business	25〜30ドル/人	利用可	共有クレジットプール、管理者によるCodex有効化が必要
Enterprise	カスタム	利用可	ボリューム割引、請求書発行、セキュリティ強化

利用制限に達した場合は、追加のChatGPTクレジットを購入することで上限を拡張できます。また、2026年2月時点では期間限定でFreeおよびGoプランのユーザーもCodexを試用できるキャンペーンが実施されています。

API提供の状況と今後の見通し

2026年2月時点では、GPT-5.3-CodexのAPIアクセスはまだ提供されていません。OpenAIは「安全にAPIアクセスを提供できるよう、近日中の有効化に向けて取り組んでいる」と発表しています。API経由でのアクセスが必要な場合は、当面の間は前世代のgpt-5.2-codexを利用することが推奨されています。
APIの具体的なトークン単価も未公表ですが、前世代モデルと同様に入力・出力それぞれのトークン量に応じた従量課金制になる見込みです。企業でのAPI活用を検討している場合は、OpenAI公式の料金ページを定期的に確認することをおすすめします。
OpenAI API料金ページ

GPT-5.3-Codexの導入方法・使い方

GPT-5.3-Codexは、用途や開発環境に応じて複数のチャネルから利用できます。ここでは、主要な4つの利用方法を順に解説します。

ChatGPT Web版での利用手順

もっとも手軽にGPT-5.3-Codexを試す方法は、ChatGPTのWeb版（またはモバイルアプリ）を利用することです。手順は以下のとおりです。
・ChatGPT（https://chatgpt.com）にアクセスし、有料プランのアカウントでログインする
・画面上部の「Codex」タブを開く
・モデルセレクターから「GPT-5.3-Codex」を選択する
・自然言語でプロンプト（指示）を入力すると、GPT-5.3-Codexがコードや成果物を生成する
Web版では、エージェントの進捗確認やリアルタイムでの対話が可能です。コーディングだけでなく、リサーチやドキュメント作成なども依頼できます。

Codex CLIのインストールと基本操作

Codex CLI（コマンドラインインターフェース）は、ターミナルからCodexを操作するためのツールです。ローカルのプロジェクトディレクトリを指定し、リファクタリングやテスト強化などをエージェントと対話しながら進められます。
インストール手順は以下のとおりです。
・Node.js（v18以上）またはBunがインストールされていることを確認する
・ターミナルで以下のコマンドを実行する：npm install -g @openai/codex
・codex コマンドを実行し、ChatGPTアカウントでサインインする
・モデルの指定は、codex -m gpt-5.3-codex のように –model/-m フラグを使用する
CLIでは、/model コマンドでセッション中にモデルを切り替えることも可能です。また、config.toml ファイルでデフォルトモデルを設定しておくと、毎回の指定が不要になります。

IDE拡張機能（VS Code等）での利用方法

GPT-5.3-Codexは、VS CodeやJetBrains系IDEの拡張機能としても利用できます。普段の開発環境にそのまま統合できるため、ワークフローを変えずにAI支援を導入できる点がメリットです。
VS Codeでの利用手順は以下のとおりです。
・VS Codeの拡張機能マーケットプレイスから「Codex」拡張機能をインストールする
・ChatGPTアカウントでサインインする
・コンポーザー（入力欄）下部のモデルセレクターから「GPT-5.3-Codex」を選択する
・自然言語で指示を入力すると、エディタ上でコード生成・修正が行われる
GPT-5.3-Codexが表示されない場合は、拡張機能を最新バージョンにアップデートしてください。

Codex Cloud（Web版エージェント）の使い方

Codex Cloudは、ブラウザ上でCodexエージェントにタスクを依頼できるWebインターフェースです。ローカル環境にツールをインストールする必要がなく、GitHubのリポジトリと連携してクラウド上でタスクを実行します。
利用手順は以下のとおりです。
・ChatGPTのCodex画面からCodex Cloudにアクセスする
・対象のGitHubリポジトリを接続する
・タスク内容を自然言語で入力する
・エージェントがクラウド環境上でタスクを実行し、完了後にプルリクエストを作成する
なお、2026年2月時点ではCodex Cloudのデフォルトモデルは変更できないため、自動的に推奨モデルが使用されます。GitHub IssueでCodexにメンションすることで、Issueからタスクをトリガーすることも可能です。
OpenAI Codex Models公式ドキュメント

GPT-5.3-Codex導入時の注意点

サイバーセキュリティ「High」分類の意味

GPT-5.3-Codexは、OpenAIの「準備態勢フレームワーク（Preparedness Framework）」において、サイバーセキュリティ分野で「High」能力と分類された初のモデルです。これは、このモデルがサイバー攻撃に悪用された場合に、実世界で重大な影響を及ぼす可能性があるとOpenAIが判断したことを意味します。
OpenAIはこのリスクに対して、以下のような多層的な安全対策を導入しています。
・デュアルユース安全トレーニング（攻撃と防御の両面でのトレーニング）
・自動モニタリングシステム
・高度な機能に対するTrusted Access（信頼されたアクセス）プログラム
・脅威インテリジェンスを組み込んだ執行パイプライン
・サイバー防御向けに1,000万ドル分のAPIクレジットを提供
企業がGPT-5.3-Codexをセキュリティ関連業務に活用する場合は、Trusted Access for Cyber（TAC）プログラムへの参加が前提となります。

API未提供によるビジネス活用の制約

2026年2月時点では、GPT-5.3-CodexのAPIアクセスが未提供であるため、自社のシステムやCI/CDパイプラインに直接組み込むことができません。カスタムワークフローの自動化や、既存の開発ツールチェーンとの本格的な連携を予定している場合は、API提供開始を待つ必要があります。
当面は、Codex CLI・IDE拡張機能・Codex Cloud経由での利用が中心となるため、まずはこれらのチャネルでPoCを実施し、GPT-5.3-Codexが自社の開発フローにどの程度適合するかを検証しておくのが現実的なアプローチです。

企業導入時のガバナンス設計

GPT-5.3-Codexを企業で導入する際は、モデル単体の安全性だけに依存せず、組織側のプロセスやアクセス制御とセットで運用設計を行うことが重要です。具体的には、以下のような観点を事前に整理しておくことをおすすめします。
・どの範囲の環境で、どのレベルの権限を持つタスクをCodexに任せるのか
・ログ取得や監査の仕組みをどう設計し、誰がレビューするのか
・TACを利用する場合、対象チーム・対象プロジェクト・許可されたユースケースをどう定義するのか
・Business／Enterpriseプランでは、管理者がワークスペースでCodexを有効化する設定が必要になる点に注意
すべてをGPT-5.3-Codexに委ねるのではなく、軽量なタスクは他のモデルに任せつつ、プロジェクト規模の開発やセキュリティ診断など「人の時間が重い仕事」に集中して使う設計が現実的です。

競合モデルとの比較：Claude Opus 4.6との違い

GPT-5.3-Codexの発表と同日（2026年2月5日）に、Anthropicも最新フラッグシップモデル「Claude Opus 4.6」をリリースしました。両モデルはAIコーディングエージェント市場において直接的な競合関係にあり、それぞれ異なるアプローチを取っています。

比較項目	GPT-5.3-Codex	Claude Opus 4.6
開発元	OpenAI	Anthropic
設計思想	インタラクティブな協働型エージェント	深い思考と自律的な実行を重視
Terminal-Bench 2.0	77.3%	65.4%
コンテキストウィンドウ	非公開	100万トークン
処理速度	GPT-5.2-Codex比25%高速	長文脈での精度を重視
料金（個人プラン）	ChatGPT Plus 月額20ドルから	Claude Pro 月額20ドルから
API提供	近日提供予定（2026年2月時点では未提供）	提供中

GPT-5.3-CodexはTerminal-Bench 2.0で優位に立ち（77.3% vs 65.4%）、ターミナル操作やコマンドライン駆動の開発ワークフローに強みがあります。一方、Claude Opus 4.6は100万トークンのコンテキストウィンドウを活かした長文脈での推論や、複雑なレガシープロジェクトの理解に優れています。
選択のポイントとしては、ターミナル操作やCI/CD連携を重視する開発チームにはGPT-5.3-Codex、大規模なコードベースの理解や長文脈処理を重視する場合はClaude Opus 4.6が適しています。両モデルともに急速に進化しているため、自社のユースケースに合わせて実際に試用し、比較検証を行うことが重要です。
Claudeの詳細については、以下のIoT Bizの記事もあわせてご参照ください。
Claudeとは？特徴・料金プラン・ChatGPTとの違いからビジネス活用法まで徹底解説｜IoTBiz

まとめ

GPT-5.3-Codexは、OpenAIが2026年2月にリリースした最新のエージェント型AIモデルです。コーディング性能と推論・知識労働能力を統合し、25%の高速化とトークン効率の向上を実現しています。ベンチマークでは、Terminal-Bench 2.0で77.3%、OSWorld-Verifiedで64.7%と、特にターミナル操作とデスクトップ操作で大幅な性能向上を記録しました。
利用にはChatGPTの有料プラン（Plus以上）が必要で、Codexアプリ、CLI、IDE拡張機能、Codex Cloudの4つのチャネルから利用できます。ただし、2026年2月時点ではAPIアクセスが未提供である点には注意が必要です。
企業が導入を検討する際は、まずCLIやIDE拡張機能で小規模なPoCを実施し、自社の開発フローとの適合性を確認することをおすすめします。GPT-5.3-Codexは単なるコード生成ツールではなく、開発・分析・資料作成を横断する汎用AIエージェントとして、ビジネスのあり方を変えるポテンシャルを持っています。