OpenAI、コーディング特化型「GPT-5-Codex」を発表

2025年9月16日に、OpenAIは、ソフトウェア開発に特化した革新的なAIモデル「GPT-5-Codex」を発表した。
このモデルは、複雑なプログラミングタスクを7時間以上独立して作業できる能力を持ち、開発者にとって真の意味でのAIペアプログラマーとして機能するとしています。

実世界のソフトウェア開発に最適化された性能

GPT-5-Codexは、実践的なソフトウェアエンジニアリング業務に焦点を当てて訓練された。プロジェクトのゼロからの構築、機能追加とテスト作成、デバッグ、大規模なリファクタリング、そしてコードレビューまで、開発現場で必要とされるあらゆるタスクに対応する。

主要なベンチマークでの成績:

  • SWE-bench Verified(500タスク):72.8%の精度を達成
  • コードリファクタリングタスク:51.3%(基本のGPT-5の33.9%から大幅向上)

特筆すべきは、Giteaのプルリクエストのような232ファイル、3,541行に及ぶ大規模な変更を含むリファクタリングタスクも処理できるとしています。

動的な思考時間調整による効率的な作業

GPT-5-Codexの革新的な特徴の一つは、タスクの複雑さに応じて思考時間を動的に調整する能力である。簡単で明確なリクエストには素早く応答し、複雑なタスクには必要な時間をかけて取り組む。

OpenAI社員のトラフィック分析によると:

  • 単純なタスク(下位10%):GPT-5と比較して93.7%少ないトークンで処理
  • 複雑なタスク(上位10%):2倍の時間をかけて推論、編集、テスト、反復を実行

実際のテストでは、大規模で複雑なタスクに対して7時間以上連続して作業し、実装の反復改善、テスト失敗の修正を経て、最終的に成功する実装を完成させた例が確認されている。

高精度なコードレビュー機能

GPT-5-Codexは、重要な欠陥を発見するためのコードレビューに特化した訓練も受けている。レビュー時には、コードベース全体をナビゲートし、依存関係を理解し、実際にコードとテストを実行して正確性を検証する。

人気のオープンソースリポジトリの最近のコミットで評価した結果:

  • 誤ったコメントの割合:4.4%(GPT-5の13.7%から大幅減少)
  • 高影響度のコメント割合:52.4%(GPT-5の39.4%から向上)
  • PRあたりの平均コメント数:0.93件(より的確で簡潔なレビュー)

開発環境との深い統合

Codexは開発者が既に使用している環境にシームレスに統合される:

Codex CLI

オープンソースとして提供され、画像(スクリーンショット、ワイヤーフレーム、図表)の共有機能、進捗追跡のTo-Doリスト、Webサーチ、外部システム接続用のMCPなどのツールを搭載。

IDE拡張機能

VS Code、Cursor、その他のVS Codeフォークに対応。開いているファイルや選択したコードのコンテキストを活用し、短いプロンプトでより速い結果を提供。

クラウド環境

コンテナのキャッシングにより、新規タスクとフォローアップの中央値完了時間を90%短縮。一般的なセットアップスクリプトを自動検出・実行し、必要に応じてpip installなどのコマンドを実行して依存関係を取得。

GitHub統合

リポジトリでコードレビューを有効にすると、PRがドラフトから準備完了に移行する際に自動的にレビューを実施。「@codex review for security vulnerabilities」のような特定の観点でのレビューも可能。

フロントエンド開発での優れた能力

GPT-5-Codexは、デスクトップアプリケーションの作成に加え、モバイルウェブサイトの作成においても人間の好みの評価で大幅な改善を示している。クラウドで作業する際は、入力として提供された画像やスクリーンショットを確認し、進捗を視覚的に検査し、作業のスクリーンショットを表示することができる。

OpenAI社内での実績

OpenAIでは、Codexが既に大部分のプルリクエストをレビューし、毎日数百の問題を発見している。これにより、Codexチームはより大きな自信を持って迅速に開発を進めることが可能になっている。

利用方法

GPT-5-Codexは、ChatGPT Plus、Pro、Business、Edu、Enterpriseプランに含まれており、以下の環境からアクセス可能:

  • Codex CLI(ターミナル)
  • IDE拡張機能(VS Code、Cursor等)
  • Webインターフェース
  • GitHub統合
  • ChatGPT iOSアプリ

プランによって利用量が異なり、Plusプランは週に数回の集中的なコーディングセッションをカバーし、Proプランは複数のプロジェクトにまたがる1週間分の作業をサポートする。

インストール方法:

bash

$ npm i -g @openai/codex

引用

あわせて読みたい
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。