OpenAI「コードレッド」の真相──GeminiとClaudeに追い上げられた巨人の次の一手

OpenAIが「コードレッド」を宣言した背景を、ベンチマーク逆転、エンタープライズ市場シェア、巨額インフラ投資、安全性リスクの4軸で整理し、次の一手をエンジニア視点で読み解きます。

テクノロジー
公開日: 2025年12月11日
読了時間: 16
著者: ぽちょ研究所
読了時間: 16

OpenAI“コードレッド”の真相──GeminiとClaudeに追い上げられた巨人の次の一手 はじめに:勝っているはずの王者が、なぜ「非常事態宣言」なのか

2022年末にChatGPTが登場してから、生成AIの主役はずっとOpenAIだ――多くの人はそう感じていると思います。 実際、2025年半ばの時点でChatGPTは週あたり7億人のアクティブユーザーを抱える、史上最大級のコンシューマーAIサービスになりました。 OpenAI

ところが2025年12月、OpenAI内部で「Code Red(コードレッド)」と名付けられた非常事態宣言が出ていたことが、複数の報道で明らかになりました。背景には、GoogleのGemini 3やAnthropicのClaude 4.5といったライバルLLM(大規模言語モデル)が、性能・企業導入ともにOpenAIを猛追、あるいは一部では追い越し始めている現実があります。 Tom's Hardware +1

この記事では、この「コードレッド」が意味するものを、

技術面(ベンチマーク)

ビジネス面(売上・市場シェア)

インフラ投資とリスク

といった観点から、できるだけ具体的な数字を使って整理してみます。そのうえで、「OpenAIの次の一手」をエンジニア目線で推測していきましょう。

  1. 何が起きたのか──OpenAI「コードレッド」メモの中身

まずは事実関係を押さえます。

1-1. 「ChatGPT最優先」への大転換

フィナンシャル・タイムズは、2025年12月初旬にサム・アルトマンCEOによる社内メモが出され、「Code Red(コードレッド)」フェーズへの移行が宣言されたと報じています。内容はざっくり言うと次の3点です。 Financial Times

ChatGPTの改善を最優先にし、それ以外の新規プロジェクトは後回し

動画SNSやショッピングエージェントなどの実験的プロジェクトを縮小・停止

モデルの差別化が難しくなる中で、ユーザー体験と継続利用を“守る”ことを最重要課題に

ビジネスインサイダーも同様のメモを報じ、「Protect the loop, delay the loot(ループを守り、儲けは後回し)」という印象的な表現で、ChatGPTのユーザー行動データ=「学習ループ」を広告などで壊さないようにする方針を解説しています。週あたりほぼ10億人近いユーザーから得られる対話ログがOpenAIの最大の“堀(moat)”だ、というわけです。 Business Insider

1-2. 直接の引き金は「Gemini 3のベンチマーク逆転」

Tom’s Hardwareや複数のテックメディアによると、このコードレッド宣言の直接の引き金になったのは、Googleの「Gemini 3」が主要な業界ベンチマークでChatGPT系モデルを上回ったという社外評価でした。 Tom's Hardware +1

さらに、フォーチュン誌の報道によれば、アルトマンは同じメモの中で、

「来週、社内評価でGemini 3を上回る新しい“推論特化モデル”をリリースする」

と述べ、短期的にも性能で巻き返す意思を示しているとされています。 Fortune

つまりコードレッドとは、

「ChatGPTはまだ世界最大のAIサービスだが、 技術 と 収益源 の両面でリードが危うくなっている。 だから、全資源を“本丸のChatGPT”に集中させる」

という宣言だと整理できます。

  1. データで見るOpenAIの現在地:強すぎるようで、意外と脆い

次に、OpenAIの「絶対王者ぶり」と「揺らぎ」を、数字で確認していきましょう。

2-1. ChatGPTは週7億ユーザー規模の巨大プラットフォーム

OpenAI自身が2025年9月に公開した「How people are using ChatGPT」という研究報告によると、

ChatGPTの週次アクティブユーザーは約7億人

分析対象となったのは150万件の会話ログで、これは消費者向けAIとして最大規模の利用実態調査

利用の約30%が仕事関連、70%がプライベート用途

会話の約半分(49%)が「質問」、40%が「何かをやってもらう(Doing)」、残り11%が創作や内省などの「表現(Expressing)」

という結果が示されています。 OpenAI

この数字だけを見れば、「ユーザー規模では圧倒的」と言ってよいでしょう。

2-2. 年間売上ランレート100億ドル、しかしまだ赤字

一方で、ビジネスとして見るとかなり攻めた状態にあることも、数字が物語っています。

2025年6月、ロイターは

OpenAIの年間売上ランレートが100億ドル(約1.5兆円)に到達

2024年12月時点の55億ドルから半年でほぼ倍増

2025年通期では127億ドルの売上を目標としている

それにもかかわらず、前年度には約50億ドルの損失を出していた と報じています。 Reuters

別の分析では、OpenAIは2025年末には年率200億ドル超の売上ランレートに到達しうる一方で、 今後8年間で約1.4兆ドル(約220兆円)のデータセンター投資コミットメントを抱えていると指摘されています。 blog.carnegieinvest.com

つまり「売上は急成長しているが、インフラ投資の約束が“ケタ違い”に大きい」というのが現状です。

2-3. エンタープライズ利用:1日40〜60分の時短効果

OpenAIが2025年12月に公開した「The State of Enterprise AI」レポートでは、約100社・9,000人のビジネスユーザーへの調査結果として、次のような数字が示されています。 OpenAI CDN

75%の従業員が「AIによって仕事の速度か品質、あるいはその両方が改善した」と回答

ChatGPT Enterpriseの利用者は、

1営業日あたり40〜60分の時間削減を実感

データサイエンスやエンジニア、コミュニケーション職では60〜80分の削減

IT部門の87%が“トラブル解決のスピードが上がった”

エンジニアの73%が“コードのデリバリが速くなった”

さらに75%の従業員が「以前はできなかったタスクをAIのおかげでこなせるようになった」と回答

このレポートはマーケティング色も強く、学術論文として厳密かと言われると議論の余地はあります。ただ、「企業内でのAI利用が“実務の中心”に入り始めている」ことは数字から読み取れます。

2-4. 市場全体:エンタープライズ生成AI投資は1年で3倍

ベンチャーキャピタルのMenlo Venturesによる2025年のレポートでは、企業による生成AIへの年間支出は2024年の115億ドルから2025年には370億ドルへと、ほぼ3倍に増加したと推計されています。 Menlo Ventures +1

同レポートによると、

2023年の生成AI支出は17億ドル

2024年に115億ドル

2025年には370億ドル

と、ソフトウェアカテゴリとして極めて異例のスピードで成長しているとされています。

  1. 数字が示す「リーダーの揺らぎ」──市場シェアとベンチマーク

ここからが本題です。 売上とユーザー数では依然としてOpenAIがトップクラスですが、「どのLLMにお金を払っているか」という視点で見ると、風景は変わってきます。

3-1. エンタープライズLLM市場で、AnthropicがOpenAIを逆転

2025年7月、Menlo Venturesが発表した「2025 Mid-Year LLM Market Update」によれば、企業向けLLM APIに対する支出は2024年末の35億ドルから、2025年半ばには84億ドルに倍増しました。 GlobeNewswire

そして、市場シェアは次のように変化しています。 GlobeNewswire +1

2023年末

OpenAI:50%(圧倒的1位)

2025年半ば

Anthropic:32%(1位)

OpenAI:25%(2位、2年でシェア半減)

Google(Gemini):20%(3位)

Meta Llama:9%

DeepSeek:1%

特にコード生成分野ではAnthropicがさらに強く、関連レポートの要約によると、

コード生成市場で

Claudeが42%のシェア

OpenAIは21%

と、2倍の差を付けられているとされています。 AI 매터스

コード生成は「最初の明確なキラーアプリ」とも言われ、GitHub Copilotが独占していた市場を、Claudeと各種AI IDE(CursorやWindsurfなど)が19億ドル規模のエコシステムに育てたと同レポートは指摘しています。 AI 매터스

3-2. Chatbot Arenaで見える「技術トップ」の座

技術コミュニティで広く参照されているLMArena(旧・Chatbot Arena)の人間評価ランキングを見てみましょう。2025年12月時点の「Arena Overview」では、上位は次のようになっています。 LMArena

gemini-3-pro(Google)

grok-4.1-thinking(xAI)

Claude Opus 4.5(thinking版)(Anthropic) …

gpt-5.1-high(OpenAI) …

chatgpt-4o-latest-20250326(OpenAI)

もちろん、ベンチマークは万能ではありませんし、LLMの価値は「単一スコア」では測りきれないものです。ただし「コミュニティ主導の総合評価」でトップ3をGoogle・xAI・Anthropicが固め、OpenAIの最新モデルが6位・13位に位置しているのは象徴的です。

3-3. 「性能で負けている」⇒「売上でも追い上げられている」

ロイターによると、Anthropicは2025年6月時点で年率30億ドルの売上ランレートに到達しており、特にコード生成系スタートアップからの需要が急増しているとされています。 Reuters +1

エンタープライズ市場では、

性能が良いモデルにワークロードが集中し

ベンダーの乗り換え自体は11%と少ないものの、66%のチームが「既存ベンダーの新モデル」へアップグレードしている

というデータも示されています。 GlobeNewswire

簡単に言えば、

「性能でトップから落ちると、そのまま市場シェアと売上にも響く」

というフェーズに、LMM市場が完全に移行した、ということです。 これはモデル性能の差が“趣味の比較”ではなく、売上と評価額に直結する段階に来ていることを意味します。

  1. インフラ戦争:250GWデータセンターと1.4兆ドルの賭け

OpenAIのコードレッドは、技術や市場シェアだけの問題ではなく、「インフラ投資の重さ」とも密接に関係しています。

4-1. 250GWのAIデータセンター計画

Tom’s Hardwareの調査によれば、サム・アルトマンは2033年までに最大250ギガワット(GW)の計算能力を備えたAIデータセンター群を構築する計画を打ち出しています。 Tom's Hardware

この規模は、記事の試算では次のように表現されています。

必要なGPUは年間3,000万枚

消費電力はインド1国の電力消費量に匹敵

排出される二酸化炭素はエネルギー大手ExxonMobilの約2倍

もちろん、これは「最大値」に近い野心的な目標ですが、AIインフラ戦争がここまでスケールしていることを示す象徴的な数字です。

4-2. 1.4兆ドルのCAPEXコミットメント

前述の投資コンサルティング会社の分析によると、OpenAIは

2025年末時点で年率200億ドル超の売上ランレートを目指しつつ blog.carnegieinvest.com

今後8年間で約1.4兆ドル(220兆円規模)のデータセンター関連投資をコミットしている

とされています。 blog.carnegieinvest.com

簡易的な試算として、そのブログではGoogleの初期成長率を参考にしながら、

OpenAIが今後5年間で累計1.5兆ドルの営業キャッシュフローを生み出せれば、

なんとか1.4兆ドルの投資を賄えるが、

それには年平均190%近い売上成長が必要で、2030年には約2兆ドルの売上に達するという、現実離れした前提が必要になる

と指摘しています。 blog.carnegieinvest.com

つまり、OpenAIは

「巨額の先行投資を行いながら、 ライバルに性能で負けるわけにはいかない」

という状況に追い込まれている、とも言えます。

4-3. 各国との“主権AI”インフラ連携

こうした背景の中で、OpenAIは各国政府・インフラ企業との提携を加速させています。

たとえば2025年12月、OpenAIはオーストラリア向けの「OpenAI for Australia」プログラムを発表し、現地データセンター企業NEXTDCと提携して46億ドル規模の「主権AIキャンパス」建設を進める覚書を締結しました。 OpenAI +1

同プログラムでは、100万〜150万人規模の労働者のAIスキル向上を掲げており、これは

インフラ投資

人材育成

国ごとのレギュレーション対応

を一体で進める「国別パッケージ」の典型例と言えます。

  1. 安全性とリスク:次世代モデルは「サイバー攻撃リスク高」

コードレッドとほぼ同じタイミングで、OpenAIは次世代モデルのサイバーセキュリティリスクに関する警告も発しています。

2025年12月10日の声明でOpenAIは、

今後のフロンティアモデルは、「高度に防御されたシステムに対するゼロデイ脆弱性の開発」

産業インフラを狙った複雑な侵入オペレーションを支援できるレベルの能力を持つ可能性があり、

それゆえ「高い(high)」サイバーリスクカテゴリーに分類すべきだ

と警鐘を鳴らしました。 Investing.com +1

これに対し、同社は

アクセス制御

インフラのハードニング

出力制御(egress control)と監視

といった多層防御で対応する方針を示しています。 Investing.com

つまり、性能レースを加速させつつも、安全側の圧力も同時に増しているわけです。 コードレッドは「Geminiに勝つ」ためだけでなく、より危険なモデルをどう社会に出すかという、もう一つの難題ともセットになっています。

  1. ライバルLLMはどこまで来ているのか

ここで、主要ライバルの状況もざっくり整理しておきましょう。

6-1. Google Gemini:検索×LLMの“ホームグラウンド”利用

GoogleのGemini 3 Proは、前述のLMArenaで総合1位を獲得しているほか、Menlo Venturesのレポートでも「多くのベンチマークでトップクラス」と評価されています。 LMArena +1

さらにGoogleはGeminiを

検索

Workspace(ドキュメント、スプレッドシート、Gmailなど)

Android

に深く統合しており、「LLMに最初に触れる入口」としての強さを発揮しつつあります。OpenAIがChatGPTで築いたブランド力に対し、Googleは既存プロダクトのデフォルト設定を塗り替える形でユーザーを取りに来ている、と言えます。

6-2. Anthropic Claude:エンタープライズとコーディングの双璧

Anthropicは、

2024年のClaude 3.5 Sonnet以降、コード関連ベンチマークでほぼトップを維持し Menlo Ventures

2025年末にはClaude Opus 4.5がSWE-bench Verifiedなどの高難度コードベンチマークで新たな最高値を更新したとされています。 Menlo Ventures

前述の通り、

エンタープライズLLM API市場の32%のシェア

コード生成分野の42%シェア

を握っているという推計は、OpenAIにとってかなりのプレッシャーです。 GlobeNewswire +1

ロイターは、Anthropicの年率売上ランレートが30億ドルを超えたと報じており、規模の面でも「OpenAIの2〜3分の1」に迫るレベルに到達しています。 Reuters +1

6-3. xAI Grok、中国勢DeepSeek・Qwen

xAI(Grok)は、LMArenaの総合2位(grok-4.1-thinking)、および4位(grok-4.1)と、トップクラスの性能を示しています。 LMArena

中国勢では、DeepSeekやAlibaba系のQwenが、コミュニティベースのベンチマークとオープンソース界隈で急速に存在感を増しつつあります。Menlo Venturesの分析では、企業の本番ワークロードにおけるシェアはまだ1%程度ですが、vLLMやOpenRouterといったインフラでの利用が増加しているとされています。 Menlo Ventures +1

オープンソース系の利用は、エンタープライズ全体では13%程度にとどまり、依然として閉源モデルが87%を占めていますが、 「安価でカスタマイズ可能な選択肢」として、引き続き無視できない存在です。 AI 매터스

  1. コードレッド後のOpenAIの「次の一手」を読む(事実+推測)

ここからは、これまでの事実を踏まえて、OpenAIがどこへ向かおうとしているのかをエンジニア目線で整理してみます。 このセクションはあくまで推測を含む解釈である点に注意してください。

7-1. 一手目:ChatGPTへの“原点回帰”とパーソナライズ

コードレッド・メモとそれを報じる記事群が共通して強調しているのは、

広告ビジネスへの進出は一旦ブレーキ

「ユーザーとモデルの対話ループ」を守ることが最重要

そのために

パーソナライズ

応答速度

信頼性

カバーできるトピックの幅

に経営資源を集中させる、という方針です。 Business Insider +2 Financial Times +2

これは、

「ChatGPTそのものを“AI OS”的な存在に育てる」

という長期戦略の再確認でもあります。

7-2. 二手目:エンタープライズ集中と「ROIの見える化」

OpenAIは、前述の「State of Enterprise AI」レポートで時間短縮やタスク拡張の定量効果を前面に押し出しました。 OpenAI CDN

さらに、Slackの元CEOであるDenise DresserをChief Revenue Officer(CRO)として招聘し、企業向け営業と収益化体制を強化しています。The Vergeによれば、DresserはSlackでAI機能を統括していた人物で、OpenAIでは「より多くのビジネスにAIを浸透させる」役割を担うとされています。 The Verge

Anthropicが企業向けでリードしつつある状況を踏まえると、OpenAIの次の一手は、

ChatGPT Enterprise / Business

比較的安価なGPT-4o / 4o mini / オープンモデル

コーディング特化のCodexやエージェント機能

を組み合わせた“エンタープライズ向けスタック”の作り込みだと考えられます。実際、OpenAIの開発者向けサイトでは「Agents」「Codex」「Open Models」といったメニューが一等地に配置されており、エージェント化とオープンモデル提供の両立が今後のテーマであることが伺えます。 OpenAI +1

7-3. 三手目:エージェント化と「Agentic AI Foundation」

OpenAIは2025年12月、「Agentic AI Foundation」という新たな非営利団体の立ち上げに参加し、AGENTS.mdというオープンなガイドライン文書を寄贈したと発表しています。 OpenAI

Menlo Venturesも、次の波を「長期的なエージェント(long-horizon agents)」と位置付けており、

コード修正

研究レポート作成

ビジネスオペレーションの自動化

といったマルチステップのタスクを半自律的にこなすシステムが、企業のAIスタックの中核になると予測しています。 GlobeNewswire +1

コードレッドは「チャットボットの品質向上」だけでなく、

「エージェント時代に向けたプラットフォームポジションを取り直す」

という意味合いも強いと考えられます。

7-4. 四手目:国別プログラムと“主権AI”パートナーシップ

OpenAI for Australiaのような国別プログラムは、

大規模GPUクラスターを含む主権AIインフラ

数百万人規模の人材育成

ローカル企業・政府との長期パートナーシップ

をセットで売り込むモデルです。 OpenAI +1

これは、従来のクラウドベンダー(AWS / Azure / GCP)が提供してきた「リージョン単位のインフラ」に対し、

「AI専用クラウド+教育+エコシステムをひとまとめにした“国家向けパッケージ”」

という新しい売り方であり、OpenAIが単なるモデルベンダーから“AI国家インフラ企業”へシフトしようとしている流れとも読めます。

7-5. 五手目:安全性をプロダクト価値に組み込む

最後に、安全性です。

OpenAIは前述のサイバーリスク警告に加え、

エンタープライズレポートの中で、安全な導入事例とガバナンスの重要性を強調し OpenAI CDN

小規模ビジネスや非営利団体向けの「AI Jam」プログラムを通じて、“良い使い方”を広める活動も行っています。 OpenAI

コードレッド下で、

モデルの強化

データセンターの拡張

と同じくらい、「どう安全に使わせるか」をプロダクト設計に埋め込むことが、OpenAIにとって差別化要因になっていくでしょう。

  1. 技術者・PMが押さえておきたい3つのシナリオ

ここまでを踏まえて、みなさんがプロダクトや技術戦略を考えるうえで、意識しておきたいシナリオを3つだけ挙げておきます。

シナリオA:ベンチマーク戦争の「第2ラウンド」

2023〜2024年:GPT-4世代が多くのベンチマークを席巻

2025年:Gemini 3 / Claude 4.5 / Grok 4.1 / GPT-5.1 などがひしめき合い、ランキングが流動化

という流れから考えると、2026年以降も「半年ごとにトップモデルが入れ替わる」状況が続く可能性が高いです。 LMArena +1

エンジニアやPMとしては、

特定ベンダー前提のアーキテクチャに縛られないこと

モデルを切り替えやすい抽象化レイヤー(AIゲートウェイや自前のアダプタ)を用意しておくこと

がますます重要になります。

シナリオB:マルチモデル前提のエンタープライズAI

Menlo Venturesの調査では、ベンダー乗り換え率は11%と低い一方で、最新モデルへのアップグレードは66%という結果が出ています。 GlobeNewswire

しかし、現場の感覚としては、

「汎用タスクはOpenAI、コードはAnthropic、画像は別のモデル」

「地域やデータ主権の都合で、中国製や欧州製モデルを併用」

といったマルチモデル構成が増えていくはずです。

OpenAIのコードレッドは、そうした世界で「ChatGPTを中心のUXレイヤーとして維持できるか」という挑戦でもあります。

シナリオC:エネルギーと規制が“隠れた勝敗ライン”になる

最後に、あまり語られないが重要なのがエネルギーと規制です。

250GWのAIデータセンター構想

1.4兆ドルのCAPEXコミットメント

サイバーリスクを「high」と認定せざるを得ない次世代モデル

を考えると、AI企業の競争は

「最強モデルを作る競争」であると同時に、 「どれだけ効率よく、安全に運用できるかの競争」

でもあります。 Tom's Hardware +2 blog.carnegieinvest.com +2

規制当局・電力会社・クラウドベンダーとの関係構築に長けた企業が、 「大きくなりすぎたモデル」を社会と折り合いをつけながら提供できるか―― ここが、第二ラウンドの勝敗ラインになるでしょう。

まとめ:コードレッドは終わりの合図ではなく、「第2章の開幕」

ここまで見てきたように、OpenAIの「コードレッド」は

売上規模では世界トップクラス

しかしエンタープライズシェアではAnthropicに抜かれ

ベンチマークではGemini 3やClaude 4.5、Grok 4.1にトップを譲り

そのうえで、インフラ投資と安全性リスクが指数関数的に重くなっている

という、かなり難しいポジションに立っていることの表れです。

裏返せば、

「ここから先の数年こそが、本当の意味でのLLM戦争の本番」

とも言えます。

エンジニアやプロダクト担当としては、

「どのモデルが一番“賢いか”」 よりも

「どのモデルを、どの構成で、どの程度のリスクで使うか」

という視点で、このコードレッド期のOpenAIとライバル各社の動きを追っていくのが良さそうです。

関連記事

2026年5月1日

AIエージェントは「グレーなコード」をどこまで拒否するのか

OpenAI・Google・Anthropicのポリシーと実運用の差を踏まえ、SNS自動化のようなグレー領域でAIエージェントがどこで拒否し、どこで補助してしまうのかを整理します。

テクノロジー続きを読む
2026年3月4日

GPT-5.3 Instantとは何か

GPT-5.3 Instantの狙い、速度設計、正確性評価、安全性の改善とトレードオフを、公開情報にもとづいて整理します。

テクノロジー続きを読む
2025年9月21日

APIキーの取り方からWeb実装まで — OpenAI / Claude(Anthropic) / Amazon Bedrockを“手を動かす人”向けにやさしく解説

生成AI APIを実務のWebアプリに安全に組み込むための実践ガイド。キーの取得、認証、最小コード例、料金の考え方、Next.jsでの安全な組み込みパターン、運用のコツまで網羅。

テクノロジー続きを読む
2026年5月12日

Claude Opus 4.7は4.6から何が変わったのか

Claude Opus 4.7が4.6からどう変わったのかを、コーディング、エージェント性能、視覚理解、指示追従、コスト、GPT-5.5との比較まで整理します。

AI続きを読む
AI core surrounded by borders and cloud infrastructure
2026年6月15日

AIにも国境が引かれた日|「知能」は輸出管理されるのか

Claude Fable 5とClaude Mythos 5の停止を起点に、AIモデルの重み、輸出管理、サイバー防衛、技術主権、そして「危険な知恵」を誰が管理するのかを考える長編考察です。

テック続きを読む