OpenAI“コードレッド”の真相──GeminiとClaudeに追い上げられた巨人の次の一手 はじめに:勝っているはずの王者が、なぜ「非常事態宣言」なのか
2022年末にChatGPTが登場してから、生成AIの主役はずっとOpenAIだ――多くの人はそう感じていると思います。 実際、2025年半ばの時点でChatGPTは週あたり7億人のアクティブユーザーを抱える、史上最大級のコンシューマーAIサービスになりました。 OpenAI
ところが2025年12月、OpenAI内部で「Code Red(コードレッド)」と名付けられた非常事態宣言が出ていたことが、複数の報道で明らかになりました。背景には、GoogleのGemini 3やAnthropicのClaude 4.5といったライバルLLM(大規模言語モデル)が、性能・企業導入ともにOpenAIを猛追、あるいは一部では追い越し始めている現実があります。 Tom's Hardware +1
この記事では、この「コードレッド」が意味するものを、
技術面(ベンチマーク)
ビジネス面(売上・市場シェア)
インフラ投資とリスク
といった観点から、できるだけ具体的な数字を使って整理してみます。そのうえで、「OpenAIの次の一手」をエンジニア目線で推測していきましょう。
- 何が起きたのか──OpenAI「コードレッド」メモの中身
- データで見るOpenAIの現在地:強すぎるようで、意外と脆い
- 数字が示す「リーダーの揺らぎ」──市場シェアとベンチマーク
- インフラ戦争:250GWデータセンターと1.4兆ドルの賭け
- 安全性とリスク:次世代モデルは「サイバー攻撃リスク高」
- ライバルLLMはどこまで来ているのか
- コードレッド後のOpenAIの「次の一手」を読む(事実+推測)
- 技術者・PMが押さえておきたい3つのシナリオ
まずは事実関係を押さえます。
1-1. 「ChatGPT最優先」への大転換
フィナンシャル・タイムズは、2025年12月初旬にサム・アルトマンCEOによる社内メモが出され、「Code Red(コードレッド)」フェーズへの移行が宣言されたと報じています。内容はざっくり言うと次の3点です。 Financial Times
ChatGPTの改善を最優先にし、それ以外の新規プロジェクトは後回し
動画SNSやショッピングエージェントなどの実験的プロジェクトを縮小・停止
モデルの差別化が難しくなる中で、ユーザー体験と継続利用を“守る”ことを最重要課題に
ビジネスインサイダーも同様のメモを報じ、「Protect the loop, delay the loot(ループを守り、儲けは後回し)」という印象的な表現で、ChatGPTのユーザー行動データ=「学習ループ」を広告などで壊さないようにする方針を解説しています。週あたりほぼ10億人近いユーザーから得られる対話ログがOpenAIの最大の“堀(moat)”だ、というわけです。 Business Insider
1-2. 直接の引き金は「Gemini 3のベンチマーク逆転」
Tom’s Hardwareや複数のテックメディアによると、このコードレッド宣言の直接の引き金になったのは、Googleの「Gemini 3」が主要な業界ベンチマークでChatGPT系モデルを上回ったという社外評価でした。 Tom's Hardware +1
さらに、フォーチュン誌の報道によれば、アルトマンは同じメモの中で、
「来週、社内評価でGemini 3を上回る新しい“推論特化モデル”をリリースする」
と述べ、短期的にも性能で巻き返す意思を示しているとされています。 Fortune
つまりコードレッドとは、
「ChatGPTはまだ世界最大のAIサービスだが、 技術 と 収益源 の両面でリードが危うくなっている。 だから、全資源を“本丸のChatGPT”に集中させる」
という宣言だと整理できます。
次に、OpenAIの「絶対王者ぶり」と「揺らぎ」を、数字で確認していきましょう。
2-1. ChatGPTは週7億ユーザー規模の巨大プラットフォーム
OpenAI自身が2025年9月に公開した「How people are using ChatGPT」という研究報告によると、
ChatGPTの週次アクティブユーザーは約7億人
分析対象となったのは150万件の会話ログで、これは消費者向けAIとして最大規模の利用実態調査
利用の約30%が仕事関連、70%がプライベート用途
会話の約半分(49%)が「質問」、40%が「何かをやってもらう(Doing)」、残り11%が創作や内省などの「表現(Expressing)」
という結果が示されています。 OpenAI
この数字だけを見れば、「ユーザー規模では圧倒的」と言ってよいでしょう。
2-2. 年間売上ランレート100億ドル、しかしまだ赤字
一方で、ビジネスとして見るとかなり攻めた状態にあることも、数字が物語っています。
2025年6月、ロイターは
OpenAIの年間売上ランレートが100億ドル(約1.5兆円)に到達
2024年12月時点の55億ドルから半年でほぼ倍増
2025年通期では127億ドルの売上を目標としている
それにもかかわらず、前年度には約50億ドルの損失を出していた と報じています。 Reuters
別の分析では、OpenAIは2025年末には年率200億ドル超の売上ランレートに到達しうる一方で、 今後8年間で約1.4兆ドル(約220兆円)のデータセンター投資コミットメントを抱えていると指摘されています。 blog.carnegieinvest.com
つまり「売上は急成長しているが、インフラ投資の約束が“ケタ違い”に大きい」というのが現状です。
2-3. エンタープライズ利用:1日40〜60分の時短効果
OpenAIが2025年12月に公開した「The State of Enterprise AI」レポートでは、約100社・9,000人のビジネスユーザーへの調査結果として、次のような数字が示されています。 OpenAI CDN
75%の従業員が「AIによって仕事の速度か品質、あるいはその両方が改善した」と回答
ChatGPT Enterpriseの利用者は、
1営業日あたり40〜60分の時間削減を実感
データサイエンスやエンジニア、コミュニケーション職では60〜80分の削減
IT部門の87%が“トラブル解決のスピードが上がった”
エンジニアの73%が“コードのデリバリが速くなった”
さらに75%の従業員が「以前はできなかったタスクをAIのおかげでこなせるようになった」と回答
このレポートはマーケティング色も強く、学術論文として厳密かと言われると議論の余地はあります。ただ、「企業内でのAI利用が“実務の中心”に入り始めている」ことは数字から読み取れます。
2-4. 市場全体:エンタープライズ生成AI投資は1年で3倍
ベンチャーキャピタルのMenlo Venturesによる2025年のレポートでは、企業による生成AIへの年間支出は2024年の115億ドルから2025年には370億ドルへと、ほぼ3倍に増加したと推計されています。 Menlo Ventures +1
同レポートによると、
2023年の生成AI支出は17億ドル
2024年に115億ドル
2025年には370億ドル
と、ソフトウェアカテゴリとして極めて異例のスピードで成長しているとされています。
ここからが本題です。 売上とユーザー数では依然としてOpenAIがトップクラスですが、「どのLLMにお金を払っているか」という視点で見ると、風景は変わってきます。
3-1. エンタープライズLLM市場で、AnthropicがOpenAIを逆転
2025年7月、Menlo Venturesが発表した「2025 Mid-Year LLM Market Update」によれば、企業向けLLM APIに対する支出は2024年末の35億ドルから、2025年半ばには84億ドルに倍増しました。 GlobeNewswire
そして、市場シェアは次のように変化しています。 GlobeNewswire +1
2023年末
OpenAI:50%(圧倒的1位)
2025年半ば
Anthropic:32%(1位)
OpenAI:25%(2位、2年でシェア半減)
Google(Gemini):20%(3位)
Meta Llama:9%
DeepSeek:1%
特にコード生成分野ではAnthropicがさらに強く、関連レポートの要約によると、
コード生成市場で
Claudeが42%のシェア
OpenAIは21%
と、2倍の差を付けられているとされています。 AI 매터스
コード生成は「最初の明確なキラーアプリ」とも言われ、GitHub Copilotが独占していた市場を、Claudeと各種AI IDE(CursorやWindsurfなど)が19億ドル規模のエコシステムに育てたと同レポートは指摘しています。 AI 매터스
3-2. Chatbot Arenaで見える「技術トップ」の座
技術コミュニティで広く参照されているLMArena(旧・Chatbot Arena)の人間評価ランキングを見てみましょう。2025年12月時点の「Arena Overview」では、上位は次のようになっています。 LMArena
gemini-3-pro(Google)
grok-4.1-thinking(xAI)
Claude Opus 4.5(thinking版)(Anthropic) …
gpt-5.1-high(OpenAI) …
chatgpt-4o-latest-20250326(OpenAI)
もちろん、ベンチマークは万能ではありませんし、LLMの価値は「単一スコア」では測りきれないものです。ただし「コミュニティ主導の総合評価」でトップ3をGoogle・xAI・Anthropicが固め、OpenAIの最新モデルが6位・13位に位置しているのは象徴的です。
3-3. 「性能で負けている」⇒「売上でも追い上げられている」
ロイターによると、Anthropicは2025年6月時点で年率30億ドルの売上ランレートに到達しており、特にコード生成系スタートアップからの需要が急増しているとされています。 Reuters +1
エンタープライズ市場では、
性能が良いモデルにワークロードが集中し
ベンダーの乗り換え自体は11%と少ないものの、66%のチームが「既存ベンダーの新モデル」へアップグレードしている
というデータも示されています。 GlobeNewswire
簡単に言えば、
「性能でトップから落ちると、そのまま市場シェアと売上にも響く」
というフェーズに、LMM市場が完全に移行した、ということです。 これはモデル性能の差が“趣味の比較”ではなく、売上と評価額に直結する段階に来ていることを意味します。
OpenAIのコードレッドは、技術や市場シェアだけの問題ではなく、「インフラ投資の重さ」とも密接に関係しています。
4-1. 250GWのAIデータセンター計画
Tom’s Hardwareの調査によれば、サム・アルトマンは2033年までに最大250ギガワット(GW)の計算能力を備えたAIデータセンター群を構築する計画を打ち出しています。 Tom's Hardware
この規模は、記事の試算では次のように表現されています。
必要なGPUは年間3,000万枚
消費電力はインド1国の電力消費量に匹敵
排出される二酸化炭素はエネルギー大手ExxonMobilの約2倍
もちろん、これは「最大値」に近い野心的な目標ですが、AIインフラ戦争がここまでスケールしていることを示す象徴的な数字です。
4-2. 1.4兆ドルのCAPEXコミットメント
前述の投資コンサルティング会社の分析によると、OpenAIは
2025年末時点で年率200億ドル超の売上ランレートを目指しつつ blog.carnegieinvest.com
今後8年間で約1.4兆ドル(220兆円規模)のデータセンター関連投資をコミットしている
とされています。 blog.carnegieinvest.com
簡易的な試算として、そのブログではGoogleの初期成長率を参考にしながら、
OpenAIが今後5年間で累計1.5兆ドルの営業キャッシュフローを生み出せれば、
なんとか1.4兆ドルの投資を賄えるが、
それには年平均190%近い売上成長が必要で、2030年には約2兆ドルの売上に達するという、現実離れした前提が必要になる
と指摘しています。 blog.carnegieinvest.com
つまり、OpenAIは
「巨額の先行投資を行いながら、 ライバルに性能で負けるわけにはいかない」
という状況に追い込まれている、とも言えます。
4-3. 各国との“主権AI”インフラ連携
こうした背景の中で、OpenAIは各国政府・インフラ企業との提携を加速させています。
たとえば2025年12月、OpenAIはオーストラリア向けの「OpenAI for Australia」プログラムを発表し、現地データセンター企業NEXTDCと提携して46億ドル規模の「主権AIキャンパス」建設を進める覚書を締結しました。 OpenAI +1
同プログラムでは、100万〜150万人規模の労働者のAIスキル向上を掲げており、これは
インフラ投資
人材育成
国ごとのレギュレーション対応
を一体で進める「国別パッケージ」の典型例と言えます。
コードレッドとほぼ同じタイミングで、OpenAIは次世代モデルのサイバーセキュリティリスクに関する警告も発しています。
2025年12月10日の声明でOpenAIは、
今後のフロンティアモデルは、「高度に防御されたシステムに対するゼロデイ脆弱性の開発」や
産業インフラを狙った複雑な侵入オペレーションを支援できるレベルの能力を持つ可能性があり、
それゆえ「高い(high)」サイバーリスクカテゴリーに分類すべきだ
と警鐘を鳴らしました。 Investing.com +1
これに対し、同社は
アクセス制御
インフラのハードニング
出力制御(egress control)と監視
といった多層防御で対応する方針を示しています。 Investing.com
つまり、性能レースを加速させつつも、安全側の圧力も同時に増しているわけです。 コードレッドは「Geminiに勝つ」ためだけでなく、より危険なモデルをどう社会に出すかという、もう一つの難題ともセットになっています。
ここで、主要ライバルの状況もざっくり整理しておきましょう。
6-1. Google Gemini:検索×LLMの“ホームグラウンド”利用
GoogleのGemini 3 Proは、前述のLMArenaで総合1位を獲得しているほか、Menlo Venturesのレポートでも「多くのベンチマークでトップクラス」と評価されています。 LMArena +1
さらにGoogleはGeminiを
検索
Workspace(ドキュメント、スプレッドシート、Gmailなど)
Android
に深く統合しており、「LLMに最初に触れる入口」としての強さを発揮しつつあります。OpenAIがChatGPTで築いたブランド力に対し、Googleは既存プロダクトのデフォルト設定を塗り替える形でユーザーを取りに来ている、と言えます。
6-2. Anthropic Claude:エンタープライズとコーディングの双璧
Anthropicは、
2024年のClaude 3.5 Sonnet以降、コード関連ベンチマークでほぼトップを維持し Menlo Ventures
2025年末にはClaude Opus 4.5がSWE-bench Verifiedなどの高難度コードベンチマークで新たな最高値を更新したとされています。 Menlo Ventures
前述の通り、
エンタープライズLLM API市場の32%のシェア
コード生成分野の42%シェア
を握っているという推計は、OpenAIにとってかなりのプレッシャーです。 GlobeNewswire +1
ロイターは、Anthropicの年率売上ランレートが30億ドルを超えたと報じており、規模の面でも「OpenAIの2〜3分の1」に迫るレベルに到達しています。 Reuters +1
6-3. xAI Grok、中国勢DeepSeek・Qwen
xAI(Grok)は、LMArenaの総合2位(grok-4.1-thinking)、および4位(grok-4.1)と、トップクラスの性能を示しています。 LMArena
中国勢では、DeepSeekやAlibaba系のQwenが、コミュニティベースのベンチマークとオープンソース界隈で急速に存在感を増しつつあります。Menlo Venturesの分析では、企業の本番ワークロードにおけるシェアはまだ1%程度ですが、vLLMやOpenRouterといったインフラでの利用が増加しているとされています。 Menlo Ventures +1
オープンソース系の利用は、エンタープライズ全体では13%程度にとどまり、依然として閉源モデルが87%を占めていますが、 「安価でカスタマイズ可能な選択肢」として、引き続き無視できない存在です。 AI 매터스
ここからは、これまでの事実を踏まえて、OpenAIがどこへ向かおうとしているのかをエンジニア目線で整理してみます。 このセクションはあくまで推測を含む解釈である点に注意してください。
7-1. 一手目:ChatGPTへの“原点回帰”とパーソナライズ
コードレッド・メモとそれを報じる記事群が共通して強調しているのは、
広告ビジネスへの進出は一旦ブレーキ
「ユーザーとモデルの対話ループ」を守ることが最重要
そのために
パーソナライズ
応答速度
信頼性
カバーできるトピックの幅
に経営資源を集中させる、という方針です。 Business Insider +2 Financial Times +2
これは、
「ChatGPTそのものを“AI OS”的な存在に育てる」
という長期戦略の再確認でもあります。
7-2. 二手目:エンタープライズ集中と「ROIの見える化」
OpenAIは、前述の「State of Enterprise AI」レポートで時間短縮やタスク拡張の定量効果を前面に押し出しました。 OpenAI CDN
さらに、Slackの元CEOであるDenise DresserをChief Revenue Officer(CRO)として招聘し、企業向け営業と収益化体制を強化しています。The Vergeによれば、DresserはSlackでAI機能を統括していた人物で、OpenAIでは「より多くのビジネスにAIを浸透させる」役割を担うとされています。 The Verge
Anthropicが企業向けでリードしつつある状況を踏まえると、OpenAIの次の一手は、
ChatGPT Enterprise / Business
比較的安価なGPT-4o / 4o mini / オープンモデル
コーディング特化のCodexやエージェント機能
を組み合わせた“エンタープライズ向けスタック”の作り込みだと考えられます。実際、OpenAIの開発者向けサイトでは「Agents」「Codex」「Open Models」といったメニューが一等地に配置されており、エージェント化とオープンモデル提供の両立が今後のテーマであることが伺えます。 OpenAI +1
7-3. 三手目:エージェント化と「Agentic AI Foundation」
OpenAIは2025年12月、「Agentic AI Foundation」という新たな非営利団体の立ち上げに参加し、AGENTS.mdというオープンなガイドライン文書を寄贈したと発表しています。 OpenAI
Menlo Venturesも、次の波を「長期的なエージェント(long-horizon agents)」と位置付けており、
コード修正
研究レポート作成
ビジネスオペレーションの自動化
といったマルチステップのタスクを半自律的にこなすシステムが、企業のAIスタックの中核になると予測しています。 GlobeNewswire +1
コードレッドは「チャットボットの品質向上」だけでなく、
「エージェント時代に向けたプラットフォームポジションを取り直す」
という意味合いも強いと考えられます。
7-4. 四手目:国別プログラムと“主権AI”パートナーシップ
OpenAI for Australiaのような国別プログラムは、
大規模GPUクラスターを含む主権AIインフラ
数百万人規模の人材育成
ローカル企業・政府との長期パートナーシップ
をセットで売り込むモデルです。 OpenAI +1
これは、従来のクラウドベンダー(AWS / Azure / GCP)が提供してきた「リージョン単位のインフラ」に対し、
「AI専用クラウド+教育+エコシステムをひとまとめにした“国家向けパッケージ”」
という新しい売り方であり、OpenAIが単なるモデルベンダーから“AI国家インフラ企業”へシフトしようとしている流れとも読めます。
7-5. 五手目:安全性をプロダクト価値に組み込む
最後に、安全性です。
OpenAIは前述のサイバーリスク警告に加え、
エンタープライズレポートの中で、安全な導入事例とガバナンスの重要性を強調し OpenAI CDN
小規模ビジネスや非営利団体向けの「AI Jam」プログラムを通じて、“良い使い方”を広める活動も行っています。 OpenAI
コードレッド下で、
モデルの強化
データセンターの拡張
と同じくらい、「どう安全に使わせるか」をプロダクト設計に埋め込むことが、OpenAIにとって差別化要因になっていくでしょう。
ここまでを踏まえて、みなさんがプロダクトや技術戦略を考えるうえで、意識しておきたいシナリオを3つだけ挙げておきます。
シナリオA:ベンチマーク戦争の「第2ラウンド」
2023〜2024年:GPT-4世代が多くのベンチマークを席巻
2025年:Gemini 3 / Claude 4.5 / Grok 4.1 / GPT-5.1 などがひしめき合い、ランキングが流動化
という流れから考えると、2026年以降も「半年ごとにトップモデルが入れ替わる」状況が続く可能性が高いです。 LMArena +1
エンジニアやPMとしては、
特定ベンダー前提のアーキテクチャに縛られないこと
モデルを切り替えやすい抽象化レイヤー(AIゲートウェイや自前のアダプタ)を用意しておくこと
がますます重要になります。
シナリオB:マルチモデル前提のエンタープライズAI
Menlo Venturesの調査では、ベンダー乗り換え率は11%と低い一方で、最新モデルへのアップグレードは66%という結果が出ています。 GlobeNewswire
しかし、現場の感覚としては、
「汎用タスクはOpenAI、コードはAnthropic、画像は別のモデル」
「地域やデータ主権の都合で、中国製や欧州製モデルを併用」
といったマルチモデル構成が増えていくはずです。
OpenAIのコードレッドは、そうした世界で「ChatGPTを中心のUXレイヤーとして維持できるか」という挑戦でもあります。
シナリオC:エネルギーと規制が“隠れた勝敗ライン”になる
最後に、あまり語られないが重要なのがエネルギーと規制です。
250GWのAIデータセンター構想
1.4兆ドルのCAPEXコミットメント
サイバーリスクを「high」と認定せざるを得ない次世代モデル
を考えると、AI企業の競争は
「最強モデルを作る競争」であると同時に、 「どれだけ効率よく、安全に運用できるかの競争」
でもあります。 Tom's Hardware +2 blog.carnegieinvest.com +2
規制当局・電力会社・クラウドベンダーとの関係構築に長けた企業が、 「大きくなりすぎたモデル」を社会と折り合いをつけながら提供できるか―― ここが、第二ラウンドの勝敗ラインになるでしょう。
まとめ:コードレッドは終わりの合図ではなく、「第2章の開幕」
ここまで見てきたように、OpenAIの「コードレッド」は
売上規模では世界トップクラス
しかしエンタープライズシェアではAnthropicに抜かれ
ベンチマークではGemini 3やClaude 4.5、Grok 4.1にトップを譲り
そのうえで、インフラ投資と安全性リスクが指数関数的に重くなっている
という、かなり難しいポジションに立っていることの表れです。
裏返せば、
「ここから先の数年こそが、本当の意味でのLLM戦争の本番」
とも言えます。
エンジニアやプロダクト担当としては、
「どのモデルが一番“賢いか”」 よりも
「どのモデルを、どの構成で、どの程度のリスクで使うか」
という視点で、このコードレッド期のOpenAIとライバル各社の動きを追っていくのが良さそうです。
関連記事
APIキーの取り方からWeb実装まで — OpenAI / Claude(Anthropic) / Amazon Bedrockを“手を動かす人”向けにやさしく解説
生成AI APIを実務のWebアプリに安全に組み込むための実践ガイド。キーの取得、認証、最小コード例、料金の考え方、Next.jsでの安全な組み込みパターン、運用のコツまで網羅。
GPT-5.2とは?新機能・性能・価格を徹底解説
OpenAIが2025年12月11日に公開したGPT-5.2の全貌を解説。Instant・Thinking・Proの3モード、GPT-5.1からの進化点、API価格、競合との比較まで網羅的に紹介します。
結局ChatGPTの独壇場?グーグルがAI覇権争いで追いつけない構造的な理由
ユーザー数やロイヤルティ、ビジネスモデル、組織文化の違いからChatGPTとGeminiの立ち位置を整理し、日本市場の行方と逆転に必要な条件を解説します。
AIはなぜ日本語が苦手なのか?構造的障壁と「英語中心」の壁、そして「完璧な翻訳」が訪れる未来
AIが日本語を苦手とする理由を、言語学的な構造的複雑さと英語中心の学習データという2つの壁から解説。誤読や誤認識の原因、そして完璧な日本語AIが現れる未来を予測します。
Google Gemini 2.5 Proがついに本格始動! - ChatGPTを抜いた? AI戦争・第二章の幕開け
Google Gemini 2.5 Proの大型アップデートについて解説。Computer Useモデルの登場、推論性能の向上、ChatGPTとの比較など、AI戦争の最新動向を詳しく紹介します。