GPU数から「トークン経済性」へ　Dellが示したAIインフラ競争の新基準

2026.05.20

米ITインフラ大手Dell Technologiesが、企業AIインフラを評価する新しい物差しを提示した。焦点は、GPUを何枚持っているかではない。AIがどれだけ速く有用な出力を返し、その出力をどれだけ安く大量に生み出せるかだ。米Forbesの記事によると、Dell Technologies World 2026でMichael Dell氏は「time to token」と「cost per token」という二つの指標を打ち出した。前者は、AIシステムがリクエストを受けてから使える出力を返すまでの時間。後者は、その出力を大規模に生成する際の単価を示す。AI投資の評価軸が、研究室のベンチマークから、企業現場の速度とコストへ移り始めていることが分かる。

この変化を象徴するのが、Michael Dell氏の発言だ。同氏は基調講演で「Time to first token is incredibly important with investments of this scale（これほどの規模の投資になれば、出力までの時間が信じられないくらいに重要になる）」と述べた。Dellによると、同社のDell AI Factory with NVIDIA上で本番AIワークロードを動かす企業顧客は5000社に達したという。大企業がAIを実験ではなく本番システムとして使い始めると、評価すべきものは変わる。モデルが高得点を出すかどうかだけでは不十分になる。ユーザーの入力から最初の有用な出力まで何秒かかるのか。1件の業務処理に何トークン使い、いくらかかるのか。処理が100件、1万件、100万件に増えたとき、コストはどのように膨らむのか。こうした問いが、AIインフラ選定の中心に来る。

背景にあるのは、エージェント型AIの計算需要である。Forbes記事によると、米AI半導体大手NVIDIAのJensen Huang氏は、エージェント型AIは単純な質問応答システムに比べて100倍から1000倍の計算量を必要とすると説明した。エージェントは、一度答えて終わるシステムではない。計画を立て、情報を探し、ツールを呼び出し、結果を検証し、失敗すればやり直す。人間には一つの作業に見える処理が、AIの内部では多数の推論と実行の連鎖になる。だからこそ、トークンの単価は細かな技術指標ではなく、AI時代の損益計算に直結する。

この見方は、モデル企業側からも出ている。同じ日、OpenAI presidentのGreg Brockman氏はXで「tokens are rapidly becoming the universal input for solving problems」と投稿した。問題解決のための普遍的な入力単位として、トークンが急速に重要になっているという意味だ。Dellのようなインフラ企業と、OpenAIのようなモデル企業が、ほぼ同じ方向を向き始めている点は重要である。AIの利用量が増えれば増えるほど、企業は「どのモデルを使うか」だけでなく、「どのトークンを、どこで、いくらで、どの速度で生成するか」を管理する必要が出てくる。

ただし、トークンを速く安く生成するだけでは、企業AIは本番業務に入らない。Dellが次に強調したのは、社内データの問題だった。今回発表されたDell AI Data Platformの新しいデータオーケストレーションエンジンは、非構造データをインデックス化し、ガバナンス付きのデータパイプラインを作り、モデルやエージェントに接続するための基盤である。Dellは、従来世代と比べてベクトルインデックス作成を12倍、データクエリを6倍、time to first tokenを19倍高速化すると主張している。これらの数字は今後の検証が必要だが、Dellがどこをボトルネックと見ているかは明確だ。企業AIの遅さは、計算資源だけでなく、データをAIが使える状態にする過程から生まれている。

Michael Dell氏は、この問題を「If your data is siloed, your agents are blind」と表現した。社内データがサイロ化していれば、エージェントは目が見えない、という意味だ。これは企業AI導入の現場感覚に近い。最先端モデルを導入しても、社内の文書、コード、顧客情報、契約、業務ルール、運用ログに安全にアクセスできなければ、AIは一般論を返すだけになってしまう。実務で価値を出すには、モデルに社内の文脈を見せる必要がある。しかし、見せすぎればセキュリティや権限管理の問題が生じる。Dellが狙うのは、その間を埋めるレイヤーである。

パートナー戦略も、この延長線上にある。DellはGoogle、OpenAI、SpaceXAI、Palantir、Hugging Faceなどとの連携を発表した。GoogleのGemini 3 FlashをGoogle Distributed Cloud経由でDell PowerEdgeサーバー上に展開し、OpenAIのCodexをDell AI Data Platformに接続し、SpaceXAIのGrokをオンプレミスまたはハイブリッド環境で使えるようにする。米PalantirのFoundryとAIPもDellのObjectScaleやPowerFlex上に展開される。狙いは、企業が自社データを外に出さずに、複数のモデルやAIサービスを選べるようにすることだ。

中でもOpenAI Codexとの連携は象徴的である。コーディング支援AIは、単にコードを生成するツールから、企業内部のコードベース、ドキュメント、運用ナレッジ、業務システムに接続された実行エージェントへ進もうとしている。そこで必要になるのは、モデルの賢さだけではない。どのコードにアクセスできるのか。どの変更を提案できるのか。どこまで自動実行してよいのか。誰が監査するのか。企業の開発現場では、AIの能力よりも、AIに任せる範囲の設計が難題になる。

この点で、Jensen Huang氏が語った「ハーネス」の説明は重要だ。Forbes記事によると、同氏はエージェントは大規模言語モデル上で直接動くのではなく、セキュアで管理されたサンドボックス内のソフトウェア層、つまりハーネス上で動くと説明した。ハーネスは、エージェントの推論ループ、ツールアクセス、外部の大規模モデルとローカルの小型モデルの使い分け、メモリ、コンテキスト管理を担う。NVIDIAのオープンソース・サンドボックスであるOpenShellは、Dell AI Factory全体でサポートされるという。

これは企業のCIOにとって、新しい評価項目になる。AIインフラを選ぶ際、サーバー性能やGPUの種類だけを見ても足りない。エージェントがどの環境で動くのか。どのツールを呼び出せるのか。認証情報をどう扱うのか。暴走や誤作動をどう止めるのか。行動ログをどう残すのか。人間の作業者であれば、権限や監査の仕組みは既存のIT統制である程度管理できる。しかし、機械の速度で複数のシステムを操作するエージェントには、別の統制設計が必要になる。

もう一つ見逃せないのが、ハイブリッドAIの位置づけだ。Dellの調査では、AIワークロードの67％がすでにパブリッククラウド外で動いており、88％の組織が少なくとも一つのAIワークロードをオンプレミスで動かしているという。これは、AIがすべてクラウドに集約されるという単純な未来像とは異なる。機密データ、規制、レイテンシー、既存システムとの接続、コスト管理を考えれば、多くの大企業にとってAIはクラウドとオンプレミスの組み合わせになる。Dellが「AI Factory」を前面に出す理由もここにある。

物理インフラの制約も、AI導入の現実を左右し始めている。Dellは今回、ラックスケールの統合システム「Dell PowerRack」と、NVIDIA Vera Rubin NVL72向けの冷却配分装置「Dell PowerCool CDU C7000」を発表した。Forbes記事によると、NVIDIA Rubin GPUのラックは130キロワット超の電力を消費し得る。Dellの冷却装置は、4U形状で220キロワット超の冷却能力を持つという。AIの導入スケジュールは、GPUの納期だけでなく、電力容量、冷却能力、ラック密度、データセンター設計にも左右される段階に入っている。

ここまで見ると、Dellの発表は単なる製品発表ではなく、企業AIが本番運用に入るときのチェックリストを示したものだと言える。まず、最初の出力までの時間を測る。次に、トークン当たりのコストを測る。さらに、社内データをエージェントが使える形に整える。エージェントを動かすハーネスと権限管理を確認する。最後に、それを支える電力・冷却・ラック単位の物理インフラを用意する。AIの議論は抽象的な「知能」から、かなり具体的な運用設計へ降りてきた。

Dellが提示した「time to token」と「cost per token」は、その変化を端的に表す言葉である。企業にとってAIは、もはやデモで驚くための技術ではない。日々の業務の中で、どれだけ速く、どれだけ安く、どれだけ安全に成果を出せるかが問われるシステムになっている。今後、企業がAIインフラを選ぶときの問いは、より実務的になるだろう。この構成で何秒で応答できるのか。この処理を100万回回すといくらかかるのか。社内データをどこまで見せられるのか。エージェントの行動を監査できるのか。Dellの発表は、企業AIの評価軸がそこまで具体化してきたことを示している。

主な出典：
Forbes「Dell Shares AI Advances And New Metrics To Evaluate Infrastructure」
https://www.forbes.com/sites/maribellopez/2026/05/18/dell-shares-ai-advances-and-new-metrics-to-evaluate-infrastructure/

Dell Technologies「Dell Technologies World 2026」関連発表
https://www.dell.com/en-us/delltechnologiesworld/lp/2026-overview

湯川鶴章

AI新聞編集長

AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算２０年間の米国生活を終え２０００年５月に帰国。時事通信編集委員を経て２０１０年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』（2015年）、『次世代マーケティングプラットフォーム』（2007年）、『ネットは新聞を殺すのか』（2003年）などがある。趣味はヨガと瞑想。妻が美人なのが自慢。

Home
AI新聞
GPU数から「トークン経済性」へ　Dellが示したAIインフラ競争の新基準

記事一覧を見る

GPU数から「トークン経済性」へ Dellが示したAIインフラ競争の新基準

湯川鶴章

AI新聞編集長

関連記事

GPU数から「トークン経済性」へ　Dellが示したAIインフラ競争の新基準