9 年苦戦 → 30 日で 200 億ドル — Stanford MS&E 435 第 2 回

Stanford MS&E 435 第 2 回 2026/04/15

サニー・マドラ / Sunny Madra · 17:38 「同じ電力で、 2.5 倍のトークンが出る」

Stanford 大学のゼミ MS&E 435 第 2 回 (2026/04/15 公開、 約 56 分)。 投資家 + 元 Groq 社長との対談

Groq が 2016 年創業から 9 年、 競合 NVIDIA の影で 「あの SRAM 中心の決定論的アーキテクチャは面白いけど、 ニッチでしょ」 と言われ続けてきた。 その同じ会社が 2025 年 12 月、 NVIDIA に 200 億ドルで買収される。 きっかけは 1 通のテキストメッセージ。 動作するシステムをジェンセンに見せてから、 200 億ドルが振り込まれるまでわずか約 30 日。

語るのは 2 人。 ブラッド・ガースナー (Brad Gerstner) — Altimeter Capital 創業 CEO、 OpenAI / Anthropic / Cerebras / Groq の主要投資家。 18 年で運用資産 150 億ドル超に育てたヘッジファンドの主。 もう 1 人が サニー・マドラ (Sunny Madra) — 元 Groq 社長、 4 度の Exit を経験した連続起業家 (Pivotal / Ford / Groq / NVIDIA)。 進行は MS&E 435 講師 アプールヴ・アグラワル (Apoorv Agrawal、 Altimeter パートナー)。

議論の前提は前回 (Class #1) と同じ — 「ソフトウェアが世界を飲み込んだ」 公式は AI には当てはまらない。 アプリのユーザーが増えるたびに GPU 計算が消費される世界では、 限界コストはゼロやない。 そしてその制約が世界中で同時に効いている結果、 「電力 1 ワットあたり何トークン出るか」 が経済の根本指標になっている、 という時代認識から始まる。

Groq が NVIDIA に持ち込んだ提案は技術的にシンプルやった。 推論を 「prefill (入力処理)」 と 「decode (出力生成)」 に分離し、 さらに decode の中の 「演算集約的」 と 「メモリ帯域集約的」 な部分を切り分ける。 NVIDIA の GPU は演算と HBM が強い (ただしメモリは外付けで遅い)。 Groq の SRAM チップは演算は少ないが SRAM 帯域が約 1 桁速い。 NVLink 経由で両者をつなげば、 同じ電力フットプリントで 2.5 倍のトークンが出る — これが 「同じ電力 → 2.5 倍トークン」 の根拠。

着眼点

Brad が 1 週間 「ジェンセンへのメール」 を出さなかった話 (18:00)

Sunny が Brad に 「NVIDIA と提携できる、 ジェンセンにメッセージを送って」 と言った瞬間、 Brad は固まった。 競合の親玉に協業を持ちかける、 しかも自分は政治資金まで使ってジェンセンと近い関係。 「クレイジーな案やと思われたくない」 で 1 週間放置。 Sunny から 「で、 送った?」 と再催促されて、 ようやく送信。 ジェンセンは即返信、 「面白い、 話そう」。 ベンチャーキャピタリストにも保身バイアスがある、 という人間味が漏れる場面。

「動作するシステムを見せてから 30 日で $20B」 (20:23)

Apoorv が時系列を確認する場面。 ジェンセンに動作するプロトタイプを見せる → NVIDIA から 200 億ドルが振り込まれる、 までわずか 30 日。 9 年間 「ニッチ」 と言われ続けた会社が、 1 ヶ月で NVIDIA の買収対象になる。 200 億ドル ≒ 約 3 兆円 ≒ 任天堂 1 社相当。 それが 30 日。 「決算が動く速度の世界では、 提携・買収は 6 ヶ月かけてやるもの」 という業界常識を、 物理制約 (電力 / メモリ) の切迫感が圧縮した瞬間。

NVIDIA は 「もう GPU を作っていない」 (20:39)

Sunny の指摘 — NVIDIA はすでに 7 種のチップ + 5 種のラックからなる垂直統合エコシステムを構築している。 「NVIDIA は GPU を作っているのではなく、 推論システム全体を作っている」。 だから decode 専用チップや SRAM 集中型チップを内製する余地は社内にもあった。 そこに Groq の動作プロトタイプが届いたから、 「カルチャーとエンジニアリングが補完的」 と判断できた。 もし Groq がただ 「もっと良い GPU」 を作っていたら、 内部紛争で買収は成立しなかった、 と本人が言い切る。

動画の構成

  • (00:00) 前提共有 — ソフトウェアが世界を飲み込んだ公式は AI には効かない
  • (00:30) ゲスト紹介 — Brad Gerstner (Altimeter)、 Invest America
  • (03:55) Sunny Madra 紹介 — Pivotal / Ford / Groq / NVIDIA で 4 連続 Exit
  • (05:11) 過去 2,000 年の人類一人当たり GDP — 1,800 年間ほぼ横ばいから 1800 年代に爆発
  • (15:00) Groq → NVIDIA 提携の発端
  • (16:04) 推論を prefill / decode に分離、 さらに decode を細分化
  • (16:34) GPU (演算 + 遅い HBM) と Groq (SRAM 中心、 1 桁速い) の構造的差
  • (17:00) NVLink Fusion でチップ間接続
  • (17:38) 同じ電力フットプリントで 2.5 倍のトークン
  • (17:51) Sunny からのテキスト 「NVIDIA と提携できる」
  • (18:00) Brad が 1 週間メールを出さなかった話
  • (20:23) 「動作システム → $20B 振込、 30 日」
  • (20:39) NVIDIA は GPU を作っていない、 推論システム全体を作っている
  • (21:46) Marc Andreessen の観察 — 周りが 1 日 $100〜$1,000 を Claude / ChatGPT トークンに使う時代

出典

Class #2 | MS&E 435: Economics of the AI Supercycle Stanford University Spring '26 Apoorv Agrawal

comment is stripped from the HTML output. */}