TK

タニシュク・クマール

Tanishq Kumar

Stanford CS 博士課程 / 推論高速化 (Speculative Speculative Decoding)

略歴

  1. Stanford CS 博士課程 (Percy Liang・Tatsunori Hashimoto に師事)
  2. 2026-03 「Speculative Speculative Decoding」 を arXiv 公開 (2603.03251)、 ICLR 2026 採択
  3. 2026-05 第 1 回 YC Paper Club で SSD を発表

補足

Stanford CS 博士課程 (Percy Liang・Tatsunori Hashimoto に師事)。 もともと学習 (training) を専門にしていたが、 推論 (inference) のアルゴリズムとシステムの奥深さに惹かれ、 推論高速化に取り組んだ。

主要主張 (第 1 回 YC Paper Club 2026 「Speculative Speculative Decoding」): 推論は今日コストや利便性のレバーとして見られているが、 性能が 「考える量」 に比例する時代には、 1 秒あたりのトークン数がそのまま引き出せる知能の上限になる — つまり推論は能力 (capability) である、 という再定義を掲げる。

技術的貢献: 通常の投機的デコーディングに残る draft↔target の逐次依存を解消し、 起草と検証を別ハードウェアで同時並行させる SSD を提案。 target が検証している間に draft が検証結果を予測して次ラウンドを先回り起草することで、 起草のレイテンシを隠す。 Tri Dao (Princeton / Together AI)、 Avner May (Together AI) との共著 (arXiv 2603.03251、 ICLR 2026)。 最適化版エンジンは Saguaro。

関連企業・組織

Stanford

公式リンク

登場した動画

← 人物一覧に戻る

comment is stripped from the HTML output. */}