TK
タニシュク・クマール
Tanishq Kumar
Stanford CS 博士課程 / 推論高速化 (Speculative Speculative Decoding)
略歴
- — Stanford CS 博士課程 (Percy Liang・Tatsunori Hashimoto に師事)
- 2026-03 「Speculative Speculative Decoding」 を arXiv 公開 (2603.03251)、 ICLR 2026 採択
- 2026-05 第 1 回 YC Paper Club で SSD を発表
補足
Stanford CS 博士課程 (Percy Liang・Tatsunori Hashimoto に師事)。 もともと学習 (training) を専門にしていたが、 推論 (inference) のアルゴリズムとシステムの奥深さに惹かれ、 推論高速化に取り組んだ。
主要主張 (第 1 回 YC Paper Club 2026 「Speculative Speculative Decoding」): 推論は今日コストや利便性のレバーとして見られているが、 性能が 「考える量」 に比例する時代には、 1 秒あたりのトークン数がそのまま引き出せる知能の上限になる — つまり推論は能力 (capability) である、 という再定義を掲げる。
技術的貢献: 通常の投機的デコーディングに残る draft↔target の逐次依存を解消し、 起草と検証を別ハードウェアで同時並行させる SSD を提案。 target が検証している間に draft が検証結果を予測して次ラウンドを先回り起草することで、 起草のレイテンシを隠す。 Tri Dao (Princeton / Together AI)、 Avner May (Together AI) との共著 (arXiv 2603.03251、 ICLR 2026)。 最適化版エンジンは Saguaro。
関連企業・組織
Stanford
公式リンク
登場した動画
- (記事準備中)