タニシュク・クマール

Tanishq Kumar

Stanford CS 博士課程 / 推論高速化 (Speculative Speculative Decoding)

略歴

— Stanford CS 博士課程 (Percy Liang・Tatsunori Hashimoto に師事)
2026-03 「Speculative Speculative Decoding」を arXiv 公開 (2603.03251)、 ICLR 2026 採択
2026-05 第 1 回 YC Paper Club で SSD を発表

補足

Stanford CS 博士課程 (Percy Liang・Tatsunori Hashimoto に師事)。もともと学習 (training) を専門にしていたが、推論 (inference) のアルゴリズムとシステムの奥深さに惹かれ、推論高速化に取り組んだ。

主要主張 (第 1 回 YC Paper Club 2026 「Speculative Speculative Decoding」): 推論は今日コストや利便性のレバーとして見られているが、性能が「考える量」に比例する時代には、 1 秒あたりのトークン数がそのまま引き出せる知能の上限になる — つまり推論は能力 (capability) である、という再定義を掲げる。

技術的貢献: 通常の投機的デコーディングに残る draft↔target の逐次依存を解消し、起草と検証を別ハードウェアで同時並行させる SSD を提案。 target が検証している間に draft が検証結果を予測して次ラウンドを先回り起草することで、起草のレイテンシを隠す。 Tri Dao (Princeton / Together AI)、 Avner May (Together AI) との共著 (arXiv 2603.03251、 ICLR 2026)。最適化版エンジンは Saguaro。

公式リンク

登場した動画

(記事準備中)

← 人物一覧に戻る

略歴

補足

関連企業・組織

公式リンク

登場した動画