ソーステン・「ソー」・シェフ
Thorsten "Thor" Schaeff
Google DeepMind Developer Relations Engineer / Gemini API + AI Studio (元 ElevenLabs)
略歴
- — ElevenLabs で AI audio の Developer Relations
- 2025-11 Google DeepMind に参画 (Gemini 3 リリース前日と語る)
- 2026 Gemini 3.1 Flash Live 公式 blog を共著
- 2026-05 AI Engineer Europe 2026 (London) で 「What's new in AI audio」 を発表
補足
Google DeepMind の Developer Relations Engineer。 Gemini API と Google AI Studio を担当する。 前職 ElevenLabs では AI audio の DevRel。 「Gemini 3 がリリースされる前日にチームに加わった」 と語る (2025 年 11 月頃)。
主要主張 (AI Engineer Europe 2026 London 「What's new in AI audio」): DeepMind の音声まわり — 理解・生成・リアルタイム・音楽 — はすべて Gemini 3 の音声理解という一つの土台の上に積まれている。 音声 AI は cascading パイプライン (音声→テキスト→LLM→音声) から、 知能を音声モデルに焼き込む single の sound-to-sound モデルへ移行しつつある、 という構図をデモで示す。
実演: Echo Script (Gemini 3 Flash への 1 API コールで話者・言語・感情・翻訳・要約を構造化抽出)、 Voice Library (約 30 の base voice を director's note で演出)、 Gemini 3.1 Flash Live (リアルタイム多モーダル、 公式 blog の共著者)、 Lyria 3 + Live Jukebox。 すべて Google AI Studio で無料で試せる点を一貫して強調する。
関連企業・組織
公式リンク
登場した動画
- (記事準備中)