ソーステン・「ソー」・シェフ

Thorsten "Thor" Schaeff

Google DeepMind Developer Relations Engineer / Gemini API + AI Studio (元 ElevenLabs)

略歴

— ElevenLabs で AI audio の Developer Relations
2025-11 Google DeepMind に参画 (Gemini 3 リリース前日と語る)
2026 Gemini 3.1 Flash Live 公式 blog を共著
2026-05 AI Engineer Europe 2026 (London) で「What's new in AI audio」を発表

補足

Google DeepMind の Developer Relations Engineer。 Gemini API と Google AI Studio を担当する。前職 ElevenLabs では AI audio の DevRel。「Gemini 3 がリリースされる前日にチームに加わった」と語る (2025 年 11 月頃)。

主要主張 (AI Engineer Europe 2026 London 「What's new in AI audio」): DeepMind の音声まわり — 理解・生成・リアルタイム・音楽 — はすべて Gemini 3 の音声理解という一つの土台の上に積まれている。音声 AI は cascading パイプライン (音声→テキスト→LLM→音声) から、知能を音声モデルに焼き込む single の sound-to-sound モデルへ移行しつつある、という構図をデモで示す。

実演: Echo Script (Gemini 3 Flash への 1 API コールで話者・言語・感情・翻訳・要約を構造化抽出)、 Voice Library (約 30 の base voice を director's note で演出)、 Gemini 3.1 Flash Live (リアルタイム多モーダル、公式 blog の共著者)、 Lyria 3 + Live Jukebox。すべて Google AI Studio で無料で試せる点を一貫して強調する。

公式リンク

登場した動画

(記事準備中)

← 人物一覧に戻る

略歴

補足

関連企業・組織

公式リンク

登場した動画