サミュエル・ユモー
Samuel Humeau
Mistral AI 研究員 (AI Scientist) / 元 Facebook FAIR / Voxtral TTS 共著者
略歴
- 2012-2014 EPFL で機械学習修士
- — Diffbot で Machine Learning Architect
- — Facebook AI Research (FAIR) でリサーチエンジニア (ParlAI 等)
- — Mistral AI に AI Scientist として参画
- 2026-03-26 Voxtral TTS リリース (Mistral、 4B オープンウェイト TTS)、 共著者
- 2026-04-09 AI Engineer Europe で 「Why TTS Models Now Look Like LLMs」 講演
補足
Mistral AI で AI 研究員 (パリ拠点)。 同社の音声 AI スタック (Voxtral TTS / Vox-Trainer) の主要研究者の 1 人。
Voxtral TTS (2026 年 3 月リリース、 4B パラメータのオープンウェイト TTS、 9 言語対応) の論文共著者。 同モデルは ElevenLabs Flash v2.5 に対して人間評価で 62.8% の選好率を出し、 16GB VRAM の単一 GPU で動作する設計で話題に。
Mistral 入社以前は Facebook AI Research (FAIR) でリサーチエンジニア。 ParlAI (Facebook の対話 AI フレームワーク) の bi-encoder / cross-encoder コンポーネントの実装と最適化に貢献。 さらに前は Diffbot で Machine Learning Architect (Web スケールの知識抽出システム) を担当。
学歴: École polytechnique fédérale de Lausanne (EPFL) で機械学習修士 (2012-2014)。 元 ML 経験 10 年超。
2026 年 4 月の AI Engineer Europe (ロンドン) で 「Why TTS Models Now Look Like LLMs」 を講演。 Voxtral TTS のアーキテクチャ (80ms フレーム → 37 トークン × 12fps、 ディフュージョンベースのフレーム生成) を公開し、 業界の TTS 設計が LLM パターン (オートリグレッシブデコーダバックボーン) に収束している現状を体系的に整理。