サミュエル・ユモー

Samuel Humeau

Mistral AI 研究員 (AI Scientist) / 元 Facebook FAIR / Voxtral TTS 共著者

略歴

2012-2014 EPFL で機械学習修士
— Diffbot で Machine Learning Architect
— Facebook AI Research (FAIR) でリサーチエンジニア (ParlAI 等)
— Mistral AI に AI Scientist として参画
2026-03-26 Voxtral TTS リリース (Mistral、 4B オープンウェイト TTS)、共著者
2026-04-09 AI Engineer Europe で「Why TTS Models Now Look Like LLMs」講演

補足

Mistral AI で AI 研究員 (パリ拠点)。同社の音声 AI スタック (Voxtral TTS / Vox-Trainer) の主要研究者の 1 人。

Voxtral TTS (2026 年 3 月リリース、 4B パラメータのオープンウェイト TTS、 9 言語対応) の論文共著者。同モデルは ElevenLabs Flash v2.5 に対して人間評価で 62.8% の選好率を出し、 16GB VRAM の単一 GPU で動作する設計で話題に。

Mistral 入社以前は Facebook AI Research (FAIR) でリサーチエンジニア。 ParlAI (Facebook の対話 AI フレームワーク) の bi-encoder / cross-encoder コンポーネントの実装と最適化に貢献。さらに前は Diffbot で Machine Learning Architect (Web スケールの知識抽出システム) を担当。

学歴: École polytechnique fédérale de Lausanne (EPFL) で機械学習修士 (2012-2014)。元 ML 経験 10 年超。

2026 年 4 月の AI Engineer Europe (ロンドン) で「Why TTS Models Now Look Like LLMs」を講演。 Voxtral TTS のアーキテクチャ (80ms フレーム → 37 トークン × 12fps、ディフュージョンベースのフレーム生成) を公開し、業界の TTS 設計が LLM パターン (オートリグレッシブデコーダバックボーン) に収束している現状を体系的に整理。

公式リンク

登場した動画

TTS モデルが LLM に似てきた理由 — Voxtral TTS (Samuel Humeau / Mistral) →

← 人物一覧に戻る

略歴

補足

関連企業・組織

公式リンク

登場した動画