SH

サミュエル・ユモー

Samuel Humeau

Mistral AI 研究員 (AI Scientist) / 元 Facebook FAIR / Voxtral TTS 共著者

略歴

  1. 2012-2014 EPFL で機械学習修士
  2. Diffbot で Machine Learning Architect
  3. Facebook AI Research (FAIR) でリサーチエンジニア (ParlAI 等)
  4. Mistral AI に AI Scientist として参画
  5. 2026-03-26 Voxtral TTS リリース (Mistral、 4B オープンウェイト TTS)、 共著者
  6. 2026-04-09 AI Engineer Europe で 「Why TTS Models Now Look Like LLMs」 講演

補足

Mistral AI で AI 研究員 (パリ拠点)。 同社の音声 AI スタック (Voxtral TTS / Vox-Trainer) の主要研究者の 1 人。

Voxtral TTS (2026 年 3 月リリース、 4B パラメータのオープンウェイト TTS、 9 言語対応) の論文共著者。 同モデルは ElevenLabs Flash v2.5 に対して人間評価で 62.8% の選好率を出し、 16GB VRAM の単一 GPU で動作する設計で話題に。

Mistral 入社以前は Facebook AI Research (FAIR) でリサーチエンジニア。 ParlAI (Facebook の対話 AI フレームワーク) の bi-encoder / cross-encoder コンポーネントの実装と最適化に貢献。 さらに前は Diffbot で Machine Learning Architect (Web スケールの知識抽出システム) を担当。

学歴: École polytechnique fédérale de Lausanne (EPFL) で機械学習修士 (2012-2014)。 元 ML 経験 10 年超。

2026 年 4 月の AI Engineer Europe (ロンドン) で 「Why TTS Models Now Look Like LLMs」 を講演。 Voxtral TTS のアーキテクチャ (80ms フレーム → 37 トークン × 12fps、 ディフュージョンベースのフレーム生成) を公開し、 業界の TTS 設計が LLM パターン (オートリグレッシブデコーダバックボーン) に収束している現状を体系的に整理。

関連企業・組織

Mistral AI

公式リンク

登場した動画

← 人物一覧に戻る

comment is stripped from the HTML output. */}