JL

ヤン・ライケ

Jan Leike

Anthropic Alignment Science / 元 OpenAI Superalignment 共同責任者

略歴

  1. 1986-87 ドイツ生まれ
  2. フライブルク大学 (ドイツ) 学部・修士 (計算機科学)
  3. オーストラリア国立大学 (ANU) 機械学習 PhD (Marcus Hutter 指導下)
  4. Future of Humanity Institute (Oxford) ポスドク
  5. DeepMind で empirical AI safety 研究 (Shane Legg と協働)
  6. 2021 OpenAI に参画、 Head of Alignment
  7. 2023-06 OpenAI Superalignment チーム共同責任者 (Ilya Sutskever と)、 4 年で AGI のアライメント達成を目標
  8. 2024-05 OpenAI 退職 (『安全性文化が後回しになっている』 と公的懸念表明)、 同月 Anthropic に参画
  9. 2025-01-08 Anthropic Research Salon パネル登壇 (Amanda Askell、 Josh Batson、 Alex Tamkin と)

補足

Anthropic Alignment Science チーム所属の AI 安全性研究者。 RLHF (Reinforcement Learning from Human Feedback) の主要研究者で、 大規模言語モデルのアライメント分野を牽引する 1 人。

元 OpenAI Superalignment 共同責任者 (Ilya Sutskever と共同)。 「OpenAI が AI 安全性を真剣に扱っていない」 と公に懸念を表明して 2024 年 5 月に退職、 同月 Anthropic に参画して大きな話題に。

DeepMind 出身、 オーストラリア国立大学 (ANU) 博士。 主要論文: 「Scalable agent alignment via reward modeling」、 「Recursive Reward Modeling」、 InstructGPT (RLHF を ChatGPT に応用した起源論文) の共著者。

Anthropic では Amanda Askell (Alignment Fine-tuning)、 Josh Batson (Interpretability)、 Alex Tamkin (Societal Impacts) と並んで、 同社の AI 安全性研究の柱を形成。

関連企業・組織

Anthropic

公式リンク

登場した動画

← 人物一覧に戻る

comment is stripped from the HTML output. */}