ヤン・ライケ

Jan Leike

Anthropic Alignment Science / 元 OpenAI Superalignment 共同責任者

略歴

1986-87 ドイツ生まれ
— フライブルク大学 (ドイツ) 学部・修士 (計算機科学)
— オーストラリア国立大学 (ANU) 機械学習 PhD (Marcus Hutter 指導下)
— Future of Humanity Institute (Oxford) ポスドク
— DeepMind で empirical AI safety 研究 (Shane Legg と協働)
2021 OpenAI に参画、 Head of Alignment
2023-06 OpenAI Superalignment チーム共同責任者 (Ilya Sutskever と)、 4 年で AGI のアライメント達成を目標
2024-05 OpenAI 退職 (『安全性文化が後回しになっている』と公的懸念表明)、同月 Anthropic に参画
2025-01-08 Anthropic Research Salon パネル登壇 (Amanda Askell、 Josh Batson、 Alex Tamkin と)

補足

Anthropic Alignment Science チーム所属の AI 安全性研究者。 RLHF (Reinforcement Learning from Human Feedback) の主要研究者で、大規模言語モデルのアライメント分野を牽引する 1 人。

元 OpenAI Superalignment 共同責任者 (Ilya Sutskever と共同)。「OpenAI が AI 安全性を真剣に扱っていない」と公に懸念を表明して 2024 年 5 月に退職、同月 Anthropic に参画して大きな話題に。

DeepMind 出身、オーストラリア国立大学 (ANU) 博士。主要論文: 「Scalable agent alignment via reward modeling」、「Recursive Reward Modeling」、 InstructGPT (RLHF を ChatGPT に応用した起源論文) の共著者。

Anthropic では Amanda Askell (Alignment Fine-tuning)、 Josh Batson (Interpretability)、 Alex Tamkin (Societal Impacts) と並んで、同社の AI 安全性研究の柱を形成。

公式リンク

登場した動画

AI アライメントはどれくらい難しい? — Anthropic 4 チーム合同パネル →

← 人物一覧に戻る

略歴

補足

関連企業・組織

公式リンク

登場した動画