クリス・オラ

Chris Olah

Anthropic 共同創業者・Interpretability 責任者 / Distill.pub 創設者

略歴

— カナダ・トロントで出生
2010 Toronto の The Abelard School を National AP Scholar として卒業
— Thiel Fellowship 受領 (18 歳で大学進学せず)
— Google Brain で解釈可能性研究
2017 Distill.pub 創設、「Research Debt」「Visualizing Optimization」等を公開
— OpenAI で解釈可能性研究継続
2021-01 Dario Amodei、 Daniela Amodei らと Anthropic 共同創業、 Interpretability チーム責任者
2024 Towards Monosemanticity 研究公開、 Claude 3 Sonnet の内部回路を解明
2024 TIME 100 AI 入り
2024-11 Lex Fridman Podcast #452 出演 (Dario Amodei、 Amanda Askell と)
2025-01-08 Anthropic Research Salon パネル登壇

補足

Anthropic 共同創業者、 Interpretability (解釈可能性) 研究の主要設計者。カナダ出身、トロントの The Abelard School を 2010 年に National AP Scholar として卒業。大学に進学せず 18 歳で Thiel Fellowship を受ける、という珍しい経歴。

経歴: Google Brain で解釈可能性研究 → OpenAI で同分野継続 → 2021 年 1 月、 Dario Amodei・Daniela Amodei らと Anthropic を共同創業。同社の Interpretability チームを率いる。

Distill.pub (2017 年創設) の主要設計者の 1 人。「研究のインタラクティブな視覚化」を中心に置く学術ジャーナルで、 ML 研究の伝達方法に革命を起こした。「Research Debt」「The Building Blocks of Interpretability」等の Distill 論文は ML 研究者必読の古典。

主要研究業績: DeepDream への貢献、 Activation Atlases、 Neural Network Visualization、 Circuits 研究シリーズ (個別ニューロンの機能解析)、 Sparse Autoencoder (SAE) を用いた特徴抽出、 Towards Monosemanticity (2024) — Claude 3 Sonnet の内部回路を解明する大規模研究。

思想: ニューラルネットワークの内部を『生物学的に』研究すべき、という立場。「ニューロンは個別に解釈可能な特徴を表現するべきで、 superposition (重ね合わせ) によって複雑化される」という仮説を中心に研究を進める。 Anthropic Salon (2025/01) では Amanda Askell・Jan Leike・Alex Tamkin と並んでパネル登壇、 Interpretability を AI 安全性の「賭け (bet)」として位置付ける。

受賞: TIME 100 AI (2024)。 Lex Fridman Podcast #452 (2024/11) に Dario Amodei、 Amanda Askell と共演。

公式リンク

← 人物一覧に戻る

略歴

補足

関連企業・組織

公式リンク