CO

クリス・オラ

Chris Olah

Anthropic 共同創業者・Interpretability 責任者 / Distill.pub 創設者

略歴

  1. カナダ・トロントで出生
  2. 2010 Toronto の The Abelard School を National AP Scholar として卒業
  3. Thiel Fellowship 受領 (18 歳で大学進学せず)
  4. Google Brain で解釈可能性研究
  5. 2017 Distill.pub 創設、 「Research Debt」 「Visualizing Optimization」 等を公開
  6. OpenAI で解釈可能性研究継続
  7. 2021-01 Dario Amodei、 Daniela Amodei らと Anthropic 共同創業、 Interpretability チーム責任者
  8. 2024 Towards Monosemanticity 研究公開、 Claude 3 Sonnet の内部回路を解明
  9. 2024 TIME 100 AI 入り
  10. 2024-11 Lex Fridman Podcast #452 出演 (Dario Amodei、 Amanda Askell と)
  11. 2025-01-08 Anthropic Research Salon パネル登壇

補足

Anthropic 共同創業者、 Interpretability (解釈可能性) 研究の主要設計者。 カナダ出身、 トロントの The Abelard School を 2010 年に National AP Scholar として卒業。 大学に進学せず 18 歳で Thiel Fellowship を受ける、 という珍しい経歴。

経歴: Google Brain で解釈可能性研究 → OpenAI で同分野継続 → 2021 年 1 月、 Dario Amodei・Daniela Amodei らと Anthropic を共同創業。 同社の Interpretability チームを率いる。

Distill.pub (2017 年創設) の主要設計者の 1 人。 「研究のインタラクティブな視覚化」 を中心に置く学術ジャーナルで、 ML 研究の伝達方法に革命を起こした。 「Research Debt」 「The Building Blocks of Interpretability」 等の Distill 論文は ML 研究者必読の古典。

主要研究業績: DeepDream への貢献、 Activation Atlases、 Neural Network Visualization、 Circuits 研究シリーズ (個別ニューロンの機能解析)、 Sparse Autoencoder (SAE) を用いた特徴抽出、 Towards Monosemanticity (2024) — Claude 3 Sonnet の内部回路を解明する大規模研究。

思想: ニューラルネットワークの内部を 『生物学的に』 研究すべき、 という立場。 「ニューロンは個別に解釈可能な特徴を表現するべきで、 superposition (重ね合わせ) によって複雑化される」 という仮説を中心に研究を進める。 Anthropic Salon (2025/01) では Amanda Askell・Jan Leike・Alex Tamkin と並んでパネル登壇、 Interpretability を AI 安全性の 「賭け (bet)」 として位置付ける。

受賞: TIME 100 AI (2024)。 Lex Fridman Podcast #452 (2024/11) に Dario Amodei、 Amanda Askell と共演。

関連企業・組織

Anthropic

公式リンク

← 人物一覧に戻る

comment is stripped from the HTML output. */}