アマンダ・アスケル
Amanda Askell
Anthropic 哲学者・Personality Alignment チーム責任者 / Claude のキャラクターと憲法の主要設計者
略歴
- 1988-89 スコットランド・プレストウィックで出生 (旧姓 Hall)
- 2009 ダンディー大学 MA(Hons) 哲学と美術の二重専攻
- 2011 オックスフォード大学 哲学 BPhil (修論 「objective epistemic consequentialism」)
- 2013 William Crouch (後の William MacAskill) と結婚
- 2015 William MacAskill と離婚、 共通苗字採用
- 2018 NYU 哲学博士 (博士論文 「Pareto Principles in Infinite Ethics」、 指導 Cian Dorr / David Chalmers / Shelly Kagan)
- 2018-11 OpenAI ポリシーチームでリサーチサイエンティスト (AI Safety via Debate 等)
- 2020-05 GPT-3 論文共著者
- 2021-03 Anthropic に Member of Technical Staff として参画
- 2021- Personality Alignment チーム責任者、 Claude のキャラクターと憲法を主導設計
- 2022-12 Constitutional AI 論文 (Bai, Kadavath, Kundu, Askell et al.) 発表
- 2023 Moral Self-Correction 論文 (Ganguli, Askell) — 22B パラメータ閾値発見
- 2024-11 Lex Fridman Podcast #452 出演 (Dario Amodei + Chris Olah と共演)
- 2024 Time 100 AI 入り
- 2025-12-05 Anthropic 公式チャンネルで 「Anthropic's philosopher answers your questions」 公開
- 2026-01 Claude 憲法 (80 ページの改訂版) 公開、 主要著者
- 2026-01-23 Hard Fork (NYT) でケビン・ルース × ケイシー・ヌーン と対談
- 2026-02-20 Scaling Laws (Lawfare + UT Austin) で法律家とのレビュー対談
- 2026-04 Newcomer ポッドキャストで 「AI Consciousness, Claude & Silicon Valley's Biggest Fear」 公開
補足
Anthropic の Personality Alignment チーム責任者。 Claude のキャラクター・価値観・憲法を 2021 年から主導設計。 Wall Street Journal は彼女の仕事を 「クロードに 『良い』 とは何かを教えること」 と表現、 New Yorker は彼女が 「クロードの魂を監督している」 と書いた。 Time 100 AI (2024 年) 入り。 1988-1989 年生まれ、 スコットランド・プレストウィック出身、 旧姓 Hall。 母は教師でアルヴァ・アカデミー (中等学校) 進学。
学歴: ダンディー大学 MA(Hons) 哲学と美術の二重専攻 (2009) → オックスフォード大学 哲学 BPhil (2011、 修論テーマは 「objective epistemic consequentialism (客観的認識的帰結主義)」) → ニューヨーク大学 (NYU) 哲学博士 (2018)。 博士論文 「Pareto Principles in Infinite Ethics (無限倫理学における Pareto 原理)」 の指導教官は Cian Dorr (主任)、 David Chalmers (心の哲学の大御所、 ハードプロブレム提唱者)、 Shelly Kagan (Yale、 道徳哲学・無限倫理)。 博士論文は 「Longtermism / 存続リスク / 無限の未来を考慮するすべてのフレームワーク」 に直結する基礎研究 — 4 つの公理 (Pareto・推移性・置換可能性・質的双子の同等性) を受け入れると、 無限世界間に遍在的な比較不可能性 (ubiquitous incomparability) が生じることを証明。 専門は倫理学、 意思決定理論、 形式認識論。
Anthropic 入社前は OpenAI のポリシーチーム で 2018 年 11 月〜 2021 年にリサーチサイエンティストとして AI Safety via Debate (討論による AI 安全性) や人間ベースライン評価を担当、 GPT-3 論文 (2020/05) 共著者。 「AI Safety を十分に優先していない」 という懸念から退職し、 2021 年 3 月に Anthropic に Member of Technical Staff として参画、 同社のファインチューニング + アライメント領域を担う。 学術的影響規模: 60 以上の論文、 190,000 以上の引用 (Google Scholar)。
Constitutional AI (憲法 AI) = 「AI に倫理規則を文章で与え、 AI 自身がその規則に基づいて自己評価・自己修正する」 という Anthropic の中核手法の主要設計者。 主要論文: Constitutional AI (Bai, Kadavath, Kundu, Askell et al., 2022/12)、 Moral Self-Correction (Ganguli, Askell, 2023) — 「22B+ パラメータで道徳的自己修正能力が emergence する」 という閾値発見、 80 ページの 2026/01 Claude 憲法 (主要著者)。 「ある状況で 『理想的な人 (a good person)』 がどう行動するか」 をモデルに考えさせる訓練アプローチで、 「ルール暗記」 から 「価値観に基づく判断」 へ重心を移した。
公開している思想: 「モデルにこれらのことについて考えるツールを与える」 「内省を通じてモデル自身が状況を理解する」 「(AI 意識の確率) 1〜70% の不確実性、 だが不確実性があっても敬意を持って扱う」 「人間の道徳的伝統に深く根ざしたペルソナを育てる」 「倫理は実際にはもっと物理学に似ている — 経験的で、 不確実性があり、 仮説がある」 など。
元配偶者 William MacAskill (旧姓 Crouch、 Effective Altruism 運動の中心人物、 Oxford 哲学者、 「Doing Good Better」 「What We Owe the Future」 著者): 2013 年結婚、 2015 年離婚。 離婚後、 両者は共通の苗字 (Askell / MacAskill 系) を採用する珍しい合意。 Giving What We Can メンバーで、 生涯収入の 10% 以上を慈善団体に寄付する誓約 (「可能なら 50% 以上にしたい」 と宣言)。 主に世界貧困対策慈善団体に寄付。 EA 運動と Anthropic Personality Alignment の思想的近さは、 この人的接続が一部の背景。
X (@AmandaAskell) で約 30 万フォロワーに哲学・AI・倫理についての考察を発信。 Newcomer / Lex Fridman (Podcast #452 with Dario Amodei + Chris Olah、 2024/11) / 80,000 Hours (2018 年頃、 無限倫理と道徳的共感) / Hard Fork (NYT、 2026/01) / Scaling Laws (Lawfare、 2026/02) 等のポッドキャストにゲスト出演し、 AI alignment の哲学的基盤を一般に広く伝える役割も担う。
関連企業・組織
公式リンク
- 個人サイト
- 個人ブログ
-
X (@AmandaAskell)
-
Wikipedia
-
LinkedIn
- Google Scholar
-
GitHub (aaskell)
- ResearchGate
- 履歴書 (CV)
- 博士論文 (PhilArchive)
- Constitutional AI 論文 (arXiv 2212.08073)
- GPT-3 論文 (arXiv 2005.14165)
- Moral Self-Correction 論文 (arXiv 2302.07459)
- TIME 100 AI 2024 プロフィール
- 80,000 Hours Podcast 出演 (2018 頃)
- Lex Fridman Podcast #452
登場した動画
- Pareto Principles in Infinite Ethics — Amanda Askell 博士論文 (NYU 2018) →
- 無限倫理・鈍感性・知的敵対者への道徳的共感 — Amanda Askell 80,000 Hours #42 (2018) →
- Amanda Askell ブログエッセイ全 8 編 — askell.blog (2020-2021) →
- Anthropic の哲学者が読者の質問に答える — Constitutional AI 設計者の Q&A →
- あなたは意識があるかどうか分からない実体を作った — Claude の魂を設計する哲学者 (Newcomer) →
- ChatGPT 広告と Claude 新憲法 — 大学に進学する子への手紙 (Hard Fork × Amanda Askell) →
- AI アライメントはどれくらい難しい? — Anthropic 4 チーム合同パネル →
- Claude 憲法を法律家が読む — 20,000 ワードの 「魂の設計図」 を法学から問う (Scaling Laws) →
- AI のパーソナリティはどうあるべきか — Amanda Askell × Stuart Ritchie (Anthropic 公式) →