AA

アマンダ・アスケル

Amanda Askell

Anthropic 哲学者・Personality Alignment チーム責任者 / Claude のキャラクターと憲法の主要設計者

略歴

  1. 1988-89 スコットランド・プレストウィックで出生 (旧姓 Hall)
  2. 2009 ダンディー大学 MA(Hons) 哲学と美術の二重専攻
  3. 2011 オックスフォード大学 哲学 BPhil (修論 「objective epistemic consequentialism」)
  4. 2013 William Crouch (後の William MacAskill) と結婚
  5. 2015 William MacAskill と離婚、 共通苗字採用
  6. 2018 NYU 哲学博士 (博士論文 「Pareto Principles in Infinite Ethics」、 指導 Cian Dorr / David Chalmers / Shelly Kagan)
  7. 2018-11 OpenAI ポリシーチームでリサーチサイエンティスト (AI Safety via Debate 等)
  8. 2020-05 GPT-3 論文共著者
  9. 2021-03 Anthropic に Member of Technical Staff として参画
  10. 2021- Personality Alignment チーム責任者、 Claude のキャラクターと憲法を主導設計
  11. 2022-12 Constitutional AI 論文 (Bai, Kadavath, Kundu, Askell et al.) 発表
  12. 2023 Moral Self-Correction 論文 (Ganguli, Askell) — 22B パラメータ閾値発見
  13. 2024-11 Lex Fridman Podcast #452 出演 (Dario Amodei + Chris Olah と共演)
  14. 2024 Time 100 AI 入り
  15. 2025-12-05 Anthropic 公式チャンネルで 「Anthropic's philosopher answers your questions」 公開
  16. 2026-01 Claude 憲法 (80 ページの改訂版) 公開、 主要著者
  17. 2026-01-23 Hard Fork (NYT) でケビン・ルース × ケイシー・ヌーン と対談
  18. 2026-02-20 Scaling Laws (Lawfare + UT Austin) で法律家とのレビュー対談
  19. 2026-04 Newcomer ポッドキャストで 「AI Consciousness, Claude & Silicon Valley's Biggest Fear」 公開

補足

Anthropic の Personality Alignment チーム責任者。 Claude のキャラクター・価値観・憲法を 2021 年から主導設計。 Wall Street Journal は彼女の仕事を 「クロードに 『良い』 とは何かを教えること」 と表現、 New Yorker は彼女が 「クロードの魂を監督している」 と書いた。 Time 100 AI (2024 年) 入り。 1988-1989 年生まれ、 スコットランド・プレストウィック出身、 旧姓 Hall。 母は教師でアルヴァ・アカデミー (中等学校) 進学。

学歴: ダンディー大学 MA(Hons) 哲学と美術の二重専攻 (2009) → オックスフォード大学 哲学 BPhil (2011、 修論テーマは 「objective epistemic consequentialism (客観的認識的帰結主義)」) → ニューヨーク大学 (NYU) 哲学博士 (2018)。 博士論文 「Pareto Principles in Infinite Ethics (無限倫理学における Pareto 原理)」 の指導教官は Cian Dorr (主任)、 David Chalmers (心の哲学の大御所、 ハードプロブレム提唱者)、 Shelly Kagan (Yale、 道徳哲学・無限倫理)。 博士論文は 「Longtermism / 存続リスク / 無限の未来を考慮するすべてのフレームワーク」 に直結する基礎研究 — 4 つの公理 (Pareto・推移性・置換可能性・質的双子の同等性) を受け入れると、 無限世界間に遍在的な比較不可能性 (ubiquitous incomparability) が生じることを証明。 専門は倫理学、 意思決定理論、 形式認識論。

Anthropic 入社前は OpenAI のポリシーチーム で 2018 年 11 月〜 2021 年にリサーチサイエンティストとして AI Safety via Debate (討論による AI 安全性) や人間ベースライン評価を担当、 GPT-3 論文 (2020/05) 共著者。 「AI Safety を十分に優先していない」 という懸念から退職し、 2021 年 3 月に Anthropic に Member of Technical Staff として参画、 同社のファインチューニング + アライメント領域を担う。 学術的影響規模: 60 以上の論文、 190,000 以上の引用 (Google Scholar)。

Constitutional AI (憲法 AI) = 「AI に倫理規則を文章で与え、 AI 自身がその規則に基づいて自己評価・自己修正する」 という Anthropic の中核手法の主要設計者。 主要論文: Constitutional AI (Bai, Kadavath, Kundu, Askell et al., 2022/12)、 Moral Self-Correction (Ganguli, Askell, 2023) — 「22B+ パラメータで道徳的自己修正能力が emergence する」 という閾値発見、 80 ページの 2026/01 Claude 憲法 (主要著者)。 「ある状況で 『理想的な人 (a good person)』 がどう行動するか」 をモデルに考えさせる訓練アプローチで、 「ルール暗記」 から 「価値観に基づく判断」 へ重心を移した。

公開している思想: 「モデルにこれらのことについて考えるツールを与える」 「内省を通じてモデル自身が状況を理解する」 「(AI 意識の確率) 1〜70% の不確実性、 だが不確実性があっても敬意を持って扱う」 「人間の道徳的伝統に深く根ざしたペルソナを育てる」 「倫理は実際にはもっと物理学に似ている — 経験的で、 不確実性があり、 仮説がある」 など。

元配偶者 William MacAskill (旧姓 Crouch、 Effective Altruism 運動の中心人物、 Oxford 哲学者、 「Doing Good Better」 「What We Owe the Future」 著者): 2013 年結婚、 2015 年離婚。 離婚後、 両者は共通の苗字 (Askell / MacAskill 系) を採用する珍しい合意。 Giving What We Can メンバーで、 生涯収入の 10% 以上を慈善団体に寄付する誓約 (「可能なら 50% 以上にしたい」 と宣言)。 主に世界貧困対策慈善団体に寄付。 EA 運動と Anthropic Personality Alignment の思想的近さは、 この人的接続が一部の背景。

X (@AmandaAskell) で約 30 万フォロワーに哲学・AI・倫理についての考察を発信。 Newcomer / Lex Fridman (Podcast #452 with Dario Amodei + Chris Olah、 2024/11) / 80,000 Hours (2018 年頃、 無限倫理と道徳的共感) / Hard Fork (NYT、 2026/01) / Scaling Laws (Lawfare、 2026/02) 等のポッドキャストにゲスト出演し、 AI alignment の哲学的基盤を一般に広く伝える役割も担う。

関連企業・組織

Anthropic

公式リンク

登場した動画

← 人物一覧に戻る

comment is stripped from the HTML output. */}