TOPIC · コア概念

アライメント

AI を人間の価値観に従わせる技術と思想 — 「悪い AI」を作らない方法 — が分かる

AGI という用語は愚かだ — Hinton × Sejnowski 国連 Digital World Conference 2026

「AGI は知能を一次元として扱う、でも知能は多次元なのが明らか。人間と比べてジャギー (jagged) になる」

ジェフリー・ヒントン × テレンス・セジノフスキー × リー・デン · 2026/04/29

AGI タイムライン
Claude 憲法を法律家が読む — 20,000 ワードの「魂の設計図」

「クロードの価値観、性格、倫理的枠組みを説明する 20,000 ワードを超える文書」

アマンダ・アスケル · 2026/02/20

パーソナリティ Anthropic AI 安全
ChatGPT 広告と Claude 新憲法 — Hard Fork × Amanda Askell

「私はクロードのキャラクターがどのようなものであるべきかを考えて、クロードに明確に説明し、もっとそのように訓練している」

アマンダ・アスケル × Kevin Roose × Casey Newton · 2026/01/23

パーソナリティ Anthropic エンタープライズ
あなたは意識があるかどうか分からない実体を作った — Claude の魂を設計する哲学者

「あなたは意識があるかどうかわからない実体を作成した」

アマンダ・アスケル · 2026/04/20

パーソナリティ Anthropic
Anthropic の哲学者が読者の質問に答える

「理想的な人がクロードの状況でどのように行動するか」

アマンダ・アスケル · 2025/12/05

パーソナリティ Anthropic
AI アライメントはどれくらい難しい? — Anthropic 4 チーム合同パネル

「プラトンに聞いてください、私が哲学者になるべきだと決めたのは彼です」

Alex Tamkin × Jan Leike × アマンダ・アスケル × Josh Batson · 2025/01/08

Anthropic AI 安全
AI のパーソナリティはどうあるべきか — Anthropic 公式 × Amanda

「クロードのキャラクターの作品は、哲学的にもっとリッチ」

アマンダ・アスケル × Stuart Ritchie · 2024/06/08

パーソナリティ Anthropic
Pareto Principles in Infinite Ethics — Amanda Askell 博士論文 (NYU 2018)

「無限倫理学とは、道徳的価値を持つ生命を持つ無限の主体が存在する宇宙に住むことの、倫理的含意の探求である」

アマンダ・アスケル · 2018/05/15

パーソナリティ
無限倫理・鈍感性・知的敵対者への道徳的共感 — Amanda Askell 80,000 Hours #42 (2018)

「異なる世界観を持つ人々への道徳的共感 — 相手の信念体系を理解しようとする姿勢が建設的対話を可能にする」

アマンダ・アスケル × Robert Wiblin · 2018/09/11

パーソナリティ
Amanda Askell ブログエッセイ全 8 編 — askell.blog (2020-2021)

「失敗率がゼロであることは問題の兆候である — 最適な失敗率は文脈によって異なる」

アマンダ・アスケル · 2020/06/01 - 2021/03/31

パーソナリティ
Anthropic Fellows Program — 「経験は問わない」 AI 安全研究の入り口

「対象は研究経験を含む正式 ML / AI 経験を持たない応募者。期待は数ヶ月以内に最初の研究的貢献を行うこと」

Anthropic 公式募集ページ · 2024/03/01 開始 / 2026 募集中

 Anthropic AI 安全

他のトピックも見る

Software 3.0 AGI タイムライン AI 経済パーソナリティ AI 安全解釈可能性 Claude Code MCP エージェント Evals / 観測性マルチモーダル RAG / 文脈 Anthropic 地政学エンタープライズインフラ本番運用終焉アーカイブ

アライメント

AGI という用語は愚かだ — Hinton × Sejnowski 国連 Digital World Conference 2026

Claude 憲法を法律家が読む — 20,000 ワードの 「魂の設計図」

ChatGPT 広告と Claude 新憲法 — Hard Fork × Amanda Askell

あなたは意識があるかどうか分からない実体を作った — Claude の魂を設計する哲学者

Anthropic の哲学者が読者の質問に答える

AI アライメントはどれくらい難しい? — Anthropic 4 チーム合同パネル

AI のパーソナリティはどうあるべきか — Anthropic 公式 × Amanda

Pareto Principles in Infinite Ethics — Amanda Askell 博士論文 (NYU 2018)

無限倫理・鈍感性・知的敵対者への道徳的共感 — Amanda Askell 80,000 Hours #42 (2018)

Amanda Askell ブログエッセイ全 8 編 — askell.blog (2020-2021)

Anthropic Fellows Program — 「経験は問わない」 AI 安全研究の入り口

他のトピックも見る

Claude 憲法を法律家が読む — 20,000 ワードの「魂の設計図」