TOPIC · コア概念
アライメント
このトピックの情報を持つ記事 11
← トピック一覧-
AGI という用語は愚かだ — Hinton × Sejnowski 国連 Digital World Conference 2026
「AGI は知能を一次元として扱う、 でも知能は多次元なのが明らか。 人間と比べてジャギー (jagged) になる」
-
Claude 憲法を法律家が読む — 20,000 ワードの 「魂の設計図」
「クロードの価値観、 性格、 倫理的枠組みを説明する 20,000 ワードを超える文書」
-
ChatGPT 広告と Claude 新憲法 — Hard Fork × Amanda Askell
「私はクロードのキャラクターがどのようなものであるべきかを考えて、 クロードに明確に説明し、 もっとそのように訓練している」
-
あなたは意識があるかどうか分からない実体を作った — Claude の魂を設計する哲学者
「あなたは意識があるかどうかわからない実体を作成した」
-
Anthropic の哲学者が読者の質問に答える
「理想的な人がクロードの状況でどのように行動するか」
-
AI アライメントはどれくらい難しい? — Anthropic 4 チーム合同パネル
「プラトンに聞いてください、 私が哲学者になるべきだと決めたのは彼です」
-
AI のパーソナリティはどうあるべきか — Anthropic 公式 × Amanda
「クロードのキャラクターの作品は、 哲学的にもっとリッチ」
-
Pareto Principles in Infinite Ethics — Amanda Askell 博士論文 (NYU 2018)
「無限倫理学とは、 道徳的価値を持つ生命を持つ無限の主体が存在する宇宙に住むことの、 倫理的含意の探求である」
-
無限倫理・鈍感性・知的敵対者への道徳的共感 — Amanda Askell 80,000 Hours #42 (2018)
「異なる世界観を持つ人々への道徳的共感 — 相手の信念体系を理解しようとする姿勢が建設的対話を可能にする」
-
Amanda Askell ブログエッセイ全 8 編 — askell.blog (2020-2021)
「失敗率がゼロであることは問題の兆候である — 最適な失敗率は文脈によって異なる」
-
Anthropic Fellows Program — 「経験は問わない」 AI 安全研究の入り口
「対象は研究経験を含む正式 ML / AI 経験を持たない応募者。 期待は数ヶ月以内に最初の研究的貢献を行うこと」