TOPIC · 技術領域

エージェント

AI エージェントの設計思想と現場の運用知識 (並列実行、永続化、オーケストレーション) が分かる

Claude Cowork 役職別デモ 3 本 — Anthropic 自身が示す「ホワイトカラー労働の skill 化」戦略 (Legal / Marketing Ops / Sales)

「I'm checking because my name goes on the reply, and trust but verify is pretty much the whole job」

マーク・パイク / Mark Pike (Anthropic Associate General Counsel) + 匿名 marketing ops + 匿名 growth account executive · 2026/05/18

Anthropic MCP エンタープライズ
コーディングはもはや constraint ではない — Niklas Gustavsson (Spotify Chief Architect) が公開する Honk V2 と「99% AI 採用」後の Spotify 組織変容

「by far、我々が今 ship している PR の大多数は AI agent と開発者の共著によるもの。コーディングはもはやボトルネックではない」

ニクラス・グスタフソン / Niklas Gustavsson (Spotify Chief Architect & VP of Engineering) · 2026/05/20

Claude Code 本番運用エンタープライズ
Ali Abdaal の Ultimate Beginner's Guide to Claude Code — 661 万人フォロワーの business creator が築いた AI flywheel と Harry Potter 命名のエージェント生態系

「過去に 50,000 ドル支払った自動化エージェンシーやコンサル業者が達成しなかったレベルの clarity を、 Claude は数回のやりとりで実現した」

アリ・アブダール / Ali Abdaal (元 NHS 医師、 Lifestyle Business Academy 創業者) · 2026/04/18

Claude Code MCP 本番運用
数時間動き続けるエージェントを作る — Anthropic の Ash Prabaker × Andrew Wilson が公開する long-running agent の設計原則

「フロンティアは縮むのではなく、移動する。モデルが強くなれば、 harness 自体は消えるのではなく、別の難所へと進化していく」

アッシュ・プラバカー / Ash Prabaker × アンドリュー・ウィルソン / Andrew Wilson (Anthropic) · 2026/05/18

Claude Code 本番運用 Anthropic
AI Harness の Deep Dive — Tejas Kumar (IBM) が体系化する「2026 年は harness の年」

「Agent harness とは、モデルを取り囲んで現実に grounding させる全てのもの。 black box のモデルを安定環境に anchoring する仕組み、それが harness」

テジャス・クマール / Tejas Kumar (IBM) · 2026/05/17

本番運用 Claude Code エンタープライズ
国家を rewire する — Eoin Mulgrew (10 Downing Street) が公開する「Insurgency Model」による政府 AI 変革

「業界で良い仕事をしてきた人なら、我々のところに来てほしい。国家の鍵を渡す。何ができるか見せてほしい」

エオイン・マルグルー / Eoin Mulgrew (10 Downing Street) · 2026/05/18

地政学エンタープライズ AI 安全
GenMedia 全体戦略を Google DeepMind が公開 — Guillaume Vernade が見せる「5 日に 1 ship」のリリース速度

「DeepMind 全体で平均 5 日に 1 つ新しいものを ship している。 GenMedia だけ見ても 1 ヶ月に 1 つ以上」

ギヨーム・ヴェルナード / Guillaume Vernade (Google DeepMind) · 2026/05/18

マルチモーダル本番運用
AI で AI を debug する — Lawrence Jones (Incident.io) が公開する AI SRE 製品の内部ツール

「File systems are exceptionally good agent context。 MCP を被せるよりも、 Computer Use エージェントを使うよりも、全部 download して filesystem として渡すほうが圧倒的に効果的やった」

ローレンス・ジョーンズ / Lawrence Jones (Incident.io) · 2026/05/17

Evals / 観測性本番運用 Claude Code
コンテキストグラフが救う AI 製品 — Stephen Chin (Neo4j) が示す $3 兆市場の門

「Gartner が context graphs を AI hype cycle に正式追加した。 Foundation Capital は $3 兆ドルの起業機会と評価してる。これは escape from the matrix や」

スティーブン・チン / Stephen Chin (Neo4j) · 2026/05/16

RAG / 文脈 Anthropic 本番運用
VS Code でエージェントを「料理」する — Liam Hampton (Microsoft) が示す 3 種エージェントの使い分けと awesome-copilot エコシステム

「VS Code を AI エージェントの単一の入口 (single entry point) にする。 third-party、 background、 local、 remote ── 全部ここから」

リアム・ハンプトン / Liam Hampton (Microsoft) · 2026/05/16

MCP Claude Code 本番運用
「Domain-Native AI Organization」の作り方 — Chris Lovejoy (Notius Labs) が提示する 3 つの組織モデル

「Vertical AI で勝つのは fundamentally an organizational problem。最良のモデルを取りに行くんやない、 domain expertise を組織にどう埋め込むかや」

クリストファー・ラブジョイ / Chris Lovejoy (Notius Labs) · 2026/05/16

エンタープライズ本番運用 Evals / 観測性
Claude Cowork 全機能解説 — Tina Huang の 22 分実演から読む Anthropic の B2C 戦略

「Productivity plugin は Anthropic 自身が作ってる、たぶん自分で同じものを作るより遥かに sophisticated や。 wheel を reinvent するな」

ティナ・フアン / Tina Huang (Lonely Octopus) · 2026/05/10

Anthropic MCP Claude Code
Intercom が 9 ヶ月で開発速度 2 倍 — Brian Scanlan が公開する Claude Code 全社展開のレシピ

「AI を使えていないなら、デザイナーであれ PM であれエンジニアであれ、期待を満たしていない — それは binary」

ブライアン・スキャンラン / Brian Scanlan (Intercom) · 2026/05/15

Claude Code エンタープライズ本番運用
「Agents は standup しない」 — Mike Spitz (PFF) が見せた post-engineer 組織の 2 ヶ月実証

「Scrum did not survive。 engineers はもう bottleneck やない、だから昔の ceremony は全部いらん」

マイク・スピッツ / Mike Spitz (PFF) · 2026/05/15

Claude Code エンタープライズ本番運用
Ship Real Agents — Laurie Voss (Arize) が語る Eval の本物の作り方 (AI Engineer Europe)

「あなたが書きすぎる eval は壊れる。 Agent が予想より賢く tool を 2 つ飛ばしたとき、 prescriptive な eval は false negative を出す」

ロリー・ヴォス / Laurie Voss · 2026/05/14

Evals / 観測性本番運用
CI/CD は死んだ — エージェント時代の Continuous Compute (Namespace × NEA)

「マージにかかる時間が決定的になる、新しいアーキテクチャが必要や。 PR は無い、我々は intent と plan から始める」

ヒューゴ・サントス × マディソン・フォークナー · 2026/05/13

本番運用インフラ
LLM はチェスが下手 — だから翻訳だけさせる (Take Take Take の AI Chess Coach)

「LLM の仕事は翻訳だけや。計算は Stockfish、人間視点は Maia、検出は detector 群」

アナント・ドール × アスビョルン・スタインスコグ · 2026/05/13

マルチモーダル
エージェントがモデルを訓練する時代 (Merve Noyan / Hugging Face)

「Qwen2-VL を LLaVA-Instruct-Mix で fine-tune して、と言うだけ。 6 年 ML やってきた私から見たらこれは SF や」

メルヴェ・ノヤン · 2026/05/13

マルチモーダル
AI SDK v6 ワークショップ — 2026 年のエージェント構築 3 ブロック (Nico Albanese / Vercel)

「2026 年のエージェント構築は agent runtime、 tools、 computer or sandbox の 3 ブロックの組み合わせ。ファイルシステムを渡した瞬間、 D0 は別物になった」

ニコ・アルバネーゼ · 2026/05/12

本番運用
バイブコーディングからエージェント工学へ — Andrej Karpathy が語る Software 3.0

「プログラマーとして、これまでで最も後れを取っていると感じる」

アンドレイ・カルパシー × Stephanie Zhan · 2026/04/29

Software 3.0 Claude Code
A Piece of Pi — コーディングエージェントを自社プロダクトに埋め込む

「コーディングエージェントは、これからのソフトウェアシステムのコア構築ブロックになる、既になりつつある」

マティアス・ルベケン · 2026/05/11

Claude Code
耐久性のあるエージェント — Replay vs Snapshot

「30 年間ステートレスコンピュートが核だった、 agents がこれを stateful compute へ強制してる」

エリック・アラム · 2026/05/10

本番運用
エージェントはプロンプトではなくコンテキストで失敗する — Arize Alex の文脈管理

「Context decides what the model sees、 Memory decides what survives」

サリーアン・デルシア · 2026/05/10

RAG / 文脈 Evals / 観測性
Slack に住む AI 同僚 Viktor — 17 世紀 Leibniz から 2026 年 AGI まで

「Viktor はツールじゃない、雇用。新しい社員を雇う時、個人メールへのアクセス渡す?」

フリデリック・ヴィアトロフスキ · 2026/05/11

AGI タイムライン
コンテキストエンジニアリングの 80% はエージェント検索

「コンテキストエンジニアリングの約 80% はエージェント検索です」

レオニー・モニガッティ · 2026/05/08

RAG / 文脈
チャットエージェントに声を与える

「これらのチャットエージェントはいずれ死ぬ」

ルーク・ハリーズ · 2026/05/09

マルチモーダル
Playground in Prod — エージェントを本番で最適化する

「私は AI の可観測性をあまり信じていない、いずれ食われる」

サミュエル・コルヴィン · 2026/05/07

本番運用 Evals / 観測性
エージェント・オブザーバビリティの全貌

「人間がエージェントを監視できなくなったとき、彼らは私たちより遥か先にいる」

ズービン・コティチャ × ダニー・ゴラパリ · 2026/05/07

Evals / 観測性本番運用
エージェントを作るのをやめた、 Skills を作ることにした

「言い換えれば、それらはフォルダーです」

バリー・チャン × マヘシュ・ムラグ · 2025/12/08

Claude Code Anthropic
MCP vs CLI、両方使え

「プロトコルとは、単なる言語に過ぎない」

ニック・クーパー · 2026/05/01

MCP
Make Your Own Event-Sourced Agent Harness — agent の全てを event に (Jonas Templestein / Iterate)

「アクションは全部 event。入力も出力もエラーも全部 event。そうすれば agent はリプレイ可能で、デバッグ可能で、並列実行可能になる」

ジョナス・テンプルスタイン · 2026/05/14

本番運用
Mind the Gap — Microsoft Foundry の Agent Observability ワークショップ (Amy Boyd & Nitya Narasimhan)

「あなたが今日 production で動かしている agent、失敗した時にどうなっているか本当に分かりますか?」

エイミー・ボイド × ニティア・ナラシマン · 2026/05/14

Evals / 観測性本番運用
エージェントは無限のキャンバスである — Rachel Lee Nabors (Dressed for Space) が示すブラウザ・プリミティブの再武装

「ブラウザは単なるドキュメントリーダーではない。動画も音声も、必要な何でもレンダリングできる無限のキャンバスだ — どんな用途にも API がある」

レイチェル・リー・ネイバーズ · 2026/05

MCP 本番運用
Lobster Trap — OpenCode をコンテナで、ローカルから Kubernetes まで往復する

「OpenCode を安全に動かせないなら、むしろこれは世の中に見せる絶好の機会。 10 年間、我々はあらゆるアプリケーションを安全にコンテナで動かしてきた、それが RHEL の本質」

サリー・アン・オマリー / Sally Ann O'Malley (Red Hat) · 2026/05

インフラエンタープライズ本番運用
Slop を作るな — Ara Khan (Cline) が示す AI エージェント成熟度の 4 段階

「Slop を作るな、頼むから。スループットは出せる、でも本物のエンジニアとして学んだ教訓は、アーキテクチャと設計を考える時間に投資する価値があるということ」

アラ・カーン / Ara Khan (Cline) · 2026/04

本番運用 Claude Code
主権の下で AI を作ると何が壊れるか — Bilge Yücel (deepset) が示す 4 つの柱と Haystack 流アーキテクチャ

「Sovereignty は spectrum である。全 pillar で sovereign にする必要はない、自分が今どのレベルの control と vendor lock-in を抱えているかを「知っている」ことが大事」

ビルゲ・ユジェル / Bilge Yücel (deepset) · 2026/05/14

地政学エンタープライズ本番運用
LLM 時代の personalization — Shivam Verma (Spotify AI Foundation) が公開する Foundational User Modeling + Semantic IDs + Soft Tokenization の三層設計

「embeddings が users を、 semantic IDs が content の圧縮版を、 soft tokenization が users をモデルの token 空間に射影する。旧来の recommended system モデルから sequential modeling フレームワークへの移行」

シヴァム・ヴェルマ / Shivam Verma (Spotify AI Foundation org、 User Representations Tech Lead) · 2026/05

本番運用インフラ RAG / 文脈
478 ページのマニュアルを誰も読まない時代の DX 設計 — Marc Klingen (Langfuse) が公開した skill 構築の 6 学び

「3 年プロジェクトを続けたら、こうなる — 478 ページのドキュメント。デプロイのたびに『誰がこれ全部書いたんだ』と思う。でも、読む時間は誰にもない」

マルク・クリンゲン / Marc Klingen (Langfuse 共同創業者) · 2026/05

Evals / 観測性 Claude Code

他のトピックも見る

Software 3.0 AGI タイムライン AI 経済アライメントパーソナリティ AI 安全解釈可能性 Claude Code MCP Evals / 観測性マルチモーダル RAG / 文脈 Anthropic 地政学エンタープライズインフラ本番運用終焉アーカイブ

エージェント

Claude Cowork 役職別デモ 3 本 — Anthropic 自身が示す 「ホワイトカラー労働の skill 化」 戦略 (Legal / Marketing Ops / Sales)

コーディングはもはや constraint ではない — Niklas Gustavsson (Spotify Chief Architect) が公開する Honk V2 と 「99% AI 採用」 後の Spotify 組織変容

Ali Abdaal の Ultimate Beginner's Guide to Claude Code — 661 万人フォロワーの business creator が築いた AI flywheel と Harry Potter 命名のエージェント生態系

数時間動き続けるエージェントを作る — Anthropic の Ash Prabaker × Andrew Wilson が公開する long-running agent の設計原則

AI Harness の Deep Dive — Tejas Kumar (IBM) が体系化する 「2026 年は harness の年」

国家を rewire する — Eoin Mulgrew (10 Downing Street) が公開する 「Insurgency Model」 による政府 AI 変革

GenMedia 全体戦略を Google DeepMind が公開 — Guillaume Vernade が見せる 「5 日に 1 ship」 のリリース速度

AI で AI を debug する — Lawrence Jones (Incident.io) が公開する AI SRE 製品の内部ツール

コンテキストグラフが救う AI 製品 — Stephen Chin (Neo4j) が示す $3 兆市場の門

VS Code でエージェントを 「料理」 する — Liam Hampton (Microsoft) が示す 3 種エージェントの使い分けと awesome-copilot エコシステム

「Domain-Native AI Organization」 の作り方 — Chris Lovejoy (Notius Labs) が提示する 3 つの組織モデル

Claude Cowork 全機能解説 — Tina Huang の 22 分実演から読む Anthropic の B2C 戦略

Intercom が 9 ヶ月で開発速度 2 倍 — Brian Scanlan が公開する Claude Code 全社展開のレシピ

「Agents は standup しない」 — Mike Spitz (PFF) が見せた post-engineer 組織の 2 ヶ月実証

Ship Real Agents — Laurie Voss (Arize) が語る Eval の本物の作り方 (AI Engineer Europe)

CI/CD は死んだ — エージェント時代の Continuous Compute (Namespace × NEA)

LLM はチェスが下手 — だから翻訳だけさせる (Take Take Take の AI Chess Coach)

エージェントがモデルを訓練する時代 (Merve Noyan / Hugging Face)

AI SDK v6 ワークショップ — 2026 年のエージェント構築 3 ブロック (Nico Albanese / Vercel)

バイブコーディングからエージェント工学へ — Andrej Karpathy が語る Software 3.0

A Piece of Pi — コーディングエージェントを自社プロダクトに埋め込む

耐久性のあるエージェント — Replay vs Snapshot

エージェントはプロンプトではなくコンテキストで失敗する — Arize Alex の文脈管理

Slack に住む AI 同僚 Viktor — 17 世紀 Leibniz から 2026 年 AGI まで

コンテキスト エンジニアリングの 80% はエージェント検索

チャット エージェントに声を与える

Playground in Prod — エージェントを本番で最適化する

エージェント・オブザーバビリティの全貌

エージェントを作るのをやめた、 Skills を作ることにした

MCP vs CLI、 両方使え

Make Your Own Event-Sourced Agent Harness — agent の全てを event に (Jonas Templestein / Iterate)

Mind the Gap — Microsoft Foundry の Agent Observability ワークショップ (Amy Boyd & Nitya Narasimhan)

エージェントは無限のキャンバスである — Rachel Lee Nabors (Dressed for Space) が示すブラウザ・プリミティブの再武装

Lobster Trap — OpenCode をコンテナで、 ローカルから Kubernetes まで往復する

Slop を作るな — Ara Khan (Cline) が示す AI エージェント成熟度の 4 段階

主権の下で AI を作ると何が壊れるか — Bilge Yücel (deepset) が示す 4 つの柱と Haystack 流アーキテクチャ

LLM 時代の personalization — Shivam Verma (Spotify AI Foundation) が公開する Foundational User Modeling + Semantic IDs + Soft Tokenization の三層設計

478 ページのマニュアルを誰も読まない時代の DX 設計 — Marc Klingen (Langfuse) が公開した skill 構築の 6 学び

他のトピックも見る

Claude Cowork 役職別デモ 3 本 — Anthropic 自身が示す「ホワイトカラー労働の skill 化」戦略 (Legal / Marketing Ops / Sales)

コーディングはもはや constraint ではない — Niklas Gustavsson (Spotify Chief Architect) が公開する Honk V2 と「99% AI 採用」後の Spotify 組織変容

AI Harness の Deep Dive — Tejas Kumar (IBM) が体系化する「2026 年は harness の年」

国家を rewire する — Eoin Mulgrew (10 Downing Street) が公開する「Insurgency Model」による政府 AI 変革

GenMedia 全体戦略を Google DeepMind が公開 — Guillaume Vernade が見せる「5 日に 1 ship」のリリース速度

VS Code でエージェントを「料理」する — Liam Hampton (Microsoft) が示す 3 種エージェントの使い分けと awesome-copilot エコシステム

「Domain-Native AI Organization」の作り方 — Chris Lovejoy (Notius Labs) が提示する 3 つの組織モデル

コンテキストエンジニアリングの 80% はエージェント検索

チャットエージェントに声を与える

MCP vs CLI、両方使え

Lobster Trap — OpenCode をコンテナで、ローカルから Kubernetes まで往復する