TOPIC · 技術領域
エージェント
このトピックの情報を持つ記事 38
← トピック一覧-
Claude Cowork 役職別デモ 3 本 — Anthropic 自身が示す 「ホワイトカラー労働の skill 化」 戦略 (Legal / Marketing Ops / Sales)
「I'm checking because my name goes on the reply, and trust but verify is pretty much the whole job」
-
コーディングはもはや constraint ではない — Niklas Gustavsson (Spotify Chief Architect) が公開する Honk V2 と 「99% AI 採用」 後の Spotify 組織変容
「by far、 我々が今 ship している PR の大多数は AI agent と開発者の共著によるもの。 コーディングは もはや ボトルネックではない」
-
Ali Abdaal の Ultimate Beginner's Guide to Claude Code — 661 万人フォロワーの business creator が築いた AI flywheel と Harry Potter 命名のエージェント生態系
「過去に 50,000 ドル支払った自動化エージェンシーやコンサル業者が達成しなかったレベルの clarity を、 Claude は数回のやりとりで実現した」
-
数時間動き続けるエージェントを作る — Anthropic の Ash Prabaker × Andrew Wilson が公開する long-running agent の設計原則
「フロンティアは縮むのではなく、 移動する。 モデルが強くなれば、 harness 自体は消えるのではなく、 別の難所へと進化していく」
-
AI Harness の Deep Dive — Tejas Kumar (IBM) が体系化する 「2026 年は harness の年」
「Agent harness とは、 モデルを取り囲んで現実に grounding させる全てのもの。 black box のモデルを安定環境に anchoring する仕組み、 それが harness」
-
国家を rewire する — Eoin Mulgrew (10 Downing Street) が公開する 「Insurgency Model」 による政府 AI 変革
「業界で良い仕事をしてきた人なら、 我々のところに来てほしい。 国家の鍵を渡す。 何ができるか見せてほしい」
-
GenMedia 全体戦略を Google DeepMind が公開 — Guillaume Vernade が見せる 「5 日に 1 ship」 のリリース速度
「DeepMind 全体で平均 5 日に 1 つ新しいものを ship している。 GenMedia だけ見ても 1 ヶ月に 1 つ以上」
-
AI で AI を debug する — Lawrence Jones (Incident.io) が公開する AI SRE 製品の内部ツール
「File systems are exceptionally good agent context。 MCP を被せるよりも、 Computer Use エージェントを使うよりも、 全部 download して filesystem として渡すほうが圧倒的に効果的やった」
-
コンテキストグラフが救う AI 製品 — Stephen Chin (Neo4j) が示す $3 兆市場の門
「Gartner が context graphs を AI hype cycle に正式追加した。 Foundation Capital は $3 兆ドルの起業機会と評価してる。 これは escape from the matrix や」
-
VS Code でエージェントを 「料理」 する — Liam Hampton (Microsoft) が示す 3 種エージェントの使い分けと awesome-copilot エコシステム
「VS Code を AI エージェントの 単一の入口 (single entry point) にする。 third-party、 background、 local、 remote ── 全部ここから」
-
「Domain-Native AI Organization」 の作り方 — Chris Lovejoy (Notius Labs) が提示する 3 つの組織モデル
「Vertical AI で勝つのは fundamentally an organizational problem。 最良のモデルを取りに行くんやない、 domain expertise を組織にどう埋め込むかや」
-
Claude Cowork 全機能解説 — Tina Huang の 22 分実演から読む Anthropic の B2C 戦略
「Productivity plugin は Anthropic 自身が作ってる、 たぶん自分で同じものを作るより遥かに sophisticated や。 wheel を reinvent するな」
-
Intercom が 9 ヶ月で開発速度 2 倍 — Brian Scanlan が公開する Claude Code 全社展開のレシピ
「AI を使えていないなら、 デザイナーであれ PM であれエンジニアであれ、 期待を満たしていない — それは binary」
-
「Agents は standup しない」 — Mike Spitz (PFF) が見せた post-engineer 組織の 2 ヶ月実証
「Scrum did not survive。 engineers はもう bottleneck やない、 だから昔の ceremony は全部いらん」
-
Ship Real Agents — Laurie Voss (Arize) が語る Eval の本物の作り方 (AI Engineer Europe)
「あなたが書きすぎる eval は壊れる。 Agent が予想より賢く tool を 2 つ飛ばしたとき、 prescriptive な eval は false negative を出す」
-
CI/CD は死んだ — エージェント時代の Continuous Compute (Namespace × NEA)
「マージにかかる時間が決定的になる、 新しいアーキテクチャが必要や。 PR は無い、 我々は intent と plan から始める」
-
LLM はチェスが下手 — だから翻訳だけさせる (Take Take Take の AI Chess Coach)
「LLM の仕事は翻訳だけや。 計算は Stockfish、 人間視点は Maia、 検出は detector 群」
-
エージェントがモデルを訓練する時代 (Merve Noyan / Hugging Face)
「Qwen2-VL を LLaVA-Instruct-Mix で fine-tune して、 と言うだけ。 6 年 ML やってきた私から見たらこれは SF や」
-
AI SDK v6 ワークショップ — 2026 年のエージェント構築 3 ブロック (Nico Albanese / Vercel)
「2026 年のエージェント構築は agent runtime、 tools、 computer or sandbox の 3 ブロックの組み合わせ。 ファイルシステムを渡した瞬間、 D0 は別物になった」
-
バイブコーディングからエージェント工学へ — Andrej Karpathy が語る Software 3.0
「プログラマーとして、 これまでで最も後れを取っていると感じる」
-
A Piece of Pi — コーディングエージェントを自社プロダクトに埋め込む
「コーディングエージェントは、 これからのソフトウェアシステムのコア構築ブロックになる、 既になりつつある」
-
耐久性のあるエージェント — Replay vs Snapshot
「30 年間ステートレスコンピュートが核だった、 agents がこれを stateful compute へ強制してる」
-
エージェントはプロンプトではなくコンテキストで失敗する — Arize Alex の文脈管理
「Context decides what the model sees、 Memory decides what survives」
-
Slack に住む AI 同僚 Viktor — 17 世紀 Leibniz から 2026 年 AGI まで
「Viktor は ツールじゃない、 雇用。 新しい社員を雇う時、 個人メールへのアクセス渡す?」
-
コンテキスト エンジニアリングの 80% はエージェント検索
「コンテキスト エンジニアリングの約 80% はエージェント検索です」
-
チャット エージェントに声を与える
「これらのチャット エージェントはいずれ死ぬ」
-
Playground in Prod — エージェントを本番で最適化する
「私は AI の可観測性をあまり信じていない、 いずれ食われる」
-
エージェント・オブザーバビリティの全貌
「人間がエージェントを監視できなくなったとき、 彼らは私たちより遥か先にいる」
-
エージェントを作るのをやめた、 Skills を作ることにした
「言い換えれば、 それらはフォルダーです」
-
MCP vs CLI、 両方使え
「プロトコルとは、 単なる言語に過ぎない」
-
Make Your Own Event-Sourced Agent Harness — agent の全てを event に (Jonas Templestein / Iterate)
「アクションは全部 event。 入力も出力もエラーも全部 event。 そうすれば agent はリプレイ可能で、 デバッグ可能で、 並列実行可能になる」
-
Mind the Gap — Microsoft Foundry の Agent Observability ワークショップ (Amy Boyd & Nitya Narasimhan)
「あなたが今日 production で動かしている agent、 失敗した時にどうなっているか本当に分かりますか?」
-
エージェントは無限のキャンバスである — Rachel Lee Nabors (Dressed for Space) が示すブラウザ・プリミティブの再武装
「ブラウザは単なるドキュメントリーダーではない。 動画も音声も、 必要な何でもレンダリングできる無限のキャンバスだ — どんな用途にも API がある」
-
Lobster Trap — OpenCode をコンテナで、 ローカルから Kubernetes まで往復する
「OpenCode を安全に動かせないなら、 むしろこれは世の中に見せる絶好の機会。 10 年間、 我々はあらゆるアプリケーションを安全にコンテナで動かしてきた、 それが RHEL の本質」
-
Slop を作るな — Ara Khan (Cline) が示す AI エージェント成熟度の 4 段階
「Slop を作るな、 頼むから。 スループットは出せる、 でも本物のエンジニアとして学んだ教訓は、 アーキテクチャと設計を考える時間に投資する価値があるということ」
-
主権の下で AI を作ると何が壊れるか — Bilge Yücel (deepset) が示す 4 つの柱と Haystack 流アーキテクチャ
「Sovereignty は spectrum である。 全 pillar で sovereign にする必要はない、 自分が今どのレベルの control と vendor lock-in を抱えているかを 「知っている」 ことが大事」
-
LLM 時代の personalization — Shivam Verma (Spotify AI Foundation) が公開する Foundational User Modeling + Semantic IDs + Soft Tokenization の三層設計
「embeddings が users を、 semantic IDs が content の圧縮版を、 soft tokenization が users をモデルの token 空間に射影する。 旧来の recommended system モデルから sequential modeling フレームワークへの移行」
-
478 ページのマニュアルを誰も読まない時代の DX 設計 — Marc Klingen (Langfuse) が公開した skill 構築の 6 学び
「3 年プロジェクトを続けたら、 こうなる — 478 ページのドキュメント。 デプロイのたびに 『誰がこれ全部書いたんだ』 と思う。 でも、 読む時間は誰にもない」