国内AIニュース

公式skillが『禁止リスト』をやめて『自己批評の工程』になった — frontend-design の設計転換
Zenn AI 中級 3日前 約1分
Claude Codeの公式Skill「frontend-design」の設計思想が刷新された。機能面ではなく、AIへの指示設計のあり方がどのように変化したのか、その差分から学べるプログラミングの学習プロセスやAI活用のヒントについて考察する。
「計画は人間・実行はAI」を約40万セッションが裏づけた — Anthropicの熟練研究を読む
Zenn AI 入門 3日前 約1分
プログラミング学習者がClaude Codeを活用する際に定めた「設計・判断は人」「実装はAI」「重要操作は確認」という3つのルールを解説。このルールがAnthropicの研究論文「Agentic coding」の結果と一致する理由を紐解く。
【Claude Code活用】PROGRESS.md駆動開発でセッションをまたいで開発する
Zenn AI 上級 3日前 約1分
Claude Codeのセッション間で記憶が保持されない課題を解決する「PROGRESS.md駆動開発」を紹介。現在地やフェーズをファイルに記録し、AIの文脈維持をサポートする具体的な設計手法を解説する。
その人の「名前」がAIモデルの中でどれほど強く重み付けされているのかがわかる「IN THE WEIGHTS」
GIGAZINE 中級 3日前 約1分
大規模言語モデル(LLM)の「重み付け」を可視化するサービス「IN THE WEIGHTS」を紹介。歴史上の偉人や有名人の名前がモデル内でどれほど強く認識されているかを確認できます。
【Opus 4.8が議論する】生産性が上がれば、社会は良くなるのか
Zenn LLM 入門 3日前 約1分
2026年、AIによる生産性向上と、賃金や雇用といった労働環境の本質的課題が乖離している現状を論じる。AIの普及がもたらす効率化の恩恵が誰に帰属するのかを問い直すエッセイ。
A2Aの仕組みを整理する — AIエージェント間通信プロトコルの基礎
Zenn LLM 中級 3日前 約1分
異なるフレームワークで構築されたエージェント同士を接続するGoogle提唱の「A2A(Agent-to-Agent)プロトコル」を解説。MCPとの比較を通じて、標準化の必要性を整理する。
複数ツールを自律的に組み合わせるAI Agentsの実装
Zenn AI 上級 3日前 約1分
LLMに検索・計算・メモリなど複数のツールを組み合わせ、複雑なタスクを自律的にこなす「AIエージェント」の実装方法を解説します。前回の単一ツール活用からステップアップした実践的な内容です。
Claude Code Dynamic Workflows 完全ガイド — 最大1000サブエージェントを束ねる自動オーケストレーション
Zenn AI 上級 3日前 約1分
Claude Code v2.1.154で導入された「Dynamic Workflows」の解説。プロンプトに「ultracode」と記述するだけで実行可能な、最新の動的ワークフロー機能について紹介します。
LangGraphで構築!マルチエージェントRAGの協調ワークフロー実装ハンズオン
Zenn LLM 中級 3日前 約1分
LangGraphを用いて、複数のエージェントが協調して高度なRAGを実現するための実践的ハンズオン。複雑な問い合わせへの役割分担や、ステートフルなワークフロー構築手順を解説する。
AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開
GIGAZINE 上級 3日前 約1分
OpenAIの研究により、AIに正直さや謙虚さ、公平性などの有益な性質を学習させると、訓練外の領域でも望ましい振る舞いが促進され、悪意ある指示への耐性も向上することが判明しました。
Obsidian Weave から Yasumaro へ — ブラウザの記録を、もっと自由に
Zenn AI 中級 3日前 約1分
Obsidian用のChrome拡張機能「Obsidian Weave」の開発秘話。ウェブ要約をデイリーノートに保存する仕組みの中で直面した「保存先」の課題と、それを通じたツール開発への気づきを綴ります。
Yasumaro とは何か — Chrome拡張だけで動くAI閲覧記録ツール w/ SQLite
Zenn AI 入門 3日前 約1分
調べた記事の履歴管理を解決するChrome拡張「Yasumaro」を紹介。Obsidian Weaveから改名された本ツールは、開発者や研究者が読み漁るドキュメントの検索性と記憶をサポートします。
Claude Opus 4.8が劣化している可能性の検証v2:Fable/Mythos停止後の実効品質劣化を多層的に
Zenn AI 上級 3日前 約1分
Claude Opus 4.8で発生している出力品質の低下について考察。Anthropicの公式情報を踏まえ、モデルのnerfの真相やユーザーが感じる一時的な性能変化のメカニズムを解説します。
AIで改善!の前に、リスクとコストの生産ラインを見ろ
Zenn AI 中級 3日前 約1分
AIに業務を任せる際のリスクを解説。判断基準や責任境界が曖昧なままAIを導入すると生じる事故シナリオを提示し、人間が制御すべき生産ラインの重要性を説きます。
Claude Codeのコストとプラン枠を常時見える化する ― statusline実装
Zenn AI 上級 3日前 約1分
Claude Codeの消費コストを可視化する「statusline」スクリプトの解説。認証不要でAPIプラン枠や累計コストをリアルタイムで表示し、無駄なAPI消費を防止する方法を紹介します。
アメリカのAI企業が独自開発モデル「Laguna M.1」をオープンモデルとして公開、高性能だが中国製オープンモデルには劣る
GIGAZINE 中級 3日前 約1分
AI企業のPoolsideが独自モデル「Laguna M.1」をオープンモデル化。誰でもダウンロード可能になり、Macでローカル実行可能な量子化モデルも提供されています。
AI彼女アプリを作っていて気付いた。人は検索ではなく連想で思い出している
Zenn AI 中級 3日前 約1分
AI彼女アプリの開発を通じて、記憶の保存よりも「思い出す」プロセスの難しさに直面した筆者。人間は検索で情報を呼び出すのではなく、会話の文脈や関連性から連想的に記憶を呼び起こしているという事実に着目し、AIの対話における記憶想起メカニズムの構築を考察する。