国内AIニュース
Claude Codeの公式Skill「frontend-design」の設計思想が刷新された。機能面ではなく、AIへの指示設計のあり方がどのように変化したのか、その差分から学べるプログラミングの学習プロセスやAI活用のヒントについて考察する。
プログラミング学習者がClaude Codeを活用する際に定めた「設計・判断は人」「実装はAI」「重要操作は確認」という3つのルールを解説。このルールがAnthropicの研究論文「Agentic coding」の結果と一致する理由を紐解く。
Claude Codeのセッション間で記憶が保持されない課題を解決する「PROGRESS.md駆動開発」を紹介。現在地やフェーズをファイルに記録し、AIの文脈維持をサポートする具体的な設計手法を解説する。
大規模言語モデル(LLM)の「重み付け」を可視化するサービス「IN THE WEIGHTS」を紹介。歴史上の偉人や有名人の名前がモデル内でどれほど強く認識されているかを確認できます。
2026年、AIによる生産性向上と、賃金や雇用といった労働環境の本質的課題が乖離している現状を論じる。AIの普及がもたらす効率化の恩恵が誰に帰属するのかを問い直すエッセイ。
異なるフレームワークで構築されたエージェント同士を接続するGoogle提唱の「A2A(Agent-to-Agent)プロトコル」を解説。MCPとの比較を通じて、標準化の必要性を整理する。
LLMに検索・計算・メモリなど複数のツールを組み合わせ、複雑なタスクを自律的にこなす「AIエージェント」の実装方法を解説します。前回の単一ツール活用からステップアップした実践的な内容です。
Claude Code v2.1.154で導入された「Dynamic Workflows」の解説。プロンプトに「ultracode」と記述するだけで実行可能な、最新の動的ワークフロー機能について紹介します。
LangGraphを用いて、複数のエージェントが協調して高度なRAGを実現するための実践的ハンズオン。複雑な問い合わせへの役割分担や、ステートフルなワークフロー構築手順を解説する。
OpenAIの研究により、AIに正直さや謙虚さ、公平性などの有益な性質を学習させると、訓練外の領域でも望ましい振る舞いが促進され、悪意ある指示への耐性も向上することが判明しました。
Obsidian用のChrome拡張機能「Obsidian Weave」の開発秘話。ウェブ要約をデイリーノートに保存する仕組みの中で直面した「保存先」の課題と、それを通じたツール開発への気づきを綴ります。
調べた記事の履歴管理を解決するChrome拡張「Yasumaro」を紹介。Obsidian Weaveから改名された本ツールは、開発者や研究者が読み漁るドキュメントの検索性と記憶をサポートします。
Claude Opus 4.8で発生している出力品質の低下について考察。Anthropicの公式情報を踏まえ、モデルのnerfの真相やユーザーが感じる一時的な性能変化のメカニズムを解説します。
AIに業務を任せる際のリスクを解説。判断基準や責任境界が曖昧なままAIを導入すると生じる事故シナリオを提示し、人間が制御すべき生産ラインの重要性を説きます。
Claude Codeの消費コストを可視化する「statusline」スクリプトの解説。認証不要でAPIプラン枠や累計コストをリアルタイムで表示し、無駄なAPI消費を防止する方法を紹介します。
AI企業のPoolsideが独自モデル「Laguna M.1」をオープンモデル化。誰でもダウンロード可能になり、Macでローカル実行可能な量子化モデルも提供されています。
AI彼女アプリの開発を通じて、記憶の保存よりも「思い出す」プロセスの難しさに直面した筆者。人間は検索で情報を呼び出すのではなく、会話の文脈や関連性から連想的に記憶を呼び起こしているという事実に着目し、AIの対話における記憶想起メカニズムの構築を考察する。