国内AIニュース
ReActエージェントの適用範囲を4つの象限で分類。スクリプト、Algorithmic Search、LLMワークフロー、Autonomous Agentic Loopに分け、AIの性質に応じた設計指針を提示するシリーズの第4弾。
金融や法務など厳密さが求められる領域において、LLMの「それらしい回答」はリスクになる。専門知識や制約条件に基づいたアーキテクチャによる、信頼性の高いAI判断の実装手法を考察する。
AIエージェント導入時の自動化の是非を論じる。失敗した際の影響度に基づき、システム的な「戻し(リカバリ)」が可能な場合と不可能な場合を分類し、安全な自動化設計の基準を提示する。
Codex CLIの設定ファイル「.codex」の管理方法を整理。グローバル設定とプロジェクトごとのローカル設定を分離し、効率的に運用するためのディレクトリ構成と役割分担を解説する。
責任経路工学の構成要素として「Evidence Log」を解説。単なるログ保存を超え、事故後に誰が何を指示し、AIがどう判断したかという「責任経路」を再構成するための記録方法を考察する。
要件からMermaid図を自動生成・管理できるデスクトップアプリ「DiagramBuilder」の紹介。機密情報を守りつつ、手軽に構成図を作成できるツール。
Cursor SDKの概要と活用方法を解説。TypeScriptでCursorのAIエージェントを自作アプリから呼び出す仕組みや、実行モード、閉域化(Self-hosted)の可能性について整理する。
独自定義のポリシーに基づきリポジトリを監査(チェック)するCLIツール「code-epunkine」を紹介。npmでインストールし、inspectorエージェントを通じてリポジトリを自動検査する手法を解説する。
VLM(Vision Language Model)でOCRを構築する際の「座標の幻覚」問題について解説。実用化に向けた課題と、モデルが返す座標の信頼性問題を検証。