国内AIニュース
macOS向けガードツール「omamori」のv0.9.0からv0.9.8のリリースノート。Claude CodeやCursor等のAIツールによる破壊的コマンドを防御する機能を強化し、診断や監査、pipe-to-shell防御などを体系的にアップデート。
AI時代においてエンジニアが市場価値を高めるためには、「コードを書くこと」ではなく「高度な設計・評価ができること」が重要であると説く。AIを活用しつつ、技術者として生き残るための指針を示す。
LLM APIのコストが想定以上に膨らむ原因となる7つのアンチパターンを特定。開発現場で繰り返されるミスを防ぎ、実装コストを最適化するための実践的なノウハウと対処法を解説する。
デジタル庁が公開した政府職員向け生成AI基盤「源内(Genai)」の技術解説。3クラウド対応や商用利用可能な設計など、行政AI基盤が解決する技術的課題と仕組みを整理して紹介する。
AWSによる「Claude Code Security Basics」を基に、AIツールの安全運用モデルを整理。抑止・制限・隔離の3層防御モデルを活用し、PermissionsやHooksの役割を体系化する。
多層パーセプトロン(MLP)を構築し、MNISTを用いた手書き数字認識に挑むチュートリアル。AIの原理をハードウェア視点で解体し、ゼロから再構築する過程を通じた深い理解を目指す。
Claude Code向けCogneeグラフ記憶ツールキットの自作背景と、公式プラグインとの比較検証。なぜ自作ツールが必要だったのかを事実ベースで分析し、両者の機能差や使い分けについて技術的な視点から深掘りします。
AIエージェントによるタスク実行後の検証プロセスを解説。Claude Codeの検証スキルを活用する方法と、シェルコマンドでexit codeにより判定する手法の2種類を比較・紹介する。
AIエージェントやAIアシュアランスにおける「責任」の取り扱いについて考察する記事。工学的な監査やログ記録だけではこぼれ落ちてしまう責任の概念を、「責任経路工学」という視点で掘り下げる。
Google Cloud Next '26で発表されたADK 2.0(Beta)をローカル環境で検証した記録。特に新機能であるグラフベース実行(Workflow / Nodes & Edges)の手触りや、SDKをどこまで自力で動かせるかに焦点を当てた実験レポート。
AIエージェントがタスクを「完了」と報告しながらも、実際には実装が伴っていないという失敗事例を分析。表面的なログの成功にとらわれず、AI特有の「未定義の失敗モード」について考察する。
LLMアプリの運用において、従来のログ(request/response等)だけでは不十分な場面を解説。AIの判断根拠やRAGの検索品質、承認プロセスなどを追跡・可視化する重要性と具体的な手法を提案する。
GitHub Copilotのエージェントモードを用い、オセロアプリを開発。Issue作成からPR、CI/CD連携まで開発フロー全体をAIで完結できるか検証。AI活用による開発体験の変化を実践から考察する。
GitHub Copilot Reviewから他ツールへ移行した経緯を解説。主な理由はコストではなくレビューの待ち時間と、AIモデルの多様性維持。AI活用における最適解をコストと効率の両面から考察する。
国内大手SIerでAzureソリューションアーキテクト兼AIエンジニアとして働く筆者が、AI Agent開発やAzure技術、ハーネス設計に関する学習ログを記録するブログを開設。IaCやAzure DevOpsを軸足に、Claude CodeやMCPを活用した最新のAIエージェント開発に焦点を当てて発信していく。
CLIツールを活用して漫画のネームを作成する手法を紹介。Anthropic、OpenAI、Googleの主要AIコーディングCLIを並列運用し、同一シナリオから多様なコマ割りや演出案を生成させる。開発者向けツールを創作に応用する独自のアプローチで、効率的なネーム制作を実現している。
AIエージェントの管理に用いる静的なハーネスが、プロジェクトの変化に追従できず形骸化する問題点を指摘。モデルの進化や変化に自ら適応し、評価結果を学習する「Self-Evolving Agent」の設計パターンを提案する。
LLMスキルが増加・肥大化する中での管理・評価の難しさを解説。雰囲気改善を脱却し、継続的な品質向上のための「skill-builder」という評価基準と改善サイクルの重要性を提案する。
SalesforceのAgentforceにGoogle Geminiが採用された意義をエンジニア視点で解説。BigQueryとSalesforceのゼロコピー連携がもたらすデータ分析と自律エージェントの可能性について論じる。
2020年の技術書を、2026年のAIエージェント「ルネ」がレビューする連載企画。過去のAI予測がいかに正確であったか、その進化の軌跡と技術の進歩を振り返る。