国内AIニュース
自作RAGの品質・コスト・ハルシネーションを評価ハーネスで測定した記録。ライブラリで簡単に動かせるRAGに対し、定量的な品質管理を行うための測定手法、コスト抑制の視点、および測定の限界についてまとめた実用ガイド。
LLM/RAGプロジェクトが本番環境で使われずに終わる原因を分析。「動くもの」から「使われるもの」へ昇華させるための設計チェックリストを提示し、精度以前に定義すべき責任範囲や設計の境界線を解説します。
「機能を作ること自体が負債になる」という視点から、開発の考え方を深掘り。使われない機能が認知負荷や保守コストの増大を招く理由を解説し、本当に価値のある開発とは何かを検討します。
QAエンジニアによる、大規模な仕様書(数千行以上)を生成AIに読み込ませる際の入力設計手法の解説。情報を増やすとモデルの出力が「質」ではなく「量」でどう変化するか、実測データに基づき論じます。
AnthropicのPrompt Cachingでコスト・レイテンシが跳ね上がる問題に対し、新機能「cache diagnostics」を活用した原因特定方法を解説。従来の勘に頼るデバッグからの脱却を目指す。
バックエンドエンジニアを目指す人向けに、RDBとSQLの基礎を解説。CRUD操作、JOIN、テーブル設計、インデックス、トランザクションといった、データベースを扱う上で必須の知識を網羅的に習得できます。
思考拡張やAI駆動開発、Markdown文化など、一見バラバラに見える概念が「不可視対象の可視化」という一つの方向に収束しているという考察。個人の研究成果を通じて、技術文化の本質を探ります。
AIツールディレクトリ運営者の経験から、自動クローリングによる「全部載せ」カタログサイトの弊害を解説。利用者に選別の負荷を与えない、質の高いキュレーション基準の作り方を伝授します。
2026年6月公開の「Claude Fable 5」の実務上の位置づけを解説。API統合時に決定すべきデータ保持やフォールバック設定、AWS/Bedrock環境ごとの仕様の違いを公式資料に基づき整理します。
Moodle 4.5とOpenAIのAPI連携ではデータ外部送信が課題となります。本記事では、機密情報を含むデータを外部に出さず、APIコストもゼロで運用可能な「ローカルLLM」によるMoodle構築手法を紹介します。
問い合わせ対応の初動をLLMとn8nで自動化する仕組みを紹介。要約や分類、返信案作成をAIで支援しつつ、最終的な判断と送信は人間が行うことで、業務効率化と品質維持を両立する設計手法を公開。
PostgreSQLでベクトルデータを保存・検索可能にするpgvectorの構築手順を紹介。OSの設定から依存パッケージのインストールまで、RAG構築に必要な環境構築の基礎を解説。
AIエージェントの本番運用において、人間が介在して止めて改善する「Loop Engineering」の重要性を解説。Prompt/Context/Harness Engineeringとの違いを明確にし、iOSアプリ開発で判明した5つの失敗パターンや、ANDON、Blind Gate、Meta-ANDON、Kaizen Learning Captureといった運用の仕組みを紹介する。