国内AIニュース
AIへの修正依頼において、依頼末尾に「完了条件(Done Criteria)」を3行加えるだけで差し戻し率を劇的に改善した実体験を解説。何を作るかではなく、何ができればOKかを定義する重要性を説く。
AIコーディングエージェントの利用で直面する「記憶の分断」と「コスト管理」の問題を解説。ツールごとの作業ログ散逸をどう整理し、継続的な開発効率を維持すべきかという課題に焦点を当てます。
Claude Codeのセッション維持問題を解決する4層構造の記憶設計を提案。知識の鮮度と用途に応じて情報を管理し、今日から真似できる最小構成の運用方法までを具体的に解説します。
Webサイト制作や運用における小さな手作業を効率化する方法を解説。htaccessやリダイレクト設定など、頻出する地味な作業を整理し、時間を短縮するための工夫やツール活用の重要性を伝えます。
図書館の貸出履歴が残らない問題に対し、自動で記録を残すための解決策を模索する記事。プライバシーと利便性の間で、いかにして読書記録を維持し、個人のナレッジを蓄積するかを考察します。
2026年6月9日発表のClaude Fable 5 / Mythos 5を踏まえ、高性能LLM運用の要点を解説。モデル選定よりも、ログ保持期間、入力データのフィルタリング、アクセス権限管理など、運用設計の重要性が高まっています。
APIベースのLLMの出力品質を定量的に評価するための軽量ライブラリを紹介します。既存の評価ツールが研究用途で複雑な中、LLMアプリケーション開発者が手軽にプロンプトの改善効果を確認できる仕組みを提供します。
Gemini CLIが「inbox3」コマンドを処理できない問題を起点に、マルチエージェント開発環境における問題の発見から解決までを記録。Claude Codeを複数運用する構成でのトラブルシューティングを詳解します。
2D間取り図から3Dモデルを作成する「Floor Plan Maker」の実験レポート。レンダリング画像ではなく、ゲーム開発やWeb3Dで実際に利用可能なGLB形式の3Dデータ生成を目指した試み。
2026年のエージェント評価に向けた「軌跡評価器(eval-sanity v0.3)」の紹介。依存ゼロ・決定的な動作を実現し、エージェントの挙動を厳密にチェックするためのツール。
OpenAIによるOna(旧Gitpod)買収のニュース解説。ブラウザベースの開発環境サービスがOpenAIのCodexチームへ統合される影響や、その背景にある「開発環境」の重要性について言及。
Claude Codeの日本語対話において一人称が「私」から「僕」へ変化する現象の分析。日本語固有の観測結果から、モデルが砕けた表現を使う際の条件や文脈を紐解く。