国内AIニュース
ディープシークやアリババといった中国企業が、高性能なAIモデルを無償で公開しています。この戦略は米国の競合他社を価格面で圧倒し、開発者コミュニティやAI主権を重視する国々から強い支持を集めています。
複数のAIサービスを併用する際の「利用制限確認」の手間を解消するツール「aimo」が公開されました。ブラウザ拡張機能またはローカル環境で4つのAIプロバイダの使用状況を1画面で一覧できるダッシュボードです。
Claude Codeのようなエージェント基盤(harness)をPythonでゼロから構築する方法を解説する技術書。blocking APIからTool Use、パーミッション管理まで、エージェントシステムの仕組みを深く理解するための8章構成です。
AIエージェントの基盤構築をステップアップさせる実践編。Streaming処理やメモリ管理、MCP、Reflectionなどの高度な機能を実装し、Claude Codeと同等の実用的なエージェントへ進化させるプロセスを7章で解説します。
「Harness Engineering」という概念を言語化し、Pythonによる実装過程を通じてその本質を考察した記事。既存のエージェントツールの裏側にある設計思想を、先行文献と自作の経験を交えて体系的に整理しています。
AIとの対話ログを公開することで、人間がAIへどう指示を出し、AIがどうプロジェクトを遂行するかの思考プロセスを可視化した記録。過去のツールをAIの助けを借りてWebアプリへ変換する際の実録です。
AI利用時間の統計分析の結果、Claudeが自律実行する「サブエージェント」の時間が、人間の手動操作時間を大きく上回っていたことが判明。AIエージェントの自律稼働が開発作業に占める割合と重要性を浮き彫りにした検証記録。
AIのコードレビューにおける「指摘の質」への不満を解決するため、複数の専門エージェントを組み合わせたレビュー仕組みを紹介。多角的な観点でのチェックと、防御的設計を組み合わせた効率的なコードレビュー手法を提案します。
RAGやドキュメント処理におけるPDF解析の難しさを解説。PDFは描画命令の集合体であり意味構造を持たないため、LLMが理解可能なドキュメントへと再構築する前処理レイヤー(PDF4LLMなど)の重要性と実装の要点を論じる。
AIが生成する決済注文ステータス更新APIの実装例を用い、表面上は正しく見えてもビジネスロジックに致命的な欠陥が潜んでいる危険性について解説します。
GitHub Copilotの無料版(月50回制限)を有効活用するための実践記録。Space機能を用いてコンテキストを保持し、効率的に小ツールを開発するコツを紹介。
Claude Codeのトークン消費を抑え、効率的に開発を進めるための習慣を解説する3回シリーズの第1回。長時間のセッションで発生する無駄なトークン消費を防ぐための基本原則を伝授。
プロ写真家のニッキー・ベイ氏が、自身の撮影した昆虫写真がAIで無断改変され、著作権を回避して再投稿される実態を告発しました。生成AIによるクリエイターの権利侵害が深刻な問題となっています。
GitHub Copilot Agent Modeを用いた開発運用体験記。AI相棒の役割は単なるコード生成ではなく、運用プロセスにおける判断や監視こそが重要であると説く。
AIエージェントの運用において、安全に停止可能な構造と責務の分離が重要であると説く。開発時に意識すべき「止める設計」の重要性と意思決定の仕組みを解説。
プログラミング不要で、QA・テストエンジニアが明日から現場で使える生成AI活用術を9章構成で解説。テストケース作成からバグレポート効率化までを網羅。
中小企業のM&AをAIで効率化するプラットフォーム「M&A Portal」が登場。AIによる財務分析と専門家によるアドバイスを組み合わせたハイブリッド型サービスで、企業の事業承継をサポートします。
AIが生成するコードの「論理汚染(Logic Hallucination)」を検証。構文は正しくてもビジネスロジックが破綻するリスクと、その対策について警鐘を鳴らす。
AIの強みと人間の役割を整理する考察記事。AIは「叩き台」として活用し、人間が担うべき責任や判断の領域を明確にすることで、共存の可能性を探る。
Claude Codeの公式機能と自作の記憶システムの比較検証。個人のワークフローにおいては、目的に応じて自作システムが勝るケースもあるという実践的な知見を共有。