国内AIニュース
RubyKaigi 2026で発表された「Rubydex」の検証記事。CursorのAgentから活用できるこのツールを、Railsモノリス環境でテストし、トークン削減の効果や使い勝手を評価する。
Claude Codeを用いたマルチエージェントシステムの設計ガイド。マルチエージェントが必要な条件と、10日間の運用に基づいた設計の考え方を解説します。
企業内でAIエージェントを安全に運用するための検証レポート。Claude CodeやCursorなど、様々なAIツールの活用現場での知見を共有します。
生成AIが高度な数学を解けるのに、単純な曜日計算を間違える理由について考察。人間の認知とAIのトークン処理プロセスの類似性に着目し、なぜAIが文脈の中で簡単なミスを犯すのかを解説する。
RAGの精度が出ない原因はデータの「入れ方」にあると指摘。Anthropicの設計思想「progressive disclosure」を用いたナレッジベース構築手法を解説します。
Node.jsや外部データベース、サーバーを一切使わず、ブラウザのIndexedDBのみで動作する「簡易ベクトル検索」の実装方法を解説します。RAGの仕組みを理解したい方に向けて、ブラウザだけで動くベクトル検索のデモを作成し、その仕組みをシンプルに紐解きます。
イースト・ロンドン大学の研究チームが、AmazonやYelpでの偽レビューを90%以上の精度で検出するAIモデルを開発しました。ボットやAIによる虚偽投稿を特定し、信頼性の高い購買判断を支援します。
Claude Codeを用いたマルチAIエージェント体制の実運用における知見。チーム構成における4つの完遂作法を軸に、運用上のトラブルや成功体験をW1の視点で再構成して解説する。
外国語の発音を忠実なカタカナに変換するWebアプリ「Katakanizer」を紹介。英文を入力すると、AIが「翻訳」ではなく「音」を重視し、カジュアルとフォーマルの2種類のカタカナ表現を提示してくれます。
CursorのComposer 2.5において、推論コストが従来の1/10に削減された点に注目。SWE-Bench Multilingualでの性能を維持しつつ、リトライ回数を繰り返すコード修正ループにおいて、コスト効率が劇的に改善されたメカニズムを考察します。
「テスト=仕様書」という考え方を軸に、LLM駆動開発におけるリグレッションテストの重要性を説く記事。ドキュメント化が困難な仕様を、実装と同期する「生きているテスト」としてコード化し、Claude Codeでの構築例を示します。
AtCoderの過去問2818問をGPT-5.5で解析し、問題を解くための「考察態度」を16章112規範に体系化したリソースを紹介。アルゴリズム名ではなく、思考のプロセス(手筋)を抽出した独自データベースです。
Google I/O 2026でのGemini 3.5 Flash発表や、OpenAIの8,520億ドル資金調達など、AI業界の最新動向を総括。PoCから本実装へ移行する市場の転換点と、政府AIの本格稼働について解説します。
2026年5月のフロンティアAIモデル更新に伴い、Claude Opus 4.7、GPT-5.5 Instant、Gemini 3.5 Flashの3モデルを比較。各モデルのAPI実装サンプルと、タスクごとの品質・価格・特性を整理します。
Cloudflareが発表した新しいCLI「cf」と、ブラウザからローカル開発環境(KV/R2/D1等)を確認できる「Local Explorer」を紹介。現時点でのWranglerとの位置づけや技術プレビューの内容を整理します。
Claudeを活用してthree.jsやGitHubに初挑戦し、Webアプリを開発する個人の連載日誌。最新AIの進化速度に触れながら、開発の試行錯誤とAIとの付き合い方を実体験ベースで綴ったエッセイ形式の記事です。
Claude Opus 4.7の強化点を解説。SWE-bench Verifiedで87.6%を記録し、コード修正能力の境界を引き上げた性能向上と、コーディング・ビジョン・エージェント機能の強化、新機能xhighについて整理します。
1人で10部門のAIエージェントを運用する経営者が、自動化における失敗の教訓を解説。特にAIのアウトプットをそのまま対外的に発信する際の敬語や内容の崩れといったリスクと、安全な運用のためのヒントを共有する。
RAGシステムにおける「Retrieverの検索スコア」と「LLMの回答精度」の不一致という課題を解説。検索器は類似度を最大化するが、最終目的はLLMの良質な回答であるという「目的関数の不一致」を指摘し、RAG構築における本質的な問題に切り込みます。
AWS AIプラクティショナー試験の対策記事。試験合格に向けて点数を稼ぐために重要だと感じたポイントを、インプット済みの方や問題集で伸び悩んでいる人向けに解説する2回シリーズの1本目。