国内AIニュース

Zenn AI 上級 2026年05月07日約1分

AIに施策の効果測定を依頼する際、AIの出力が因果効果を意味するとは限りません。AIに分析をさせる前に定義すべき「介入」「対象」「比較対象」「結果」「割付」の5項目について解説。AIをビジネス施策の分析に活用するための論理的アプローチを整理します。

飼い主の感情に反応する犬のような感情知能ロボット「Familiar」をルンバの生みの親でiRobotの創業者でもあるコリン・アングルが発表

GIGAZINE 中級 2026年05月07日約1分

ルンバ創業者が共同設立した新企業FM＆Mが、初のAIロボット「Familiar」を発表しました。家庭向けロボットにどのようなAI技術が融合されているのか期待が高まっています。

オープンワールドRPG「NTE」、一部で「AI使用」と明かす　ゲーム自体は「人間の創造性に基づく」

ITmedia AI+ 中級 2026年05月07日約1分

中国の開発スタジオHotta Studioが、新作RPG「NTE」でAIを使用していることを公表しました。SNSでの指摘を受けたもので、AI活用による開発手法が注目されています。

「魔法世界は運用で回る」という異世界転生小説を書いている

Zenn AI 入門 2026年05月07日約1分

異世界転生小説の執筆を通じ、「運用で回る魔法世界」という題材からAI活用の視点を考察。既存の異世界ものとの比較や、物語設定におけるタイトルの重要性に触れながら、創作活動におけるAIや情報工学的なアプローチの面白さを探るエッセイ。

【MultiRoleChat】8つのLLMに同じ問題を同時に解かせたら、正確さより速さの差が面白かった

Zenn AI 中級 2026年05月07日約1分

8つの異なるLLMに対し、同一条件で20問の並列クイズテストを実施。精度と応答速度を検証した結果、正解率は総じて高いものの、速度面では意外なモデルの逆転現象が発生。モデル選択の判断材料として、並列実行環境の作り方と実験結果をレポートします。

pay.sh — AIエージェントが自分でAPIを買う時代が来た（Solana Foundation × Google Cloud）

Zenn AI 上級 2026年05月07日約1分

AIエージェントが自律的に支払いを完結させる「pay.sh」の解説。SolanaとGoogle Cloudの連携により実現したAI向け課金インフラの概要を説明し、導入からAPIを通じた実際の課金までの手順をシェアします。

Claude Code Computer Useの設計判断 — 4段階フォールバックと5つの落とし穴

Zenn AI 上級 2026年05月07日約1分

Claude Codeの「Computer Use」機能は強力ですが、コストとリスクの管理が不可欠です。フォールバック階層・権限ティア・コストモデルの3軸で判断基準を整理。「最後の手段」として賢く利用するための設計指針を解説します。

Claude Code Auto Modeの設計判断 — AI分類器に何を委ね、何を委ねないか

Zenn AI 上級 2026年05月07日約1分

Claude Codeの「Auto Mode」が導入する新しい信頼モデル「AI分類器」について解説。従来の権限管理との違いや、なぜAnthropicがこの設計を採用したのかというトレードオフを深掘りします。AI自動実行への不安を解消する設計思想に迫ります。

Cursor上でClaude Codeを回す「完全自動化」は本当に最適解か？— エージェント駆動開発の現在地

Zenn AI 中級 2026年05月07日約1分

CursorとClaude Codeを組み合わせた「エージェント駆動開発」の妥当性を検証。それぞれの役割の違いと、実務レベルで人間が介入しない開発フローを実現するための設計指針をまとめました。2026年のトレンドを先取りする開発手法の現実を探ります。

C-3PO、一体化する ── parallel-orchestra を C3 に同梱した

Zenn AI 上級 2026年05月07日約1分

Claude Codeの設計思想に基づくCLIツール「C3」のv0.5.0からv0.6.4までの進化を解説。前回記事からの機能改善や変更点に焦点を当て、自動化プロセスにおける最新の技術的なアップデートを網羅的に紹介します。

AIエージェントを「行儀」ではなく「物理」で縛る — AOS v0.1 という最小仕様の試み

Zenn AI 中級 2026年05月07日約1分

LLMエージェント運用において、自然言語ルールのみでは限界がある問題を提示。リポジトリ管理における130KB超の規律ファイルの実態を明かし、sed -iの禁止など、開発現場で直面する具体的な運用課題と技術的解決策を考察します。

ギター特化SNS「RiffLog」をNext.js + Supabase + AIで作る構成

Zenn AI 入門 2026年05月07日約1分

ギターSNS「RiffLog」の個人開発事例を紹介。Next.jsとSupabaseを選択した理由や、フロントエンド主導での迅速な開発体制について解説します。フルスタックフレームワークを使わず、スピードを優先した技術選定の経緯をまとめました。

M365 Copilotの定着に万全なサポートは逆効果？　社内利用率95％の企業が実践する5つの鉄則

ITmedia AI+ 中級 2026年05月07日約1分

Claude Codeの利用制限に焦りを感じた筆者が、独自の計測により5時間の制限枠がどの程度のトークン量やAPI料金に相当するかを算出しました。検証結果、今回の条件では約644万トークン相当であることが判明。記事執筆直後に大幅なレート制限緩和が発表されましたが、AI開発ツールのコストや制限を把握するための有用な分析事例となっています。

OpenAI o1は電子カルテと看護師からのわずか数文の情報だけで従来モデルと人間の医師の両方を大きく上回る正確な診断ができたという研究結果

GIGAZINE 上級 2026年05月07日約1分

ハーバード大等の研究で、AIモデル「OpenAI o1」が人間の医師と同等以上の診断能力を示すことが判明。特にトリアージ段階での高い精度が確認され、医療AIの進化が注目されている。

DeepSeek-V4が出た——100万トークンが「標準装備」になる時代の話

Zenn LLM 中級 2026年05月07日約1分

2026年4月に公開されたオープンソースモデル「DeepSeek-V4」を解説。100万トークンのコンテキストウィンドウがもたらすインパクトと、Pro/Flashモデルの性能をベンチマークに基づき検証。OSS活用が現実的となった現在のAIトレンドを考察します。

AIワークフローのテストケースを作る：golden case / regression / incident replay

Zenn LLM 上級 2026年05月07日約1分

LLMアプリケーションのテストにおける課題を整理。従来の関数テストとは異なり、自然言語の不確定性がある中での品質保証について論じます。Hallucinationの抑制や、期待値評価のための現実的なテスト手法とワークフローの考え方を提案します。

商品選びから決済までをAIでお助け──MUFGがGoogleとタッグで実現目指す　Google Cloud上にインフラ構築

ITmedia AI+ 入門 2026年05月07日約1分

MUFGとGoogleが提携し、Google Cloud上でAIによる商品選びから決済までを支援する次世代インフラを構築。AIが購買体験を刷新する未来のサービス実現を目指す。

Aurora Mobile、Azuki Partnersと提携：「AI＋オムニチャネル」で不動産業界の人手不足を解決

ASCII.jp 入門 2026年05月07日約1分

Aurora MobileとAzuki Partnersが提携。「AI×オムニチャネル」技術を活用し、深刻な人手不足が続く不動産業界の課題解決に向けた取り組みを開始。

AIに「これ買っておいて」で決済から家計簿記録まで完結　MUFGがGoogleとの提携で目指す自律型金融サービス

ITmedia AI+ 入門 2026年05月07日約1分

MUFGとGoogleが協力し、AIエージェントが買い物・決済・家計可視化までを自動化するサービスの開発を発表。AIエージェント時代を見据えた革新的な購買体験の基盤作りが進む。

デザイナーである前に、作りたかった人へ。

Zenn AI 中級 2026年05月07日約1分