国内AIニュース
ローマ教皇庁でのAI関連イベントにAnthropic共同創業者のクリス・オラー氏が登壇。商業的圧力と倫理的視点の板挟みにある現代のAI研究において、外部からの批判の重要性を訴えました。
自律制御ロボットを活用した「AIロボティクスソリューション」を推進するため、共創センターを設立。人型、多脚型、ドローン型など、多様なロボット技術の実用化を目指します。
AIエージェントの自律的な生活習慣とパフォーマンスの関係を分析。体調管理やエネルギー状態をシステムプロンプトに反映させる設計を行い、5日間の観察から得られた知見を共有します。
LLMの安全性確保において、モデルの論理推論のみに依存するリスクを指摘。プロンプトインジェクション等により安全ルールが迂回される現状を分析し、「考える前に止める」制御手法の重要性と実装のあり方を考察します。
AIエージェントのツール定義における設計原則を解説。スキーマ設計、命名規則、パラメータ設計のベストプラクティスに加え、トークン消費を60%削減する手法や大規模ツールセットでの精度維持のコツを網羅した実践ガイド。
Codexに特定の関西弁の指示を与えることで発動する「関西弁インジェクション」について報告。現時点ではセキュリティリスクは低い軽度の汚染と判定されているが、ファイル内の特定のコメント行がトリガーになる事象を解説。
M5 Max搭載MacにおけるローカルLLM推論の性能検証。mactopによるテレメトリ計測を通じ、MoEモデルではGPU性能、Denseモデルではメモリ帯域幅がボトルネックとなることや、発熱の影響を解説するシリーズ最終編。
個人モデルを構築しアンケート回答を自動化するPoC「bunshin」の実装記録。ホールドアウトデータを用いた評価で、単一選択の精度71.4%、MAE1.0などの結果を得た。自由対話と強制選択回答の質的乖離も考察。
ローカルLLM「Gemma4-26B」をエディタ「Continue」と組み合わせて、完全ローカル環境でモダンWeb開発を試みた実践記事。成果物の品質や開発プロセスにおけるローカルAIの有用性を検証する。
Difyを用いて社内問い合わせAIを実装した事例。情シス・人事・経費など5つのナレッジとClaude Sonnet 4.5を組み合わせ、OSSテンプレートとして公開。テスト質問で高スコアを達成した設計を解説。
契約書要約ツールを開発した経験から、単なる要約では解決できない「契約リスクへの不安」という課題を提示。AI Agentに求めるべきは、要約ではなくリスクを特定し対話的に支援する機能であることを考察する。
エンジニアではない方でも理解できるClaude Codeのセットアップガイド。インストール手順から基本的な対話のコツまでを3ステップで解説し、ツール導入の心理的・技術的ハードルを取り除く初心者向け教科書。
AI初心者が3ヶ月でAIアシスタント「R.E.V.I.S.」をゼロから完成させるまでの開発記録。開発者本人がClaudeにソースコードを渡し、自身の設計や実装プロセスについてインタビューを受ける形式で進む連載企画の導入編。