国内AIニュース
AI初心者が3ヶ月でAIアシスタント「R.E.V.I.S.」をゼロから完成させるまでの開発記録。開発者本人がClaudeにソースコードを渡し、自身の設計や実装プロセスについてインタビューを受ける形式で進む連載企画の導入編。
Claude Codeのプラグイン開発時における挙動差異や設定トラブルを解決するための検証記録。v2.1.146-150を対象に、hooks.jsonやSKILL.mdの挙動を調査し、意図した通りのプラグイン動作を実現する方法を解説。
LLMエージェントがCADなどの状態を持つシステムを操作する際の危険性を解説。テキスト生成と異なり、失敗が環境に永続的な悪影響を及ぼすため、エージェントによる自動操作には細心の注意が必要であることを説く。
研究現場でのAI利用が進む中、AIが虚偽の内容や存在しない参考文献を作成する問題が指摘されています。250万件の生物医学論文を調査した結果、2810件の論文で偽の引用文献が発見されました。
AIエージェントの本番運用で直面する品質低下の課題に対し、Anthropicのエンジニアリングブログを基に設計指針を整理。個別の成功事例を模倣するのではなく、システムの構成と本質的な問題への対処法を提案する。
Huaweiは、微細化に依存せず信号遅延を圧縮しトランジスタ密度を高める新法則「τスケーリング法則」を提唱。秋のKirinチップに回路技術LogicFoldingを適用し、2031年までに1.4nm相当の実現を目指す。
AIエージェント開発における観測性の重要性を解説。複数のLLM呼び出しやサブエージェントが連鎖する複雑な挙動は、従来のログだけでは把握不可能。トレースや評価指標を活用した新たな観測手法の必要性を説く。