コーディングエージェントの精度を補強するskill集「Quaere」の検証記録。Terminal-Benchを用い、エージェントがskillファイルを実際にどのように読み込んでいるかをログ解析。長大なコードの読み込み実態と挙動を明らかにする。
Codex が SKILL.md を 220 行で打ち切っていた話
編集メモ: AIエージェントによる長大なドキュメントやコードの読み込みには構造的な制限があるため、意図通りに機能させるには情報の分割やログ監視の工夫が求められる。