自律型AIエージェントの性能を客観的に評価する重要性が高まっています。「Kojumi Beta1」は、エージェントがタスクを完了できるかをブラックボックス形式で評価する市場プラットフォームです。AIの自律化が進む中、実効性のあるAIを選別する仕組みについて考察します。