OpenAIは6月30日、計算生物学分野におけるAIの推論能力と判断力を評価するための新たなベンチマークテスト「GeneBench-Pro」を発表した。
OpenAI、科学研究でのAIの判断力を評価する新ベンチ
編集メモ: 科学研究分野でのAI判断力を評価するベンチマークの登場は、専門領域においてAIが単なる補助から推論・意思決定のパートナーへ進化し、実用レベルの信頼性が問われ始めていることを示しています。
OpenAIは6月30日、計算生物学分野におけるAIの推論能力と判断力を評価するための新たなベンチマークテスト「GeneBench-Pro」を発表した。