GUIエージェントやPhysical AIなどの視覚情報が主体のエージェントにおける記憶の仕組みを考察。従来のRAG手法では不十分なケースに対し、連続的な視覚入力をどう保存・検索するかを議論する。