llama.cppで利用されるファイルフォーマット「GGUF」の内部構造を解説。GGUFは単一ファイルで完結する利点がある一方、その中身については不明点も多い。オンデバイス推論エンジン「NobodyWho」開発チームが、モデル実行に必要な情報がどのように格納されているかを明らかにしている。