《酉阳杂俎》服饰提取日志

处理时间:2025年
输入文件:/home/z/my-project/upload/part4/酉阳杂俎.txt
输出目录:/home/z/my-project/upload/4笔记output/酉阳杂俎/
词库:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md


一、文件基本信息

项目
文件大小 406,022 字节
总行数 1,213 行
编码 UTF-8(含BOM)
结构 正集20卷 + 续集10卷,共30卷
章节 以"●卷X"标记分段

二、提取流程

第1轮:核心服饰词全搜

执行命令: bash rg -n '衣' ... # 分批搜索 rg -n '冠|冕|袍|裘|巾|帻|履|舄|笏|绶' rg -n '幞头|裙|衫|袄|褐|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎' rg -n '丝|毡|帽|靴|鞋|袜|披|氅|褂|袖|袂|裾|襟|衽|裆|裤|襦|襕' rg -n '簪|钗|钏|珮|璎珞|霞帔|鱼袋|鞍|鞯|辔|卤簿|仪仗|弁|胄|缨|步摇|花钿|蔽膝|屦|屐|蹀躞|缂丝|黼|黻|翟衣|袆衣|深衣'

第1轮命中行数统计: | 关键词组 | 命中行数 | |---------|---------| | 衣 | 122 | | 冕袍裘巾帻履舄笏绶 | 64 | | 幞头裙衫袄褐绅纨绮绫罗锦绣帛绢绸缎 | 116 | | 丝毡帽靴鞋袜披氅褂袖袂裾襟衽裆裤襦襕 | 67 | | 簪钗钏珮璎珞霞帔鱼袋鞍鞯辔卤簿仪仗弁胄缨步摇花钿蔽膝屦屐蹀躞缂丝黼黻翟衣袆衣深衣 | 46 |

第2轮:制度动作词

执行命令: bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'

第2轮命中行数:1行(赐绯/赐鱼相关,已纳入第1轮结果)

第3轮:组合扩展词

根据前两轮结果,补充搜索: - 面衣、魂衣、明衣(丧服扩展词)——命中4条 - 僧衣、俗衣(宗教服饰扩展词)——命中2条 - 天衣(佛教服饰扩展词)——命中2条

合并去重

所有命中行合并去重后:303行


三、排除审查

按照词库第四条"排除规则表",对303行命中逐一审查:

排除类别 具体条目 排除行数
"麻"="麻灰"(建筑材料) L210 1
"罗"="罗网捕鸟" L159 1
"丝"="丝竹"(乐器) L225 1
"丝"="丝绳"(器物用绳) L933 1
"环"="环绕义" L213 1
"衣"="衣食"(泛指生计) L157, L204 2
"衣"="衣箱/衣篮"(容器) L496, L541 2
"冠"="冠玉"(比喻) L43 1
"带"="带领/地带" 多处 3
"佩"非首饰义 0
"纹"非纹样义 多处 5
佛教地狱/天界纯宗教描写(无服饰细节) L94, L98, L100, L101, L103, L106 6
星宿/地理类无服饰信息 L107 1
食物/药物类仅偶涉"衣"字 L236, L244 2
动植类无服饰信息 多处 约20
其他纯叙事无服饰焦点 约130条 约130

排除总计:约238行
有效服饰信息:65条


四、提取结果统计

输出文件 内容 条目数
酉阳杂俎_原文提取.md 按卷次排列的原文段落 65条
酉阳杂俎_总结.md 分类统计、核心发现、学术审查 -
酉阳杂俎_日志.md 本文件,处理流程记录 -

五、质量评估

5.1 提取完整性

5.2 排除准确性

5.3 学术审查


六、备注