《豪谱》服饰提取——处理日志

处理日期:2026-03-04
操作员:子Agent(rysxguji技能)
输入文件:/home/z/my-project/upload/part4/豪谱.txt
输出目录:/home/z/my-project/upload/4笔记output/豪谱/
词库版本:fushi-keywords.md(rysxguji技能内置)


一、文件基本信息

项目 数值
文件名 豪谱.txt
行数 188行
字节数 32,815字节(约32KB)
朝代
作者 渤海高承勋松三辑
体裁 笔记体人物类书
分目 24类(义豪→奢豪)

判断:文件小于500KB,但仍按规范使用grep定位+分段读取,未一次性加载全文。


二、执行步骤记录

第1轮:核心服饰词全搜

命令bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' INPUT_FILE

结果:命中30行

行号 命中关键词 初步判断
5 朝服 ✅保留
11 布衣 ✅保留
13 饮食 ❌排除(饮食非服饰)
14 裳(褰裳) ✅保留
20 佩(佩刀) ✅保留
26 衣(单衣)、履(草履) ✅保留
50 衣(脱衣)、裈(裈衣) ✅保留
51 衣(脱衣) ✅保留
52 羊肉 ❌排除(食物误判)
54 相识 ❌排除(无关误判)
55 系(车辕) ❌排除(动词非服饰)
56 帽(脱帽) ✅保留
68 罗(罗巾) ✅保留
70 服(变服)、帽(布帽) ✅保留
72 帛(金帛) ⚠️边缘保留
73 衣(儒衣)、帽(僧帽)、鞋(道人鞋)、鞍 ✅保留
76 帛、绢、衣、裈、服 ✅保留(信息密集)
77 袴(袴褶) ✅保留
78 帛(金帛) ⚠️边缘保留
79 服(丽服)、衣(新衣/故衣) ✅保留
90 带(双带)、衣(舞衣) ✅保留
91 锦、绣、组(綦组) ✅保留
94 帛(金帛)、织(心织) 帛⚠️/织❌
96 簟、扇 ❌排除(日用非服饰)
103 衣食 ❌排除(泛指生活)
104 丝(牵丝) ❌排除(入仕代称)
105 衣裳、衣(净衣) ✅保留
108 衣(衣帛)、帛 ✅保留
109 袍(袍袖) ✅保留
110 袍(袍袖) ✅保留
121 领(领巾)、衣(衣袖) ✅保留
124 奢华艳曳、团扇、双鬟 团扇❌/鬟✅/艳曳✅
129 仆射 ❌排除(官名)
131 冠(弱冠) ❌排除(年龄代称)
139 巾(鹿皮巾) ✅保留
145 裘褐、衣、绮缟、椎髻、布衣 ✅保留(信息密集)
149 衣(褫其衣) ✅保留
150 衣服 ✅保留
151 袖(袖剑) ✅保留
152 裾(捉裾) ✅保留
162 丝(素丝) ⚠️边缘保留(比喻)
165 绢、缣 ✅保留
168 裘、袍 ✅保留
178 衣(敝衣)、屦(芒屦) ✅保留
181 衣(衣白)、首饰、领(衣领)、服(易服) ✅保留
185 丝竹 ❌排除(乐器非丝织品)

第2轮:制度动作词搜索

命令bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' INPUT_FILE

结果:0行命中

注:"赐鹿皮巾"(第139行)虽属赐服制度,但"赐"与"服"未连用,故第2轮未命中。已在第1轮通过"巾"命中。

第3轮:组合扩展词搜索

命令bash rg -n '品色|赐鱼袋|佩鱼|金银鱼袋|大裘|衮冕|鷩冕|毳冕|絺冕|玄冕|软脚|硬脚|展角|交角|乌纱|蟒衣|飞鱼服|斗牛服|麒麟服|蚕|桑|茧|缫|织|纺|绸|缂丝|折帛|和买|市舶|绢价|匹帛' INPUT_FILE

结果:3行命中,全部为误判

行号 命中词 误判原因
56 桑(桑民怿) 人名用字,非蚕桑
94 织(心织舌耕) 比喻用法,非纺织
141 桑(桑苎翁) 自号,非蚕桑

补充搜索:发饰首饰词

命令bash rg -n '笄|簪|钗|钿|珰|貂|髻|步摇|花钿' INPUT_FILE

结果:5行命中

行号 命中词 判断
57 髻(双丫髻) ✅保留
83 貂、珰(貂珰) ✅保留(宦官冠饰)
122 珰(尤珰) ❌排除(宦官代称,非描述冠饰)
145 髻(椎髻) ✅保留(已在第1轮命中)
161 笄(始笄) ✅保留

三、对抗式学术审查

3.1 误判排除清单

行号 关键词 误判场景 排除理由
13 饮食 "不饮食"=不吃饭 非服饰
52 羊肉 "白羊肉"=食物 非服饰
54 相识 "相识已多"=认识 非服饰
55 "系于车辕"=绑扎 动词义,非腰带
94 "心织舌耕"=比喻 非纺织语境
103 衣食 "衣食"合称=生活 泛指,无具体服饰信息
104 "牵丝入仕"=入官 丝=官印丝带代称,非丝织品描述
122 "尤珰"=宦官名 宦官代称,非描述冠饰实物
129 仆射 "仆射"=官名 非服饰词(射≠服饰)
131 "弱冠"=二十岁 年龄代称,非首服
185 丝竹 "丝竹"=音乐 乐器总称,非丝织品

3.2 遗漏补充清单

行号 补充词 遗漏原因 补充理由
57 双丫髻、插花、胡粉 "髻"不在核心词表 双丫髻=少女发饰,插花=头饰,胡粉=化妆
83 貂珰 "珰"被误判为宦官代称 此处"貂珰"确指宦官冠饰制度(貂尾+金珰)
154 梳头、结发 未在词库中 发饰行为,涉及头梳与发髻
161 始笄 "笄礼"搜索未匹配"始笄" 笄=发饰,始笄=及笄之年
37 三日新妇 "新妇"不在词库 "闭置车中如三日新妇"暗含婚服语境

3.3 边缘案例裁定

行号 内容 裁定 理由
72 金帛(燔金帛不可胜数) ⚠️边缘保留 帛=丝织品类财物,但非服饰描述
78 金帛(一船金帛) ⚠️边缘保留 同上
94 金帛(金帛丰积) ⚠️边缘保留 同上
96 白团扇 ❌排除 日用风物,非服饰本体
162 素丝(素丝之质) ⚠️边缘保留 比喻用法,但涉丝帛材质认知

四、输出文件清单

文件名 内容 大小
豪谱_服饰总结.md 服饰内容分类总结与分析
豪谱_处理日志.md 本文件,处理过程记录
豪谱_原文提取.md 服饰相关原文逐条提取

五、质量自检

检查项 结果
是否一次性加载全文 否(32KB虽小,仍用grep定位)
是否按词库执行grep 是(三轮+补充搜索)
误判是否逐条审查 是(排除11处误判)
遗漏是否补充 是(补充5处遗漏)
边缘案例是否裁定 是(5处边缘裁定)
三份MD是否齐全