《交谊典师弟部》服饰整理日志
操作流程
第1步:文件检查
- 命令:
wc -c - 结果:130,925 字节
- 判断:文件中等大小,需分轮检索,禁止整本载入
第2步:五轮词库 grep -n 检索
第1轮:衣裳冠冕巾帽袍衫裙裘带佩履舄靴
- 命令:
grep -n '衣\|裳\|冠\|冕\|巾\|帽\|袍\|衫\|裙\|裘\|带\|佩\|履\|舄\|靴' - 命中行数:13行
- 有效服饰记录:18条
- 主要命中:抠衣(行34)、衣带必饬(行72)、摄衣(行74)、抠衣而降(行82)、佩长剑/冠切云(行102)、衣褐带索(行116)、布衣(行116,123)、冠服(行125)、巾帻(行125)、不解带(行125)
第2轮:服色舆服冠服章服朝服祭服丧服吉服常服公服
- 命令:
grep -n '服色\|舆服\|冠服\|章服\|朝服\|祭服\|丧服\|吉服\|常服\|公服' - 命中行数:1行
- 有效服饰记录:3条
- 主要命中:冠服(行125)、盛服(行125)、丧服(行125)
第3轮:丝帛绢锦绮绫罗缎绸缂丝葛麻布褐
- 命令:
grep -n '丝\|帛\|绢\|锦\|绮\|绫\|罗\|缎\|绸\|缂丝\|葛\|麻\|布\|褐' - 命中行数:7行
- 有效服饰记录:6条
- 主要命中:素丝(行123)、缣百匹(行123)、衣褐(行116)、布衣(行123)、麻衣布绖(行125)
- 噪声:丝竹(乐器)、丝竹管弦(非服饰)
第4轮:紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带
- 命令:
grep -n '紫袍\|绯袍\|绿袍\|赐紫\|赐绯\|鱼袋\|笏\|幞头\|金带\|玉带' - 命中行数:1行
- 有效服饰记录:2条
- 主要命中:笏(行95荐笏/曳笏)、金紫(行125)
- 说明:金紫为"金紫光禄大夫"简称,金印紫绶
第5轮:旂旗章珮环玦簪钗钿翠珠玉
- 命令:
grep -n '旂\|旗\|章\|珮\|环\|玦\|簪\|钗\|钿\|翠\|珠\|玉' - 命中行数:16行
- 有效服饰记录:4条
- 主要命中:玉帛(行123,123)、珠玉(行95蓄珠玉)
- 噪声极高:章(篇章)、旗(旗号)、珠玉(比喻)等大量非服饰用法
第3步:sed 提取上下文
- 对命中行34、72、74、82、95、102、116、123、125使用sed提取原文
- 对长行(116、123、125)使用Python grep -oP提取关键词前后30字上下文
- 对特定术语(鹤氅、深衣、斩衰、衰绖、巾帻、盛服、锦衣、麻衣、冠服、布绖)做补充检索
第4步:分类整理
将35条记录分为7大类:
1. 礼仪服饰动作(4条)
2. 赋体服饰意象(1条)
3. 丧服礼制(7条)
4. 官服与品级(4条)
5. 特殊服饰(4条)
6. 平民服饰与织物(9条)
7. 其他提及(6条)
第5步:审查
- 去重:同一行多次出现的合并为一条
- 排除:"锦衣卫"为官署名非服饰,标注说明
- 排除:"裘仁"为人名非裘服,不录入
- 排除:丝竹管弦为乐器非织物,不录入
- 比喻用法:锦衣(锦衣玉食气)、白衣(无官职)标注为比喻
- 缺字处理:"芒□"推测为"鞋"
第6步:生成三MD文件
- 交谊典师弟部_总结.md:分类统计与核心发现
- 日志.md:本文件,操作流程记录
- 原文提取.md:35条服饰原文及释义
五轮检索统计汇总
| 指标 | 数值 |
|---|---|
| 文件大小 | 130,925 字节 |
| 总命中行数(去重) | 约22行 |
| 有效服饰关键词数 | 28个(去重后) |
| 有效服饰记录数 | 35条 |
| 噪声率 | 第5轮最高(珠玉章旗等大量非服饰用法) |
日志完成