《事林广记前集》服饰内容提取操作日志
Step 0:文件检查与目录创建
- 命令:
wc -c /home/z/my-project/upload/part1_extracted/事林广记前集.txt - 结果:329414 bytes(约322KB),未超500KB阈值
- 命令:
mkdir -p /home/z/my-project/upload/p1output/事林广记前集/ - 结果:输出目录创建成功
Step 1:第一轮grep——核心词(16词)
- 命令:
rg -n "关键词" 事林广记前集.txt | head -80 - 逐词执行,结果统计:
| 关键词 | 匹配行数 | 服饰相关行数 |
|---|---|---|
| 衣 | ~50行 | ~30行 |
| 裳 | 0行 | 0行 |
| 冠 | ~25行 | ~15行 |
| 冕 | 0行 | 0行 |
| 巾 | 5行 | 3行 |
| 帽 | 8行 | 6行 |
| 袍 | 4行 | 3行 |
| 衫 | 4行 | 3行 |
| 裙 | 2行 | 1行(词牌名) |
| 裘 | 2行 | 1行 |
| 带 | ~15行 | 5行 |
| 佩 | 8行 | 3行 |
| 履 | 11行 | 2行 |
| 舄 | 1行 | 1行(书信套语) |
| 靴 | 3行 | 3行 |
- 小计:16词,约76条匹配,筛选后约46条服饰相关
Step 2:第二轮grep——制度词(10词)
- 命令:
rg -n "关键词" 事林广记前集.txt | head -30
| 关键词 | 匹配行数 | 说明 |
|---|---|---|
| 服色 | 0 | 无匹配 |
| 舆服 | 0 | 无匹配 |
| 冠服 | 0 | 无匹配 |
| 章服 | 0 | 无匹配 |
| 朝服 | 0 | 无匹配 |
| 祭服 | 1 | 行2669,家祭更祭服 |
| 丧服 | 6 | 行2358/2403/2404/2405/2431/2563 |
| 吉服 | 1 | 行2563,"丧用吉服" |
| 常服 | 1 | 行2563,吊服条 |
| 公服 | 2 | 行1770/2146,冠礼服制 |
- 小计:10词,11条匹配,全部服饰相关
- 重要发现:本书无服色、舆服、冠服、章服、朝服等制度性记载
Step 3:第三轮grep——材质词(15词)
- 命令:
rg -n "关键词" 事林广记前集.txt | head -20
| 关键词 | 匹配行数 | 服饰相关行数 |
|---|---|---|
| 丝 | ~14行 | 4行(五彩丝、丝绵贵、纺丝等) |
| 帛 | ~11行 | 3行(纏帛蔽形、帛纏头、钱帛) |
| 绢 | 5行 | 3行(聘财用绢、吊服用白绢) |
| 锦 | ~10行 | 2行(锦袄、锦带) |
| 绮 | 8行 | 1行(绮罗香,词牌名) |
| 绫 | 1行 | 0行(地名孟绫甸) |
| 罗 | 多行 | 0行(均为地名/人名) |
| 缎 | 0行 | 0行 |
| 绸 | 0行 | 0行 |
| 缂丝 | 0行 | 0行 |
| 葛 | 多行 | 1行(麻葛绖带) |
| 麻 | 多行 | 3行(麻布、麻带、绖带麻葛) |
| 布 | 多行 | 4行(麻布、火浣布、布衣、白布襕衫) |
| 褐 | 1行 | 0行(変褐色,非布料义) |
- 小计:15词,约20条服饰相关
Step 4:第四轮grep——品色词(10词)
| 关键词 | 匹配行数 | 说明 |
|---|---|---|
| 紫袍 | 0 | 无匹配 |
| 绯袍 | 0 | 无匹配 |
| 绿袍 | 0 | 无匹配 |
| 赐紫 | 0 | 无匹配 |
| 赐绯 | 0 | 无匹配 |
| 鱼袋 | 0 | 无匹配 |
| 笏 | 3 | 行1745/2146/2709,家宴/冠礼/乡饮搢笏 |
| 幞头 | 2 | 行334/2146,中元市卖/冠礼 |
| 金带 | 0 | 无匹配 |
| 玉带 | 0 | 无匹配 |
- 小计:10词,5条匹配
- 重要发现:本书无品色服制记载(紫袍/绯袍/绿袍/赐紫/赐绯/鱼袋/金带/玉带均无匹配)
Step 5:第五轮grep——配饰词(12词)
| 关键词 | 匹配行数 | 服饰相关行数 |
|---|---|---|
| 旂 | 0 | 0 |
| 旗 | 2 | 0(彩旗/地名) |
| 章 | 多行 | 0(均为人名/地名/月令章句) |
| 珮 | 0 | 0 |
| 环 | 多行 | 1(环金钗玉珥) |
| 玦 | 0 | 0 |
| 簪 | 4 | 2(玳簪/金簪) |
| 钗 | 4 | 2(钗头符/金钗) |
| 钿 | 0 | 0 |
| 翠 | 6 | 1(金珠牙翠,七夕装饰) |
| 珠 | 多行 | 2(珠履/缀饰镠琲) |
| 玉 | 多行 | 2(玉珥/璇玑玉衡) |
- 小计:12词,约7条服饰相关
Step 6:关键行上下文提取
- 命令:
PYTHONIOENCODING=utf-8 python3 -c "...lines[ln-1]..." - 提取行号:2144/2145/2146/2148/2563/334/345/349/1770/1747/2362/2366/2368/2402-2405/1161/1177/1185/1193/1197/1199/1245/1538/1592/1253/1148/1187/1122/2337-2339/2239/3259/324/325/3311/1241/2669/1745/355/356
- 每行截取前200字符进行概览
Step 7:对抗式学术审查
- 对24条关键引文逐一执行
rg -c "引文片段" 事林广记前集.txt验证 - 结果:24/24 全部验证通过,均返回匹配数1
- 验证的关键短语包括:
- "古者未冠为童子彩衣紒" ✓
- "公服靴笏次旋襕衫次四癸衫" ✓
- "幞头帽巾各承以盘" ✓
- "双紒袍勒帛素屐" ✓
- "陈服止用背子" ✓
- "白布襕衫角带" ✓
- "古者羔裘玄冠不以吊" ✓
- "衣貂鹿之皮" ✓
- "五彩丝系臂" ✓
- "卖冥衣靴鞋席帽衣" ✓
- "火浣布" ✓
- "受衣着锦袄" ✓
- "彩六表里" ✓
- "更祭服" ✓
- 等24条,全部通过
总结统计
- 总关键词:63词(5轮)
- 总匹配行数:约112条(去重后)
- 筛选后服饰相关记录:约82条
- 对抗审查通过率:24/24 = 100%