皇朝经世文四编·服饰内容提取日志
操作时间:2026-03-04
操作文件:/home/z/my-project/upload/经世文编/经世文编/皇朝经世文四编.txt
文件信息:2894行,2.5MB
步骤1:文件基本信息
- 命令:
wc -l / ls -lh
- 结果:2894行,2.5MB
- 耗时:<1秒
步骤2:第1轮grep——上位概念关键词
- 命令:
grep -n '服饰|舆服|冠服|章服|服色|衣冠|服制'
- 结果:命中约15处有效行
- 关键行号:779, 803, 821, 931, 971, 1022, 1089, 1144, 1240, 1242, 1260, 1314, 1340, 1363, 1787, 1846, 1951, 1954
- 过滤噪音:行803"服丧"义项已排除;行971"服制"实指丧服制度,非服饰制度,但涉及三月之服制始于禹,有一定参考价值,保留备注
- 耗时:约3秒
步骤3:第2轮grep——冠帽关键词
- 命令:
rg -n '袍|裘|褐|衫|襦|袄|褂|深衣|法服|朝服|祭服|公服|戎服'
- 结果:命中约20处有效行
- 关键行号:833(黄马褂), 905(裘), 931(深衣), 1116(红内衫), 1242(朝服、祭服、常服), 1254(释褐、敝裘), 1788(深衣、绣衣丝履)
- 过滤噪音:行1097"裘集岛"为地名,排除
- 耗时:约3秒
步骤4:第3轮grep——品色关键词
- 命令:
rg -n '紫袍|绯袍|绿袍|青袍|白袍|黄袍|赐紫|赐绯|借紫|品色'
- 结果:命中2处
- 关键行号:833(黄马褂), 1242(三品以上紫五品以上朱七品以上绿九品以上青)
- 耗时:约2秒
步骤5:第4轮grep——材质关键词
- 命令:
rg -n '锦|绮|帛|绢|绫|罗|缎|绸|缂丝|缯|丝帛|绢帛|绫罗|锦绮'
- 结果:命中约15处
- 关键行号:833, 1242, 1340, 1370, 1647, 1653, 1788
- 过滤噪音:大量"丝"作"丝毫"等非材质义项出现,已逐条甄别
- 耗时:约3秒
步骤6:第5轮grep——配饰关键词
- 命令:
rg -n '绶|佩|笏|鱼袋|金带|玉带|革带|鞶囊'
- 结果:命中约8处
- 关键行号:833(鞶带), 1233(银绶), 1235(银绶), 1242(佩绶), 1274(钱佩贤,人名,排除), 1312(琼琚玉佩), 1846(佩刀)
- 过滤噪音:行1274"钱佩贤"为人名,排除;行1846"佩刀"为武器非配饰,排除
- 耗时:约2秒
步骤7:第6轮grep——动作关键词
- 命令1:
rg -n '赐服|赐衣|赐帛|赐锦'
- 结果:命中1处
- 关键行号:2866(土耳其"王赐帛自绞")
- 命令2:
rg -n '僭|逾制'
- 结果:命中约10处
- 关键行号:777, 795, 1340, 1787, 1951, 2107
- 耗时:约4秒
步骤8:第7轮grep——纺织关键词
- 命令:
rg -n '蚕桑|蚕事|织布|织造|染坊|绣补|缫丝'
- 结果:命中约20处
- 关键行号:312-316, 763, 847, 913, 1126, 1242, 1327, 1340, 1370-1371, 1623, 1634, 1636, 1638, 1641, 1643-1649, 1651
- 耗时:约3秒
步骤9:补充grep——清代服饰特有关键词
- 命令:
rg -n '黄马褂|翎顶|顶戴|顶珠|蓝翎|花翎'
- 结果:命中约8处
- 关键行号:180, 833, 877, 1175, 1196, 1239-1240, 2155, 2339, 2362, 2501
- 耗时:约2秒
步骤10:sed提取关键段落
| 提取行范围 |
内容 |
耗时 |
| 1239-1250 |
《翎顶考》《补服考》全文 |
<1秒 |
| 1355-1375 |
辨服色上下文 |
<1秒 |
| 1785-1795 |
礼论服制上下文 |
<1秒 |
| 1018-1025 |
胡服教射段落 |
<1秒 |
| 1945-1958 |
婚丧僭越段落 |
<1秒 |
| 1840-1850 |
使臣服色段落 |
<1秒 |
步骤11:噪音过滤汇总
| 噪音类型 |
示例 |
处理 |
| 服丧/服阕 |
行803"服丧" |
排除 |
| 五服(丧服) |
行971"三月之服制始于禹" |
保留但标注为丧服制 |
| 冠军(非冠帽) |
行1240"冠军使"为官职名 |
排除 |
| 佩服(非佩饰) |
行1298"佩服"为动词 |
排除 |
| 组织/练习 |
未出现 |
无需处理 |
| 服药 |
未出现 |
无需处理 |
| 人名含关键词 |
行1274"钱佩贤" |
排除 |
| 地名含关键词 |
行1097"裘集岛" |
排除 |
| 兵器 |
行1846"佩刀" |
排除 |
统计
- grep总轮次:9轮(8轮主搜+1轮补充)
- 有效服饰命中行数:约40行(去重后)
- 关键段落sed提取:6段
- 最终分类:8大类
- 产出MD:3份