《书叙指南》服饰内容提取操作日志
基本信息
- 源文件:
/home/z/my-project/upload/part1_extracted/书叙指南.txt - 文件大小:332,037字节(约324KB),未超500KB阈值
- 输出目录:
/home/z/my-project/upload/p1output/书叙指南/ - 操作日期:2026-03-04
Step 0:环境准备
$ wc -c /home/z/my-project/upload/part1_extracted/书叙指南.txt
332037
$ mkdir -p /home/z/my-project/upload/p1output/书叙指南/
文件324KB,未超500KB限制,但依规不全文载入上下文,采用grep逐步提取。
Step 1:第一轮grep——核心词(15个)
关键词:衣、裳、冠、冕、巾、帽、袍、衫、裙、裘、带、佩、履、舄、靴
命中统计
| 关键词 | 命中行数(主要) | 服饰相关行 |
|---|---|---|
| 衣 | 大量 | 35,238,266,307,330-333,472,474,568,570,843 |
| 裳 | 少量 | 296,331,472 |
| 冠 | 大量 | 16,35,226,238,265-266,330-333,345,602,843 |
| 冕 | 少量 | 266,602 |
| 巾 | 中等 | 270,302,331,360,474,592 |
| 帽 | 极少 | 813("脱帽避帐") |
| 袍 | 少量 | 333,568,570,807 |
| 衫 | 少量 | 333,841 |
| 裙 | 极少 | 含于"帬"字,行333 |
| 裘 | 少量 | 240,331,333,568,813 |
| 带 | 大量 | 266,331,333,602 |
| 佩 | 少量 | 16,265,266 |
| 履 | 中等 | 35,228,296,331,333,662 |
| 舄 | 极少 | 333,726 |
| 靴 | 极少 | 333 |
核心发现:行330-333为"衣服冠履"专章,是全书服饰内容最密集区段。
Step 2:第二轮grep——制度词(10个)
关键词:服色、舆服、冠服、章服、朝服、祭服、丧服、吉服、常服、公服
命中统计
| 关键词 | 命中行数 | 说明 |
|---|---|---|
| 服色 | 0 | 未命中 |
| 舆服 | 3 | 行266、668、843("舆服志"引用) |
| 冠服 | 0 | 未单独命中,含于"衣服冠履"中 |
| 章服 | 0 | 未命中 |
| 朝服 | 3 | 行238、266("严装衣冠待明""着朝服") |
| 祭服 | 0 | 未命中 |
| 丧服 | 2 | 行333、841 |
| 吉服 | 1 | 行333("吉服曰嘉服") |
| 常服 | 0 | 未命中 |
| 公服 | 0 | 未命中 |
核心发现:制度词命中较少,该书以名物雅称为主,不以制度分类。
Step 3:第三轮grep——材质词(15个)
关键词:丝、帛、绢、锦、绮、绫、罗、缎、绸、缂丝、葛、麻、布、褐
命中统计
| 关键词 | 命中行数 | 主要服饰相关行 |
|---|---|---|
| 丝 | 多 | 302,331,333,360 |
| 帛 | 少 | 163,266,360 |
| 绢 | 少 | 163,360 |
| 锦 | 少 | 331,360,462,600 |
| 绮 | 少 | 331("文章遒丽"语境) |
| 绫 | 少 | 331,474("绀绫之袿") |
| 罗 | 少 | 331(含于他词) |
| 缎 | 0 | 未命中 |
| 绸 | 少 | 264 |
| 缂丝 | 0 | 未命中 |
| 葛 | 中 | 28,303,331,757("蕉葛""荃葛") |
| 麻 | 少 | 843 |
| 布 | 中 | 307,568,570 |
| 褐 | 少 | 333,568 |
核心发现:高级材质词(锦、绮、绫、罗)多用于描述华服;基础材质(布、褐、葛、麻)多出现在贫服描述中。
Step 4:第四轮grep——品色词(10个)
关键词:紫袍、绯袍、绿袍、赐紫、赐绯、鱼袋、笏、幞头、金带、玉带
命中统计
| 关键词 | 命中行数 | 说明 |
|---|---|---|
| 紫袍 | 0 | 未命中 |
| 绯袍 | 0 | 未命中 |
| 绿袍 | 0 | 未命中 |
| 赐紫 | 0 | 未命中(但有"龟紫""假紫") |
| 赐绯 | 0 | 未命中(但有"着绯曰朱衣鱼章") |
| 鱼袋 | 0 | 未命中(但有"拥笏垂鱼""朱衣鱼章") |
| 笏 | 多 | 238,266("笏曰板""御珽""服笏") |
| 幞头 | 0 | 未命中 |
| 金带 | 1 | 266("金带曰黄金横带") |
| 玉带 | 0 | 未命中(但有"玉重组长""佩玉") |
核心发现:该书使用雅称而非通行术语,如"龟紫"代"赐紫","朱衣鱼章"代"赐绯"。
Step 5:第五轮grep——配饰词(部分)
关键词:簪、钗、钿、翠、珮、玦、步摇、金摇
命中统计
| 关键词 | 命中行数 | 主要行 |
|---|---|---|
| 簪 | 2 | 259("簪白笔")、264 |
| 钗 | 1 | 296("折钗断带") |
| 钿 | 0 | 未命中 |
| 翠 | 多 | 462,474,502,666("戴金翠""翠樽雕觞") |
| 珮 | 0 | 单独未命中,含于"佩" |
| 玦 | 1 | 402("赐玦") |
| 步摇 | 1 | 474("妇人珠吊子曰步揺") |
| 金摇 | 1 | 474("又曰金揺") |
Step 6:对抗式学术审查
对总结中引用的关键条目逐一grep验证:
$ rg -n "儒衣冠曰危冠方袂" 书叙指南.txt → 行331 ✅
$ rg -n "貂鹖之冠" 书叙指南.txt → 行266 ✅
$ rg -n "金华之舄" 书叙指南.txt → 行333 ✅
$ rg -n "布袍草履" 书叙指南.txt → 行568 ✅
$ rg -n "绣衣袿裳" 书叙指南.txt → 行474 ✅
$ rg -n "荷衣蕙" 书叙指南.txt → 行333+602 ✅
$ rg -n "练冠麻衣" 书叙指南.txt → 行843 ✅
$ rg -n "拖绥鸣玉" 书叙指南.txt → 行266 ✅
$ rg -n "步揺" 书叙指南.txt → 行474 ✅
$ rg -n "龟紫" 书叙指南.txt → 行266 ✅
全部10条验证通过,无编造。
总结
- 五轮grep共使用55个关键词
- 有效命中关键词:约38个(部分词如缎、缂丝、幞头等未命中)
- 提取服饰记录:约79条(去重后)
- 核心区段:行330-333(衣服冠履专章)、行265-266(冠绶车服专章)