《古文观止》服饰内容提取 · 工作日志
时间:2026-03-05
任务:提取《古文观止》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/古文辞类纂/原文提取.md
读取 文总集output/古文辞类纂/总结.md
读取 文总集output/古文辞类纂/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/古文观止.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文观止.md(data分支)
→ 保存为 /home/z/my-project/upload/文总集/文总集/古文观止.txt
wc -l → 1953行,411591字节
mkdir -p 文总集output/古文观止/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词及匹配行数 |
|---|---|
| R1 | 衣(63) 裳(4) 裘(7) 冠(29) 冕(3) |
| R2 | 袍(0) 褐(2) 裙(0) 衫(0) 襦(2) |
| R3 | 绶(1) 佩(3) 笏(2) 履(14) 舄(3) 靴(1) |
| R4 | 帻(0) 弁(1) 铠(0) 甲(19) 兜鍪(0) 胄(4) |
| R5 | 帛(8) 绢(0) 缟(4) 纱(0) 锦(14) 绮(1) |
| R6 | 绣(5) 黼(1) 黻(1) 衮(3) 章服(0) 袞(0) |
| R7 | 带(13) 襟(6) 袖(7) 衽(2) 袵(0) 绅(6) |
| R8 | 丝(11) 麻(4) 葛(11) 布衣(13) 绵(2) 纩(1) |
| R9 | 朝服(3) 祭服(2) 丧服(0) 戎服(0) 法服(0) 命服(0) |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) 赐衣(0) |
总匹配行数:约235行(去重前,含大量非服饰用法)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 布衣(13处全部有效): 行764/826/889/890/958/981/1031/1112/1220/1235/1509/1710/1900
- 衮冕(2处): 行325/542
- 桓圭衮裳(1处): 行1547
- 命妇祭服朝服(1处): 行565
- 皮冠翠被豹舄(1处): 行493
- 黑貂之裘敝(1处): 行665
- 金玉锦绣/锦绣千纯(2处): 行665/666
- 阿缟之衣锦绣之饰(1处): 行784
- 衣必文采履丝曳缟(1处): 行971
- 短褐穿结(1处): 行1073
- 褐衣疏食(1处): 行885
- 黄冠草屦葛衣(1处): 行1699
- 冬一裘夏一葛(1处): 行1300
- 衣赭衣关三木(1处): 行923
- 天下缟素(1处): 行764
- 玄裳缟衣(1处): 行1737
- 峨大冠拖长绅(1处): 行1843
- 垂绅正笏(1处): 行1548
- 绾墨绶(1处): 行1085
- 舍簪笏(1处): 行1106
- 方山冠(1处): 行1750
- 掩袖工谗翚翟(1处): 行1096
- 飘轻裾翳长袖(1处): 行1281
- 罗襦襟解履舄交错(1处): 行897
- 冠胄衣甲(1处): 行1612
- 躬擐甲胄(1处): 行426
- 缯纩无温(1处): 行1128
- 锦绣纂组祭服(1处): 行939
- 被发(3处): 行684/873/1718
- 旃裘(1处): 行921
- 冠带(2处): 行815/904
- 衣锦之荣(1处): 行1546
- 朝服冠缨(1处): 行1622
- 衣服附在吾身(1处): 行483
- 弹冠振衣(1处): 行873
关键发现:
- 全书1953行,服饰内容中等丰富,集中在经典名篇
- 臧哀伯谏(行325)为全书冕服制度最完整段落
- 苏秦故事(行665-666)为服饰对比最戏剧化段落
- "布衣"凡13见,全部有效,是最高频服饰词汇
- 楚灵王皮冠翠被豹舄(行493)为全书最奢华服饰描写
- 《古文观止》无辞赋类选文(相比《古文辞类纂》),故缺少华丽冕服铺陈
Step 5: 噪音过滤
噪音类别:
- "衣"63行中约43行为非服饰用法(衣食、衣被、衣服泛指等)
- "甲"19行中约16行为"兵甲""甲兵""带甲"指军队/武器
- "冠"29行中约17行为"冠军""弱冠""卿子冠军"等非服饰用法
- "履"14行中约11行为"践履""履行"等动词用法
- "佩"3行中约1行为"佩韦"人名
- "葛"11行中约8行为"诸葛""葛蔓"等非服饰用法
- "丝"11行中约9行为"丝竹""游丝"等非服饰用法
- "锦"14行中约9行为"锦鳞""锦囊""锦衣卫"等非服饰用法
- "襟"6行中约4行为"襟喉""正襟"等非服饰用法
- "绅"6行中约3行为"缙绅"代指士大夫
有效服饰段落估计:约30段,含服饰提及约70处
Step 6: 保存三份文件
- 文总集output/古文观止/原文提取.md
- 文总集output/古文观止/总结.md
- 文总集output/古文观止/日志.md(本文件)
关键发现
- 服饰内容中等丰富:全书1953行,有效服饰段落约30段
- 《左传》篇为冕服制度核心:臧哀伯"衮冕黻珽带裳幅舄衡紞纮綖"为全书最完整制度记载
- 苏秦服饰对比最戏剧化:黑貂裘敝→锦绣千纯,服饰即命运
- "布衣"为最高频有效服饰词:13见,含义从服饰延伸至身份政治
- 华夷之辨贯穿始终:冠带/被发/旃裘对立从左传至宋文
- 《古文观止》无辞赋类选文,故缺少班固、司马相如等华丽冕服铺陈
- 冠服品级讽刺为时文特色:峨大冠拖长绅、金玉其外败絮其中
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库data分支下载
- "甲"19行中仅约3行为有效服饰(躬擐甲胄、冠胄衣甲、缯纩),其余为"带甲""甲兵"
- "锦"14行中约9行为非服饰(锦鳞游泳、锦囊、锦衣卫等)
- "衣"63行中有效服饰约20行,大量为"衣食""衣被"等泛指
- "冠"29行中"卿子冠军"出现4次,为项羽部将宋义之称号,非服饰
- 全书无辞赋类选文,与《古文辞类纂》相比缺少班固、扬雄等华丽服饰描写
- "锦衣经历"为明代锦衣卫官职名,非服饰描写
文件大小
- 原文提取.md:约14KB
- 总结.md:约9KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《古文观止》为清代最流行的古文入门选本,服饰内容中等丰富,集中在经典名篇中的制度论述与叙事对比,绝少铺陈虚饰。已据实整理,未灌水凑字。