《古文集成》服饰内容提取 · 工作日志
时间:2026-03-05
任务:提取《古文集成》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/古文观止/原文提取.md
读取 文总集output/古文观止/总结.md
读取 文总集output/古文观止/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/古文集成.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文集成.md(data分支)
→ 保存为 /home/z/my-project/upload/文总集/文总集/古文集成.txt
wc -l → 1698行,1024632字节
mkdir -p 文总集output/古文集成/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词及匹配行数 |
|---|---|
| R1 | 衣(83) 裳(13) 裘(14) 冠(52) 冕(15) |
| R2 | 袍(0) 褐(6) 裙(2) 衫(0) 襦(1) |
| R3 | 绶(4) 佩(10) 笏(2) 履(40) 舄(6) 靴(0) |
| R4 | 帻(0) 弁(3) 铠(0) 甲(49) 兜鍪(0) 胄(10) |
| R5 | 帛(20) 绢(1) 缟(4) 纱(1) 锦(12) 绮(6) |
| R6 | 绣(2) 黼(4) 黻(2) 衮(6) 章服(0) 袞(0) |
| R7 | 带(21) 襟(6) 袖(5) 衽(1) 袵(3) 绅(10) |
| R8 | 丝(13) 麻(9) 葛(19) 布衣(14) 绵(10) 纩(2) |
| R9 | 朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(2) 命服(0) |
| R10 | 深衣(1) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) 赐衣(1) |
总匹配行数:约310行(去重前,含大量非服饰用法)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 衮冕(2处): 行267/286
- 布衣(14处): 行53/242/300/444/454/499/528/551/589/1272/1306/1644等
- 峩冠博带(1处): 行499
- 束带(2处): 行683/1541
- 垂绅正笏(1处): 行267
- 搢绅(3处): 行31/108/221
- 被发左衽/左袵(2处): 行410/1258
- 法服(2处): 行535/1200
- 衣冠(约10处): 行49/114/286/1058/1077/1183/1245/1258/1292/1311
- 鹬冠胡服(1处): 行108
- 轩冕(约5处): 行213/277/296等
- 纡青拖紫(1处): 行1665
- 冕旒(2处): 行1192/1656
- 羊裘(1处): 行298
- 赭衣(1处): 行945
- 缟素(1处): 行1644
- 释褐(1处): 行53
- 褐衣(1处): 行482
- 短褐(1处): 行809
- 绨褐(1处): 行868
- 夏葛冬裘(2处): 行960/1472
- 裘葛(1处): 行211
- 解印绶(1处): 行1541
- 翟裘既焚(1处): 行1203
- 一裘之费(1处): 行1214
- 正衣冠(2处): 行1058/1245
- 服周之冕(1处): 行159
- 赐衣一袭(1处): 行535
- 绶佩青朱(1处): 行236
- 绂冕(1处): 行1660
- 锦裳(1处): 行1529
- 衣服殊制(1处): 行535
- 裂冠毁冕(1处): 行1258
关键发现:
- 全书1698行,服饰内容中等丰富,集中在唐宋古文与箴铭
- 胡铨上高宗封事(行1258)为华夷服饰之辨最激烈段落
- "布衣"凡14见,全部有效,是最高频服饰词汇
- 韩愈原道"夏葛而冬裘"与谏迎佛骨表"法服"为经典论述
- 箴铭中"正衣冠"之训出现多次
- 欧阳修昼锦堂记"桓圭衮冕""垂绅正笏"为品级论述代表
Step 5: 噪音过滤
噪音类别:
- "衣"83行中约68行为非服饰用法(衣食、衣被、衣冠泛指等)
- "甲"49行中约46行为"兵甲""甲兵""带甲"指军队/武器
- "冠"52行中约37行为"冠军""弱冠""冠绝"等非服饰用法
- "履"40行中约37行为"践履""履行"等动词用法
- "葛"19行中约15行为"诸葛""葛蔓"等非服饰用法
- "丝"13行中约11行为"丝竹""游丝"等非服饰用法
- "锦"12行中约10行为"锦鳞""锦囊"等非服饰用法
- "佩"10行中约7行为"佩韦""佩服"等非服饰用法
- "帛"20行中约18行为"帛书""财帛"等泛指
- "带"21行中约10行为"地带""带兵"等非服饰用法
- "绵"10行中约10行为"绵延""连绵"等非服饰用法
- "胄"10行中约8行为"贵胄""胄子"指后裔
有效服饰段落估计:约25段,含服饰提及约65处
Step 6: 保存三份文件
- 文总集output/古文集成/原文提取.md
- 文总集output/古文集成/总结.md
- 文总集output/古文集成/日志.md(本文件)
关键发现
- 华夷服饰之辨为全书最核心主题:胡铨封事"裂冠毁冕""被发左衽"为最激烈论述
- 布衣为最高频有效服饰词:14见,含义从服饰延伸至身份政治
- 冕服描写服务于政治论述:桓圭衮冕、垂绅正笏为德重于服
- 箴铭多言正衣冠:为儒家修身之始
- 夏葛冬裘为常理论证之器:韩愈原道以之喻华夷
- 先王教化以衣冠为本:曾巩论"与之为衣冠饮食"
- 全书无辞赋类选文,缺少华丽冕服铺陈
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库data分支下载
- "甲"49行中仅约3行为有效服饰(甲兵已足等),其余为"带甲""甲兵"指军队
- "锦"12行中约10行为非服饰(锦鳞、锦囊等)
- "衣"83行中有效服饰约15行,大量为"衣食""衣被"等泛指
- "冠"52行中"冠军""弱冠"出现频繁,非服饰用法
- "履"40行中绝大多数为动词"践履""履行",非足衣
- "绵"10行全部为"绵延""连绵"等,无一处为服饰用法
- "胄"10行中约8行为"贵胄""胄子"指后裔,非甲胄之服
- 全书无辞赋类选文,与《古文辞类纂》相比缺少班固、扬雄等华丽服饰描写
- "绶佩而青朱"(行236)为官服品级描述,非纯粹配饰
文件大小
- 原文提取.md:约12KB
- 总结.md:约8KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《古文集成》为南宋古文选本,服饰内容中等丰富,华夷服饰之辨(胡铨封事)为全书最突出特色,箴铭"正衣冠"之训多次出现。已据实整理,未灌水凑字。