《古文关键》服饰内容提取 · 工作日志
时间:2026-03-05
任务:提取《古文关键》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/文章轨范/原文提取.md
读取 文总集output/文章轨范/总结.md
读取 文总集output/文章轨范/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/古文关键.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文关键.md
→ 保存为 /home/z/my-project/upload/文总集/文总集/古文关键.txt
wc -l → 301行,143KB
mkdir -p 文总集output/古文关键/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(5) 裳(0) 裘(2) 冠(4) 冕(0) | |
| R2 | 袍(0) 褐(0) 裙(0) 衫(0) 襦(0) | |
| R3 | 绶(0) 佩(0) 笏(0) 履(2) 舄(0) | |
| R4 | 帻(0) 弁(0) 铠(0) 甲(4) 兜鍪(0) | |
| R5 | 帛(2) 绢(0) 缟(0) 纱(0) 锦(0) | |
| R6 | 绣(0) 黼(0) 黻(0) 衮(0) 章服(0) | |
| R7 | 带(1) 袂(0) 襟(0) 袖(0) 衽(1) | |
| R8 | 丝(3) 麻(2) 葛(2) 布衣(3) 绵(1) | |
| R9 | 朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) |
总匹配行数:约34行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 布衣(3: 行123/205/272) 韦帯(1: 行205) 束帯(1: 行123) 冠带(1: 行189)
- 服左衽(1: 行139) 右袵(1: 行189) 被髪(1: 行189) 不左袵(1: 行189)
- 留衣服(1: 行139) 其服丝麻(1: 行126) 麻丝(2: 行126)
- 被甲(1: 行192) 弹冠(1: 行223) 屦(1: 行300)
- 裂其麻(1: 行205——非服饰,指撕诏书)
关键发现:
- 《古文关键》全书仅301行,服饰内容极为稀少
- 韩愈《原道》为服饰内容最集中的单篇(行126),含5处服饰提及
- 欧阳修《本论》"右袵而冠带""被髪于伊川"为华夷之辨核心段落
- 无衮冕、黼黻、章服、朝服、祭服等制度性词汇
- R2全部为0(袍褐裙衫襦),R3除履外为0,R6全部为0
Step 5: 噪音过滤
噪音类别:
- "衣"5行中约2行为非服饰用法(衣食、衣被等泛指)
- "甲"4行中约3行为"兵甲""藏甲""甲兵"指武器,仅行192"被甲荷戈"有效
- "履"2行均为非服饰用法(布履星罗=足迹遍布,非礼弗履=践履)
- "帛"2行为"币帛""一束之帛"指丝绸礼物/财物,非直接服饰
- "绵"1行为"绵绵延延"非服饰
- "冠"4行中约2行为"冠军""卷首冠以"等非服饰用法
- "裂其麻"(行205)指撕诏书,非服饰
有效服饰段落估计:约9段,含服饰提及约18处
Step 6: 保存三份文件
- 文总集output/古文关键/原文提取.md
- 文总集output/古文关键/总结.md
- 文总集output/古文关键/日志.md(本文件)
关键发现
- 服饰内容极少:全书301行六十余篇,服饰相关段落仅约9段,无任何制度性记录
- 华夷之辨最突出:欧阳修《本论》"右袵而冠带"、韩愈《与孟尚书书》"服左衽"为全书服饰思想核心
- 布衣为高频词:出现3次,从服饰延伸至身份、品德
- 韩愈《原道》为最集中单篇:含"为之衣""夏葛冬裘""责冬之裘""麻丝""其服丝麻"五处
- 无军服制度描写:"被甲荷戈"仅为修辞对比,非制度描述
- "屦"为唯一足衣提及:苏辙以制鞋喻立法,属比喻用法
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库下载
- 全书仅301行,为小型选本,服饰内容极少
- R2、R6全部匹配为0,R9全部为0,R10全部为0,反映此书非礼制文献
- "甲"4行中仅1行(被甲荷戈)为有效服饰,其余3行均为"兵甲""藏甲""甲兵"指武器
- "履"2行均为非服饰用法(布履星罗=足迹遍布,非礼弗履=践履)
- "帛"2行均为"币帛""一束之帛"指丝绸财物,非直接服饰
- "裂其麻"(行205)指撕诏书(裂麻制诰),非服饰
- "绵"1行为"绵绵延延"非绵衣
- "冠"4行中2行为"冠军""卷首冠以"等非服饰用法
- 原文使用异体字:帯=带,袵=衽,髪=发,需注意grep搜索时兼顾
文件大小
- 原文提取.md:约5KB
- 总结.md:约5KB
- 日志.md:约3KB
审核结果
原文均从grep -n提取,有明确行号对应。《古文关键》为南宋吕祖谦所编古文选本,以论文法度为主,服饰内容极少,均为文学修辞中的零星用法,无制度性记录。已据实整理,未灌水凑字。