《崇古文诀》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《崇古文诀》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/御选古文渊鉴/原文提取.md
读取 文总集output/御选古文渊鉴/总结.md
读取 文总集output/御选古文渊鉴/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/崇古文诀.txt 不存在
→ 从殆知阁GitHub仓库(frankslin/daizhigev20, data分支)下载
→ 文件实际为.md格式(531KB, 607行)
→ 用sparse checkout下载并复制为.txt
→ mkdir -p 文总集output/崇古文诀/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(55) 裳(5) 裘(6) 冠(30) 冕(8) | |
| R2 | 袍(0) 褐(2) 裙(0) 衫(0) 襦(1) | |
| R3 | 绶(4) 佩(8) 笏(4) 履(16) 舄(3) | |
| R4 | 帻(0) 弁(1) 铠(0) 甲(31) 兜鍪(0) | |
| R5 | 帛(10) 绢(1) 缟(2) 纱(0) 锦(7) | |
| R6 | 绣(6) 黼(6) 黻(2) 衮(4) 章服(1) | |
| R7 | 带(17) 袂(2) 襟(5) 袖(2) 衽(0) | |
| R8 | 丝(11) 麻(9) 葛(12) 布衣(11) 绵(0) | |
| R9 | 朝服(1) 祭服(0) 丧服(0) 戎服(0) 法服(1) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 白衣(0) |
总匹配行数:约260行(去重前)
补充搜索:
- 冕旒(1) 介胄(1) 绣衣(2) 文绣(1) 黼绣(1)
- 冠带(3) 韦带(2) 束带(1) 幅巾(1) 衮冕(2)
- 黼黻(2) 衣冠(10) 衣服(5) 端委(1) 冠缨(1)
- 皂绨(1) 缟素(1) 卉裳(1) 菲衣(1) 三注之甲(1)
- 衣锦(2) 绛衣(1) 金紫(1) 左袵(2) 垂绅(2)
- 搢笏(1) 正笏(1) 执笏(1) 椎髻(1) 衣褐(1)
- 衮龙(1) 绂冕(1) 被髪(1) 旌旗车服(1) 冕服(0)
Step 4: 重点提取与噪音过滤
因文件行数较少(607行)且行特长,采用Python逐行搜索而非sed提取。
关键发现:
- 全书607行,服饰内容远少于御选古文渊鉴,约35段有效服饰段落
- 行71贾谊治安策为全书最完整的服饰僭越论述
- 行292司马光风俗论"衣冠无非是习与不习"为全书最具理论深度之服饰论述
- 行599胡铨"被髪左袵vs衣冠之会"为全书最激烈的华夷服饰之辨
- 行43/52/55/58/64楚辞九歌服饰意象为全书最具文学性之服饰描写
Step 5: 噪音过滤
噪音类别:
- "衣"55行中约35行为非服饰用法(衣食、衣被等泛指)
- "甲"31行中约28行为天干"甲子"或"甲兵"泛指
- "带"17行中约14行为地带、带领等非服饰用法
- "履"16行中约14行为"履践""履至尊"等非鞋履用法
- "葛"12行中约10行为人名(诸葛等)
- "帛"10行中约9行为财帛、布帛泛指
- "佩"8行中约6行为钦佩、敬佩非佩饰
有效服饰段落估计:约35段
Step 6: 保存三份文件
- 文总集output/崇古文诀/原文提取.md
- 文总集output/崇古文诀/总结.md
- 文总集output/崇古文诀/日志.md(本文件)
关键发现
- 贾谊服饰僭越最集中:绣衣丝履、白縠薄纨、黼绣、皂绨文绣,为全书唯一完整论述服饰僭越之段落
- 司马光风俗论最深刻:衣冠无非是,习与不习——以赵武灵王、孝文帝正反两例论证
- 胡铨华夷之辨最激烈:管仲变左袵为衣冠vs秦桧驱衣冠归左袵
- 楚辞服饰最具文学性:荷衣蕙带、青云衣白霓裳
- 服饰总量偏少:607行仅约35段,在文总集中属较少者
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库sparse checkout下载
- 仓库中文件为.md格式而非.txt,需复制转换
- 文件531KB,但仅607行,每行平均876字符,行特长导致ripgrep编码报错
- 改用Python逐行搜索替代grep/sed
- "甲"31行中绝大多数为天干或甲兵泛指
- "履"16行中绝大多数为履践、履至尊
- "葛"12行中绝大多数为人名
文件大小
- 原文提取.md:约11KB
- 总结.md:约6KB
- 日志.md:约3KB
审核结果
原文均从Python逐行搜索提取,有明确行号对应。《崇古文诀》为南宋楼昉编古文评点本,服饰内容以贾谊僭越论、司马光风俗论、胡铨华夷辨为核心,楚辞服饰意象为文学性补充。全书服饰内容约35段,属文总集中偏少者。已据实整理,未灌水凑字。