《古文苑》服饰内容提取 · 工作日志
时间:2026-03-05
任务:提取《古文苑》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/古文观止/原文提取.md
读取 文总集output/古文观止/总结.md
读取 文总集output/古文观止/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/古文苑.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/古文苑.md(data分支)
→ 保存为 /home/z/my-project/upload/文总集/文总集/古文苑.txt
wc -l → 818行,402211字节
mkdir -p 文总集output/古文苑/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词及匹配行数 |
|---|---|
| R1 | 衣(47) 裳(17) 裘(7) 冠(24) 冕(1) |
| R2 | 袍(2) 褐(3) 裙(2) 衫(1) 襦(1) |
| R3 | 绶(13) 佩(13) 笏(0) 履(17) 舄(0) 靴(0) |
| R4 | 帻(0) 弁(3) 铠(0) 甲(29) 兜鍪(0) 胄(6) |
| R5 | 帛(12) 绢(7) 缟(1) 纱(0) 锦(12) 绮(7) |
| R6 | 绣(7) 黼(3) 黻(2) 衮(3) 章服(0) 袞(0) |
| R7 | 带(13) 襟(4) 袖(13) 衽(3) 袵(2) 绅(3) |
| R8 | 丝(27) 麻(4) 葛(13) 布衣(1) 绵(6) 纩(0) |
| R9 | 朝服(2) 祭服(1) 丧服(0) 戎服(0) 法服(0) 命服(4) |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(3) 赐衣(0) |
总匹配行数:约280行(去重前,含大量非服饰用法)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 翠云之裘/白縠之单衫/步摇/冠缨(行84): 宋玉讽赋女子服饰
- 华袿飞髾/纎罗/罗衣长袖(行88): 宋玉舞赋舞服
- 姣服极丽(行88): 郑女舞服
- 黄衣绛足(行103): 黄鹂之喻
- 列襟联袍(行103): 枚乘柳赋
- 重葩累绣/文锦(行112): 屏风赋
- 服色容冶/黼帐/罗袖/上服亵衣(行121): 相如美人赋
- 祭服/裳衣/罗裙/珠佩/红黛/长袖/兰襟(行123-124): 捣素赋
- 文绣/褐不完/易衣(行136): 逐贫赋贫富对比
- 奇锦/绵茧/筩中黄润/明衣/襜袩(行138): 蜀都赋织物与服饰
- 约屦朝服/皮弁为履/胡服(行146): 遂初赋冠服僭越
- 缟巾(行158): 髑髅赋丧服
- 绮袖丹裳/丝扉/青衣/缯(行184-185): 诮青衣赋婢妾服饰
- 衣裳鲜洁/黼黻玄黄(行273): 岁会赋朝会服饰
- 锦裘/官绢/罗縠裘/织成鞾(行433): 曹操与杨彪书赐物
- 玄冠/朝服(行472): 傅咸冠赋
- 衮职(行496): 焦君铭
- 命服/纡朱怀金(行550/552): 笥铭、命服铭
- 衮阙(行682): 百官箴
- 缋组/服离桂/防岌(行171): 九宫赋冠服仪饰
关键发现:
- 全书818行,服饰内容中等偏上,集中在辞赋篇
- 宋玉讽赋、舞赋为女子服饰描写最精彩段落
- 班婕妤捣素赋为全书服饰含量最丰之篇
- 扬雄逐贫赋"文绣vs褐不完"为全书最鲜明贫富服饰对比
- 刘歆遂初赋"约屦正朝服、降皮弁为履"为全书最精妙服饰政治隐喻
- 蜀都赋为蜀锦蜀布之珍贵经济史料
Step 5: 噪音过滤
噪音类别:
- "衣"47行中约31行为非服饰用法(衣食、衣被、衣服泛指等)
- "甲"29行中约27行为"兵甲""甲兵"指军队/武器
- "冠"24行中约18行为"冠军""弱冠"等非服饰用法
- "履"17行中约15行为"践履""履行"等动词用法
- "丝"27行中约23行为"丝竹""游丝"等非服饰用法
- "葛"13行中约12行为"诸葛""葛蔓"等非服饰用法
- "佩"13行中约10行为"佩韦"人名或"钦佩"等
- "锦"12行中约5行为非服饰(锦鳞等比喻用法)
- "袖"13行中约8行为"领袖""长袖善舞"等引申用法
- "绅"3行中约2行为"缙绅"代指士大夫
- "弁"3行中约1行为人名
有效服饰段落估计:约25段,含服饰提及约55处
Step 6: 保存三份文件
- 文总集output/古文苑/原文提取.md
- 文总集output/古文苑/总结.md
- 文总集output/古文苑/日志.md(本文件)
关键发现
- 服饰内容中等偏上:全书818行,有效服饰段落约25段
- 辞赋篇为服饰描写主阵地:宋玉讽赋、舞赋、相如美人赋、班婕妤捣素赋、扬雄逐贫赋、蜀都赋
- 宋玉舞赋"华袿飞髾而杂纎罗"为全书最精彩舞服描写
- "人皆文绣余褐不完"为全书最鲜明贫富服饰对比
- "约屦正朝服、降皮弁为履"为全书最精妙服饰政治隐喻
- 蜀都赋为蜀锦蜀布之珍贵经济史料
- 曹操与杨彪书展示汉末服饰为贵重礼品之核心
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库data分支下载
- "甲"29行中仅约2行为有效服饰(胄/甲胄相关),其余为"兵甲""甲兵"
- "衣"47行中有效服饰约16行,大量为泛指
- "冠"24行中"冠军"出现多次,为称号非服饰
- "丝"27行中大量为"丝竹"(音乐)用法
- "葛"13行中绝大多数为"诸葛"人名
- 全书"布衣"仅1见(行136逐贫赋),远少于《古文观止》的13见
- "青衣"3见,2处为婢妾代称,1处为曹操书中的侍女
文件大小
- 原文提取.md:约12KB
- 总结.md:约9KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《古文苑》为唐以前散佚诗文之重要汇编,服饰内容集中在辞赋篇的女子服饰描写与贫富对比,铭诔书札篇提供制度性与社会性旁证。已据实整理,未灌水凑字。