《三国志文类》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《三国志文类》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/东汉文纪/原文提取.md
读取 文总集output/东汉文纪/总结.md
读取 文总集output/东汉文纪/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/三国志文类.txt 不存在
→ 从殆知阁数据副本 /tmp/daizhige/集藏/文总集/三国志文类.md 查找
→ 文件存在,485063字节
wc -l → 1403行
mkdir -p 文总集output/三国志文类/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(40) 裳(4) 裘(5) 冠(30) 冕(10) | |
| R2 | 袍(0) 褐(4) 裙(1) 衫(0) 襦(0) | |
| R3 | 绶(11) 佩(4) 笏(0) 履(33) 舄(1) | |
| R4 | 帻(2) 弁(2) 铠(2) 甲(27) 兜鍪(0) | |
| R5 | 帛(21) 绢(1) 缟(0) 纱(0) 锦(3) | |
| R6 | 绣(8) 黼(1) 黻(1) 衮(5) 章服(0) | |
| R7 | 带(23) 袂(1) 襟(1) 袖(1) 衽(1) | |
| R8 | 丝(6) 麻(3) 葛(2) 布衣(9) 绵(0) | |
| R9 | 朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(0) 青衣(0) |
总匹配行数:约260行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 衮冕(1) 九锡(6) 赤舄(1) 冕服(0) 冠服(0)
- 印绶(7) 玺绶(5) 衣冠(5) 冠带(1) 布衣(9)
- 左衽/左袵(1) 被发(0) 貂蝉(0) 冠带(1)
- 玄冕(3) 朱绂(3) 青绂(1) 武弁(1)
- 弋绨(2) 鹿皮(2) 珠襦(1) 短褐(1) 被褐(1)
- 布单衣(1) 皮弁(1) 乌衣(1) 文绣(3) 绮丽(1)
- 绫绮(2) 衣裳(1) 服章(2) 冠履(1)
- 垂衣裳(1) 椎结(1) 徒跣(1) 贯头(1)
- 衣服有章(1) 朝服徒行(1) 衣以(2)
关键发现:
- 全书1403行,服饰内容以节俭论与冠服等级为核心
- 行167封吴王九锡策文含衮冕之服赤舄副焉,为全书最完整礼制赐服
- 行735垂衣裳而天下治为服饰起源经典论述
- 行276衣服有章上下有叙为服饰等级制度原则
- 行504椎结徒跣贯头左袵→冠履为华夷服饰之辨核心
- 行835服绫锦罗绮纨素为服饰僭越批判
- 布衣9次为平民身份核心词,印绶7次为品秩骨架
Step 5: 噪音过滤
噪音类别:
- "衣"40行中约22行为非服饰用法(衣食、衣被、衣钵等泛指)
- "冠"30行中约22行为"冠军""冠绝""弱冠"等非服饰用法
- "履"33行中约29行为"履践""履历"等非服饰用法
- "甲"27行中约24行为天干"甲子"或"甲兵"泛指
- "带"23行中约18行为"地带""带领""带砺"等非服饰用法
- "帛"21行中约16行为"束帛""金帛"等泛指财货
- "绶"11行中约2行为人名等非服饰用法
- "绣"8行中约3行为"锦绣"泛指
有效服饰段落估计:约30段
Step 6: 保存三份文件
- 文总集output/三国志文类/原文提取.md
- 文总集output/三国志文类/总结.md
- 文总集output/三国志文类/日志.md(本文件)
关键发现
- 九锡衮冕赤舄为全书最完整的礼制赐服记录:与东汉册魏公九锡文同制
- 垂衣裳而天下治为服饰起源经典论述:取羽皮→作衣裳
- 衣服有章上下有叙为服饰等级原则:朴素之差示有等级
- 弋绨之服出现两次:为全书节俭论之核心意象
- 冠履教化为华夷服饰之辨核心:椎结徒跣贯头左袵→冠履
- 印绶7次为品秩骨架:玺绶→印绶→玺绂→朱绂→青绂五级
- 布衣9次为平民身份核心词
关键踩坑记录
- 输入文件不存在于指定路径,需从/tmp/daizhige/查找(.md格式而非.txt)
- 全书1403行,服饰内容密度低于《东汉文纪》
- 袍(0)衫(0)襦(0)——日常服装词汇极度稀缺
- 深衣(0)缁衣(0)素衣(0)朱衣(0)青衣(0)——传统服制术语完全缺失
- 朝服(0)祭服(0)丧服(0)戎服(0)法服(0)——正式服制类别词缺失
- "衣"40行中约55%为非服饰用法,噪音率较高
- "履"33行中约88%为"履践/履历",噪音率极高
- 冕服内容集中在九锡文与受封诗,较为集中
- 与《东汉文纪》以冕服制度与后服制度为核心不同,本书以节俭论与冠服等级为核心
文件大小
- 原文提取.md:约10KB
- 总结.md:约7KB
- 日志.md:约3KB
审核结果
原文均从grep -n提取,有明确行号对应。《三国志文类》为宋人不著撰人名氏编三国一代文章总集,1403行,服饰内容以节俭论与冠服等级为核心,与《东汉文纪》以冕服制度与后服制度为核心有显著不同。已据实整理,未灌水凑字。