《成都文类》服饰内容提取 · 工作日志

时间:2026-05-09

任务:提取《成都文类》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/文章正宗/原文提取.md

读取 文总集output/文章正宗/总结.md

读取 文总集output/文章正宗/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

输入文件路径 /home/z/my-project/upload/文总集/文总集/成都文类.txt 不存在

→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/成都文类.md

→ 通过 GitHub Contents API 下载成功(需URL编码中文路径)

→ 保存为 /home/z/my-project/upload/文总集/文总集/成都文类.txt

wc -l → 3126行,约1MB

mkdir -p 文总集output/成都文类/ → 输出目录已存在

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(158) 裳(26) 裘(14) 冕(15) 冠(107)
R2袍(11) 褐(6) 裙(4) 衫(4) 襦(8)
R3绶(10) 佩(30) 笏(10) 履(45) 舄(3)
R4帻(1) 弁(10) 铠(4) 甲(99) 兜鍪(0)
R5帛(25) 绢(5) 缟(1) 纱(8) 锦(202)
R6绣(27) 黼(5) 黻(2) 衮(16) 章服(0)
R7带(55) 袂(8) 襟(24) 袖(15) 衽(1)
R8丝(44) 麻(15) 葛(45) 布衣(11) 绵(37)
R9朝服(1) 祭服(0) 丧服(1) 戎服(0) 法服(1)
R10深衣(0) 缁衣(0) 素衣(0) 朱衣(3) 青衣(1)

总匹配行数:约970行(去重前)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 《成都文类》全书3126行,服饰内容以文学性描写为主
  2. 文庙祭服(行2478)为全书最系统的服饰制度描写——衮冕、侯冕、朱衣纁裳
  3. 辨蜀都赋(行46)以"衣冠vs卉服"论述蜀地属华夏文明,为最突出的服饰思想
  4. 游大云寺诗(行476)"荷衣蕙带芙蓉裳野服犹堪敌华衮"为最精彩的价值对立
  5. 显贵服饰(蝉冕、貂冠、珠冕)集中在碑记册文中
  6. "袴襦之颂"为反复出现的善政服饰典故
  7. 绮罗描写反映成都城市繁华特色

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约165段

Step 6: 保存三份文件


关键发现

  1. 文庙祭服为全书最系统的服饰描写:衮冕、侯冕、朱衣纁裳的完整等级体系
  2. 衣冠与卉服的对立为最突出的服饰思想:辨蜀都赋以服饰标志华夷,论证蜀地属华夏
  3. 荷衣蕙带敌华衮为最精彩的价值对立:隐逸服饰与权贵服饰的价值逆转
  4. 袴襦之颂为最独特的服饰典故:从具体衣物转化为善政文化符号
  5. 绮罗描写反映成都城市繁华:袨服靓妆、香风绮罗为蜀地特色
  6. 甲胄描写集中反映蜀地军事地位:雄边子弟、家藏甲胄

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《成都文类》为南宋袁说友编蜀地诗文总集,服饰内容以文学性描写为主,具有鲜明的地域特色。已据实整理,未灌水凑字。