《成都文类》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《成都文类》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/文章正宗/原文提取.md
读取 文总集output/文章正宗/总结.md
读取 文总集output/文章正宗/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/成都文类.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/成都文类.md
→ 通过 GitHub Contents API 下载成功(需URL编码中文路径)
→ 保存为 /home/z/my-project/upload/文总集/文总集/成都文类.txt
wc -l → 3126行,约1MB
mkdir -p 文总集output/成都文类/ → 输出目录已存在
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(158) 裳(26) 裘(14) 冕(15) 冠(107) | |
| R2 | 袍(11) 褐(6) 裙(4) 衫(4) 襦(8) | |
| R3 | 绶(10) 佩(30) 笏(10) 履(45) 舄(3) | |
| R4 | 帻(1) 弁(10) 铠(4) 甲(99) 兜鍪(0) | |
| R5 | 帛(25) 绢(5) 缟(1) 纱(8) 锦(202) | |
| R6 | 绣(27) 黼(5) 黻(2) 衮(16) 章服(0) | |
| R7 | 带(55) 袂(8) 襟(24) 袖(15) 衽(1) | |
| R8 | 丝(44) 麻(15) 葛(45) 布衣(11) 绵(37) | |
| R9 | 朝服(1) 祭服(0) 丧服(1) 戎服(0) 法服(1) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(3) 青衣(1) |
总匹配行数:约970行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 衮冕(1) 衮衣(2) 衮龙(1) 衮衣绣裳(1) 被衮(1)
- 衣冠(~15) 冠带(3) 冕弁(1) 侯冕(1) 蝉冕(1)
- 珥貂(1) 貂冠(2) 辂车珠冕(2)
- 袨服(2) 卉服(3) 毳裘(1) 铠甲(3) 甲胄(2)
- 荷衣(2) 绮罗(~8) 罗衣(1) 袴襦(3) 释褐(1)
- 朝服(1) 法服(1) 朱衣(3) 裁褐(1) 羸襦(1)
关键发现:
- 《成都文类》全书3126行,服饰内容以文学性描写为主
- 文庙祭服(行2478)为全书最系统的服饰制度描写——衮冕、侯冕、朱衣纁裳
- 辨蜀都赋(行46)以"衣冠vs卉服"论述蜀地属华夏文明,为最突出的服饰思想
- 游大云寺诗(行476)"荷衣蕙带芙蓉裳野服犹堪敌华衮"为最精彩的价值对立
- 显贵服饰(蝉冕、貂冠、珠冕)集中在碑记册文中
- "袴襦之颂"为反复出现的善政服饰典故
- 绮罗描写反映成都城市繁华特色
Step 5: 噪音过滤
噪音类别:
- "衣"158行中约133行为非服饰用法(衣食、衣被、衣冠泛指等)
- "锦"202行中约187行为地名(锦城、锦江、锦水等)或"锦上添花"等非服饰用法
- "甲"99行中约91行为天干"甲子"或"甲兵"泛指
- "葛"45行中约40行为人名(葛亮、诸葛等)
- "绵"37行中约33行为地名(绵州、绵竹等)
- "带"55行中约45行为非服饰用法(地带、连带、带领等)
- "帛"25行中约22行为"财帛""布帛"泛指
- "襟"24行中约20行为"胸襟""襟带"非服饰
- "履"45行中约37行为"履历""履践"非鞋履
- "佩"30行中约25行为"钦佩""敬佩"非佩饰
有效服饰段落估计:约165段
Step 6: 保存三份文件
- 文总集output/成都文类/原文提取.md
- 文总集output/成都文类/总结.md
- 文总集output/成都文类/日志.md(本文件)
关键发现
- 文庙祭服为全书最系统的服饰描写:衮冕、侯冕、朱衣纁裳的完整等级体系
- 衣冠与卉服的对立为最突出的服饰思想:辨蜀都赋以服饰标志华夷,论证蜀地属华夏
- 荷衣蕙带敌华衮为最精彩的价值对立:隐逸服饰与权贵服饰的价值逆转
- 袴襦之颂为最独特的服饰典故:从具体衣物转化为善政文化符号
- 绮罗描写反映成都城市繁华:袨服靓妆、香风绮罗为蜀地特色
- 甲胄描写集中反映蜀地军事地位:雄边子弟、家藏甲胄
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库下载
- GitHub raw URL对中文路径需URL编码,否则404
- 须使用GitHub Contents API(Accept: application/vnd.github.v3.raw)才能正确获取文件
- "锦"202行中绝大多数为地名(锦城、锦江),非服饰用法,需仔细甄别
- "葛"45行中绝大多数为人名(诸葛亮等),非葛布服饰
- "绵"37行中绝大多数为地名(绵州、绵竹),非丝绵
- R9中朝服仅1行、祭服0行、戎服0行——高级服制词汇极度稀缺
- 全书服饰内容以文学修辞为主,与《文章正宗》的制度性论述风格迥异
文件大小
- 原文提取.md:约10KB
- 总结.md:约8KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《成都文类》为南宋袁说友编蜀地诗文总集,服饰内容以文学性描写为主,具有鲜明的地域特色。已据实整理,未灌水凑字。