《全蜀艺文志》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《全蜀艺文志》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/成都文类/原文提取.md
读取 文总集output/成都文类/总结.md
读取 文总集output/成都文类/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/全蜀艺文志.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/集藏/文总集/全蜀艺文志.md
→ 仓库分支为 data(非main),需通过 GitHub Contents API 获取下载URL
→ 下载成功,保存为 /home/z/my-project/upload/文总集/文总集/全蜀艺文志.txt
wc -l → 4789行,约1.5MB
mkdir -p 文总集output/全蜀艺文志/ → 输出目录已创建
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(215) 裳(50) 裘(21) 冕(29) 冠(158) | |
| R2 | 袍(12) 褐(14) 裙(19) 衫(7) 襦(6) | |
| R3 | 绶(15) 佩(47) 笏(4) 履(76) 舄(10) | |
| R4 | 帻(1) 弁(8) 铠(4) 甲(157) 兜鍪(1) | |
| R5 | 帛(30) 绢(4) 缟(5) 纱(11) 锦(264) | |
| R6 | 绣(54) 黼(10) 黻(4) 衮(24) 章服(0) | |
| R7 | 带(124) 袂(20) 襟(38) 袖(29) 衽(4) | |
| R8 | 丝(77) 麻(28) 葛(79) 布衣(13) 绵(80) | |
| R9 | 朝服(1) 祭服(1) 丧服(0) 戎服(1) 法服(1) | |
| R10 | 深衣(1) 缁衣(0) 素衣(0) 朱衣(1) 青衣(10) |
总匹配行数:约1460行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 衮衣(4) 衮服(0) 衮绣(0) 衮职(3) 衮冕(2)
- 衣冠(~20) 冠带(3) 冕旒(3) 左衽/左袵(2)
- 蝉冕(1) 珥貂(2) 貂冠(2)
- 袨服(2) 卉服(1) 甲胄(1) 铠甲(0)
- 释褐(4) 袴襦(2) 绮罗(~8)
- 濯锦(19) 贝锦(3) 黄裳(3)
- 冕服(1) 冕旒(3) 法服(1) 戎服(1)
关键发现:
- 《全蜀艺文志》全书4789行,服饰内容以文学性描写为主
- 与《成都文类》高度重叠——蝉冕蔑如、貂冠韵水苍、贝锦斐成等核心段落同出一源
- 文庙祭服(行3163、3176)为全书最系统的服饰制度描写——衮冕南面、冕旒服章
- 辨蜀都赋(行37)以"衣冠vs卉服"论述蜀地属华夏文明,为最突出的服饰思想
- 蜀都赋(行34)"贝锦斐成濯色江波"为蜀锦工艺的经典描写
- 文君濯锦赋(行66-67)为全书最详细的织锦工艺描写
- "锦"264行中绝大多数为地名(锦城、锦江、锦水)或"锦上添花"等非服饰用法
Step 5: 噪音过滤
噪音类别:
- "锦"264行中约244行为地名(锦城、锦江、锦水、锦里等)或非服饰用法
- "甲"157行中约147行为天干"甲子"或"甲兵"泛指
- "葛"79行中约74行为人名(诸葛亮、葛亮等)
- "绵"80行中约74行为地名(绵州、绵竹等)
- "带"124行中约112行为非服饰用法(地带、连带、带领等)
- "履"76行中约66行为"履历""履践"非鞋履
- "佩"47行中约41行为"钦佩""敬佩"非佩饰
- "衣"215行中约185行为非服饰用法(衣食、衣被、衣冠泛指等)
- "帛"30行中约26行为"财帛""布帛"泛指
- "襟"38行中约28行为"胸襟""襟带"非服饰
- "绣"54行中约44行为"锦绣""绣户"等非服饰用法
有效服饰段落估计:约215段
Step 6: 保存三份文件
- 文总集output/全蜀艺文志/原文提取.md
- 文总集output/全蜀艺文志/总结.md
- 文总集output/全蜀艺文志/日志.md(本文件)
关键发现
- 文庙祭服为全书最系统的服饰描写:衮冕南面、冕旒服章的完整等级体系
- 衣冠与卉服的对立为最突出的服饰思想:辨蜀都赋以服饰标志华夷,论证蜀地属华夏
- 蜀锦描写为最具地方特色的服饰内容:贝锦斐成、濯色江波、织回文之重锦
- 蝉冕蔑如、貂冠韵水苍为显贵服饰的精彩描写
- 袴襦之颂为反复出现的善政服饰典故
- 与《成都文类》高度重叠——核心服饰段落多出自相同源文献
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库下载
- GitHub仓库分支为"data"而非"main",需通过API获取正确下载URL
- "锦"264行中绝大多数为地名(锦城、锦江),非服饰用法,需仔细甄别
- "葛"79行中绝大多数为人名(诸葛亮等),非葛布服饰
- "绵"80行中绝大多数为地名(绵州、绵竹),非丝绵
- R9中朝服仅1行、祭服1行、戎服1行——高级服制词汇极度稀缺
- 全书服饰内容以文学修辞为主,与《成都文类》存在大量重叠
文件大小
- 原文提取.md:约8KB
- 总结.md:约7KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《全蜀艺文志》为明周复俊编蜀地诗文总集,服饰内容以文学性描写为主,具有鲜明的地域特色(蜀锦、衣冠华夷之辨)。已据实整理,未灌水凑字。