《文章轨范》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《文章轨范》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/文编/原文提取.md
读取 文总集output/文编/总结.md
读取 文总集output/文编/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
输入文件路径 /home/z/my-project/upload/文总集/文总集/文章轨范.txt 不存在
→ 从殆知阁GitHub仓库下载:frankslin/daizhigev20/data/集藏/文总集/文章轨范.md
→ 保存为 /home/z/my-project/upload/文总集/文总集/文章轨范.txt
wc -l → 274行,148KB
mkdir -p 文总集output/文章轨范/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(13) 裳(2) 裘(4) 冠(6) 冕(2) | |
| R2 | 袍(0) 褐(0) 裙(0) 衫(0) 襦(0) | |
| R3 | 绶(0) 佩(0) 笏(1) 履(3) 舄(0) | |
| R4 | 帻(0) 弁(0) 铠(0) 甲(3) 兜鍪(0) | |
| R5 | 帛(1) 绢(0) 缟(1) 纱(0) 锦(2) | |
| R6 | 绣(0) 黼(0) 黻(0) 衮(0) 章服(0) | |
| R7 | 带(4) 袂(0) 襟(3) 袖(1) 衽(2) | |
| R8 | 丝(3) 麻(2) 葛(4) 布衣(5) 绵(1) | |
| R9 | 朝服(0) 祭服(0) 丧服(0) 戎服(0) 法服(0) | |
| R10 | 深衣(0) 缁衣(0) 素衣(0) 朱衣(1) 青衣(0) |
总匹配行数:约58行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 裂冠毁冕(1) 被发左衽(2) 羽衣(1) 玄裳缟衣(1)
- 束带(1) 玉带裘马(1) 泥涂轩冕(1) 冠带(1)
- 衣冠(1) 麻丝(2) 服左衽(1) 留衣服(1)
- 衣食(1) 摄衣(1) 韦带(1) 云锦裳(1)
关键发现:
- 《文章轨范》全书仅274行,服饰内容极为稀少
- 裘、葛、布衣、冠带、朱衣象笏为主要服饰用语
- 胡铨《请斩秦桧等疏》中"裂冠毁冕""被发左衽""衣冠之防"为全书服饰思想最集中段落
- 苏轼《后赤壁赋》"玄裳缟衣""羽衣蹁跹"为全书最具文学性的服饰描写
- 无衮冕、黼黻、章服、朝服、祭服等制度性词汇,反映此书为文章选本而非礼制文献
Step 5: 噪音过滤
噪音类别:
- "衣"13行中约7行为非服饰用法(衣食、衣被等)
- "带"4行中约2行为非服饰用法(地带、连带等)
- "甲"3行中约2行为天干"甲子"或"甲兵"泛指
- "襟"3行为"胸襟"非服饰
- "袖"1行为"领袖"非服饰
- "帛"1行为"财帛"非服饰
- "锦"2行中约1行为"云锦裳"(有效)
有效服饰段落估计:约20段
Step 6: 保存三份文件
- 文总集output/文章轨范/原文提取.md
- 文总集output/文章轨范/总结.md
- 文总集output/文章轨范/日志.md(本文件)
关键发现
- 服饰内容极少:全书274行69篇,服饰相关段落仅约20段,无任何制度性记录
- 华夷之辨最突出:胡铨疏"裂冠毁冕""被发左衽"为全书服饰思想的核心,冠冕=华夏文明
- 布衣为高频词:出现5次,从服饰延伸至身份、品德
- 韩愈文为主要载体:全书69篇中韩愈31篇,裘葛、冠带、麻丝、布衣多出韩文
- 苏轼文提供审美:后赤壁赋"玄裳缟衣""羽衣"为唯一文学想象性服饰描写
- 谢枋得批注关注服饰修辞:如"冬一裘夏一葛"批注"此是衣不说出衣字",注意服饰词汇的修辞运用
关键踩坑记录
- 输入文件不存在于指定路径,需从殆知阁GitHub仓库下载
- 殆知阁数据分支为"data"而非"main",下载URL需修正
- 全书仅274行,为小型选本,服饰内容远少于《文编》(2902行)和《文章辨体汇选》
- R2-R10大量关键词匹配为0(袍褐裙衫、绶佩、黼黻衮、朝服祭服等),反映此书非礼制文献
- "衣"13行中过半为非服饰用法(衣食、衣被等),需逐行鉴别
- 谢枋得批注(用【】标注)中偶有服饰修辞评点,值得注意
文件大小
- 原文提取.md:约8KB
- 总结.md:约6KB
- 日志.md:约3KB
审核结果
原文均从grep -n提取,有明确行号对应。《文章轨范》为南宋文章选本,以批点法度为主,服饰内容极少,均为文学修辞中的零星用法,无制度性记录。已据实整理,未灌水凑字。