《唐宋文醇》服饰内容提取 · 工作日志
时间:2026-05-10
任务:提取《唐宋文醇》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/御选唐宋文醇/原文提取.md
读取 文总集output/御选唐宋文醇/总结.md
读取 文总集output/御选唐宋文醇/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
指定输入文件路径 /home/z/my-project/upload/文总集/文总集/唐宋文醇.txt 不存在
→ 实际目录中仅有 御选唐宋文醇.txt
→ 文件头部元数据确认:title为"御选唐宋文醇"
→ 文件首行"钦定四库全书""御选唐宋文醇序"确认即为《御选唐宋文醇》
→ 判定:唐宋文醇.txt 与 御选唐宋文醇.txt 系同一书,书名"唐宋文醇"为简称
wc -l → 3494行
mkdir -p 文总集output/唐宋文醇/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(116) 裳(15) 裘(11) 冠(56) 冕(7) | |
| R2 | 袍(0) 褐(5) 裙(0) 衫(1) 襦(1) | |
| R3 | 绶(3) 佩(11) 笏(13) 履(46) 舄(1) | |
| R4 | 帻(0) 弁(5) 铠(0) 甲(70) 兜鍪(0) | |
| R5 | 帛(30) 绢(6) 缟(4) 纱(0) 锦(8) | |
| R6 | 绣(9) 黼(2) 黻(2) 衮(4) 章服(1) | |
| R7 | 带(19) 袂(1) 襟(6) 袖(12) 衽(0) | |
| R8 | 丝(30) 麻(20) 葛(17) 布衣(24) 绵(12) | |
| R9 | 朝服(2) 祭服(0) 丧服(4) 戎服(1) 法服(1) | |
| R10 | 深衣(0) 缁衣(3) 素衣(0) 朱衣(2) 青衣(0) |
总匹配行数:约530行(去重前)
Step 4: 补充搜索与grep -n精确提取
对以下关键词执行grep -n提取行号与上下文:
- 衣服殊制(1) 法服(1) 赐衣一袭(1) 冠带(2) 韦带(2)
- 布衣韦带(4) 布衣隐于(1) 束带结发(1) 布衣时(1)
- 椎髻卉裳(1) 冬一裘夏一葛(1) 角巾鹿裘(1) 褒衣危冠(1)
- 紫衣金鱼(1) 绯衣银鱼(3) 赐绯鱼袋(2) 赐紫金鱼袋(5)
- 赐三品衣鱼(1) 衣鱼(2) 衮衣(1) 衮冕(3)
- 衣裳舆马章绶(1) 冠屦裳衣(1) 皮冠(1) 鹖冠(3)
- 华言华服(1) 冠冕佩玉(1) 服黻冕而垂旒(1)
- 衣褐之徒(1) 绯衣緅衾(1) 赐绯衣银鱼(3)
- 朱衣象笏(1) 朱衣银鱼(1) 冠胄服甲(1)
- 戎服(1) 幅巾(2) 缁衣之好(1) 食褐(1)
关键发现:
- 全书3494行,服饰内容远较先秦典籍稀少
- 赐服(紫衣金鱼、绯衣银鱼)为最频繁的服饰现象,集中于碑志文
- 韩愈谏佛骨表"衣服殊制"为全书最重要的服饰思想论述
- 衮冕之争(太后欲服衮冕祭太庙)为最激烈的服饰制度争论
- 布衣韦带四次出现,为寒士/隐士的核心服饰意象
- 苏轼论冠冕佩玉为全书唯一对古服制度的反思批判
Step 5: 噪音过滤
噪音类别:
- "衣"116行中约91行为非服饰用法(衣食、衣被、衣服泛指、衣钵等)
- "甲"70行中约65行为天干"甲子"或"甲兵"泛指
- "带"19行中约14行为非服饰用法(地带、连带、带领等)
- "履"46行中约41行为"履历""履践"非鞋履
- "帛"30行中约27行为"布帛""财帛"泛指赋税
- "佩"11行中约8行为"钦佩""敬佩"非佩饰
- "襟"6行中约4行为"胸襟"非服饰
- "袖"12行中约10行为"领袖"非服饰
有效服饰段落估计:约55段
Step 6: 保存三份文件
- 文总集output/唐宋文醇/原文提取.md
- 文总集output/唐宋文醇/总结.md
- 文总集output/唐宋文醇/日志.md(本文件)
关键发现
- 指定输入文件"唐宋文醇.txt"不存在:上传目录中仅有"御选唐宋文醇.txt",经核实为同一书。"唐宋文醇"系"御选唐宋文醇"之简称
- 赐服为最频繁服饰现象:紫衣金鱼、绯衣银鱼、赐三品衣鱼等,集中于碑志文,是唐宋官场等级文化的直接反映
- 华夷之辨为最深刻服饰论述:韩愈"衣服殊制"、柳宗元"椎髻卉裳→冠带",服饰即文明边界
- 布衣韦带为士人核心意象:四次出现,寒士出仕的服饰转换贯穿唐宋散文
- 衮冕之争最激烈:太后欲穿衮冕祭太庙,两次被谏止,服饰即权力
- 苏轼批判强服古服:冠冕佩玉的价值在日用而非复古;服饰美丑反映治乱安危
关键踩坑记录
- 指定输入文件"唐宋文醇.txt"不存在,仅有"御选唐宋文醇.txt",系同一书
- "衣"116行中过半为非服饰用法(衣食、衣被、衣服泛指),需逐行鉴别
- "甲"70行中绝大多数为天干或"甲兵"泛指,有效甲胄服饰行仅约5行
- "履"46行中绝大多数为"履践""履历"非鞋履用法
- R2中袍(0)、裙(0)、R4中铠(0)、兜鍪(0)、R10中深衣(0)——高级服制词汇稀缺
- 本书为唐宋散文选集,服饰内容远较先秦典籍稀少,以点缀性描述为主
文件大小
- 原文提取.md:约10KB
- 总结.md:约8KB
- 日志.md:约4KB
审核结果
原文均从grep -n提取,有明确行号对应。《唐宋文醇》(即《御选唐宋文醇》)为清高宗御选唐宋十家文,服饰内容以赐服、华夷之辨、布衣意象、衮冕之争为核心,具有较重要的思想史价值。已据实整理,未灌水凑字。