《唐宋文醇》服饰内容提取 · 工作日志

时间:2026-05-10

任务:提取《唐宋文醇》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/御选唐宋文醇/原文提取.md

读取 文总集output/御选唐宋文醇/总结.md

读取 文总集output/御选唐宋文醇/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

指定输入文件路径 /home/z/my-project/upload/文总集/文总集/唐宋文醇.txt 不存在

→ 实际目录中仅有 御选唐宋文醇.txt

→ 文件头部元数据确认:title为"御选唐宋文醇"

→ 文件首行"钦定四库全书""御选唐宋文醇序"确认即为《御选唐宋文醇》

→ 判定:唐宋文醇.txt 与 御选唐宋文醇.txt 系同一书,书名"唐宋文醇"为简称

wc -l → 3494行

mkdir -p 文总集output/唐宋文醇/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(116) 裳(15) 裘(11) 冠(56) 冕(7)
R2袍(0) 褐(5) 裙(0) 衫(1) 襦(1)
R3绶(3) 佩(11) 笏(13) 履(46) 舄(1)
R4帻(0) 弁(5) 铠(0) 甲(70) 兜鍪(0)
R5帛(30) 绢(6) 缟(4) 纱(0) 锦(8)
R6绣(9) 黼(2) 黻(2) 衮(4) 章服(1)
R7带(19) 袂(1) 襟(6) 袖(12) 衽(0)
R8丝(30) 麻(20) 葛(17) 布衣(24) 绵(12)
R9朝服(2) 祭服(0) 丧服(4) 戎服(1) 法服(1)
R10深衣(0) 缁衣(3) 素衣(0) 朱衣(2) 青衣(0)

总匹配行数:约530行(去重前)

Step 4: 补充搜索与grep -n精确提取

对以下关键词执行grep -n提取行号与上下文:

关键发现

  1. 全书3494行,服饰内容远较先秦典籍稀少
  2. 赐服(紫衣金鱼、绯衣银鱼)为最频繁的服饰现象,集中于碑志文
  3. 韩愈谏佛骨表"衣服殊制"为全书最重要的服饰思想论述
  4. 衮冕之争(太后欲服衮冕祭太庙)为最激烈的服饰制度争论
  5. 布衣韦带四次出现,为寒士/隐士的核心服饰意象
  6. 苏轼论冠冕佩玉为全书唯一对古服制度的反思批判

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约55段

Step 6: 保存三份文件


关键发现

  1. 指定输入文件"唐宋文醇.txt"不存在:上传目录中仅有"御选唐宋文醇.txt",经核实为同一书。"唐宋文醇"系"御选唐宋文醇"之简称
  2. 赐服为最频繁服饰现象:紫衣金鱼、绯衣银鱼、赐三品衣鱼等,集中于碑志文,是唐宋官场等级文化的直接反映
  3. 华夷之辨为最深刻服饰论述:韩愈"衣服殊制"、柳宗元"椎髻卉裳→冠带",服饰即文明边界
  4. 布衣韦带为士人核心意象:四次出现,寒士出仕的服饰转换贯穿唐宋散文
  5. 衮冕之争最激烈:太后欲穿衮冕祭太庙,两次被谏止,服饰即权力
  6. 苏轼批判强服古服:冠冕佩玉的价值在日用而非复古;服饰美丑反映治乱安危

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《唐宋文醇》(即《御选唐宋文醇》)为清高宗御选唐宋十家文,服饰内容以赐服、华夷之辨、布衣意象、衮冕之争为核心,具有较重要的思想史价值。已据实整理,未灌水凑字。