《全唐文》服饰内容提取 · 工作日志

时间:2026-05-08

任务:提取《全唐文》全部服饰相关内容,整理分类总结


操作流程

Step 1: 读取参考模板

```

读取 文总集output/文苑英华/原文提取.md

读取 文总集output/文苑英华/总结.md

读取 文总集output/文苑英华/日志.md

→ 确认三份MD输出格式

```

Step 2: 确认输入文件

```

全唐文.txt 不存在于 /home/z/my-project/upload/文总集/文总集/

搜索发现文件位于 /tmp/daizhige_data/集藏/文总集/全唐文.md(.md非.txt)

wc -l → 60256行,26MB

mkdir -p 文总集output/全唐文/ → 创建输出目录

```

Step 3: 多轮grep搜索(10轮50词)

轮次关键词匹配行数
R1衣(3178) 裳(540) 裘(303) 冠(2469) 冕(637)
R2袍(103) 褐(322) 裙(27) 衫(29) 襦(66) 袈(31)
R3绶(448) 佩(703) 笏(80) 履(1518) 舄(115) 带(1055)
R4帻(37) 弁(126) 铠(23) 甲(2443) 胄(525)
R5帛(849) 绢(277) 缟(94) 纱(50) 锦(649) 绮(462) 罗(1508)
R6绣(406) 黼(140) 黻(89) 衮(382) 章服(53) 法服(47)
R7袂(195) 襟(641) 袖(197) 衽(157) 裾(211)
R8丝(719) 麻(306) 葛(353) 布衣(140) 绵(705)
R9朝服(39) 祭服(19) 丧服(48) 戎服(17) 法服(47) 冕服(44) 衮服(11)
R10深衣(3) 缁衣(64) 素衣(14) 朱衣(15) 青衣(18) 紫衣(39) 绯衣(11) 白衣(47)

高价值复合词

总匹配行数:约20000+行(去重前)

Step 4: 重点提取与上下文确认

对以下核心内容执行 grep -n + sed 提取:

  1. 定服色诏(行355)——唐太宗定服色制度
  2. 禁僭服色立私社诏(行1054)——高宗禁袍衫内著朱紫
  3. 禁滥借鱼袋诏(行2071、2365)——中宗两申鱼袋禁令
  4. 禁僭用服色诏(行2147)——玄宗禁借绯紫长袍
  5. 赐衣定制(行4315)——节度使鹘衔绶带/观察使雁衔威仪
  6. 绣袍回文铭(行6947-6949)——武则天创制
  7. 准敕详度诸司制度条件奏(行26935)——最详尽的服制规定
  8. 冠通天佩玉玺(行12291)——天子冠冕
  9. 袭衮服(行11615、57350)——郊祀耕藉礼服
  10. 解辫冠带(行602)——突厥归唐
  11. 谏迎佛骨(行31660)——韩愈论衣服殊制
  12. 乞宣所司制造绣袍议(行52314)——金吾将军绣袍

Step 5: 噪音过滤

噪音类别

有效服饰段落估计:约300-400段

Step 6: 保存三份文件


关键发现

  1. 诏令奏议为主载体:《全唐文》不同于文学总集,服饰内容集中于制度性文献——皇帝诏令与臣僚奏议
  2. 鱼袋制度极其突出:鱼袋549行、紫金鱼袋396行,为唐代独有的官服标识系统
  3. 服色等级最详尽:礼部式紫朱绿青黄五等,袍纹鹘衔/雁衔/团窠三级
  4. 冠带化夷观念贯穿:74行"冠带"中绝大多数为"华夏文明"代称
  5. 绣袍回文铭为唐代首创:武则天将政治训诫织入官服,属独有制度
  6. 禁僭诏令反复出现:从太宗到文宗,服色僭越屡禁不止
  7. 韩愈谏迎佛骨以"衣服殊制"论证华夷之辨,是服饰文化论述最深刻的篇章

关键踩坑记录


文件大小


审核结果

原文均从grep -n提取,有明确行号对应。《全唐文》为唐代文章总集,服饰内容以诏令奏议的制度性文献为主,文学想象较少,已据实整理。