《唐代墓志汇编续集》服饰内容提取 · 工作日志
时间:2026-05-09
任务:提取《唐代墓志汇编续集》全部服饰相关内容,整理分类总结
操作流程
Step 1: 读取参考模板
```
读取 文总集output/唐文拾遗续拾/原文提取.md
读取 文总集output/唐文拾遗续拾/总结.md
读取 文总集output/唐文拾遗续拾/日志.md
→ 确认三份MD输出格式
```
Step 2: 确认输入文件
```
指定文件 /home/z/my-project/upload/文总集/文总集/唐代墓志汇编续集.txt 不存在
搜索发现文件位于 /tmp/daizhige_data/集藏/文总集/唐代墓志汇编续集.md(.md非.txt)
wc -l → 13100行
mkdir -p 文总集output/唐代墓志汇编续集/ → 创建输出目录
```
Step 3: 多轮grep搜索(10轮50词)
| 轮次 | 关键词 | 匹配行数 |
|---|---|---|
| R1 | 衣(302) 裳(60) 裘(52) 冠(602) 冕(213) | |
| R2 | 袍(7) 褐(139) 裙(5) 衫(1) 襦(10) 袈裟(1) | |
| R3 | 绶(93) 佩(96) 笏(11) 履(227) 舄(32) 带(107) 帻(8) 巾(40) | |
| R4 | 弁(18) 铠(4) 甲(308) 胄(155) 戎服(0) | |
| R5 | 帛(85) 绢(40) 缟(15) 纱(2) 锦(99) 绮(77) 罗(101) | |
| R6 | 绣(30) 黼(27) 黻(17) 衮(53) 章服(7) 法服(2) 冕服(3) | |
| R7 | 袂(23) 襟(117) 袖(49) 衽(9) 裾(62) 领(193) | |
| R8 | 丝(77) 麻(23) 葛(44) 布衣(7) 绵(162) 纩(15) | |
| R9 | 朝服(3) 祭服(0) 丧服(3) 缁衣(6) 朱衣(5) 紫衣(1) 绯衣(1) 白衣(3) | |
| R10 | 赐衣(0) 服制(0) 服色(1) 鱼袋(206) 赐紫(126) 赐绯(95) 衣冠(107) 冠带(6) 舆服(2) 貂蝉(18) 冕旒(10) 通天冠(0) |
高价值复合词:
- 赐紫金鱼袋(111) 绯鱼袋(101) 金鱼袋(122) 银青光禄大夫(135)
- 借绯(6) 借紫(4) 紫袍金带(3) 章服(7)
- 鱼轩(21) 象服(6) 翟衣(3) 法服(2) 冕服(3)
- 紫绶(27) 金章(28) 银章(16) 簪缨(50) 貂蝉(18)
- 冕旒(10) 冠带(6) 衣衾(9) 命服(3)
总匹配行数:约3800行(去重前),其中鱼袋/赐紫/赐绯/银青光禄合计约558行
Step 4: 重点提取与上下文确认
对以下核心内容执行 grep -n 提取:
- 借绯→赐紫金鱼袋(行6575、6809、7164)——唐元功臣章服升迁路径
- 赐紫袍金带(行2093、5583、6621)——武将勋赏制度
- 朱衣银章/朱衣银印(行10965、11661)——侍御史章服
- 面赐朱衣象版(行12927)——面赐章服仪式
- 翟衣/象服/鱼轩(行378、2051、3058、6603、7223、8289、8856、9140)
- 尚服李法满掌山龙之法服(行2688-2689)
- 袭冠带於朝廷(行3597)——冠带化夷
- 赐章服/奏加章服(行8994、11640、10130、10555)
- 赐紫服/重赐紫衣(行4791、11446)
- 冠带犬戎(行11613)——武宗朝冠带化夷
Step 5: 噪音过滤
噪音类别:
- "冠"602行中约90%为"冠军""冠绝"等非服饰用法
- "甲"308行中约70%为天干
- "衣"302行中约50%为佛教用语或世族用语
- "衣冠"107行中约80%为世族用词
- "锦"99行中约40%为地名
- "履"227行中约60%为"履行/履历"
- "襟"117行中约50%为"襟怀"等比喻
- "鱼袋"206行中绝大多数为墓志题衔
- "胄"155行中约60%为姓氏或"甲胄"泛指
有效服饰段落估计:约50-60段
Step 6: 保存三份文件
- 文总集output/唐代墓志汇编续集/原文提取.md
- 文总集output/唐代墓志汇编续集/总结.md
- 文总集output/唐代墓志汇编续集/日志.md(本文件)
关键发现
- 墓志题衔中的章服信息密度极高:赐紫金鱼袋111行+绯鱼袋101行+金鱼袋122行+银青光禄大夫135行+赐紫126行+赐绯95行,合计约790行,是任何其他文总集无法比拟的章服制度数据量
- 借绯→赐紫金鱼袋升迁路径清晰:唐元功臣武将的章服升迁路径在墓志中完整呈现
- 赐紫袍金带专用于武将勋赏:3行均为对外族归降将领或立殊勋武将的特别赏赐
- 命妇礼服是本书最有价值的服饰内容:翟衣、象服、鱼轩共约30行,提供了唐代命妇礼服的具体使用场景
- 尚服李法满墓志极为珍贵:直接记录尚服局"掌山龙之法服"的职责
- 面赐朱衣象版:崔凝拜官时的面赐仪式,反映唐代章服授予的仪式性
- 章服制度内容分散:7行章服内容分布在道士、武将、文官等不同墓志中,形式各异
关键踩坑记录
- 输入文件路径非预期位置(/tmp/daizhige_data/而非upload/),且扩展名为.md而非.txt
- 全书13100行,严禁加载整本,全程使用grep+sed
- 墓志文体的特殊性决定了服饰内容以题衔中的官职标注为主,制度性论述极少
- "鱼袋"206行中绝大多数为墓志题衔,不算独立服饰论述
- "衣冠"107行中约80%为世族用词,非实际服饰内容
- 与《全唐文》《唐会要》等制度性文献形成互补关系
文件大小
- 原文提取.md:约12KB
- 总结.md:约7KB
- 日志.md:约3KB