《重修宣和博古图》服饰内容提取日志

基本信息

项目 内容
书名 重修宣和博古图
输入文件 /home/z/my-project/upload/器物/器物/重修宣和博古图.txt
输出目录 /home/z/my-project/upload/器物output/重修宣和博古图/
总行数 9174行
文献性质 宋代青铜器图录(非服饰专书)

处理流程

第一步:wc -l 查总行数

wc -l 重修宣和博古图.txt → 9174

第二步:多轮grep -n提取服饰关键词行号

逐词检索41个关键词,记录命中情况:

关键词 命中行数 备注
5行 含衮衣、绘衣、衣服等
0行 无命中
5行 含冠礼、冠字、冠之簪导等
~80行 绝大多数为"篆带""雷带""星带"等器物纹带
0行 无命中
0行 无命中
0行 无命中
0行 无命中
3行 "处尊履贵""刻伐履"等非鞋履义
2行 "杖屦""如屦之繶"非核心服饰内容
0行 无命中
0行 无命中
0行 无命中
0行 无命中
0行 无命中
0行 无命中
2行 綦弁、侧弁
2行 衮冕、冕旒
1行 冠之簪导
~30行 全部为"两耳有珥"器耳装饰
1行 "携佩之器"指携带工具
~60行 全部为器物环钮
0行 无命中
0行 无命中
0行 无命中
0行 无命中
3行 帛女鬲、主缯帛
0行 无命中
1行 衮冕绣宗彝之章
0行 无命中
0行 无命中
~10行 "布以细纹"等非织物义
0行 无命中
5行 "萦丝""盘丝"比喻纹饰
0行 无命中
0行 无命中
1行 主缯帛
0行 无命中
0行 无命中
0行 无命中
0行 无命中
0行 无命中
2行 黼作斧形、黼黻
2行 招黻、黼黻
0行 无命中
0行 无命中
1行 帷幄
1行 汉武立帐
1行 帷幄
~10行 九旗、旗帜等
~6行 建旌、结旌等
1行 旗斾
0行 无命中

第三步:sed -n 提取上下文

对第二步筛选出的关键行号,使用 sed -n 'N-2,N+2p' 提取前后各2行上下文,共提取约30段原文。

第四步:噪音过滤

本书为青铜器图录,存在大量服饰词被挪用于器物描述的情况,严格过滤如下:

噪音词 噪音含义 过滤量
"篆带""雷带""星带"=钟鼎纹带 ~80行全部过滤
"两耳有珥"=器耳装饰 ~30行全部过滤
"连环""圈环"=器物提环 ~60行全部过滤
"携佩之器"=随身携带工具 1行过滤
"布以细纹""分布"=排列义 ~10行过滤
"萦丝""盘丝"=纹饰细如丝 5行过滤
"处尊履贵"=动词"居"义 3行过滤
"杖屦"=敬老之具 2行过滤

过滤后保留有效条目27条。

第五步:输出三份MD

文件 大小 说明
重修宣和博古图_总结.md ~4KB 六大主题归纳总结
重修宣和博古图_原文提取.md ~6KB 27条原文逐条收录
重修宣和博古图_日志.md 本文件 处理流程完整记录

噪音率分析

特别说明

  1. 本书非服饰专书,服饰内容全部为器物考释中的旁涉引述,无系统论述。
  2. 保留的"旗旌"内容虽属仪仗而非狭义服饰,但九旗制度与冠服制度同属礼制等级体系,且有旂旗斿数等差与冠服等级对应关系,故予保留。
  3. "帛女"条涉及宫中缯帛管理之职,虽篇幅极短,但对了解周代宫廷纺织职官有参考价值,故予保留。
  4. 未发现以下关键词的有效命中:裳、袍、裘、褐、巾、绅、袂、裾、襟、裙、幅、绮、罗、纱、绢、锦、练、絮、绸、缎、绫、纨、绡、绶、绂、鹖、帻、纛。这与本书为青铜器图录的性质一致——器物考释涉及冕服章纹、旗旌等级,但极少涉及日常衣物及丝织品种。