《事林广记别集》服饰内容提取操作日志

基本信息


Step 0:文件大小检查

wc -c /home/z/my-project/upload/part1_extracted/事林广记别集.txt

结果:184499字节,未超过500KB,但仍严格执行grep先提取策略。

mkdir -p /home/z/my-project/upload/p1output/事林广记别集/

结果:输出目录创建成功。


Step 1:第一轮grep——核心词

命令

FILE="/home/z/my-project/upload/part1_extracted/事林广记别集.txt"
for word in               ; do
  count=$(grep -c "$word" "$FILE")
  echo "【${word}】匹配: ${count}行"
  grep -n "$word" "$FILE" | head -30
done

匹配结果

关键词 匹配行数 服饰相关行
22 6(典衣署、御衣局、尚衣局、妇人衣男子服、冠黄衣朱服、黑衣郎)
0 0
3 2(章佩监冠冕、冠黄衣朱服)
1 1(冠冕章服)
0 0
1 1(笠帽不许用金玉)
1 1(赐以騑袍)
1 1(窄袖衫)
1 0(裙襕为食材比喻,非服饰)
0 0
23 5(鞓带局、御带库、玉带、金带、束带)
3 2(章佩监、佩之令人不恐/御兵)
0 0
0 0
1 1(靴不得裁制花样)

小计:15个核心词中8个命中,服饰相关记录约21条。


Step 2:第二轮grep——制度词

命令

for word in 服色 舆服 冠服 章服 朝服 祭服 丧服 吉服 常服 公服; do
  count=$(grep -c "$word" "$FILE")
  echo "【${word}】匹配: ${count}行"
  grep -n "$word" "$FILE" | head -20
done

匹配结果

关键词 匹配行数 服饰相关行
服色 1 1(官民服色)
舆服 0 0
冠服 0 0
章服 1 1(冠冕章服)
朝服 0 0
祭服 0 0
丧服 1 0(主丧服为牛相术语,非服饰制度)
吉服 0 0
常服 1 0(常服快气进食,医药用语)
公服 2 2(官员公服品级、诸公服)

小计:10个制度词中4个命中,服饰相关记录4条。


Step 3:第三轮grep——材质词

命令

for word in          缂丝    ; do
  count=$(grep -c "$word" "$FILE")
  echo "【${word}】匹配: ${count}行"
  grep -n "$word" "$FILE" | head -20
done

匹配结果

关键词 匹配行数 服饰相关行
52 6(摊丝局、金丝子局、紸丝、绫罗、筭匹帛、丝为度量单位)
8 2(筭匹帛法、钱帛宝货)
9 4(聘财绢、疋里绢、纱绢片)
4 4(异样文锦局、织染纹锦局、绫锦局、弘州锦院)
2 2(纹绮局、绮源库)
3 3(绫锦局、紬绫罗、旧绫)
16 5(绣罗局、紫罗服、绯罗服、绿罗服、褐罗窄袖衫、紬绫罗)
0 0
0 0
缂丝 0 0
2 0(葛山地名、葛粉药材)
30 1(麻绳縍缚,其余均为食材/药材)
27 2(布帛衣服、稀疏狭布)
2 2(檀褐罗、茶褐罗)

小计:14个材质词中12个命中,但大量命中在饮食、医药语境中。服饰相关记录约31条(含局署名)。


Step 4:第四轮grep——品色词

命令

for word in 紫袍 绯袍 绿袍 赐紫 赐绯 鱼袋  幞头 金带 玉带; do
  count=$(grep -c "$word" "$FILE")
  echo "【${word}】匹配: ${count}行"
  grep -n "$word" "$FILE" | head -20
done

匹配结果

关键词 匹配行数 服饰相关行
紫袍 0 0
绯袍 0 0
绿袍 0 0
赐紫 0 0
赐绯 0 0
鱼袋 0 0
2 2(搢笏、执笏)
幞头 1 1(舒脚幞头)
金带 1 1(荔枝金带)
玉带 1 1(一品玉带)

小计:10个品色词中4个命中,服饰相关记录5条。注意:书中用"紫罗服/绯罗服/绿罗服"而非"紫袍/绯袍/绿袍"表述。


Step 5:第五轮grep——配饰词

命令

for word in            ; do
  count=$(grep -c "$word" "$FILE")
  echo "【${word}】匹配: ${count}行"
  grep -n "$word" "$FILE" | head -20
done

匹配结果

关键词 匹配行数 服饰相关行
0 0
1 1(龙凤旗帜)
9 1(冠冕章服)
0 0
3 1(耳环许珠玉)
0 0
0 0
1 1(金钗篦)
0 0
8 1(翠毛金钗)
6 2(耳环用金珠碧甸、首饰金珠宝玉)
9 3(玉带、玉局、器皿用金玉)

小计:12个配饰词中7个命中,服饰相关记录约10条。


Step 6:上下文提取

对命中行执行 sed -n '起始行,结束行p' 提取前后各扩5行上下文。重点提取区域:


Step 7:对抗式学术审查

对25条核心引文逐一执行grep验证,全部通过

序号 验证关键词 命中行号 结果
1 章佩监.*冠冕章服 127 ✅通过
2 诸公服文武官同 872 ✅通过
3 官民服色 874 ✅通过
4 紫罗服.绯罗服.绿罗服 872 ✅通过
5 一品玉带二品花犀带 872 ✅通过
6 荔枝金带.*乌犀角带 872 ✅通过
7 檀褐罗窄袖衫 873 ✅通过
8 幞头 873 ✅通过
9 命妇服 875 ✅通过
10 庶人男女 877 ✅通过
11 妇人衣男子服 830 ✅通过
12 典衣署 235 ✅通过
13 御衣局 244 ✅通过
14 尚衣局 251 ✅通过
15 绣罗局 247 ✅通过
16 杂用绢 838-839 ✅通过
17 搢笏 42,46 ✅通过
18 冠黄衣朱服 1922 ✅通过
19 赐以騑袍 2017 ✅通过
20 笠帽不许用金玉靴 877 ✅通过
21 绫锦局 275 ✅通过
22 纹绮局 276 ✅通过
23 鞓带斜皮局 277 ✅通过
24 御带库 340 ✅通过
25 龙凤旗帜 896 ✅通过

Step 8:分类整理与文档产出

将提取结果按服饰类别分类:
1. 官员公服品级制度
2. 官民服色制度(含命妇、庶人)
3. 车舆制度
4. 婚姻聘财织物
5. 服饰相关官署机构
6. 朝仪服饰礼节
7. 民俗禁令
8. 神话异闻
9. 织物度量

产出三篇MD文档:
- 事林广记别集_总结.md
- 事林广记别集_日志.md(本文件)
- 事林广记别集_原文提取.md


统计汇总