《陈氏香谱》服饰内容提取日志

基本信息

项目 内容
书名 陈氏香谱
输入文件 /home/z/my-project/upload/器物/器物/陈氏香谱.txt
输出目录 /home/z/my-project/upload/器物output/陈氏香谱/
处理时间 2026-03-05
总行数 1654行

操作记录

步骤1:查看总行数

wc -l /home/z/my-project/upload/器物/器物/陈氏香谱.txt
# 结果:1654行

步骤2:多轮grep -n提取服饰关键词行号

对47个服饰关键词逐一grep,命令如下:

for kw in 衣 裳 冠 带 袍 裘 褐 巾 履 屦 绅 袂 裾 襟 裙 幅 弁 冕 簪 珥 佩 环 绮 罗 纱 绢 帛 锦 绣 练 絮 布 麻 丝 绸 缎 缯 绫 纨 绡 绶 绂 黼 黻 鹖 帻 帷 帐 幄 旗 旌 旆 纛; do
  result=$(grep -n "$kw" 陈氏香谱.txt 2>/dev/null)
  if [ -n "$result" ]; then echo "=== 关键词: $kw ==="; echo "$result"; fi
done

命中关键词及行号统计

关键词 命中行数 主要行号
47行 41,111,119,161,175,183,254,264,266,286,351,427,454,528,702,799,990,1055,1059,1073,1075,1077,1080,1081,1084,1087,1093,1096,1099,1101,1104,1107,1109,1115,1118,1159,1162,1165,1167,1171,1173,1176,1179,1182,1185,1186,1196,1200,1295,1443,1451,1505,1531,1577,1578,1579,1582,1614,1618,1620,1630,1641,1643
4行 1558,1574,1620,1647
3行 1443,1534,1579
多行 41,53,94,149,586,605,624,698,761,918,946,967,968,1032,1186,1190,1297,1534,1569,1574
4行 125,327,479,734
3行 541,1451,1477,1513
3行 3,1427,1572
1行 1638
2行 1551,1618
1行 1513
多行 19,41,70,94,209,242,646,761,946,1032,1063,1064,1069,1072,1083,1086,1089,1095,1100,1106,1108,1114,1125,1161,1297,1337,1400,1401,1564,1572,1601,1607,1618,1647
5行 41,90,374,646,1297,1501,1503,1517,1638
3行 1383,1543,1546,1582
多行 19,45,86,136,270,291,292,294,307,323,343,383,392,398,401,451,457,469,472,477,482,490,493,501,503,513,600,669,777,802,818,894,905,951,1003,1038,1094,1121,1190,1192,1249,1250,1310,1337,1343,1483,1537,1577,1578,1579
4行 867,873,1072,1100,1103
9行 329,433,456,479,734,1069,1089,1095,1106,1111,1114,1190
4行 262,657,737,1250,1389
4行 1579,1630,1636,1641
1行 1534(如练凝漆,非服饰用法)
多行 222,307,407,416,677,1045,1149,1284,1308,1316,1572
多行 136,181,335,385,421,453,572,805,956,1111,1141,1189,1198
2行 222,1641
2行 222,1582
2行 1558,1647
4行 962,1543,1574,1582
多行 386,440,754,1341,1510,1511,1543,1577,1583,1641
1行 1599(旗鼓,非服饰用法)

未命中关键词

袍、裘、绅、屦、幅、弁、冕、簪、珥、帛、絮、绸、缎、缯、绫、绶、绂、黼、黻、鹖、帻、幄、旌、旆、纛

共24个关键词未命中。

步骤3:sed -n提取关键行及上下文

对命中的关键行使用sed提取前后上下文,命令示例:

sed -n '39,43p' 陈氏香谱.txt    # 行41龙脑佩衣衿
sed -n '109,112p' 陈氏香谱.txt   # 行111衣香
sed -n '117,121p' 陈氏香谱.txt   # 行119艾蒳绿衣
sed -n '159,162p' 陈氏香谱.txt   # 行161蔷薇水洒衣
sed -n '173,176p' 陈氏香谱.txt   # 行175蘼芜藏衣
sed -n '181,185p' 陈氏香谱.txt   # 行183熏衣
sed -n '252,256p' 陈氏香谱.txt   # 行254蘅芜香着衣
sed -n '262,268p' 陈氏香谱.txt   # 行264金日磾薰衣
sed -n '349,353p' 陈氏香谱.txt   # 行351熏衣法
sed -n '1081,1120p' 陈氏香谱.txt # 衣香诸方
sed -n '1157,1180p' 陈氏香谱.txt # 熏衣香诸方
sed -n '1441,1453p' 陈氏香谱.txt # 衣冠露香、华阳巾
sed -n '1503,1515p' 陈氏香谱.txt # 鹊尾香炉黄巾裙
sed -n '1549,1562p' 陈氏香谱.txt # 褋襟、雾裳
sed -n '1573,1582p' 陈氏香谱.txt # 蕙带霓裳、翠帷
sed -n '1612,1622p' 陈氏香谱.txt # 裛衣裳
sed -n '1636,1650p' 陈氏香谱.txt # 缛绣、垂袂、霓裳霞佩

步骤4:精简过滤噪音

以下行经判定为非服饰用法,已过滤:

关键词 行号 原文片段 过滤理由
125 黑褐色 描写颜色,非褐衣
327 黑褐色为度 炒制火候颜色
479 黑褐色止勿令焦 同上
734 蜜炒褐黄色 同上
1534 如练凝漆 "练"喻白绢色,修饰烟态非衣物
53 但带木颇不坚实 "带有"之意,非衣带
586 烧带性 烧制术语
624 带润 略带湿润
698 带露水摘花 连带露水
918 带青色未破未开者 带有青色
307 羯布罗香 香名,非织物
407 次布香末 铺布香末
1045 以布针从口穿到腹 工具用法
1149 细布纽净研 细布作工具
1284 以布复包裹 包装用法
1308 以密布绞取汁 过滤工具
1316 净布中绞取浓汁 同上
1572 方吐英而布叶 分布叶子
136 麻叶而方茎 叶如麻,非麻衣
181 似脂麻 植物名
335 胡麻膏 植物名
385 麻黄 药材名
421 壬癸虫 行号误,无关
453 剉如麻豆 大小比喻
572 热麻油 油料
805 麻缕系定 绑扎用
956 胡麻膏熬之 植物名
1111 捣如麻豆 大小比喻
1141 芝麻油 油料
1189 麻黄根 药材名
1198 清麻油 油料
大量 捣罗、筛罗、罗为末、罗过 筛罗(研磨过筛),非织物
1599 旗鼓严中军 旗鼓军阵,非服饰
1641 丝转 烟丝旋转,非丝织

步骤5:生成输出文件

文件名 大小 内容
陈氏香谱_总结.md ≤20KB 结构化综述、分类、原文引用、注释、学术审查、总结表
陈氏香谱_原文提取.md ≤20KB 带行号原始片段,分类分组,关键词加粗
陈氏香谱_日志.md ≤20KB 完整操作记录(本文件)

命中统计

统计项 数值
服饰关键词总数 47个
命中关键词 23个
未命中关键词 24个
grep原始命中行数 约180行(含大量噪音)
过滤后服饰相关行数 约80行
提取原文片段 92条
分类数 7类(衣香、熏衣香、佩香饰物、服饰织物、帷帐、典故服饰、诗文意象)

关键发现

  1. 《陈氏香谱》服饰内容高度集中于"香衣互动"主题,衣香方与熏衣香方合计22+种,为全书服饰核心。
  2. 织物词汇(罗、纱、绢、绮、纨、绣、锦、布、绡)主要作为香事容器或场景描写载体,非独立服饰论述。
  3. 帷帐类内容与帐中香、帐角香炉紧密结合,体现室内用香与织物陈设的关联。
  4. 典故中"衣冠露香""华阳巾鹤氅衣""黄巾裙"等为研究古代服饰与香事结合的重要史料。
  5. 24个关键词未命中(如袍、裘、绅、弁、冕、簪、珥、帛、绸、缎、绫等),反映本书以香事为主旨,服饰非独立议题。