伸蒙子
《伸蒙子》服饰内容提取日志
操作流程
步骤1:Grep关键词检索
第一轮:衣、裳、冠、冕、服、袍、裘
134: ……呜呼服玩之器重于千金也忽壊则弃粪壤焉稗草之丛蔓于茸兰也忽食则同糓粟焉
命中1行。其中"服"属"服玩之器",指器用玩物,非服饰义。→ 判定为噪声
第二轮:佩、弁、帻、笏、舄、履、带、旒
(无命中)
第三轮:帛、锦、绫、罗、缎、绸、绢、丝
125: 丝虫常丝也绊人之身孰曰喜邪枭鸟常舌也鸣人之面孰曰怪邪……
140: ……条其吏非劝民之农桑邪农桑未必由吏劝也而先夺民之粟帛焉……
命中2行。→ 判定均为有效片段
第四轮:褐、布、深衣、章服、冠服、舆服、丧服、祭服、赐服、品色、朝服
27: ……布防墨岂不易于运斧斤之劳乎矧绳墨误犹可移斤斧误其可移哉……
命中1行。其中"布"为动词"布置",布防墨=布置绳墨线,非布料。→ 判定为噪声
第五轮:婚冠、加元服、衮服、黼黻、文绣、织、染
91: ……染顔闵之行而至丧亡乎……
命中1行。其中"染"为隐喻"沾染、污染品行",非纺织染工艺。→ 判定为噪声
步骤2:Sed上下文提取
对5条命中行均执行 sed -n 'N±5p' 提取上下文,确认语义环境。
步骤3:去噪判定
| 行号 | 关键词 | 上下文语义 | 判定 |
|---|---|---|---|
| 134 | 服 | 服玩之器=器用玩物 | ❌噪声 |
| 125 | 丝 | 丝虫=蚕,丝=蚕丝 | ✅有效(隐喻) |
| 140 | 帛 | 粟帛=粮与丝织品 | ✅有效(赋税语境) |
| 27 | 布 | 布防墨=布置墨线 | ❌噪声 |
| 91 | 染 | 染行=沾染品行 | ❌噪声 |
步骤4:分类
有效片段2条,均归入 纺织材料 类别:
| 行号 | 篇目 | 关键词 | 分类 | 语境 |
|---|---|---|---|---|
| 125 | 《讥惑》 | 丝 | 纺织材料 | 隐喻:丝虫吐丝绊人 |
| 140 | 《讽失》 | 帛 | 纺织材料 | 赋税:夺民粟帛 |
步骤5:产出文件
- [x] 伸蒙子_总结.md
- [x] 伸蒙子_日志.md
- [x] 伸蒙子_原文提取.md
统计汇总
| 指标 | 数值 |
|---|---|
| 全书总行数 | 156 |
| 关键词命中行数 | 5 |
| 噪声行数 | 3 |
| 有效片段数 | 2 |
| 有效分类数 | 1(纺织材料) |
| 最终结论 | 本书服饰内容极少 |