《勇卢闲诘》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 勇卢闲诘 |
| 作者 | 〔清〕赵之谦 |
| 输入文件 | /home/z/my-project/upload/器物/器物/勇卢闲诘.txt |
| 输出目录 | /home/z/my-project/upload/器物output/勇卢闲诘/ |
| 总行数 | 57 |
| 文本性质 | 鼻烟专谱,非服饰专书 |
处理流程
第一步:总行数统计
wc -l 勇卢闲诘.txt → 57行
文件较小,共57行。
第二步:服饰关键词grep
对47个服饰关键词逐一执行 rg -n 检索:
衣|裳|冠|带|袍|裘|褐|巾|履|屦|绅|袂|裾|襟|裙|幅|弁|冕|簪|珥|佩|环|绮|罗|纱|绢|帛|锦|绣|练|絮|布|麻|丝|绸|缎|缯|绫|纨|绡|绶|绂|黼|黻|鹖|帻|帷|帐|幄|旗|旌|旆|纛
命中关键词:衣、裳、冠、带、褐、履、冕、佩、罗、帛、锦、练、布、麻、丝、旗(共16个关键词有命中)
未命中关键词:袍、裘、巾、屦、绅、袂、裾、襟、裙、幅、弁、簪、珥、环、绮、纱、绢、绣、絮、绸、缎、缯、绫、纨、绡、绶、绂、黼、黻、鹖、帻、帷、帐、幄、旌、旆、纛(共37个关键词无命中)
第三步:逐条上下文审查
对16个命中关键词逐条审查原文语境,区分有效服饰引用与噪音:
| 关键词 | 行号 | 语境 | 判定 |
|---|---|---|---|
| 衣 | 20 | "短衣数重。里为小囊" | ✅有效——服装形制 |
| 冠 | 43 | "冠裳履舃" | ✅有效——首服 |
| 裳 | 43 | "冠裳履舃" | ✅有效——下服 |
| 履 | 43 | "冠裳履舃" | ✅有效——足服 |
| 带 | 25 | "悬之带闲" | ✅有效——腰带佩饰 |
| 佩 | 55 | "以所佩答之" | ✅有效——随身佩戴 |
| 布 | 29 | "布帛铅锡皮革" | ✅有效——纺织物 |
| 帛 | 29 | "布帛铅锡皮革" | ✅有效——纺织物 |
| 褐 | 41 | "咖什伦褐色" | ❌噪音——颜色词 |
| 冕 | 46 | "唐仲冕" | ❌噪音——人名 |
| 罗 | 20/21/23/32/38 | 罗马国名/罗列/罗珍宝 | ❌噪音——非织物 |
| 锦 | 41 | "云锦石""云锦湖" | ❌噪音——地名石名 |
| 练 | 49 | "胡练溪" | ❌噪音——人名 |
| 布 | 21 | "布露辉卢" | ❌噪音——译音 |
| 麻 | 31 | "歌麻" | ❌噪音——音韵术语 |
| 丝 | 24/40/41 | "金丝熏""缠丝玛瑙" | ❌噪音——烟名/玛瑙纹 |
| 旗 | 37 | "八旗" | ❌噪音——制度名 |
第四步:过滤结果
- 有效命中:8个关键词(衣、冠、裳、履、带、佩、布、帛)
- 有效条目:5条(分布于第20、25、29、43、55行)
- 过滤噪音:9条
第五步:输出文件
| 文件 | 大小说明 |
|---|---|
| 勇卢闲诘_总结.md | 服饰内容总结分析 |
| 勇卢闲诘_原文提取.md | 服饰相关原文及噪音记录 |
| 勇卢闲诘_日志.md | 本处理日志 |
特别说明
- 本书为鼻烟专谱,服饰内容极少,5条有效记录均为旁及之笔,非专论服饰。
- "短衣数重。里为小囊。藏鼻烟壶"一条最为重要,将服饰形制与鼻烟壶携带方式关联,反映了中西器物与服饰的配合关系。
- "冠裳履舃"为古语固定搭配,在此仅用于比喻(形容其人察看客从穿戴的性格),非服饰制度论述。
- 所有提取均经grep验证,引用原文不转述,每篇输出文件≤20KB。