《义门读书记》服饰内容提取日志

基本信息

搜索策略

第一轮:广域关键词扫描

使用以下关键词组进行初步定位:

类别 关键词 匹配行数
头部服饰 冠、冕、弁、帻、巾、帽、幞头 101行
身体服饰 衣、裳、袍、袂、袖、襟、裾、袴、裙、襦、褐、裘、蓑 158行
佩饰绶带 佩、绶、带、绅、鞶、囊、印绶 133行
足部服饰 履、屦、屐、鞋、袜、靴、舄 30行
首饰 簪、笄、钗、步摇、梳、钿、珥、珠、环、钏、镯、瑱、充耳 66行

合计匹配行数:488行(含大量非服饰用法的误匹配)

第二轮:精确复合词筛选

使用复合关键词缩小范围: - 冠冕类:冠带、衣履、皮弁、通天冠、长冠、武冠、麻冕、免冠、頍弁、缨弁、冠礼、加冠 - 衣裳类:朝聘祭服、礼服、常服、丧服、戎服、深衣、裼裘、裼袭、皮弁素服、黄衣、紫衣、衣褐、緼袍、衣裘、冠带衣履 - 佩饰类:印绶、紫绶、黄绶、绶囊、玉佩、珥貂、簪缨 - 足部类:脱舄、青鞵布袜、靴、屦

第三轮:逐行人工甄别

对第二轮筛选出的约70行进行逐行阅读,排除以下类型: 1. 非服饰用法:如"冠于首"(置于首位)、"冠绝"(超越)、"衣裳觉冷"(衣裳感觉冷—非服饰讨论)、"布衣"(指平民身份而非服饰)、"缙绅"(指士大夫阶层)、"环"(环绕义) 2. 文学修饰:纯文学描写无考据价值者(如"颠倒着衣裳"仅言诗体用三百篇体) 3. 重复条目:同一服饰内容在不同行出现时合并

最终有效条目:40条

提取过程

步骤 操作 说明
1 wc -l 确认总行数13,378行,文件1.5MB
2 rg -n 多组关键词 广域扫描,获得488行初始匹配
3 rg -n 复合词 精确筛选,缩小至约70行
4 sed -n 提取 逐行提取关键行原文内容
5 逐行甄别 排除非服饰用法,保留40条有效条目
6 分类整理 按冠冕、衣裳、佩饰、足部、首饰五类归纳
7 生成三篇MD 总结、日志、原文提取

排除条目说明(典型示例)

行号 原文片段 排除理由
231 诸侯皮弁聴朔于太庙 保留,涉及皮弁朝服制度
339 冠以孔子之言 排除:"冠"作"置于首位"义
390 一句冠于首 排除:"冠"作动词"置于前"义
1317 堕冠履之义 保留,涉及冠履之义的礼制讨论
2284 冠带衣履天下 保留,重要服饰产业史料
3067 不冠以穆宗 排除:"冠"作"加于前"义
4256 弱冠 排除:仅指年龄二十,非服饰讨论
5431 刺史二字当作别驾缘上苏弁之文传冩致误 排除:与服饰无关
5506 辨鹖冠子 排除:书名,非冠制
5633 好聚书 排除:无关
9193 元冕无丑士 保留,涉及冕服品第
9945 籁发而衣裳觉冷 排除:文学描写非服饰讨论
11413 颠倒着衣裳 排除:文学修辞,仅注"用三百篇体于律诗中"
11606 地僻懒衣裳 排除:文学描写
11811 白衣送酒 排除:用典非服饰
12314 裘马之徒 保留,"裘马"反映服饰与身份
12623 秋风洒衣裳 排除:文学描写

输出文件清单

文件名 说明
义门读书记_总结.md 服饰内容分类总结与分析
义门读书记_日志.md 本文件,处理过程记录
义门读书记_原文提取.md 40条有效原文提取