目 录
《义门读书记》服饰内容提取日志
基本信息
- 书名:义门读书记
- 输入文件:/home/z/my-project/upload/part1/义门读书记.txt
- 输出目录:/home/z/my-project/upload/1笔记output/义门读书记/
- 文件大小:1.5MB
- 总行数:13,378行
- 处理日期:2026-03-05
搜索策略
第一轮:广域关键词扫描
使用以下关键词组进行初步定位:
| 类别 | 关键词 | 匹配行数 |
|---|---|---|
| 头部服饰 | 冠、冕、弁、帻、巾、帽、幞头 | 101行 |
| 身体服饰 | 衣、裳、袍、袂、袖、襟、裾、袴、裙、襦、褐、裘、蓑 | 158行 |
| 佩饰绶带 | 佩、绶、带、绅、鞶、囊、印绶 | 133行 |
| 足部服饰 | 履、屦、屐、鞋、袜、靴、舄 | 30行 |
| 首饰 | 簪、笄、钗、步摇、梳、钿、珥、珠、环、钏、镯、瑱、充耳 | 66行 |
合计匹配行数:488行(含大量非服饰用法的误匹配)
第二轮:精确复合词筛选
使用复合关键词缩小范围: - 冠冕类:冠带、衣履、皮弁、通天冠、长冠、武冠、麻冕、免冠、頍弁、缨弁、冠礼、加冠 - 衣裳类:朝聘祭服、礼服、常服、丧服、戎服、深衣、裼裘、裼袭、皮弁素服、黄衣、紫衣、衣褐、緼袍、衣裘、冠带衣履 - 佩饰类:印绶、紫绶、黄绶、绶囊、玉佩、珥貂、簪缨 - 足部类:脱舄、青鞵布袜、靴、屦
第三轮:逐行人工甄别
对第二轮筛选出的约70行进行逐行阅读,排除以下类型: 1. 非服饰用法:如"冠于首"(置于首位)、"冠绝"(超越)、"衣裳觉冷"(衣裳感觉冷—非服饰讨论)、"布衣"(指平民身份而非服饰)、"缙绅"(指士大夫阶层)、"环"(环绕义) 2. 文学修饰:纯文学描写无考据价值者(如"颠倒着衣裳"仅言诗体用三百篇体) 3. 重复条目:同一服饰内容在不同行出现时合并
最终有效条目:40条
提取过程
| 步骤 | 操作 | 说明 |
|---|---|---|
| 1 | wc -l | 确认总行数13,378行,文件1.5MB |
| 2 | rg -n 多组关键词 | 广域扫描,获得488行初始匹配 |
| 3 | rg -n 复合词 | 精确筛选,缩小至约70行 |
| 4 | sed -n 提取 | 逐行提取关键行原文内容 |
| 5 | 逐行甄别 | 排除非服饰用法,保留40条有效条目 |
| 6 | 分类整理 | 按冠冕、衣裳、佩饰、足部、首饰五类归纳 |
| 7 | 生成三篇MD | 总结、日志、原文提取 |
排除条目说明(典型示例)
| 行号 | 原文片段 | 排除理由 |
|---|---|---|
| 231 | 诸侯皮弁聴朔于太庙 | 保留,涉及皮弁朝服制度 |
| 339 | 冠以孔子之言 | 排除:"冠"作"置于首位"义 |
| 390 | 一句冠于首 | 排除:"冠"作动词"置于前"义 |
| 1317 | 堕冠履之义 | 保留,涉及冠履之义的礼制讨论 |
| 2284 | 冠带衣履天下 | 保留,重要服饰产业史料 |
| 3067 | 不冠以穆宗 | 排除:"冠"作"加于前"义 |
| 4256 | 弱冠 | 排除:仅指年龄二十,非服饰讨论 |
| 5431 | 刺史二字当作别驾缘上苏弁之文传冩致误 | 排除:与服饰无关 |
| 5506 | 辨鹖冠子 | 排除:书名,非冠制 |
| 5633 | 好聚书 | 排除:无关 |
| 9193 | 元冕无丑士 | 保留,涉及冕服品第 |
| 9945 | 籁发而衣裳觉冷 | 排除:文学描写非服饰讨论 |
| 11413 | 颠倒着衣裳 | 排除:文学修辞,仅注"用三百篇体于律诗中" |
| 11606 | 地僻懒衣裳 | 排除:文学描写 |
| 11811 | 白衣送酒 | 排除:用典非服饰 |
| 12314 | 裘马之徒 | 保留,"裘马"反映服饰与身份 |
| 12623 | 秋风洒衣裳 | 排除:文学描写 |
输出文件清单
| 文件名 | 说明 |
|---|---|
| 义门读书记_总结.md | 服饰内容分类总结与分析 |
| 义门读书记_日志.md | 本文件,处理过程记录 |
| 义门读书记_原文提取.md | 40条有效原文提取 |