子思子
《子思子》服饰内容提取日志
操作流程
第一步:关键词检索(grep -n)
| 轮次 | 关键词 | 命中行数 | 命中行号 |
|---|---|---|---|
| 第一轮 | 衣、裳、冠、冕、服、袍、裘 | 16行 | 14,22,49,72,76,78,80,112,133,148,152,159,171,177,196,221,238 |
| 第二轮 | 佩、弁、帻、笏、舄、履、带、旒 | 2行 | 127,240 |
| 第三轮 | 帛、锦、绫、罗、缎、绸、绢、丝 | 4行 | 112,213,238,250 |
| 第四轮 | 褐、布、深衣、章服、冠服、舆服、丧服、祭服、赐服、品色、朝服 | 6行 | 14,22,80,159,177,196 |
| 第五轮 | 婚冠、加元服、衮服、黼黻、文绣、织、染 | 0行 | — |
合计命中行数:22行(去重后)
第二步:上下文提取(sed)
对每条命中行执行 sed -n 'N-2,N+2p' 提取前后上下文,确保语义完整。
提取范围: - 第72行(±2行):祭祀盛服上下文 - 第76行(±2行):戎衣上下文 - 第78行(±2行):裳衣上下文 - 第80行(±2行):齐明盛服上下文 - 第112行(±2行):衣锦尚絅上下文 - 第127行(±2行):玦佩上下文 - 第133行(±2行):缊袍/白狐裘上下文 - 第148行(±2行):旧君反服上下文 - 第152行(±2行):服卫之衣上下文 - 第171行(±4行):闻丧而服上下文 - 第177行(±4行):丧服/吊服/吉服上下文 - 第196行(±2行):赐服/衣服之等上下文 - 第238行(±2行):锦缋纷华上下文 - 第250行(±2行):束帛上下文
第三步:去噪处理
| 行号 | 原文片段 | 命中词 | 判定 | 原因 |
|---|---|---|---|---|
| 49 | 拳拳服膺 | 服 | ❌排除 | "服膺"意为铭记于心,非服饰 |
| 221 | 莫不服先生之大名 | 服 | ❌排除 | "服"意为敬服/信服,非服饰 |
| 240 | 履其行 | 履 | ❌排除 | "履"意为践行,非鞋履 |
| 14 | 外篇丧服第六 | 丧服 | ❌排除 | 目录标题,非正文内容 |
| 22 | 丧服第六(提要中) | 丧服 | ❌排除 | 提要列举篇名 |
| 159 | 丧服第六 | 丧服 | ❌排除 | 篇名标题,非正文论述 |
| 213 | 欲报君以财帛 | 帛 | ❌排除 | "帛"为财物泛称,非服饰用帛 |
| 80 | 布在方策 | 布 | ❌排除 | "布"意为分布/记载,非布匹 |
去噪后有效片段:14条
第四步:分类
| 类别 | 条数 | 行号 |
|---|---|---|
| 丧服制度 | 5 | 148, 171, 177(x3) |
| 祭祀礼服 | 3 | 72, 78, 80 |
| 衣饰哲学 | 2 | 112, 238 |
| 日常衣着 | 2 | 133, 152 |
| 服饰品级 | 1 | 196 |
| 佩饰与馈赠 | 2 | 127, 250 |
| 军戎服饰 | 1 | 76 |
第五步:产出文件
| 文件名 | 内容 | 大小 |
|---|---|---|
| 子思子_总结.md | 分类概述、特色分析、审核结论 | <20KB |
| 子思子_日志.md | 操作流程、去噪记录、分类统计 | <20KB |
| 子思子_原文提取.md | 有效片段原文(关键词加粗) | <20KB |
第六步:质量审核
- [x] 未将整本TXT载入LLM上下文
- [x] 先grep定位,再sed提取片段
- [x] 每篇MD<20KB
- [x] 有效片段14条>3条,未触发"本书服饰内容极少"提示
- [x] 关键词已加粗
- [x] 去噪充分,无非服饰用法混入
- [x] 文件已保存至指定目录