《读史记十表》服饰关键词提取日志
处理信息
| 步骤 | 操作 | 结果 |
|---|---|---|
| 1 | wc -l 源文件 | 1265行 |
| 2 | mkdir -p 输出目录 | 成功创建 |
| 3 | grep -c 全量服饰关键词 | 60行命中(含大量非服饰语义) |
| 4 | grep -n 精确服饰关键词(冠带/弁/冕/朝服/丧服/绶/缟素/带剑等) | 6处有效 |
| 5 | sed -n 提取上下文 | 完成 |
| 6 | 撰写3份MD | 进行中 |
服饰关键词命中明细
全量grep(60行)→ 有效服饰语义筛选(6行)
全量grep命中的关键词包括大量非服饰用途的字符,例如:
- "衣"出现在"衣服/衣冠"之外的字词中(如"依"的偏旁等)
- "冠"多用于"冠于上"(列于首位),非指冠帽
- "带"多用于"带砺之誓"(山河带砺),非指腰带
- "黄/白/黑/青/紫"多为姓名或地名用字
- "佩/帛/锦/罗"等出现在人名或地名中
经逐一甄别,确认以下6处为有效服饰语义:
| 序号 | 行号 | 关键词 | 服饰语义 | 非服饰误判排除 |
|---|---|---|---|---|
| 1 | 433 | 带剑 | 吏佩剑制度 | — |
| 2 | 500 | 冠带 | 冠帽与腰带(文明象征) | — |
| 3 | 555 | 弁髦 | 弁冠与髦饰(冠礼遗俗) | — |
| 4 | 1097 | 绶 | 官印佩绶 | — |
| 5 | 1180 | 冠 | 以冠加号(冠字引申用法) | — |
| 6 | 1214 | 缟素 | 白色丧服 | — |
排除的非服饰语义命中示例
| 行号 | 命中词 | 实际语义 | 排除理由 |
|---|---|---|---|
| 165 | 冠 | "不冠于十二诸侯年表之前" | "冠"=置于首位,非冠帽 |
| 314 | 冠 | "冠周于上" | "冠"=列于上方,非冠帽 |
| 432 | 冠 | "冠周于上" | 同上 |
| 553 | 冠 | "冠秦于上" | 同上 |
| 659 | 冠 | "冠汉帝纪年于上" | 同上 |
| 789 | 冠/带 | "冠帝年于端"/"带砺之誓" | 冠=置首;带=山河带砺比喻 |
| 1168 | 冠 | "冠年于上" | 冠=置于年首 |
| 1172 | 带 | "汉不绝如帯" | 帯=如带之细,比喻 |
| 598 | 带 | "河山带砺之誓" | 带=山河带砺比喻 |
| 多行 | 黄/白/黑/青/紫 | 姓名地名用字 | 非服色描述 |
| 多行 | 衣 | 非独立服饰语义 | 构词偏旁或泛指 |
处理方法说明
1. 初筛:以完整服饰关键词表(含冠/冕/弁/衣/裳/袍/服/紫/绯/绿/青/黄/白/黑/佩/笏/带/绶/帛/绢/绮/绫/罗/锦等77个词)进行grep,共命中60行
2. 复审:逐行审读命中内容,区分"服饰语义"与"非服饰语义"(如冠=动词"置于首位"、带=比喻"山河带砺"、色彩字用于姓名地名等)
3. 终选:确认6处有效服饰语义,提取上下文写入原文提取文件
输出文件清单
| 文件名 | 内容 | 状态 |
|---|---|---|
| 读史记十表_总结.md | 服饰文献总结与分析 | ✓ 已写入 |
| 读史记十表_日志.md | 本文件,处理日志 | ✓ 已写入 |
| 读史记十表_原文提取.md | 服饰相关原文上下文 | 待写入 |