《后山诗话》服饰提取操作日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 后山诗话 |
| 作者 | [宋] 陈师道 |
| 输入文件 | /home/z/my-project/upload/诗话/诗话/后山诗话.txt |
| 输出目录 | /home/z/my-project/upload/诗话output/后山诗话/ |
| 全文行数 | 175行 |
| 产出文件 | 后山诗话_总结.md、后山诗话_日志.md、后山诗话_原文提取.md |
操作流程
第一步:关键词grep搜索
使用ripgrep对全部49个服饰关键词逐字搜索,命中的关键词及行号如下:
| 关键词 | 命中行号 |
|---|---|
| 衣 | 35, 63, 65, 69, 125, 133 |
| 裳 | 51, 63, 69 |
| 冠 | 7, 17, 35, 77, 113, 151, 169 |
| 冕 | 35 |
| 服 | 5, 31, 65 |
| 裙 | 31 |
| 袖 | 37 |
| 帽 | 7, 149 |
| 巾 | 149 |
| 罗 | 31 |
| 纱 | 133 |
| 丝 | 25, 75 |
| 布 | 51 |
| 染 | 65 |
| 裁 | 133 |
| 缝 | 133 |
| 练 | 133 |
未命中关键词(34个):裘、佩、带、袍、褐、袂、衿、领、履、舄、笏、帔、襦、衮、锦、帛、绢、绫、缎、绸、绮、葛、麻、毡、绣、织、舆服、冠服、章服、服色、品服、朝服、祭服、丧服、常服、簪、钗、珰、玦、环、绶、鱼袋、幞头、靴、袜
第二步:上下文提取
对每个命中行提取完整段落上下文,确认语义环境。
第三步:筛选有效服饰片段
经逐条审查,从原始命中中识别出12处有效服饰片段,分布在第7、17、31、35、37、63、65、69、125、133、149、169行。
第四步:对抗式审查(排除误报)
| 行号 | 关键词 | 原文片段 | 排除理由 |
|---|---|---|---|
| 5 | 服 | “铉内不服” | “服”为”服从”义,非服饰 |
| 31 | 服 | “服金石药”“服硫黄” | “服”为”服用”义,非服饰 |
| 51 | 裳 | “黄裳” | 人名(黄裳,字勉仲),非服饰名词 |
| 51 | 布 | “使布何所道” | “布”为”陈述”义,非布料 |
| 77 | 冠 | “李冠” | 人名(李冠,齐人词家),非冠帽 |
| 77 | 冠 | “冠军侯” | 爵号(冠军侯),非冠帽 |
| 113 | 冠 | “冠军侯” | 同上,爵号 |
| 25 | 丝 | “游丝白日静” | “游丝”指蛛丝飘絮,非丝织品 |
| 75 | 丝 | “微闻丝声” | “丝声”指弦乐声,非丝织品 |
| 151 | 冠 | “入冠” | “入冠”为”入寇”异写,非冠帽 |
共排除10条误报。
第五步:产出三份MD
- 后山诗话_总结.md:服饰汇编,关键词加粗,附注释表格
- 后山诗话_日志.md:本操作记录
- 后山诗话_原文提取.md:带行号原文,附排除项说明
统计摘要
- 全文总行数:175
- 关键词grep命中行数(去重):19行
- 排除误报行数:8行(部分行兼有有效与无效命中)
- 有效服饰片段数:12处
- 涉及服饰类别:冠帽(4处)、衣冠朝服(1处)、衣裳日常(5处)、裙袖舞衣(2处)、制衣工艺(1处,含多关键词)