《后山诗话》服饰提取操作日志


基本信息

项目 内容
书名 后山诗话
作者 [宋] 陈师道
输入文件 /home/z/my-project/upload/诗话/诗话/后山诗话.txt
输出目录 /home/z/my-project/upload/诗话output/后山诗话/
全文行数 175行
产出文件 后山诗话_总结.md、后山诗话_日志.md、后山诗话_原文提取.md

操作流程

第一步:关键词grep搜索

使用ripgrep对全部49个服饰关键词逐字搜索,命中的关键词及行号如下:

关键词 命中行号
35, 63, 65, 69, 125, 133
51, 63, 69
7, 17, 35, 77, 113, 151, 169
35
5, 31, 65
31
37
7, 149
149
31
133
25, 75
51
65
133
133
133

未命中关键词(34个):裘、佩、带、袍、褐、袂、衿、领、履、舄、笏、帔、襦、衮、锦、帛、绢、绫、缎、绸、绮、葛、麻、毡、绣、织、舆服、冠服、章服、服色、品服、朝服、祭服、丧服、常服、簪、钗、珰、玦、环、绶、鱼袋、幞头、靴、袜

第二步:上下文提取

对每个命中行提取完整段落上下文,确认语义环境。

第三步:筛选有效服饰片段

经逐条审查,从原始命中中识别出12处有效服饰片段,分布在第7、17、31、35、37、63、65、69、125、133、149、169行。

第四步:对抗式审查(排除误报)

行号 关键词 原文片段 排除理由
5 “铉内不服” “服”为”服从”义,非服饰
31 “服金石药”“服硫黄” “服”为”服用”义,非服饰
51 “黄裳” 人名(黄裳,字勉仲),非服饰名词
51 “使布何所道” “布”为”陈述”义,非布料
77 “李冠” 人名(李冠,齐人词家),非冠帽
77 “冠军侯” 爵号(冠军侯),非冠帽
113 “冠军侯” 同上,爵号
25 “游丝白日静” “游丝”指蛛丝飘絮,非丝织品
75 “微闻丝声” “丝声”指弦乐声,非丝织品
151 “入冠” “入冠”为”入寇”异写,非冠帽

共排除10条误报。

第五步:产出三份MD


统计摘要