研究总结 日志 原文

《寿世传真》服饰整理·工作日志

任务信息

项目 内容
任务 服饰整理-寿世传真
源文件 /home/z/my-project/download/part2_extracted/医藏/寿世传真.txt
输出目录 /home/z/my-project/upload/2output/寿世传真/
文件总行数 2101行

处理流程

第一步:文件初读

第二步:服饰关键词搜索(grep -n)

第一轮搜索关键词:衣、裳、冠、帽、履、鞋、带、佩、饰、簪、钗、袍、裙、衫、袂、褐、裘、笠、袜、锦、绣、绸、缎、绢、纱、绫、罗、帛、丝、麻、葛、氅、帻、纨、襦、袴、裈

命中行号(筛选后与服饰切实相关者):

第二轮搜索关键词:着衣、寒衣、暖衣、加衣、减衣、棉衣、夹衣、单衣、冠服、衣冠、冠带、衣裳

第三轮搜索关键词:丝、茧、织、纺、绸、缎、纱、绫、罗、绮、缯、帛、绒、毡、毳

第四轮搜索关键词:薰衣、丝绵、绵衣、冠、弁、冕、巾、帻、帕、幞、幅巾

第五轮搜索关键词:求衣、短褐、衣褐、裘褐、布帛

第六轮搜索关键词:盛服

第三步:上下文提取(sed)

使用 sed -n 'Xp,Yp' 提取各命中行上下文,确认服饰相关内容:

第四步:筛选与判定

排除项(非服饰含义):

收录项:共17条,详见总结MD。

第五步:撰写输出文件

  1. 服饰整理_总结.md:分类汇总17条服饰条目
  2. 服饰整理_日志.md:本文档,记录处理流程
  3. 服饰整理_原文提取.md:原文摘录,≤20KB

处理备注