《皇清书史》服饰整理工作日志


基本信息

项目 内容
源文件 /home/z/my-project/upload/书法/书法/皇清书史.txt
文件规模 12116行 / 约1013KB
输出目录 /home/z/my-project/upload/书法output/皇清书史/
执行时间 2026-03-05
执行方式 rysxguji子Agent,按内置四级词库grep+sed提取

执行步骤

第一步:验证输入与创建输出目录

第二步:一级词grep提取

第三步:二级词grep提取

第四步:三级词grep提取

第五步:四级词+动词词grep提取

第六步:补充搜索——官服制度相关

第七步:合并去重与甄别

第八步:撰写三份MD

文件 内容 要求
皇清书史_原文提取.md 按类归组的原文条目,附行号 ≤20KB
皇清书史_总结.md 十类分项总结+核心结论 ≤20KB
皇清书史_日志.md 本文件,完整工作记录 ≤20KB

提取统计

关键词级别 搜索词数 初次匹配行数 去重甄别后有效条目
一级词 24 506→169 约15条
二级词 18 约120 约21条
三级词 18 约60 约8条
四级词 19 约40 约18条
动词词 13 含于四级 含于四级
补充搜索 约30 约8条
合计 约70条

甄别标准

  1. 保留:直接描述服饰穿着、赐服制度、织物材料(不论穿着/书写用途)、服饰比喻
  2. 保留但标注:布衣(社会身份而非穿着)、织物载体(书写用途而非穿着)
  3. 排除:人名中的服饰用字(如履安、裘曰修)、书名中的织物字(如珊瑚网、巾箱帖)、旗籍标识(如正红旗、镶蓝旗)

注意事项

  1. 《皇清书史》为书法史著作,服饰内容非其主旨,提取结果必然零散。
  2. 绫、绢、缣等织物词在本书中90%以上为书画载体用法,已逐条甄别。
  3. "布衣"一词出现30余次,多为身份标识,本次选取代表性条目收入。
  4. "毡裘气""兔毛褐"等已脱离服饰本义,转为书法品评术语,纳入提取但加以说明。
  5. 严禁整本载入LLM,全程采用grep逐词提取+人工甄别方式。

日志结束