交谊典朋友部 服饰整理日志

操作流程

步骤1:文件统计

步骤2:五轮关键词 grep -n

第一轮:衣裳冠冕巾帽袍衫裙裘带佩履舄靴

第二轮:服色舆服冠服章服朝服祭服丧服吉服常服公服

第三轮:丝帛绢锦绮绫罗缎绸缂丝葛麻布褐

第四轮:紫袍绯袍绿袍赐紫赐绯鱼袋笏幞头金带玉带

第五轮:旂旗章珮环玦簪钗钿翠珠玉

步骤3:紧凑匹配与统计

步骤4:语境审查(sed + Python 上下文提取)

步骤5:分类与去重

审查记录

误判排除清单

关键词 原始匹配次数 有效次数 排除原因
48 0 均为"文章""章句"义
34 0 均为比喻/人名,非玉佩/玉带
6 0 "跳珠""珠星"等比喻
6 0 "翠草""翠巘"景物
4 0 旗帜,非服饰
18 0 "丝竹""青丝"非织物
20 9 含于"布衣"者有效,其余"宣布"义
12 3 仅"锦带""缓带""服带"有效
22 10 含于复合词者有效,其余动词/人名
10 1 仅"葛衣"有效,其余地名
6 4 "纶巾""角巾""衣巾"有效
14 6 大部分为"履道""操履"等非服饰义
2 0 非环佩义
2 2 "玳簪"有效

合并去重

  1. "袭衮衣与绣裳"——L218与L419两见(任昉文重出),合并为1条
  2. "弹冠"——4处出处不同,各保留为独立条目
  3. "布衣"——9处用法各异(布衣之交、布衣之心、脱粟布衣等),各保留
  4. "屣履"——3处(崔骃、范式、谢师直),各保留
  5. "纶巾"——2处(谢安形象、隐逸词),各保留

文件大小控制

操作时间线

  1. wc -c → 249,835字节
  2. 五轮 grep -n → 34+1+27+1+35 = 98行初步命中
  3. grep -on 紧凑统计 → 91+92+133 = 316条关键词命中
  4. Python 逐行统计 → 50行有匹配
  5. Python 语境提取 → 严格73条 + 语境47条 = 120条初始
  6. 人工审查去重 → 42条有效记录
  7. 生成三个MD文件