《辽海丛书附录》服饰提取操作日志

处理日期:2026-03-04 输入文件:/home/z/my-project/upload/part4/辽海丛书附录.txt 输出目录:/home/z/my-project/upload/4笔记output/辽海丛书附录/ 词库:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md


一、文件基本信息

项目 数值
文件大小 60,122 字节
总行数 217 行
平均行长 ~277 字符/行
文件结构 缘起→凡例→辽东志卷一→辽东志序→白石道人歌曲卷一→白石道人歌曲卷二

策略:文件60KB,属中型TXT,可直接用rg逐行grep定位,无需分段加载。


二、检索执行记录

第1轮:核心服饰词全搜

bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣'

命中行数:约20行(去重后),含大量误命中需过滤。

误命中过滤

行号 关键词 原文片段 误命中类型 处理
L4 "金毓黻辑" 人名用字 排除
L12 "独出冠时" "冠"=超越义 排除
L27 "既冠以图" "冠"=前置/加于前 排除
L41 "一戎衣而却契丹" "戎衣"代指战争 保留(含戎服概念)
L74 "丰衣美食养士" "衣"=生活义 排除
L86 "引佩刀刺妻" "佩"=佩戴武器 排除

第2轮:制度动作词

bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'

新增命中: - L41: "僭伪"(僭越称帝) - L77: "僭帝号""僭伪位"(僭越制度)

第3轮:组合扩展词

bash rg -n '衮冕|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛'

新增命中: - L59: "服衮冕即皇帝位" - L99: "奉衮冕玉辂"


三、提取统计

类别 命中条数 保留条数 排除条数
首服 4 4 0
体服/礼服 14 12 2
下服 0 0 0
足服 1 1 0
腰带 1 1 0
佩饰 3 3 0
衣料 7 5 2
仪仗 2 2 0
制度动作 3 3 0
合计 35 31 4

四、操作时间线

时间 操作 耗时
T+0 读取词库文件 <1s
T+1 检查TXT文件大小与结构 <1s
T+2 创建输出目录 <1s
T+3 第1轮核心词grep <1s
T+4 第2轮制度动作词grep <1s
T+5 第3轮组合扩展词grep <1s
T+6 逐条审查过滤误命中 ~5min
T+7 撰写总结MD ~3min
T+8 撰写本日志 ~2min
T+9 撰写原文提取MD ~3min
T+10 对抗式学术审查 ~3min

五、特殊说明

  1. 文件性质:本书为丛书附录,主体内容为姜夔《白石道人歌曲》之疏证,大量引用《宋史》本纪原文,服饰信息实际来源于《宋史》而非本书原创。

  2. 辽海地方性缺失:虽名"辽海丛书",但服饰内容均与中原王朝(宋)相关,无辽东/辽海地区服饰特色记录。

  3. 词库覆盖度:核心词+制度动作词已覆盖本书所有服饰内容,组合扩展词仅新增2条(衮冕),未出现蚕桑纺织、折帛和买等经济制度类内容。

  4. 曲谱符号干扰:姜夔曲辞中夹杂大量音律符号(如"黄清太清黄清""折字"等),需注意区分与服饰无关。