《辽海丛书附录》服饰提取操作日志
处理日期:2026-03-04 输入文件:/home/z/my-project/upload/part4/辽海丛书附录.txt 输出目录:/home/z/my-project/upload/4笔记output/辽海丛书附录/ 词库:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
一、文件基本信息
| 项目 | 数值 |
|---|---|
| 文件大小 | 60,122 字节 |
| 总行数 | 217 行 |
| 平均行长 | ~277 字符/行 |
| 文件结构 | 缘起→凡例→辽东志卷一→辽东志序→白石道人歌曲卷一→白石道人歌曲卷二 |
策略:文件60KB,属中型TXT,可直接用rg逐行grep定位,无需分段加载。
二、检索执行记录
第1轮:核心服饰词全搜
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣'
命中行数:约20行(去重后),含大量误命中需过滤。
误命中过滤:
| 行号 | 关键词 | 原文片段 | 误命中类型 | 处理 |
|---|---|---|---|---|
| L4 | 黻 | "金毓黻辑" | 人名用字 | 排除 |
| L12 | 冠 | "独出冠时" | "冠"=超越义 | 排除 |
| L27 | 冠 | "既冠以图" | "冠"=前置/加于前 | 排除 |
| L41 | 衣 | "一戎衣而却契丹" | "戎衣"代指战争 | 保留(含戎服概念) |
| L74 | 衣 | "丰衣美食养士" | "衣"=生活义 | 排除 |
| L86 | 佩 | "引佩刀刺妻" | "佩"=佩戴武器 | 排除 |
第2轮:制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠'
新增命中: - L41: "僭伪"(僭越称帝) - L77: "僭帝号""僭伪位"(僭越制度)
第3轮:组合扩展词
bash
rg -n '衮冕|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛'
新增命中: - L59: "服衮冕即皇帝位" - L99: "奉衮冕玉辂"
三、提取统计
| 类别 | 命中条数 | 保留条数 | 排除条数 |
|---|---|---|---|
| 首服 | 4 | 4 | 0 |
| 体服/礼服 | 14 | 12 | 2 |
| 下服 | 0 | 0 | 0 |
| 足服 | 1 | 1 | 0 |
| 腰带 | 1 | 1 | 0 |
| 佩饰 | 3 | 3 | 0 |
| 衣料 | 7 | 5 | 2 |
| 仪仗 | 2 | 2 | 0 |
| 制度动作 | 3 | 3 | 0 |
| 合计 | 35 | 31 | 4 |
四、操作时间线
| 时间 | 操作 | 耗时 |
|---|---|---|
| T+0 | 读取词库文件 | <1s |
| T+1 | 检查TXT文件大小与结构 | <1s |
| T+2 | 创建输出目录 | <1s |
| T+3 | 第1轮核心词grep | <1s |
| T+4 | 第2轮制度动作词grep | <1s |
| T+5 | 第3轮组合扩展词grep | <1s |
| T+6 | 逐条审查过滤误命中 | ~5min |
| T+7 | 撰写总结MD | ~3min |
| T+8 | 撰写本日志 | ~2min |
| T+9 | 撰写原文提取MD | ~3min |
| T+10 | 对抗式学术审查 | ~3min |
五、特殊说明
-
文件性质:本书为丛书附录,主体内容为姜夔《白石道人歌曲》之疏证,大量引用《宋史》本纪原文,服饰信息实际来源于《宋史》而非本书原创。
-
辽海地方性缺失:虽名"辽海丛书",但服饰内容均与中原王朝(宋)相关,无辽东/辽海地区服饰特色记录。
-
词库覆盖度:核心词+制度动作词已覆盖本书所有服饰内容,组合扩展词仅新增2条(衮冕),未出现蚕桑纺织、折帛和买等经济制度类内容。
-
曲谱符号干扰:姜夔曲辞中夹杂大量音律符号(如"黄清太清黄清""折字"等),需注意区分与服饰无关。