《世说新语》服饰提取日志

执行时间:2026-03-05 输入文件:/home/z/my-project/upload/part1/世说新语.txt 输出目录:/home/z/my-project/upload/1笔记output/世说新语/ 词库版本:rysxguji fushi-keywords.md


一、文件基本信息

项目
文件名 世说新语.txt
总行数 1092
文件大小 476,410 字节(约465KB)
性质 笔记体小说(钦定四库全书本),含刘孝标注
时代跨度 汉末至东晋
结构 分36门(德行、言语、政事……),每条一事,注附条后

二、三轮grep执行记录

第1轮:核心服饰词全搜

关键词 命中行数 服饰语境行数 说明
47 28 大量"衣冠"代指士族、"布衣"代指平民,均保留
21 12 "冠军""冠绝"排除,"冠冕""加冠""冠帻"保留
12 10 "轩冕""冠冕""端冕"均含服饰义
5 5 "颠倒衣裳""褰裳""编草为裳"等
6 6 "羔裘""狐裘""鹤氅裘""裘袍"等
3 3 "裘袍""草衣缊袍"
22 9 排除"带领""地带""连带"等动词/方位义
巾/帻 5 5 "去巾帻""着帻""葛巾""岸帻""衣帻"
2 2 "风吹帽落"
8 5 排除"履行""临履"等动词义
8 8 "好屐""蜡屐""高屐""据屐""屐齿"
4 4 "韦褐""衣褐""裘褐不完""裋褐"
裈/袴/绔 4 4 "妇无裈""犊鼻裈""中道还取袴""绫罗绔褲"
2 1 "敛笏"保留,"字子笏"为人名排除
0 0 未出现
帛/绢 4 4 "帛绢制衣""赐绢一匹""遗绢百匹"
19 3 排除"罗列""星罗"等排列义,保留"罗绮""纱罗"
5 5 "锦被""锦步障""锦香囊""曳纨绣"
4 4 "穷绮丽""纱罗锦绮""清绮"
1 1 "碧绫里"
1 1 "曳纨綉"
丝/布/麻 6 "执丝妇之事""帛绢制衣""青布绔""大布""麻油""紫丝布"
3 3 "搢绅敦逼""搢绅莫不来萃""缙绅处士"
1 1 "鹤氅裘"
1 1 "单练衫"
1 1 "抽簮落发"
1 1 "钗以当笄"
首轮合计 ~313行 62有效条

第2轮:制度动作词

关键词 命中行数 服饰语境 说明
敛衽 2 2 行364"正坐敛衽"、行264"敛袵讃述"
1 1 行1026"僣拟王者"
释服 0 0
加冠 0 0
赐服/赐紫/赐绯/赐蟒/赐鱼/赏衣 0 0
逾制/违式 0 0
品色/品服/冠礼/笄礼 0 0
次轮合计 3行 3有效条

第3轮:组合扩展词

主题 命中 说明
蚕桑纺织 0 本书无蚕桑纺织内容
币帛/束帛 0
冕服体系 0
三轮合计 0行 0有效条

三、排除规则执行记录

规则 原命中数 排除数 保留数 排除理由
衣→"衣钵""衣冠"代指士族 0 保留 按规则仍含服饰信息
衣→"衣"作动词"穿" 0 保留 描述穿着行为
冠→"冠军""冠绝" 3 3 非服饰义
带→"带领""地带""连带" 13 13 动词/方位义
服→"服药""服从""服丧" 约8 8 非服饰义
罗→"罗列""星罗棋布" 16 16 排列义
佩→"敬佩""钦佩" 0 0
领→"领兵""带领" 约5 5 动词义
环→"环能""环境" 0 0
麻→"麻制"翰林诏书 0 0
帛→"帛书""帛画" 0 0
锦→地名 0 0
褐→仅色彩义 0 0

四、提取方法

  1. 按词库核心词逐词 rg -n 搜索
  2. 对每个命中行读取上下文(行号±3行),判定是否为服饰语境
  3. 按排除规则表逐条审查
  4. 对确认有效的条目按服饰类别分类
  5. 原文提取采用 sed 方式获取片段,不做整本载入

五、输出文件

文件 路径 大小
总结 /home/z/my-project/upload/1笔记output/世说新语/世说新语_总结.md 见下
日志 /home/z/my-project/upload/1笔记output/世说新语/世说新语_日志.md 本文件
原文提取 /home/z/my-project/upload/1笔记output/世说新语/世说新语_原文提取.md 见下

六、对抗式审查

审查项 结果
是否整本载入 否,使用 grep+sed 逐条提取
是否遗漏核心词 否,词库全部核心词均已搜索
排除规则是否严格执行 是,"冠绝""带领""罗列"等均排除
比喻用法是否误排 "衣冠之胄""冠盖相承"保留(含服饰信息)
"服色"是否误判 行221"服色黄"为佛经描述,非品色制度,已排除
有效条目是否注水 62条均为确实含服饰信息的原文片段
是否有无内容强行标注 无,本书服饰信息确属偏少但非为零
三份MD是否均≤20KB