《殷芸小说》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《殷芸小说》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/殷芸小说.txt


Step 1: 文件基本信息

```bash wc -l -c /home/z/my-project/upload/part3/殷芸小说.txt

结果:389行,51408字节(约51KB)

文件性质:南朝梁殷芸编纂笔记小说集,分十卷

```


Step 2: 第1轮 grep — 核心服饰词

bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' "/home/z/my-project/upload/part3/殷芸小说.txt"

命中行号:L41, L50, L58, L60, L62, L95, L98, L108, L116, L120, L122, L125, L131, L139, L141, L160, L178, L184, L206, L214, L220, L226, L230, L234, L258, L260, L268, L272, L286, L296, L335, L362, L381, L389

合计命中行数:34行


Step 3: 第2轮 grep — 制度动作词

bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' "/home/z/my-project/upload/part3/殷芸小说.txt"

结果:0条命中。笔记小说无服饰制度相关内容,符合预期。


Step 4: 第3轮 grep — 组合扩展词

bash rg -n '蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' "/home/z/my-project/upload/part3/殷芸小说.txt"

命中:L125(采桑、丝将系蚁)、L226(织成靴)、L312(桑树煮龟)

评估:L125"采桑"与"丝"关联但非服饰语境(解谜故事),L312"桑"为薪柴用途,均不作为服饰条目。L226"织成靴"已在第1轮覆盖。


Step 5: 逐条审查与排除

行号 关键词 语境 判定
L41 "丁绶"为人名(巧工) 排除
L50 "玉簪搔头",首饰 保留
L58 裘、履 "青羔裘、紫丝履",赐服 保留
L60 "手巾角""葛巾",首服 保留
L62 "珠襦玉匣",丧葬服饰 保留
L95 裙、衫 "单绢裙衫",体服 保留
L98 "白袷黄练单衣",鬼神着装 保留
L108 "伐树制屐",足服 保留
L116 "纳履拔剑",足服 保留
L120 衣裳 "衣裳既造",丧服语境 保留
L122 丝、绢、帛、染 "丝绢→帛→染皂",衣料与染色 保留
L125 "丝将系蚁",工具用途 排除
L131 裳、衣裳 "唾吾裳""颠倒我衣裳",民谣 保留
L139 "驾服弩骀",驾驭义 排除
L139 "引领",动词引颈义 排除
L141 衮、绫 "被龙服衮""绀绫",礼服+衣料 保留
L141 "丝竹",乐器代称 排除
L160 锦、绣 "锦绣",衣料比喻 保留
L178 "引领望之",动词 排除
L184 "牛衣",特殊覆盖物 保留
L206 "布衣雄世",平民代称 保留
L214 "帻责之子",首服标识 保留
L220 "黄绢幼妇",字谜 排除
L226 锦、裘、绢、罗、靴、鞍、辔 赐物清单 保留
L230 衣服、绢、绵 赐物清单 保留
L234 冠、冕 "南州冠冕",代称 保留
L258 "敛襟",礼仪动作 保留
L260 "半英雄",非"半臂" 排除
L268 "着履登缘",足服 保留
L272 "着屐声",足服(鬼) 保留
L286 衣、帻 "白单衣,平上帻",鬼着装 保留
L296 "葛巾",首服 保留
L335 "披羽衣",仙人装束 保留
L362 衣服 "取济衣服",日常 保留
L381 "葛巾修刺",鬼着装 保留
L389 衣服 "容貌衣服",梦境 保留

统计:第1轮命中34行 → 排除7条误命中 → 有效27行 → 整合为23条独立条目


Step 6: 上下文提取

对有效命中行,使用 sed -n 提取前后各2-5行上下文:

bash sed -n '48,52p' # L50 玉簪 sed -n '56,64p' # L58-L62 赐服+葛巾+珠襦 sed -n '93,102p' # L95-L98 裙衫+单衣 sed -n '106,112p' # L108 制屐 sed -n '114,120p' # L116 纳履 sed -n '118,126p' # L120-L122 衣裳+丝绢帛 sed -n '129,143p' # L131-L141 民谣+书信 sed -n '158,162p' # L160 锦绣 sed -n '182,186p' # L184 牛衣 sed -n '204,208p' # L206 布衣 sed -n '212,216p' # L214 帻 sed -n '224,232p' # L226-L230 赐物清单 sed -n '232,236p' # L234 冠冕 sed -n '256,262p' # L258 敛襟 sed -n '266,274p' # L268-L272 履+屐 sed -n '284,288p' # L286 白单衣帻 sed -n '294,298p' # L296 葛巾 sed -n '333,337p' # L335 羽衣 sed -n '360,364p' # L362 衣服 sed -n '379,389p' # L381-L389 葛巾+衣服


Step 7: 分类整理

按8类整理: 1. 首饰(1条) 2. 赐服与赠物(3条) 3. 首服-巾帻(5条) 4. 体服(11条) 5. 足服(5条) 6. 衣料与染色(2条) 7. 礼仪与冠服代称(2条) 8. 特殊-牛衣(1条)


Step 8: 产出文件

文件 说明
殷芸小说_总结.md 含分类整理+对抗式学术审查
殷芸小说_日志.md 本文件,含grep命令与统计
殷芸小说_原文提取.md 带行号的原始片段

操作流程轨迹

文件确认(389行/51KB) → 第1轮grep(34行命中) → 第2轮grep(0行) → 第3轮grep(3行,无新增) → 逐条审查(排除7条) → sed上下文提取(27行) → 分类整理(8类23条) → 产出3份MD

审核结果