《姑妄言》服饰内容整理 · 对话记录
时间:2026-04-20 任务:提取《姑妄言》TXT文件服饰相关内容,整理分类总结 文件:/home/z/my-project/upload/part2/姑妄言.txt(约3MB,3390行)
操作流程
Step 1: 读取参考模板
读取3个参考MD文件:
- /home/z/my-project/upload/参考/总结.md → 《吕氏春秋》格式,分类综述+学术审查
- /home/z/my-project/upload/参考/日志.md → 《晋会要》操作日志格式
- /home/z/my-project/upload/参考/原文提取.md → 《天工开物》原文提取格式
Step 2: 创建输出目录
mkdir -p /home/z/my-project/upload/2小说output/姑妄言/
Step 3: 第1轮grep——基础服饰词
grep -n '衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜' 姑妄言.txt
→ 858行匹配(大量为小说叙事中的"衣""服"等泛用词,需二次筛选)
Step 4: 第2轮grep——丝织品词
grep -n '锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素|丝|绸' 姑妄言.txt
→ 513行匹配("素""丝"等泛用词占大量,需人工过滤)
Step 5: 第3轮grep——等级服色词
grep -n '舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯' 姑妄言.txt
→ 仅4行匹配,其中有效1行:L602"丧服易之以青"
Step 6: 第4轮grep——配饰词
grep -n '笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛' 姑妄言.txt
→ 59行匹配("簪"字最多,"金簪"为核心)
Step 7: 第5轮grep——纺织材料词
grep -n '绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻' 姑妄言.txt
→ 324行匹配(泛用词"布""织""绣"需过滤)
Step 8: 针对性二次grep
发现前5轮结果量大但有效比例低,遂针对小说特点做精准搜索:
grep -n '衮冕|衮龙袍|冲天冠|峨冠博带|金冠黼黻|红袍乌帽|竹冠布氅|麻履丝绦|绿袍|纱帽|幞头|金莲|珠冠|斗笠' 姑妄言.txt
→ 约30行,高命中率
grep -n '绿头巾|直裰|睡鞋|荆钗|裙布|金簪|金镯|金坠|汗巾|绉纱|缎子' 姑妄言.txt
→ 约50行,核心女性服饰描写
grep -n '苗人|龙家|猡猡|木邦|衣尚白|毡衫|文身|象镯|铜铃|缨络|海肥|髻簪' 姑妄言.txt
→ 约30行,西南少数民族服饰集中段落
Step 9: sed提取原文
sed -n '595,640p' 姑妄言.txt → 西南苗疆服饰大段(约46行)
其余关键行已在grep输出中包含上下文
Step 10: 筛选与分类
有效服饰片段约80处,按8大类整理: 1. 官服与礼服(9处) 2. 明代社会等级服饰(6处) 3. 女性日常服饰(9处) 4. 贫富服饰对比(5处) 5. 西南少数民族服饰(14处) 6. 道士与宗教服饰(3处) 7. 配饰与随身物品(7处) 8. 纺织面料(3处合计若干条目)
关键发现
- 乐户绿头巾制度(L136):书中明注"洪武钦定,乐户裹绿头巾,挚红布腰带,连毛猪皮靴",为明代贱籍服饰制度的珍贵小说旁证
- 西南苗疆服饰志(L595-638):约40余行集中记述苗、瑶、猡猡、龙家、八番等十余种少数民族服饰,堪称一篇小型民族服饰志,在明清小说中极为罕见
- 缠足与睡鞋文化:多处描写"金莲三寸""大红睡鞋"等,缠足鞋饰描写细腻
- 贫富服饰对比:以"裙布荆钗"对"穿绸着缎"反复对比,反映明代服饰等级观念
- 官服体系:纱帽、圆领、补服、直裰等明代官服元素出现,但均为叙事性提及,非制度性记述
- 苗锦与花线(L635):记载苗锦织造工艺"大似苎""藻彩云霞",为少数民族纺织史的文学记录
关键踩坑记录
- 此书为情色小说,大量"衣""裤""裙"出现在性描写中,需区分"服饰描写"与"脱衣叙事"
- "布""丝""绣"等泛用词匹配量大(合计近1700行),但有效服饰描写不足5%,二次筛选极耗精力
- 第3轮"等级服色词"几乎无命中,因为此书为世情小说而非制度文献
- 苗疆服饰段落(L595-638)体量巨大且高度集中,不同于全书其他散见服饰描写,疑为作者抄录地方志材料
- "绿头巾"在小说中有多重含义:既指洪武制度(L136),也喻指戴绿帽子(L970、L1063),需区分
审核结果
全部通过 ✅ - 原文均从TXT文件grep+sed提取,有明确行号对应 - 排除了性描写中"脱衣/穿衣"的叙事性片段,仅保留有服饰描写价值的段落 - 苗疆服饰段因体量大且为抄录性质,做了适当节选而非全文录入 - 三篇MD每篇不超20KB