《增广贤文》服饰逐本整理日志

基本信息

  • 书名:增广贤文
  • 源文件:/home/z/my-project/upload/启蒙蒙学/增广贤文.txt
  • 全文:351行 / 16,394字节

操作记录

第一轮:文件探测

  • 命令:wc -l; wc -c
  • 结果:351行,16,394字节

第二轮:关键词grep检索(四组并行)

组别 关键词范围 命中行数 有效行
第1组 衣裳服冠冕弁帻巾帽履舄靴鞋袜裘袍衫襦裙裤褐袂领袖 2行 2行
第2组 带佩笏绶簪钗钿珰环玦璧琼佩玉衣裳冠带布衣锦绮罗纱绢帛丝缎绸绫 1行 1行
第3组 缟絺绤葛麻布绵絮衮黼黻纹绣织染色青赤黄白黑玄朱紫绿绯赭 17行 2行
第4组 龙袍章服朝服祭服丧服常服吉服戎服冕服皮弁进贤冠武冠幞头鱼袋革带大带蔽膝方心曲领霞帔凤冠顶戴花翎补服蟒袍甲铠兜鍪旒旂旗 0行 0行

第三轮:补充检索

  • 检索”着衣/无衣/衣多/布衣/衣裳/衣冠/衣禄/穿衣/更衣”→ 命中2行(225行、340行,与第1组重复)
  • 检索”缎/绸/绫/罗/纱/绢/帛/丝/锦/绮”→ 命中1行(162行,与第2组重复)
  • 检索”绣/织/染/裘/褐/袍/裙/衫”→ 命中2行(162行重复 + 295行新增)
  • 检索”麻/布/绵/絮/葛”→ 命中1行(188行新增)
  • 检索”紫/绯/朱衣/青衣/黄衣/白衣/黑衣”→ 0行
  • 检索”旗/旒/旂/铠/甲”→ 0行

第四轮:sed提取上下文

对5条有效行提取前后各2行上下文,确认语义完整。

第五轮:去噪过滤

逐一审查第3组17条色彩命中,判定15条为非服饰语境(白发、黄金、黄河、白酒、绿杨、朱门等),仅保留162行”假缎染就真红色”。

最终有效条目

序号 行号 原文 服饰关键词 分类
1 162 假缎染就真红色,也被旁人说是非 缎、染、色 面料染织
2 188 种麻得麻,种豆得豆 纺织原料
3 225 风流不用着衣多 衣、着衣 穿衣观念
4 295 绣花虽好不闻香 刺绣工艺
5 340 无衣懒出门 衣饰与社会

输出文件

文件 路径
原文提取 /home/z/my-project/upload/启蒙蒙学output/增广贤文/增广贤文_原文提取.md
总结 /home/z/my-project/upload/启蒙蒙学output/增广贤文/增广贤文_总结.md
日志 /home/z/my-project/upload/启蒙蒙学output/增广贤文/增广贤文_日志.md