《三字经》服饰内容提取 · 工作日志

时间:2026-05-11 任务:提取《三字经》全部服饰相关内容


操作流程

Step 1: 文件基本信息确认

  • 命令:wc -c /home/z/my-project/upload/启蒙蒙学/三字经.txt
  • 结果:12,845字节
  • 命令:wc -l /home/z/my-project/upload/启蒙蒙学/三字经.txt
  • 结果:235行
  • 文件结构:前98行为清版,第100行起为”民国复位版”,两版并列

Step 2: grep第1轮(核心服饰词)

  • 命令:grep -n '衣\|裳\|冠\|冕\|服\|裘\|袍\|带\|佩\|履\|舄\|巾\|帻\|弁\|笏\|绶\|章\|黼\|黻\|绣\|纹' 三字经.txt
  • 匹配行数:1行
  • 匹配结果:第144行 斩齐衰 大小功 至缌麻 五服终(匹配”服”字)

Step 3: grep第2轮(材质词)

  • 命令:grep -n '丝\|帛\|绢\|锦\|绮\|绫\|罗\|缎\|绸\|麻\|葛\|布\|裘\|褐\|毡\|绒\|棉' 三字经.txt
  • 匹配行数:5行
  • 匹配结果:
  • 第25行:匏土革木石金与丝竹乃八音(匹配”丝”——乐器分类,非服饰)
  • 第94行:蚕吐丝蜂酿蜜人不学不如物(匹配”丝”——蚕丝,服饰原料相关)
  • 第137行:匏土革木石金与丝竹乃八音(匹配”丝”——同第25行,非服饰)
  • 第144行:斩齐衰大小功至缌麻五服终(匹配”麻”——丧服用材)
  • 第229行:蚕吐丝蜂酿蜜人不学不如物(匹配”丝”——同第94行)

Step 4: grep第3轮(颜色词)

  • 命令:grep -n '青\|赤\|黄\|白\|黑\|玄\|朱\|紫\|绯\|绿\|赭' 三字经.txt
  • 匹配行数:8行
  • 匹配结果:
  • 第27行:自子孙至玄曾乃九族人之伦(匹配”玄”——辈分名,非颜色,噪音
  • 第48行:考世系知终始自羲农至黄帝(匹配”黄”——黄帝名号,非颜色,噪音
  • 第119行:曰黄道日所躔曰赤道当中权(匹配”黄”“赤”——天文术语,非服饰,噪音
  • 第120行:赤道下温暖极我中华在东北(匹配”赤”——天文术语,非服饰,噪音
  • 第133行:青赤黄及白黑此五色目所识(匹配”青赤黄白黑”——五色,服饰色彩制度基础,有效
  • 第140行:身而子子而孙自子孙至玄曾(匹配”玄”——辈分名,非颜色,噪音
  • 第173行:自羲农至黄帝并顼喾在上世(匹配”黄”——黄帝名号,非颜色,噪音
  • 第207行:宋周程张朱陆明王氏皆道学(匹配”朱”——朱熹姓氏,非颜色,噪音

Step 5: grep第4轮(制度词)

  • 命令:grep -n '冠礼\|婚礼\|丧服\|祭服\|朝服\|公服\|常服\|赐服\|章服\|品色\|舆服\|车服\|服制\|冠带' 三字经.txt
  • 匹配行数:0行

Step 6: grep第5轮(配饰/动作词)

  • 命令:grep -n '簪\|钗\|珰\|珩\|璜\|琚\|充耳\|蔽膝\|大带\|革带\|鱼袋\|幞头\|赐紫\|赐绯\|借紫\|加冠\|释服\|更衣' 三字经.txt
  • 匹配行数:0行

Step 7: 上下文提取

对有效匹配行执行 sed -n 提取前后上下文: - 第133行上下文(第131-138行):五色位于五常与五味之间的知识分类序列 - 第144行上下文(第142-149行):五服位于五伦与训蒙之间的亲族-教育过渡 - 第94行上下文(第92-99行):蚕吐丝位于劝学段末尾 - 第229行上下文(第227-233行):同第94行,民国版

Step 8: 噪音过滤

从5轮grep共14条原始匹配中,过滤掉以下噪音: | 过滤项 | 行号 | 原始匹配词 | 噪音原因 | |--------|------|------------|----------| | 第25行 | 25 | 丝 | “丝竹”为八音分类(弦乐器),非服饰材质 | | 第27行 | 27 | 玄 | “玄曾”为辈分名称,非颜色 | | 第48行 | 48 | 黄 | “黄帝”为人名,非颜色 | | 第119行 | 119 | 黄、赤 | “黄道”“赤道”为天文术语,非服饰 | | 第120行 | 120 | 赤 | “赤道”为天文术语,非服饰 | | 第137行 | 137 | 丝 | 同第25行,乐器分类 | | 第140行 | 140 | 玄 | 同第27行,辈分名 | | 第173行 | 173 | 黄 | 同第48行,人名 | | 第207行 | 207 | 朱 | “朱陆”为朱熹姓氏,非颜色 |

过滤后有效匹配:3条(去重后)

Step 9: 对抗式审查

逐条验证原文存在性: - ✅ 第133行:青赤黄 及白黑 此五色 目所识 — 原文确认无误 - ✅ 第144行:斩齐衰 大小功 至缌麻 五服终 — 原文确认无误 - ✅ 第94行:蚕吐丝 蜂酿蜜 人不学 不如物 — 原文确认无误 - ✅ 第229行:蚕吐丝 蜂酿蜜 人不学 不如物 — 原文确认无误(民国版同句)


关键发现

  1. 服饰内容极度稀少:《三字经》235行中仅3条有效服饰相关内容,这与蒙学读物的性质一致
  2. 清版无直接服饰内容:清版98行中无任何直接服饰论述,”蚕吐丝”仅为比喻用法
  3. 民国版新增两条关键内容:五色(第133行)和五服(第144行)均为民国复位版新增
  4. 五服为最核心服饰条目:”斩齐衰大小功至缌麻五服终”直接涉及丧服制度,是中国服饰礼制中最系统的部分
  5. 五色为服饰色彩基础:青赤黄白黑五正色是历代品色衣、章服制度的色彩框架

审核结果

全部通过 ✅(3条有效匹配均经逐行验证,原文确认无误)