《四书管窥》服饰提取日志

基本信息

项目内容
输入文件/home/z/my-project/upload/四书/四书管窥.txt
文件规模1,299行,514,505字节(约502KB)
输出目录/home/z/my-project/upload/四书output/四书管窥/
处理时间2026-03-05

8轮grep执行记录

第1轮:衣裳裘冠冕弁巾帻帽

命令grep -n [衣裳裘冠冕弁巾帻帽] 四书管窥.txt

命中行数:20行

有效服饰条目

噪音过滤:行516、行898的"冠"为动词用法,排除。

第2轮:服袍衫裙裤褐襦袂裾

命令grep -n [服袍衫裙裤褐襦袂裾] 四书管窥.txt

命中行数:大量("服"字在经学文本中极高频)

有效服饰条目

噪音过滤:"服"在经学文本中大量出现为"从事""铭记""服事"等动词用法,需逐条甄别。行345(犁服耕)、行431(以服事殷)、行616(服刑)、行693(服刑)、行1108(服膺)等均排除。

第3轮:佩饰带绶笏鱼袋玉

命令grep -n [佩饰带绶笏鱼袋玉] 四书管窥.txt

命中行数:大量("玉"字比喻用法极多)

有效服饰条目

噪音过滤:"玉"在经学文本中大量用作比喻(雕琢玉、珉中玉表、衒玉等),行110、219、407、471-472、563、686、832等均排除。"鱼"多为"鱼梁""鱼我所欲"等非服饰用法。"带"多为"带领"义非腰带。

第4轮:丝帛绢锦绮绫罗缎绸缂

命令grep -n [丝帛绢锦绮绫罗缎绸缂] 四书管窥.txt

命中行数:4行

有效服饰条目

说明:本书为元人经学著作,先秦丝织品术语(绢、锦、绮、绫、罗、缎、绸、缂)在其讨论四书的语境中极少出现。仅有的"帛"均为"币帛""玉帛"(礼仪用丝织品)。

第5轮:麻葛布绵裘褐毡

命令grep -n [麻葛布绵裘褐毡] 四书管窥.txt

命中行数:中等

有效服饰条目

噪音过滤:"布"大量出现为"布帛""布政"等非服饰用法。行513"明衣布"已归入第1轮。"绵"在行492为日常穿着场景。

第6轮:舄履屦靴鞋

命令grep -n [舄履屦靴鞋] 四书管窥.txt

命中行数:0

说明:本书完全不涉及鞋履类内容。四书文本中鞋履词汇本就极少,加之本书为辨正体而非注释体,更无讨论。

第7轮:染青赤朱黄白黑玄紫

命令grep -n [染青赤朱黄白黑玄紫] 四书管窥.txt

命中行数:极大量

有效服饰条目:无独立服饰条目

说明:颜色词在经学辨正文本中无处不在,但几乎全部为哲学概念(赤子=婴儿、玄=深远、白=明白、紫=夺朱等),无专门讨论服色制度者。行453"赤黻"已在第1轮覆盖。

第8轮:旌旗旂盖帷帐幕

命令grep -n [旌旗旂盖帷帐幕] 四书管窥.txt

命中行数:0

说明:本书不涉及旌旗帷帐等仪仗服饰内容。


噪音过滤统计

轮次原始命中行有效服饰行噪音率
第1轮201620%
第2轮大量5(新增)>90%
第3轮大量5(新增2)>95%
第4轮40(新增)100%
第5轮中等2(新增1)~80%
第6轮00N/A
第7轮极大量0~100%
第8轮00N/A

总计有效服饰条目:19条(去重后)


关键发现

  1. 服饰内容极少:全书1,299行中仅19条有效服饰内容,占比约1.5%。
  2. 以礼服为核心:19条中12条涉及礼制性服饰,日常服饰、民间服饰几乎为零。
  3. "服"字噪音率最高:经学文本中"服"大量用作动词(从事、践行),需逐条人工甄别。
  4. 颜色词完全无用:第7轮颜色词命中极多但100%为哲学概念,无一涉及服色制度。
  5. 鞋履、旌旗为零:第6、8轮完全无命中,反映本书性质为经学辨正而非制度考述。
  6. 核心讨论集中在3处:黻冕(行453-454)、絺绤(行505-506)、丧服(行631),此三处为本书服饰论述的精华所在。

处理流程

  1. ✅ 创建输出目录
  2. ✅ 检查输入文件(1,299行/514KB)
  3. ✅ 执行8轮grep关键词搜索
  4. ✅ 噪音过滤与有效条目甄别
  5. ✅ 读取关键行上下文(Read工具验证)
  6. ✅ 撰写原文提取.md(19条,带行号与加粗关键词)
  7. ✅ 撰写总结.md(9大类结构化综述+对抗式审查)
  8. ✅ 撰写本日志
  9. ⏳ 校验三份MD文件大小