《赤水元珠》服饰内容提取日志
基本信息
- 书名:赤水元珠
- 输入文件:/home/z/my-project/download/part3/医藏/赤水元珠.txt
- 输出目录:/home/z/my-project/upload/2output/赤水元珠/
- 文件总行数:14286行
- 执行时间:2025年
操作步骤记录
Step 1:创建输出目录
mkdir -p /home/z/my-project/upload/2output/赤水元珠
✅ 成功
Step 2:多轮grep搜索服饰关键词
第1轮:衣冠鞋帽类
关键词:衣|裳|冠|帽|巾|履|鞋|裘|袍|袄|裙|裤|衿|袂|衮|冕|弁|笏
命中行数:约80行(去重后) 主要发现:
- “衣"字大量出现,但绝大多数为"硃砂为衣"(丸衣)或"每服"(服药)
- “履"多见于"不能任身履地""行履不得"(步行义,非鞋履义)
- “袍"仅见于药名"恩袍散""绿袍散”
- “裙"仅见于"鳖甲去裙酥炙"(甲裙,非衣裙)
- “巾"仅见于"手巾栉"(梳洗用具,1处)
- “冠""帽""裘""袄""衿""袂""衮""冕""弁""笏":零命中
第2轮:织物材质类
关键词:帛|绢|绸|缎|丝|麻|葛|缟|缣|绫|罗|纱|褐|毡|锦|绣
命中行数:约30行 主要发现:
- “麻"几乎全部为"麻黄""麻仁"(药名),约80处
- “帛"仅2处:绢帛(包扎用)、绢袋(盛药用)
- “纱"仅1处:纱袋(制药用)
- “锦"仅1处:色如锦斑(喻皮肤病色)
- “绸/缎/缟/缣/绫/罗/褐/毡/绣":零命中
第3轮:佩饰制度类
关键词:佩|氅|褂|袜|赐服|赐紫|赐绯|品色|舆服|章服|冠服|服色|丧服
命中行数:0行 主要发现:
- 以上关键词全部无命中
- “佩"未单独出现于服饰语境
- “袜"无命中
- 所有服饰制度词汇(赐服、品色、舆服等)均不存在
Step 3:关键行上下文提取
对初步筛选出的约25个可疑行号,使用sed -n提取前后各5-10行上下文,逐条判断是否为服饰义。
提取的行号范围:
- 行94(衣甲角→指甲,非衣)
- 行222(衣被盖覆→服饰✅)
- 行262(不欲近衣→服饰病理✅)
- 行274(欲得近衣→服饰病理✅)
- 行460(人汗沾衣→服饰✅)
- 行482(不欲去衣→服饰病理✅)
- 行700(绵衣系之→服饰✅)
- 行164(绢袋盛之→织物✅)
- 行1812(绵衣缚之→服饰✅)
- 行1845(天寒衣薄→服饰✅)
- 行1867(形不可与衣相保→服饰✅)
- 行1914(汗沾衣色→服饰✅)
- 行2123(体重不能胜衣→服饰✅)
- 行2296(着青衣→服饰✅)
- 行2485(去衣冻体/加衣衾→服饰✅)
- 行3195(绢帛顶住→织物✅)
- 行3381(衣薄衣厚→服饰✅)
- 行5185(所穿衣服→服饰✅)
- 行5187(先寒而衣→服饰养生✅)
- 行5193(绢帛→织物✅)
- 行5315(失履→鞋履✅)
- 行5395(衣缨士人→服饰✅,重要)
- 行5401(履不任穿→鞋履✅)
- 行6151(裤脚→服饰✅)
- 行6727(皂衣人→服饰✅,重要)
- 行6738(衣被尽蹇→服饰✅)
- 行7921(袵席→卧具✅)
- 行7951(汗出染衣→服饰✅)
- 行8078(寻衣摸牀→服饰病理✅)
- 行8425(弃衣而走→服饰病理✅)
- 行8578(引衣自盖→服饰✅)
- 行8599(烧裩裆→内衣✅,重要)
- 行8810(着衣絮→服饰✅)
- 行8815(循衣摸牀→服饰病理✅)
- 行8828(烧裩散/赤衣散→内衣✅)
- 行8861-8863(欲衣/不用衣→服饰病理✅)
- 行9294(衣带→服饰✅,重要)
- 行9316(绵衣→服饰✅)
- 行10210(绵衣→服饰✅)
- 行10214(绵衣裹手/手巾→服饰✅)
- 行12733(衣被盖暖→服饰✅)
- 行12867(粘拈衣被→服饰✅)
- 行13562(衣被覆之→服饰✅)
- 行13910(欲去衣→服饰✅)
Step 4:噪音过滤
排除项目(非服饰义)
| 排除内容 | 原因 | 数量 |
|---|---|---|
| 硃砂为衣/金箔为衣/白麪为衣/真土为衣 | 丸药包衣,非衣物 | ~40处 |
| 每服/温服/食后服/空心服 | 服药义,非服饰 | 数百处 |
| 麻黄/麻仁/麻子仁 | 药名,非织物 | ~80处 |
| 鳖甲去裙 | 甲边缘,非衣裙 | 2处 |
| 带下/白带 | 病名,非腰带 | ~10处 |
| 白果去衣/大蒜去衣 | 去壳膜,非脱衣 | ~5处 |
| 垣衣 | 苔藓名,非衣物 | 1处 |
| 恩袍散/绿袍散 | 药名含"袍",无服饰义 | 2处 |
| 不能任身履地/行履不得 | 履=步行,非鞋履 | ~8处 |
保留但降级项目
| 内容 | 原因 | 处理 |
|---|---|---|
| 烧裩散/裩裆 | 药方名,但"裩"确为内衣 | 保留,标注为药方 |
| 足下缓失履 | “履"有穿鞋义 | 保留 |
| 衣被(合称) | 非单一服饰名 | 保留,标注为合称 |
Step 5:撰写产出文档
产出3份MD文档:
- ✅ 赤水元珠_总结.md —— 结构化总结
- ✅ 赤水元珠_日志.md —— 本文件
- ✅ 赤水元珠_原文提取.md —— 带行号原文片段
统计摘要
| 指标 | 数值 |
|---|---|
| 文件总行数 | 14286 |
| grep命中行数(3轮合计) | ~110行 |
| 提取上下文行数 | ~60行 |
| 确认服饰义条目 | ~25条 |
| 具象服饰物品 | 15条 |
| 服饰病理关系 | 15条 |
| 独立服饰制度内容 | 0条 |
| 噪音排除率 | ~95% |