《中星谱》服饰内容提取操作日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务ID | 2 |
| 书名 | 《中星谱》 |
| 输入文件 | /home/z/my-project/upload/算法/算法/中星谱.txt |
| 输出目录 | /home/z/my-project/upload/算法output/中星谱/ |
| 文件大小 | 22,765 字节 |
| 文件行数 | 503 行 |
操作记录
步骤1:文件基础信息获取
wc -l 中星谱.txt → 503 行
wc -c 中星谱.txt → 22765 字节
步骤2:10轮关键词grep检索
第1轮:衣、裳、服、冠、冕
grep -n "衣|裳|服|冠|冕" 中星谱.txt
- 命中1行:行18,含"授衣"
- 语境:引《诗经》"七月流火九月授衣",时令引用,非服饰专论
第2轮:袍、褐、裘、裙、襦
grep -n "袍|褐|裘|裙|襦" 中星谱.txt
- 0命中
第3轮:巾、帻、帽、弁、履、舄
grep -n "巾|帻|帽|弁|履|舄" 中星谱.txt
- 0命中
第4轮:丝、帛、绢、锦、绫、罗、缎、绮
grep -n "丝|帛|绢|锦|绫|罗|缎|绮" 中星谱.txt
- 命中1行:行31,含"匹帛"
- 语境:凡例中论述刻法换算时的比喻,"譬有匹帛于此"
第5轮:织、染、绣、缝、纺
grep -n "织|染|绣|缝|纺" 中星谱.txt
- 命中3行:
- 行4:含"织女"——星名"织女星"
- 行31:含"缝"——实为"合缝"之喻(同一行含"匹帛")
- 行481:含"缝"——"赤道是圆匣合缝处"
注意:行4的"织女"、行481的"合缝"在第4轮未命中,但第5轮的"织""缝"命中。行31的"缝"同指"合缝"。
第6轮:佩、带、绶、笏、袂、衿
grep -n "佩|带|绶|笏|袂|衿" 中星谱.txt
- 0命中
第7轮:舆服、章服、服色、冠服、朝服、祭服
grep -n "舆服|章服|服色|冠服|朝服|祭服" 中星谱.txt
- 0命中
第8轮:布衣、锦衣、短褐、缁、缟、素
grep -n "布衣|锦衣|短褐|缁|缟|素" 中星谱.txt
- 命中1行:行18,含"素"——"素好览厯代史",意为"一向/向来",非"素色/素服"之"素"
修正:该命中关键词"素"为副词用法,与服饰无关。
第9轮:靴、鞋、袜、幞头、簪、钗、钏
grep -n "靴|鞋|袜|幞头|簪|钗|钏" 中星谱.txt
- 0命中
第10轮:龙袍、鱼袋、玉佩、金带、翠
grep -n "龙袍|鱼袋|玉佩|金带|翠" 中星谱.txt
- 0命中
步骤3:命中行上下文提取
对第1、4、5轮命中的行号(4、18、31、36、481),分别用sed提取前后2行上下文:
- 行2-6:提要,含"织女"星名
- 行16-20:原序,含"授衣"时令引用
- 行29-33:凡例,含"匹帛"比喻
- 行34-38:凡例,含"织女"星名说明
- 行479-483:图说,含"合缝"比喻
步骤4:内容研判
| 命中 | 行号 | 关键词 | 语义判定 | 是否服饰内容 |
|---|---|---|---|---|
| 1 | 18 | 授衣 | 《诗经》时令引用 | 否 |
| 2 | 31 | 匹帛 | 刻法换算比喻 | 否 |
| 3 | 4 | 织女 | 星名 | 否 |
| 4 | 36 | 织女 | 星名说明 | 否 |
| 5 | 481 | 合缝 | 天球赤道比喻 | 否 |
| 6 | 18 | 素 | 副词"一向" | 否 |
最终结论:本书无任何服饰相关实质性内容。
步骤5:撰写三份MD文档
- 中星谱_总结.md:服饰结构化综述
- 中星谱_日志.md:本文件
- 中星谱_原文提取.md:带行号原始片段
检索统计
| 轮次 | 关键词 | 命中行数 | 服饰相关 |
|---|---|---|---|
| 1 | 衣/裳/服/冠/冕 | 1 | 0 |
| 2 | 袍/褐/裘/裙/襦 | 0 | 0 |
| 3 | 巾/帻/帽/弁/履/舄 | 0 | 0 |
| 4 | 丝/帛/绢/锦/绫/罗/缎/绮 | 1 | 0 |
| 5 | 织/染/绣/缝/纺 | 3 | 0 |
| 6 | 佩/带/绶/笏/袂/衿 | 0 | 0 |
| 7 | 舆服/章服/服色/冠服/朝服/祭服 | 0 | 0 |
| 8 | 布衣/锦衣/短褐/缁/缟/素 | 1 | 0 |
| 9 | 靴/鞋/袜/幞头/簪/钗/钏 | 0 | 0 |
| 10 | 龙袍/鱼袋/玉佩/金带/翠 | 0 | 0 |
| 合计 | — | 6 | 0 |