《中星谱》服饰内容提取操作日志

基本信息

项目 内容
任务ID 2
书名 《中星谱》
输入文件 /home/z/my-project/upload/算法/算法/中星谱.txt
输出目录 /home/z/my-project/upload/算法output/中星谱/
文件大小 22,765 字节
文件行数 503 行

操作记录

步骤1:文件基础信息获取

wc -l 中星谱.txt → 503 行
wc -c 中星谱.txt → 22765 字节

步骤2:10轮关键词grep检索

第1轮:衣、裳、服、冠、冕

grep -n "衣|裳|服|冠|冕" 中星谱.txt

第2轮:袍、褐、裘、裙、襦

grep -n "袍|褐|裘|裙|襦" 中星谱.txt

第3轮:巾、帻、帽、弁、履、舄

grep -n "巾|帻|帽|弁|履|舄" 中星谱.txt

第4轮:丝、帛、绢、锦、绫、罗、缎、绮

grep -n "丝|帛|绢|锦|绫|罗|缎|绮" 中星谱.txt

第5轮:织、染、绣、缝、纺

grep -n "织|染|绣|缝|纺" 中星谱.txt

注意:行4的"织女"、行481的"合缝"在第4轮未命中,但第5轮的"织""缝"命中。行31的"缝"同指"合缝"。

第6轮:佩、带、绶、笏、袂、衿

grep -n "佩|带|绶|笏|袂|衿" 中星谱.txt

第7轮:舆服、章服、服色、冠服、朝服、祭服

grep -n "舆服|章服|服色|冠服|朝服|祭服" 中星谱.txt

第8轮:布衣、锦衣、短褐、缁、缟、素

grep -n "布衣|锦衣|短褐|缁|缟|素" 中星谱.txt

修正:该命中关键词"素"为副词用法,与服饰无关。

第9轮:靴、鞋、袜、幞头、簪、钗、钏

grep -n "靴|鞋|袜|幞头|簪|钗|钏" 中星谱.txt

第10轮:龙袍、鱼袋、玉佩、金带、翠

grep -n "龙袍|鱼袋|玉佩|金带|翠" 中星谱.txt

步骤3:命中行上下文提取

对第1、4、5轮命中的行号(4、18、31、36、481),分别用sed提取前后2行上下文:

步骤4:内容研判

命中 行号 关键词 语义判定 是否服饰内容
1 18 授衣 《诗经》时令引用
2 31 匹帛 刻法换算比喻
3 4 织女 星名
4 36 织女 星名说明
5 481 合缝 天球赤道比喻
6 18 副词"一向"

最终结论:本书无任何服饰相关实质性内容。

步骤5:撰写三份MD文档

  1. 中星谱_总结.md:服饰结构化综述
  2. 中星谱_日志.md:本文件
  3. 中星谱_原文提取.md:带行号原始片段

检索统计

轮次 关键词 命中行数 服饰相关
1 衣/裳/服/冠/冕 1 0
2 袍/褐/裘/裙/襦 0 0
3 巾/帻/帽/弁/履/舄 0 0
4 丝/帛/绢/锦/绫/罗/缎/绮 1 0
5 织/染/绣/缝/纺 3 0
6 佩/带/绶/笏/袂/衿 0 0
7 舆服/章服/服色/冠服/朝服/祭服 0 0
8 布衣/锦衣/短褐/缁/缟/素 1 0
9 靴/鞋/袜/幞头/簪/钗/钏 0 0
10 龙袍/鱼袋/玉佩/金带/翠 0 0
合计 6 0