《同文算指》服饰内容提取操作日志
任务ID:17
书名:《同文算指》
输入文件:/home/z/my-project/upload/算法/算法/同文算指.txt
输出目录:/home/z/my-project/upload/算法output/同文算指/
操作时间:2025年
一、文件基本信息
| 项目 | 数值 |
|---|---|
| 文件路径 | /home/z/my-project/upload/算法/算法/同文算指.txt |
| 总行数 | 3306 |
| 总字节 | 335,707 |
| 文件编码 | UTF-8 |
| 书籍性质 | 明·李之藻演,利玛窦所译之算学著作 |
二、多轮grep检索记录
第1轮:衣裳服冠冕
rg -n "衣|裳|服|冠|冕" 同文算指.txt
命中:1处 - 第938行:"作衣一袭"(2次命中"衣")
第2轮:袍褐裘裙襦
rg -n "袍|褐|裘|裙|襦" 同文算指.txt
命中:0处
第3轮:巾帻帽弁履舄
rg -n "巾|帻|帽|弁|履|舄" 同文算指.txt
命中:0处
第4轮:丝帛绢锦绫罗缎绮
rg -n "丝|帛|绢|锦|绫|罗|缎|绮" 同文算指.txt
命中:大量(丝、绢、绫、罗四字频繁出现) - 关键命中行:42, 44, 835, 840, 987, 1132, 1258, 1318, 1350, 1356, 1359, 1360, 1542, 1547, 1554, 1920, 1921 - 注意:大量"丝"字用作小数单位(毫丝忽微),非织物之丝,需逐条甄别
第5轮:织染绣缝纺
rg -n "织|染|绣|缝|纺" 同文算指.txt
命中:"织"字命中多处(织绢、织布),均为织造工艺语境 - 第987行:织绢六疋 - 第1258行:织绢每疋用丝 - 第2073行:织布自冬至始
第6轮:佩带绶笏袂衿
rg -n "佩|带|绶|笏|袂|衿" 同文算指.txt
命中:0处(服饰相关义项)
第7轮:舆服章服服色冠服朝服祭服
rg -n "舆服|章服|服色|冠服|朝服|祭服" 同文算指.txt
命中:0处
第8轮:布衣锦衣短褐缁缟素
rg -n "布衣|锦衣|短褐|缁|缟|素" 同文算指.txt
命中:0处("布"单独出现多次,但无"布衣"连文)
第9轮:靴鞋袜幞头簪钗钏
rg -n "靴|鞋|袜|幞|头|簪|钗|钏" 同文算指.txt
命中:"钏"命中1处(第1920行"七钏九钗"),为金属首饰重量算题,非服饰制度语境
第10轮:龙袍鱼袋玉佩金带翠
rg -n "龙袍|鱼袋|玉佩|金带|翠" 同文算指.txt
命中:0处
补充检索1:布帛绢绸纱缎褐裘麻绵
rg -n "布|帛|绢|丝|绸|纱|缎|褐|裘|麻|绵" 同文算指.txt
命中:大量(布、绢、丝、纱、绵五字高频) - 关键新发现行:932(蚕茧/绵)、1031(夏布/绵布)、1036、1146、1150、1356、1630、1867、2740
补充检索2:袭匹疋
rg -n "袭|匹|疋" 同文算指.txt
命中:大量 - "疋"作为织物计量单位出现数十次 - "袭"仅第938行"衣一袭" - "匹"出现于第1841、1867、1920、2740行
补充检索3:纻线茧
rg -n "纻|线|茧" 同文算指.txt
命中: - 第1132行:纻丝 - 第1356行:丝、绵、线三色 - 第932行:蚕茧
三、sed上下文提取记录
对每条命中行执行 sed -n 'N-5,N+5p' 提取上下文,共提取以下区间:
| 序号 | 行号区间 | 内容概要 |
|---|---|---|
| 1 | 40-46 | 度量衡制度,含"四丈曰疋" |
| 2 | 833-845 | 买绢准测法 |
| 3 | 840-844 | 买绢逆推 |
| 4 | 930-950 | 茧换绵、布作衣一袭 |
| 5 | 985-996 | 织绢重准测 |
| 6 | 1029-1042 | 夏布换绵布、买布尺寸 |
| 7 | 1130-1155 | 纻丝折价、买布万疋、布税 |
| 8 | 1255-1265 | 织绢工丝分配 |
| 9 | 1315-1325 | 官绢三等户 |
| 10 | 1348-1362 | 绫罗绢价格、丝绵线三色 |
| 11 | 1540-1555 | 绫罗纱绢四色 |
| 12 | 1626-1640 | 白布青布价差 |
| 13 | 1839-1870 | 绢作帐、米换布 |
| 14 | 1918-1925 | 纱绢互价 |
| 15 | 2070-2076 | 织布递加 |
| 16 | 2738-2745 | 金换绢开方 |
四、甄别与排除
4.1 "丝"字歧义处理
书中"丝"字有两种含义: 1. 织物之丝:作为纺织原料(第1258、1356行等) 2. 小数单位之丝:十毫为一丝(第42行"厘毫丝忽"等)
判断规则:若上下文为"毫丝忽""丝忽微纎"等连用,则为小数单位;若与绢、绵、线等纺织术语并列,则为织物原料。
4.2 "布"字歧义处理
书中"布"字有两种含义: 1. 布匹之布:夏布、绵布、白布、青布等 2. 布算之布:布位列数(第274、2029行"布位"等)
判断规则:与疋、丈、尺、两等量词连用者为布匹;与"位列""位数"连用者为布算。
4.3 排除条目
- 第1920行"七钏九钗":虽为首饰,但算题仅涉金属重量,无服饰制度内容,未纳入核心条目
- 第42行"厘毫丝忽":纯小数单位,排除
- 第274行"布位列数":布算术语,排除
五、产出文件清单
| 文件 | 路径 | 说明 |
|---|---|---|
| 原文提取 | 同文算指_原文提取.md | 带行号原始片段23条,关键词加粗 |
| 总结 | 同文算指_总结.md | 结构化综述7章,含品类谱系、价格分析、制度考辨 |
| 日志 | 同文算指_日志.md | 本文件,完整操作记录 |
六、服饰内容丰富度评价
评价:稀少
理由: 1. 全书3306行中仅23处涉及织物/服饰,占比0.7% 2. 唯一涉及服装制作的条目仅第938行"作衣一袭"1处 3. 所有织物信息均为算题素材,无专门服饰论述 4. 无服饰制度、穿着礼俗、服色等级等任何内容 5. 织物品类名称和价格数据有一定经济史参考价值,但服饰研究价值极有限