《大学》服饰内容提取——完整操作日志
任务信息
| 项目 | 内容 |
|---|---|
| 任务 | 处理《大学》古籍TXT,提取服饰相关内容 |
| 输入文件 | /home/z/my-project/upload/四书/四书/大学.txt |
| 输出目录 | /home/z/my-project/upload/四书output/大学/ |
| 执行时间 | 2026-03-05 |
操作记录
步骤1:验证输入文件
```bash
ls /home/z/my-project/upload/四书/四书/大学.txt
结果:文件存在
wc -l /home/z/my-project/upload/四书/四书/大学.txt
结果:31行
```
步骤2:创建输出目录
```bash
mkdir -p /home/z/my-project/upload/四书output/大学/
结果:目录创建成功
```
步骤3:8轮grep服饰关键词搜索
第1轮:基本服饰词
```bash
grep -n '衣\|裳\|裘\|冠\|冕\|弁\|巾\|帻\|帽' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
第2轮:服装类型词
```bash
grep -n '服\|袍\|衫\|裙\|裤\|褐\|襦\|袂\|裾' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
第3轮:佩饰配件词
```bash
grep -n '佩\|饰\|带\|绶\|笏\|鱼袋\|玉' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
第4轮:丝织面料词
```bash
grep -n '丝\|帛\|绢\|锦\|绮\|绫\|罗\|缎\|绸\|缂' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
第5轮:粗质面料词
```bash
grep -n '麻\|葛\|布\|绵\|裘\|褐\|毡' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
第6轮:鞋履词
```bash
grep -n '舄\|履\|屦\|靴\|鞋' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
第7轮:颜色与染色词
```bash
grep -n '染色\|染\|青\|赤\|朱\|黄\|白\|黑\|玄\|紫' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:2处匹配
| 行号 | 匹配字 | 上下文 | 是否服饰相关 |
|---|---|---|---|
| 17 | 黄 | 缗蛮黄鸟,止于丘隅 | 否——"黄鸟"为鸟类名 |
| 21 | 赤 | 如保赤子 | 否——"赤子"为婴儿 |
第8轮:旗帜帷帐词
```bash
grep -n '旌旗\|旂\|盖\|帷\|帐\|幕' /home/z/my-project/upload/四书/四书/大学.txt
```
结果:无匹配
步骤4:上下文验证
对第7轮命中项进行上下文验证:
```bash
验证"黄"字上下文
sed -n '17p' 大学.txt | grep -o '..黄..'
输出:缗蛮黄鸟,
验证"赤"字上下文
sed -n '21p' 大学.txt | grep -o '..赤..'
输出:如保赤子。
```
确认两处命中均非服饰语境。
步骤5:撰写输出文档
根据检索结果撰写三份MD文档:
- 总结.md — 服饰结构化综述
- 日志.md — 本文件
- 原文提取.md — 带行号的原始匹配片段
结论
《大学》全文经8轮关键词系统检索,未发现任何服饰相关内容。仅有2处颜色字(黄、赤)命中,但经上下文验证均非服饰用法("黄鸟"为鸟类,"赤子"为婴儿)。本结果真实可靠,如实记录。