- 灰原哀角色数字人:构建有深度、有逻辑、能自然对话的AI角色模型
- 同人文学知识库:梳理优质作品的情节、技巧、主题,供阅读推荐和创作参考
核心思路:一次深度阅读,双重产出。角色分析和文学分析共享同一个阅读过程,不重复消耗tokens。
预算:400美元 API额度
- 质量>数量:精读少量优质作品,不要被烂文污染
- 逻辑>统计:找"为什么这样做",不只是"经常做什么"
- 保留矛盾:角色的复杂性和不一致才真实
project/
├── works/ # 同人作品(txt格式)
│
├── analysis/
│ ├── works/ # 单篇分析(双重输出)
│ │ ├── 001_角色.md # 角色维度分析
│ │ ├── 001_文学.md # 文学维度分析
│ │ └── ...
│ │
│ └── baseline.md # 前3-5篇的基线分析
│
└── outputs/
│ ├── character/ # 角色数字人成果
│ │ ├── character_card.yaml # 最终角色卡
│ │ ├── value_system.json # 价值观体系
│ │
│ └── knowledge_base/ # 同人文学知识库
│ ├── by_quality.md # 按质量分级索引
│ ├── by_theme.md # 按主题分类索引
│ ├── plot_patterns.json # 常见情节模式
│ ├── writing_techniques.md # 写作技巧合集
│ └── recommendations.md # 阅读推荐路径
读前几篇高质量作品,建立双重基线:
角色维度:
- 核心性格特征(共识部分)
- 典型说话方式
- 基本反应模式
文学维度:
- 常见题材和类型
- 基础质量标准(什么算"写得好")
- 社群偏好(粉丝喜欢看什么)
输出:analysis/baseline.md
对每篇作品进行平行分析:
标题: [作品名]
字数: [X万字]
质量: [1-5星]
# 核心特征(3-5个)
- 特征1: 具体表现
- 特征2: 具体表现
# 关键场景
场景1:
情境: "..."
她的选择: "..."
内在逻辑: "为什么这样选?体现了什么价值观?"
# 典型对话(5-10句)
- "原文引用" - 情境 - 体现什么
# 关系动态
柯南:
互动模式: "..."
情感状态: "..."
关键时刻: "..."
# OOC标记(如果有)
- 哪里不像她?为什么?
# 边界案例
- 有没有"破例"的时刻?标题: [作品名]
作者: [如果知道]
字数: [X万字]
类型: [日常/推理/AU/...]
完结: [是/否]
# 质量评分
总分: X/5
- 情节: X/5
- 人物: X/5
- 文笔: X/5
- 创新: X/5
# 情节分析
核心冲突: "..."
结构: "起承转合的分布"
节奏: "快/慢节奏的处理"
转折点: "第X章发生了什么"
# 主题
核心主题: [3-5个关键词]
表达方式: "通过什么手法传达主题"
# 写作技巧亮点
- 技巧1: 具体例子
- 技巧2: 具体例子
# 情感曲线
[简单描述:开局-发展-高潮-结局的情感强度]
# 金句(3-5句)
- "引用"
# 推荐理由
- 适合什么样的读者
- 为什么值得读
# 相似作品
- [如果有的话]从所有XXX_角色.md中提取:
# outputs/character/character_card.yaml
角色: 灰原哀
核心定位: "一句话总结她是谁"
价值观体系:
真相追求:
强度: 9/10
表现: ["例子1", "例子2"]
边界: "什么情况下会妥协"
来源: [作品001, 作品005]
保护他人:
强度: 8/10
表现: [...]
冲突: "当和真相追求冲突时如何权衡"
情感触发器:
破防时刻: ["什么让她情绪失控", ...]
温柔时刻: ["什么让她柔软", ...]
回避话题: ["什么她不愿提", ...]
典型反应:
被关心: "..."
遇危险: "..."
面对柯南: "..."
语言特征:
语气: "冷静、带点调侃、..."
常用表达: ["工藤", "大侦探", ...]
句式偏好: "短句/长句"
禁用词: [...]
关系动态:
柯南:
定位: "搭档/命运共同体/..."
互动: "既撩拨又担忧"
边界: "什么话题不开玩笑"额外输出:
value_system.json- 价值观决策树(用于处理冲突场景)test_scenarios.yaml- 100个测试场景及期望反应
从所有XXX_文学.md中整理:
by_quality.md - 按质量分级
# 5星作品(必读)
- [作品名] - 作者 - 推荐理由
# 4星作品(优质)
...
# 3星作品(及格)
...by_theme.md - 按主题分类
# 真相与代价
- 作品A: 如何处理这个主题
- 作品B: 不同角度
# 身份认同
...
# 情感成长
...plot_patterns.json - 情节模式库
{
"误会-解开": {
"描述": "柯南和灰原因误会产生隔阂,后解开",
"成功案例": ["作品A", "作品C"],
"失败案例": ["作品X为什么没写好"],
"关键要素": ["时机", "铺垫", "情绪递进"]
},
"生死危机": {
...
}
}writing_techniques.md - 写作技巧合集
# 节奏控制
优秀案例:作品A 在第X章用了XX手法
效果:...
# 情感推进
优秀案例:作品B 通过XX细节
效果:...
# 对话设计
...recommendations.md - 阅读路径
# 新手入门
先读这3篇了解基本设定:[列表]
# 情感向
如果你喜欢细腻的情感描写:[列表]
# 推理向
如果你喜欢烧脑剧情:[列表]
# 进阶阅读
看完基础后可以挑战这些:[列表]用知识库的洞察反哺角色卡:
- 某个主题在多篇中如何体现?角色的态度一致吗?
- 某个情节模式下,角色的反应有规律吗?
- 写作技巧中,哪些对话/场景最"像她"?
核心策略:一次深度阅读,双重输出。不需要读两遍。
预估消耗(基于Claude Sonnet 4):
- 单篇深度分析(角色+文学):~15k tokens/篇
- 20篇作品:~300k tokens
- 基线分析:~30k tokens
- 汇总生成(两个维度):~50k tokens
- 总计:~380k tokens ≈ $5-15
实际可分析量:
- 400美元可以支撑分析数百篇作品
- 但不需要——30-50篇优质作品足够构建完整体系
质量>数量:遇到烂文直接跳过,不浪费tokens
# 转换docx为txt
python tools/docx_to_txt.py --input fanfics_raw/ --output fanfics/将同人txt文件放入fanfics/目录,然后告诉Claude:
"请按照README的流程,从fanfics/目录开始分析,先建立baseline。"
- 版权:仅供个人学习,不公开分发
- 质量筛选:遇到烂文直接跳过,不要浪费tokens
- 保持怀疑:如果某个特征只在一两篇出现,标注"低信心"
- 记录来源:重要特征注明来自哪篇作品
一个可以:
- 在新场景下做出符合逻辑的反应
- 不只是"像她说话",而是"像她思考"
- 保留角色的复杂性和矛盾性
- 在价值观冲突时做出可预测但不僵化的选择
的AI角色模型。
一个可以:
- 快速定位:想看某个主题/类型,立刻找到优质作品
- 学习参考:提取优秀作品的写作技巧和情节模式
- 避坑指南:知道哪些套路容易写崩
- 阅读路径:为不同需求的读者提供个性化推荐
的结构化文库。
- 角色分析 → 文学评价:角色塑造得好不好,是文学质量的重要指标
- 文学分析 → 角色深化:不同作品中的角色表现,揭示角色的多面性
- 共享阅读过程:一次投入,双重产出,成本效率最大化
这不是两个独立的项目,而是一个有机整体。