把一场讲座 / 分享的录音(外加 PPT 图或文件)反编译成一页自包含、杂志级精排的 HTML 纪要——「主编精选」式编辑风格:暖纸底色 + 衬线 × 等宽字体对位、约 20 个版面模块、手写 SVG 概念图、首部可挂直播链接、正文可内嵌幻灯片图片。还能把成品 HTML 切成小红书竖版卡片。
本质是一个 Claude Code / Agent Skill(见 SKILL.md):它只负责「内容提炼 + 排版生成」,把录音转写、读图这类多模态前段交给 Gemini,把提炼与写 HTML/SVG 留给宿主模型(如 Claude)。
看 examples/literature-love/(一场「文学中的爱情 · 张爱玲《倾城之恋》」讲座的实跑结果):
文学中的爱情.html—— 最终单页成品(CSS 内联、可直接分享、移动端自适应、带「生成分享卡」)digest.md—— 提炼出的结构化纪要xhs_cards/+xhs_caption.txt—— 切好的小红书竖版卡片与文案
SKILL.md # Skill 主文档:流水线、版面语法、模块目录、质量基线
assets/
styles.css # 设计系统皮肤(产物里逐字内联)
skeleton.html # HTML 骨架:head + 顶栏 + 正文槽位 {{BODY}} + 分享卡 + JS
scripts/ # 「模型编排」内置脚本(多模态走 Gemini)
transcribe_gemini.py # A 段:录音 → 转写稿
read_slides_gemini.py # B 段:PPT 图 → 结构化 JSON
_env.py # 零依赖加载项目根 .env
requirements.txt # google-genai
build/
render_cards.mjs # 把成品 HTML 切成小红书竖版卡片(puppeteer-core)
package.json
examples/literature-love/ # 一次完整实跑的示例产物
cp .env.example .env # 填入 GEMINI_API_KEY(脚本启动时自动加载,无需 export)把录音 / 转写稿 / 纪要交给宿主模型,按 SKILL.md 的 7 步流水线产出单页 HTML。多模态前段可用内置脚本:
pip install -r scripts/requirements.txt
# 录音 → 转写稿
python3 scripts/transcribe_gemini.py 录音.m4a > transcript.txt
# PPT 图(按播放顺序)→ 结构化 JSON
python3 scripts/read_slides_gemini.py slides/*.png > slides.json无 Gemini 时脚本会非零退出并打印原因,上层据此回退到其它 ASR / 宿主模型自身视觉——绝不跳过、绝不编造内容。
cd build && npm install # 依赖 puppeteer-core + 本机 Chrome
node render_cards.mjs <你的.html> [输出目录]
# 不带参数则跑 examples/ 里的示例- 单文件自包含:CSS 内联、手写 SVG,不引 React / Tailwind / 图表库。
- 只整理与延展,不虚构:金句逐字摘录;延展必须联网检索、带真实链接,编辑推演显式标注。
- 品牌不写死:顶栏 / 分享卡的品牌全走
{{BRAND}}等占位,可留空。
完整流水线、版面模块目录、SVG 指南、质量基线与反模式,见 SKILL.md。