这是一个给 Codex 使用的 LLM 量化论文阅读 skill,用来做论文雷达和论文精读。
这里的“量化”指 LLM quantization / low-bit / compression / inference optimization,包括低 bit 量化、模型压缩、推理优化、serving/runtime 集成、算子/kernel 相关工作。它不是金融量化研究。
radar:在固定研究范围内,按时间和来源搜索 LLM 量化相关论文/项目,只输出真正有价值的候选。deep-read:对选中的论文做深度技术评审,重点看算法新颖性、工程成熟度、vLLM/SGLang/TensorRT-LLM 兼容性、实验扎实程度、模型覆盖、算子相关性和实际部署价值。
.
├── SKILL.md
├── workflows/
│ ├── radar.md
│ └── deep-read.md
├── config/
│ ├── topics.yml
│ ├── sources.yml
│ ├── radar-rubric.yml
│ └── deep-read-rubric.yml
├── templates/
│ ├── radar-result.md
│ ├── deep-read-report.md
│ └── paper-scorecard.md
├── references/
│ ├── research-map.md
│ └── prompt-style.md
├── outputs/
│ ├── radar/
│ └── deep-read/
└── agents/
└── openai.yaml
SKILL.md:Codex skill 入口,负责触发和选择radar/deep-read工作流。workflows/:两套核心工作流说明。config/:固定研究范围、信息来源、radar 初筛标准和 deep-read 深度评估标准。templates/:雷达结果、精读报告和论文评分卡模板。references/:LLM 量化研究地图和输出风格约束。outputs/:保存实际运行后的 radar 和 deep-read 结果。agents/:Codex UI 元数据。
sources.yml
└─ 决定 radar 去哪里搜
topics.yml
└─ 被 radar 消费,用于搜索召回、主题过滤和排除误召回
radar-rubric.yml
└─ 被 radar 消费,用于对通过主题过滤的候选做初筛排序和动作建议
research-map.md
├─ 被 radar 消费,用于给候选打标签、描述技术方向和应用场景
└─ 被 deep-read 消费,用于组织精读报告中的技术方向、系统方向、应用场景、成熟度和算子视角
deep-read-rubric.yml
└─ 被 deep-read 消费,用于生成评分卡、分配分析重点和展示论文维度画像
简短理解:
topics.yml是入口过滤器,决定什么能被搜到和留下。research-map.md是分类解释器,决定留下来的内容怎么被理解和描述。
当前是 v0.1 baseline。后续应该通过真实运行 radar 和 deep-read 来迭代关键词、评分标准和输出模板。