- [2026-02-03] 新增 OpenClaw 支持,可使用本地 AI Agent 进行推理。
- [2026-02-03] 重构了主实验代码,配置更简洁、使用更便捷。
- [2026-01-26] 论文被 ICLR 2026 接收!🎉
官方实现 "When AI Agents Collude Online: Financial Fraud Risks by Collaborative LLM Agents on Social Platforms"(AI 智能体的线上共谋:社交平台上协作式大语言模型智能体的金融诈骗风险)。本项目在 OASIS 基础上扩展,可规模化模拟多智能体金融诈骗场景,覆盖从公开造势、私聊劝诱到转账兑现的完整生命周期。
- 端到端诈骗模拟 —— 覆盖公开信息流、推荐系统、一对一劝诱与资金转移。
- 异构智能体社会 —— 良性与恶意 LLM 智能体共存,通过公共广场与私信协同。
- 丰富基准 —— 28 个真实诈骗场景,100–1100 名智能体,涵盖 Qwen、DeepSeek、Claude、GPT-4o 等模型。
- 多维指标 —— 群体影响力 (
R_pop)、对话成功率 (R_conv)、点击率、信息提交率、转账率等。
| 指标 | 描述 |
|---|---|
| R_pop | 成功被骗的良性智能体占比 |
| R_conv | 私聊场景中的成功率 |
| Click / Submit / Transfer | 各渠道的转化情况 |
MultiAgent4Fraud/
├── data/ # CSV 数据集(基础人群、比例、鲁棒性、图结构)
├── generator/ # 角色画像 JSON 与智能体 CSV 生成工具
├── oasis/ # 核心模拟器(基于 OASIS 扩展)
├── scripts/ # 入口脚本(保留 twitter_simulation/.../test.yaml)
├── tutorials/ # 教程与实验复现指引
├── utils/ # 常用工具(端口扫描、可视化等)
├── visualization/ # 诈骗分析与绘图脚本
└── assets/ # README / 论文配图
数据位于 data/our_twitter_sim/:
base-agent-data/– 基础人群配置(110、1100 ...)。differet_good_ratio/– 良性/恶性比例(1:10、1:20、1:50 ...)。network_structure/– 随机图 / 无标度 / 高聚类网络。robustness/– 驳斥、封禁与安全性实验数据。
在 YAML 配置中更新 data.csv_path 指向目标 CSV。
git clone https://github.com/zheng977/MutiAgent4Fraud.git
cd MultiAgent4Fraud
conda create -n maf python=3.10
conda activate maf
pip install --upgrade pip setuptools
pip install -e .如需调用基于 API 的 LLM,请创建 .env:
OPENAI_API_KEY="sk-..."
OPENAI_API_BASE="https://api.openai.com/v1"python agents_init.py
# 配置脚本以加载画像 JSON,并在 data/our_twitter_sim/ 下生成 CSV- 静态系统提示词:
scripts/twitter_simulation/align_with_real_world/system_prompt(static).json - 动态摘要器:
scripts/twitter_simulation/align_with_real_world/system_prompt(dynamic).json - 自定义动作空间(可选):
scripts/twitter_simulation/align_with_real_world/action_space_prompt.txt - 推荐系统类型 (
simulation.recsys_type):reddit(轻量)或twhin-bert(需在oasis/social_platform/recsys.py中加载模型)。
编辑 llm_deploy.sh 并在集群上运行(如 vLLM 服务):
sbatch llm_deploy.sh- 将
scripts/twitter_simulation/align_with_real_world/test.yaml拷贝为configs/my_run.yaml。 - 更新
data.csv_path、model.cfgs、simulation.num_timesteps等参数。 - 执行:
python scripts/twitter_simulation/align_with_real_world/twitter_simulation_large.py \
--config_path configs/my_run.yaml输出将保存至 results/<run_name>_<timestamp>/(统计 CSV 与可选图表)。
详见 tutorials/tutorials.md,下表给出速查:
| 实验 | 数据集 | 配置提示 |
|---|---|---|
| 大规模消融 | base-agent-data/ |
调整 model.num_agents 及 model.cfgs 中数量;保持 shared_reflection: false |
| 协作机制消融 | base-agent-data/ |
切换 simulation.shared_reflection 与相关协作开关 |
| 恶意模型消融 | base-agent-data/ |
固定良性配置,替换 model.cfgs 第二项 |
| 良性模型消融 | base-agent-data/ |
固定恶意配置,替换 model.cfgs 第一项 |
| 不同比例 | differet_good_ratio/ |
调整人群数量以匹配 CSV |
| 网络结构 | network_structure/ |
设置 data.csv_path 指向所需拓扑 |
| 鲁棒性 / 安全性实验 | robustness/ |
配置 simulation.defense(封禁、驳斥等) |
补充说明:
- 如需非零安全提示词比例,运行前调用
set_safety_prompt_ratio(ratio)(默认0)。 - 确保各
server_url可访问,并通过环境变量设置 OpenAI 兼容服务的 API Key。
visualization/ 目录提供结果分析脚本:
fraud_visulsion.py—— 绘制诈骗相关指标(R_pop、R_conv 等)。extract_transfer_conversations.py—— 导出关键私聊对话。query_fraud_transfers.py—— 查看各恶意智能体的转账次数。
@misc{ren2025aiagentscolludeonline, title={When AI Agents Collude Online: Financial Fraud Risks by Collaborative LLM Agents on Social Platforms}, author={Qibing Ren and Zhijie Zheng and Jiaxuan Guo and Junchi Yan and Lizhuang Ma and Jing Shao}, year={2025}, eprint={2511.06448}, archivePrefix={arXiv}, primaryClass={cs.MA}, url={https://arxiv.org/abs/2511.06448}, }
- 基于 OASIS | MultiAgent4Collusion | MAST
- 数据集托管于 Hugging Face(见上文链接)。
欢迎提交 PR 与 Issue,期待与你合作!
