轨迹预测模块 (Trajectory Prediction Module)

核心功能

1. 数据接收与解析

自适应CSV文件读取，自动识别必选字段（ts/id/x/y/z）和辅助字段
智能时间格式解析，支持"MM:SS.mmm"等多种时间表示
动态字段装载，无需修改代码即可适配新数据源

2. 数据预处理

去重处理：基于ts+id+x+y+z唯一标识删除重复数据
异常值过滤：XYZ坐标范围校验（可配置）
数据清洗统计：输出处理前后数据统计信息

3. 轨迹预测

卡尔曼滤波预测

基于状态空间模型的最优估计
适用于线性运动目标的快速预测
计算开销小，实时性好

LSTM深度学习预测

基于PyTorch实现的长短期记忆网络
能够捕捉复杂非线性轨迹模式
支持模型持久化和增量训练

混合预测（推荐）

加权融合卡尔曼和LSTM结果
默认权重：卡尔曼0.3 + LSTM 0.7
兼顾稳定性和准确性

4. 结果导出

CSV格式预测结果导出
JSON格式开发接口数据转换
时间戳格式与原数据保持一致

模块结构

prediction/
├── data_receiver.py          # 自适应数据接收器
├── data_preprocessor.py      # 数据预处理模块
├── predictor.py              # 轨迹预测核心模块
├── config.yaml               # 系统配置文件
│
├── main.py                   # 命令行批处理入口
├── app.py                    # Web API服务入口
│
├── models/                   # LSTM模型存储目录
│   ├── model_{id}.pth        # 各目标的LSTM模型
│   └── scaler_{id}.npy       # 对应的标准化器
│
└── data/                     # 数据目录
    ├── 1.csv                 # 示例输入数据
    └── predict_result.csv    # 预测结果输出

数据流向

CSV文件 → AdaptiveDataReceiver → DataPreprocessor → TrajectoryPredictor
                                    ↓
                            按ID分组 → 选择预测模式
                                    ↓
                          Kalman / LSTM / Hybrid
                                    ↓
                            结果导出 & 关联分析

快速开始

环境准备

系统要求：

Python 3.8 或更高版本
CUDA（可选，用于GPU加速LSTM训练）

安装依赖：

pip install flask pandas torch numpy scikit-learn pyyaml filterpy scipy

如需GPU加速，请根据CUDA版本安装对应版本的PyTorch：
pip install torch --index-url https://download.pytorch.org/whl/cu118

运行方式

方式一：命令行批处理

准备CSV数据文件，放置在 data/ 目录下

编辑 main.py 选择预测模式：

PREDICT_MODE = "HYBRID"  # 可选：KALMAN / LSTM / HYBRID

运行程序：
```
python main.py
```
查看结果：
- 控制台输出统计信息
- data/predict_result.csv - 预测结果文件

方式二：Web API服务

启动服务：
```
python app.py
```
访问可视化界面：
```
http://127.0.0.1:5201
```
上传CSV文件进行预测

配置说明

配置文件 config.yaml 包含所有可调参数：

CSV读取配置

csv:
  default_encoding: "utf-8"    # 文件编码
  delimiter: ","               # 分隔符
  header_row: 0                # 表头行号

数据预处理配置

preprocess:
  x_range: [-180.0, 180.0]    # X坐标有效范围（经度）
  y_range: [-90.0, 90.0]      # Y坐标有效范围（纬度）
  z_range: [-1000.0, 10000.0] # Z坐标有效范围（高度）

预测配置

predict:
  predict_steps: 15            # 预测未来点数（默认15步）
  
  # 卡尔曼滤波参数
  kalman:
    process_noise: 0.01        # 过程噪声协方差
    measure_noise: 0.1         # 测量噪声协方差
  
  # LSTM神经网络参数
  lstm:
    look_back: 5               # 历史窗口大小（使用前5个点预测）
    epochs: 30                 # 训练轮数
    batch_size: 2              # 批次大小
    units: 32                  # LSTM隐藏层单元数
    lr: 0.001                  # 学习率
    model_save_dir: "./models" # 模型保存路径
  
  # 混合预测权重
  hybrid:
    kalman_weight: 0.3         # 卡尔曼权重
    lstm_weight: 0.7           # LSTM权重
  
  # 输出配置
  output:
    result_csv_path: "data/predict_result.csv"  # 结果输出路径

参数调优建议

参数	调整方向	影响
`predict_steps`	增大	预测更远未来，但精度可能下降
`look_back`	增大	考虑更长历史，需要更多训练数据
`epochs`	增大	训练更充分，但耗时增加
`units`	增大	模型容量更大，可能过拟合
`kalman_weight`	调整	平衡线性和非线性预测

使用示例

示例1：命令行批处理

from data_receiver import AdaptiveDataReceiver
from data_preprocessor import DataPreprocessor
from predictor import TrajectoryPredictor

# 1. 读取数据
receiver = AdaptiveDataReceiver()
raw_data = receiver.load_csv("data/1.csv")

# 2. 数据预处理
preprocessor = DataPreprocessor(receiver.config)
clean_data = preprocessor.process(raw_data)

# 3. 按目标ID分组
predictor = TrajectoryPredictor(receiver.config)
grouped_data = predictor.group_by_id(clean_data)
print(f"🎯 目标总数：{len(grouped_data)}")

# 4. 执行预测（选择一种模式）
# 模式1：卡尔曼滤波
predict_result = predictor.predict_kalman(grouped_data)

# 模式2：LSTM深度学习
# predict_result = predictor.predict_lstm(grouped_data)

# 模式3：混合预测（推荐）
# predict_result = predictor.predict_hybrid(grouped_data)

# 5. 导出结果
if predict_result:
    predictor.export_to_csv(predict_result)
    print(f"✅ 预测完成，共 {len(predict_result)} 个目标")

示例2：Web API调用

import requests

# 上传CSV文件进行预测
url = "http://127.0.0.1:5201/upload"
files = {"file": open("prediction/data/1.csv", "rb")}
response = requests.post(url, files=files)

result = response.json()
if result["ok"]:
    history = result["history"]  # 历史轨迹
    predict = result["predict"]  # 预测点
    assoc = result["assoc"]  # 关联轨迹
    print(f"✅ 预测成功！")
else:
    print(f"❌ 预测失败：{result['err']}")

示例3：自定义配置

import yaml

# 加载配置
with open("config.yaml", "r", encoding="utf-8") as f:
    config = yaml.safe_load(f)

# 修改预测步数为30步
config["predict"]["predict_steps"] = 30

# 调整混合权重
config["predict"]["hybrid"]["kalman_weight"] = 0.4
config["predict"]["hybrid"]["lstm_weight"] = 0.6

# 创建预测器
predictor = TrajectoryPredictor(config)

API接口

核心类说明

1. AdaptiveDataReceiver（数据接收器）

功能：自适应CSV文件解析，自动识别字段

初始化：

receiver = AdaptiveDataReceiver(config_path="./config.yaml")

方法：

# 加载CSV文件
raw_data = receiver.load_csv("data/1.csv")
# 返回：List[RadarData]

数据结构：

@dataclass
class RadarData:
    ts: datetime        # 时间戳
    id: Any             # 目标ID
    x: float            # X坐标
    y: float            # Y坐标
    z: float            # Z坐标
    aux: Dict[str, Any] # 辅助字段（自动识别）

2. DataPreprocessor（数据预处理器）

功能：数据去重和异常值过滤

初始化：

preprocessor = DataPreprocessor(config)

方法：

# 执行预处理
clean_data = preprocessor.process(raw_data)
# 返回：List[RadarData]

处理流程：

基于ts+id+x+y+z去重
XYZ坐标范围校验
输出统计信息

3. TrajectoryPredictor（轨迹预测器）

功能：核心预测引擎，支持三种预测模式

初始化：

predictor = TrajectoryPredictor(config)

方法：

group_by_id - 按目标ID分组

grouped_data = predictor.group_by_id(clean_data)
# 返回：Dict[target_id, List[RadarData]]

predict_kalman - 卡尔曼滤波预测

result = predictor.predict_kalman(grouped_data)

predict_lstm - LSTM深度学习预测

result = predictor.predict_lstm(grouped_data, train_new=True)
# train_new: 是否重新训练模型（默认True）

predict_hybrid - 混合预测

result = predictor.predict_hybrid(grouped_data)

export_to_csv - 导出CSV

predictor.export_to_csv(result, csv_path="data/predict_result.csv")

convert_to_develop_interface - 转换为开发接口格式

interface_data = predictor.convert_to_develop_interface(result)
# 返回：Dict[time_str, List[Dict]]

返回结果格式：

{
    target_id: {
        "predictions": [
            {
                "predict_ts": datetime,      # 预测时间（datetime对象）
                "predict_ts_str": "MM:SS.m", # 预测时间（字符串）
                "x": 116.4,                  # 预测X坐标
                "y": 39.9,                   # 预测Y坐标
                "z": 50.0,                   # 预测Z坐标
                "step": 1                    # 预测步数
            },
            ...
        ],
        "history_count": 100  # 历史数据点数
    }
}

数据格式

输入CSV格式

必选字段：

字段名	类型	说明	示例
ts	字符串	时间戳	"12:30.123"
id	整数/字符串	目标唯一标识	1, 2, "target_001"
x	浮点数	X坐标（经度）	116.4074
y	浮点数	Y坐标（纬度）	39.9042
z	浮点数	Z坐标（高度）	50.0

辅助字段：

自动识别并保留在 RadarData.aux 中
不影响预测逻辑
示例：speed, heading, radar_id等

示例数据：

ts,id,x,y,z,speed
12:30.123,1,116.4074,39.9042,50.0,12.5
12:31.456,1,116.4080,39.9050,51.0,13.0
12:30.234,2,116.5000,40.0000,52.0,11.8

输出CSV格式

ts,id,x,y,z
12:32.789,1,116.4090,39.9060,52.0
12:34.122,1,116.4100,39.9070,53.0
...

Web API响应格式

{
  "ok": true,
  "history": {
    "1": [
      {"ts": 1672531800.0, "lng": 116.4074, "lat": 39.9042, "z": 50.0},
      ...
    ]
  },
  "predict": [
    {"id": 1, "ts": "12:32.789", "lng": 116.4090, "lat": 39.9060, "z": 52.0},
    ...
  ],
  "assoc": [
    {"tra_id": 1, "ts": "12:30.123", "lng": 116.4074, "lat": 39.9042, "z": 50.0},
    ...
  ]
}

算法详解

1. 卡尔曼滤波（Kalman Filter）

原理

卡尔曼滤波是一种递归的状态估计算法，通过预测-更新两步循环，对系统状态进行最优估计。

实现细节

# 状态向量：[x, y, z]
# 观测模型：直接观测位置
# 状态转移：基于速度外推

# 预测步骤
p_predict = p + Q  # 协方差预测
x_pred = x_est     # 状态预测

# 更新步骤
K = p_predict / (p_predict + R)  # 卡尔曼增益
x_est = x_pred + K * (z_meas - x_pred)  # 状态更新
p = (1 - K) * p_predict  # 协方差更新

多步预测

# 基于最后两点的速度进行递推外推
vx = last_x - prev_x
vy = last_y - prev_y
vz = last_z - prev_z

next_x = last_x + vx
next_y = last_y + vy
next_z = last_z + vz

优缺点

✅ 优点：计算快、稳定性好、适合线性运动
❌ 缺点：难以捕捉复杂非线性轨迹

2. LSTM神经网络

原理

长短期记忆网络（LSTM）是一种特殊的循环神经网络（RNN），能够学习长期依赖关系，适合时序预测任务。

网络结构

class TrajectoryLSTM(nn.Module):
    def __init__(self, input_size=3, hidden_size=32, output_size=3, predict_steps=15):
        super().__init__()
        self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size * predict_steps)
    
    def forward(self, x):
        out, _ = self.lstm(x)
        out = self.fc(out[:, -1, :])  # 取最后一个时间步
        out = out.view(-1, predict_steps, 3)
        return out

数据预处理

# 1. 构建序列样本
# 输入：[t-5, t-4, t-3, t-2, t-1] -> 输出：[t]
X, y = [], []
for i in range(look_back, len(data)):
    X.append(data[i-look_back:i])
    y.append(data[i])

# 2. MinMaxScaler标准化
scaler = MinMaxScaler()
coords_scaled = scaler.fit_transform(coords)

# 3. 训练模型
model.train()
for epoch in range(epochs):
    outputs = model(X)
    loss = criterion(outputs, y)
    loss.backward()
    optimizer.step()

模型持久化

# 保存
torch.save({
    'model_state_dict': model.state_dict(),
    'predict_steps': predict_steps
}, f"models/model_{target_id}.pth")

np.save(f"models/scaler_{target_id}.npy", [scaler.min_, scaler.scale_])

# 加载
checkpoint = torch.load(path, map_location=device)
model.load_state_dict(checkpoint['model_state_dict'])

优缺点

✅ 优点：能捕捉复杂轨迹模式、适应性强、精度高
❌ 缺点：需要足够训练数据、计算开销大、训练时间长

3. 混合预测（Hybrid）

原理

加权融合卡尔曼滤波和LSTM的预测结果，结合两者的优势。

融合公式

x_hybrid = kalman_weight * x_kalman + lstm_weight * x_lstm
y_hybrid = kalman_weight * y_kalman + lstm_weight * y_lstm
z_hybrid = kalman_weight * z_kalman + lstm_weight * z_lstm

默认权重

卡尔曼权重：0.3
LSTM权重：0.7

权重调优建议

线性运动为主：提高卡尔曼权重（如0.5:0.5）
复杂轨迹为主：提高LSTM权重（如0.2:0.8）
平衡模式：默认权重（0.3:0.7）

优缺点

✅ 优点：兼顾稳定性和准确性、鲁棒性强
❌ 缺点：需要同时运行两个模型

关联实现逻辑

核心思想：按时间步逐帧处理，使用“轨迹预测点 vs 当前新点”的全局最优匹配完成关联。

输入归一化

在 TrajectoryAssociator._normalize_input_data() 中将输入整理为 {ts: [[x,y(,z)], ...]}。
校验字段合法性、information.ts 与外层 time_step 一致性。

按时间推进

将所有 ts 升序遍历。
每个时间步取出当前帧新点 new_points。

轨迹预测

对“仍活跃”的每条轨迹调用 TrajectoryPredictor.predict_next_point() 生成预测点。
历史长度足够时使用卡尔曼滤波；不足时退化为末点近似。

点级关联（匈牙利算法）

在 PointAssociator.associate() 构造代价矩阵并调用 linear_sum_assignment。
pos_dim=2 时，距离使用经纬度球面距离（米）；pos_dim=3 时使用欧氏距离缩放。
仅保留距离 <= threshold_m 的匹配结果。

轨迹更新

匹配成功：将新点接入对应轨迹。
未匹配新点：新建轨迹。
轨迹超时（timeout_steps * cycle）后不再参与后续匹配。

输出整理与校验

模块输出为 Dict[traj_id, List[information]]。
其中 information.id == traj_id，表示“关联后轨迹号”。

说明：输入中的 id 在关联过程中不参与匹配计算，匹配依据是时序 + 空间距离 + 预测。

关联模块接口说明

输入接口

类型：Dict[time_step, List[information]]

`time_step`

类型：int | float
约束：必须与对应 information.ts 一致

`information`

类型：Dict
字段（仅允许以下字段）：
- ts：int | float（必填）
- id：int（必填）
- x：float（必填）
- y：float（必填）
- z：float（可选，缺省默认 0.0）

输入示例

{
  100: [
    {"ts": 100, "id": 1, "x": 120.1, "y": 30.2, "z": 0.0},
    {"ts": 100, "id": 2, "x": 120.2, "y": 30.3}
  ],
  106: [
    {"ts": 106, "id": 1, "x": 120.12, "y": 30.25, "z": 0.0}
  ]
}

输出接口

类型：Dict[traj_id, List[information]]
说明：information.id 为关联后的轨迹编号（等于外层 traj_id）

`traj_id`

类型：int

`information`

类型：Dict
字段（固定为以下 5 个）：
- ts：float
- id：int（且必须等于外层 traj_id）
- x：float
- y：float
- z：float

输出示例

{
  0: [
    {"ts": 100.0, "id": 0, "x": 120.1, "y": 30.2, "z": 0.0},
    {"ts": 106.0, "id": 0, "x": 120.12, "y": 30.25, "z": 0.0}
  ],
  1: [
    {"ts": 100.0, "id": 1, "x": 120.2, "y": 30.3, "z": 0.0}
  ]
}

对外调用入口

推荐直接调用：traj_association_module.py 中的 associate_trajectories()

from traj_association_module import associate_trajectories

result = associate_trajectories(
  data=input_data,   # Dict[time_step, List[information]]
  ds_id=1,
  pos_dim=3,
)

备注

run_csv_association.py 仅用于本地 CSV 输入/输出查看，不属于对外模块接口。
当前 run_csv_association.py 的 CSV 输出会将 id 回填为输入原始 id（用于展示/对照）；模块接口 associate_trajectories() 的返回中，id 仍表示关联后轨迹号。

项目启动步骤：输出csv文件：run_csv_association.py 前端启动：start_viewer.py

关联接口调用：traj_association_module.py

关联实现逻辑

核心思想：按时间步逐帧处理，使用“轨迹预测点 vs 当前新点”的全局最优匹配完成关联。

输入归一化

在 TrajectoryAssociator._normalize_input_data() 中将输入整理为 {ts: [[x,y(,z)], ...]}。
校验字段合法性、information.ts 与外层 time_step 一致性。

按时间推进

将所有 ts 升序遍历。
每个时间步取出当前帧新点 new_points。

轨迹预测

对“仍活跃”的每条轨迹调用 TrajectoryPredictor.predict_next_point() 生成预测点。
历史长度足够时使用卡尔曼滤波；不足时退化为末点近似。

点级关联（匈牙利算法）

在 PointAssociator.associate() 构造代价矩阵并调用 linear_sum_assignment。
pos_dim=2 时，距离使用经纬度球面距离（米）；pos_dim=3 时使用欧氏距离缩放。
仅保留距离 <= threshold_m 的匹配结果。

轨迹更新

匹配成功：将新点接入对应轨迹。
未匹配新点：新建轨迹。
轨迹超时（timeout_steps * cycle）后不再参与后续匹配。

输出整理与校验

模块输出为 Dict[traj_id, List[information]]。
其中 information.id == traj_id，表示“关联后轨迹号”。

说明：输入中的 id 在关联过程中不参与匹配计算，匹配依据是时序 + 空间距离 + 预测。

关联模块接口说明

输入接口

类型：Dict[time_step, List[information]]

`time_step`

类型：int | float
约束：必须与对应 information.ts 一致

`information`

类型：Dict
字段（仅允许以下字段）：
- ts：int | float（必填）
- id：int（必填）
- x：float（必填）
- y：float（必填）
- z：float（可选，缺省默认 0.0）

输入示例

{
  100: [
    {"ts": 100, "id": 1, "x": 120.1, "y": 30.2, "z": 0.0},
    {"ts": 100, "id": 2, "x": 120.2, "y": 30.3}
  ],
  106: [
    {"ts": 106, "id": 1, "x": 120.12, "y": 30.25, "z": 0.0}
  ]
}

输出接口

类型：Dict[traj_id, List[information]]
说明：information.id 为关联后的轨迹编号（等于外层 traj_id）

`traj_id`

类型：int

`information`

类型：Dict
字段（固定为以下 5 个）：
- ts：float
- id：int（且必须等于外层 traj_id）
- x：float
- y：float
- z：float

输出示例

{
  0: [
    {"ts": 100.0, "id": 0, "x": 120.1, "y": 30.2, "z": 0.0},
    {"ts": 106.0, "id": 0, "x": 120.12, "y": 30.25, "z": 0.0}
  ],
  1: [
    {"ts": 100.0, "id": 1, "x": 120.2, "y": 30.3, "z": 0.0}
  ]
}

对外调用入口

推荐直接调用：traj_association_module.py 中的 associate_trajectories()

from traj_association_module import associate_trajectories

result = associate_trajectories(
  data=input_data,   # Dict[time_step, List[information]]
  ds_id=1,
  pos_dim=3,
)

备注

run_csv_association.py 仅用于本地 CSV 输入/输出查看，不属于对外模块接口。
当前 run_csv_association.py 的 CSV 输出会将 id 回填为输入原始 id（用于展示/对照）；模块接口 associate_trajectories() 的返回中，id 仍表示关联后轨迹号。

项目启动步骤：输出csv文件：run_csv_association.py 前端启动：start_viewer.py

关联接口调用：traj_association_module.py

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
association		association
prediction		prediction
.gitignore		.gitignore
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

轨迹预测模块 (Trajectory Prediction Module)

核心功能

1. 数据接收与解析

2. 数据预处理

3. 轨迹预测

卡尔曼滤波预测

LSTM深度学习预测

混合预测（推荐）

4. 结果导出

模块结构

数据流向

快速开始

环境准备

运行方式

方式一：命令行批处理

方式二：Web API服务

配置说明

CSV读取配置

数据预处理配置

预测配置

参数调优建议

使用示例

示例1：命令行批处理

示例2：Web API调用

示例3：自定义配置

API接口

核心类说明

1. AdaptiveDataReceiver（数据接收器）

2. DataPreprocessor（数据预处理器）

3. TrajectoryPredictor（轨迹预测器）

group_by_id - 按目标ID分组

predict_kalman - 卡尔曼滤波预测

predict_lstm - LSTM深度学习预测

predict_hybrid - 混合预测

export_to_csv - 导出CSV

convert_to_develop_interface - 转换为开发接口格式

数据格式

输入CSV格式

输出CSV格式

Web API响应格式

算法详解

1. 卡尔曼滤波（Kalman Filter）

原理

实现细节

多步预测

优缺点

2. LSTM神经网络

原理

网络结构

数据预处理

模型持久化

优缺点

3. 混合预测（Hybrid）

原理

融合公式

默认权重

权重调优建议

优缺点

关联实现逻辑

关联模块接口说明

输入接口

time_step

information

输入示例

输出接口

traj_id

information

输出示例

对外调用入口

备注

关联实现逻辑

关联模块接口说明

输入接口

time_step

information

输入示例

`time_step`

`information`

`traj_id`

`information`

`time_step`

`information`

`traj_id`

`information`

Packages