执行 main.py 内的main函数即可启动项目。
model包下的每个类都是对大模型的封装,要注意模型的加载路径。最好将模型下载到本地再加载本地路径。
分词用的,现在没有用到。如果要对pdf文档中的飞表格数据进行操作,可能会用到。
https://huggingface.co/hfl/chinese-roberta-wwm-ext 并将DocVQA/vectorstore/faiss.py第七行的文件路径修改为本地模型
https://github.com/hiyouga/ChatGLM-Efficient-Tuning
DocVQA/utils/train_data/train_data1.json 用生成的数据集训练之后需要导出模型再由系统进行调用
python src/export_model.py
--model_name_or_path path_to_your_chatglm_model
--finetuning_type lora
--checkpoint_dir path_to_checkpoint
--output_dir path_to_export
python DocVQA/utils/train_data.py