bert4torch

一款用pytorch来复现bert4keras的简洁训练框架

下载安装

安装稳定版

pip install bert4torch

安装最新版

pip install git+https://www.github.com/Tongjilibo/bert4torch.git

注意事项：pip包的发布慢于git上的开发版本，git clone注意引用路径
测试用例：git clone https://github.com/Tongjilibo/bert4torch，修改example中的预训练模型文件路径和数据路径即可启动脚本
自行训练：针对自己的数据，修改相应的数据处理代码块
开发环境：使用torch==1.10版本进行开发，如其他版本遇到不适配，欢迎反馈

功能

核心功能：加载bert、roberta、albert、xlnet、nezha、bart、RoFormer、RoFormer_V2、ELECTRA、GPT、GPT2、T5、GAU-alpha等预训练权重继续进行finetune、并支持在bert基础上灵活定义自己模型
丰富示例：包含pretrain、sentence_classfication、sentence_embedding、sequence_labeling、relation_extraction、seq2seq等多种解决方案
实验验证：已在公开数据集实验验证, 使用如下examples数据集
易用trick：集成了常见的trick, 即插即用
其他特性：加载transformers库模型一起使用；调用方式简洁高效；有训练进度条动态展示；配合torchinfo打印参数量；默认Logger和Tensorboard简便记录训练过程；自定义fit过程，满足高阶需求

快速上手

版本说明

v0.2.1：兼容torch<=1.7.1的torch.div无rounding_mode, 增加自定义metrics，支持断点续训，增加默认Logger和Tensorboard日志
v0.2.0：兼容torch<1.9.0的缺失take_along_dim，修复bart中位置向量514的问题，修复Sptokenizer对符号不转换，打印Epoch开始的时间戳，增加parallel_apply
v0.1.9：增加mixup/manifold_mixup/temporal_ensembling策略, 修复pgd策略param.grad为空的问题，修改tokenizer支持批量
v0.1.8：修复原来CRF训练中loss陡增的问题，修复xlnet的token_type_ids输入显存占用大的问题
v0.1.7：增加EarlyStop，CRF中自带转bool类型
v0.1.6：增加transformer_xl、xlnet、t5_pegasus模型，prompt、预训练等示例，支持增加embedding输入，EMA策略，修复tokenizer和sinusoid的bug
v0.1.5：增加GAU-alpha，混合梯度，梯度裁剪，单机多卡(DP、DDP)
v0.1.4：增加了VAT，修复了linux下apply_embedding返回项有问题的情况
v0.1.3：初始版本

更新：

2022年9月10更新：增加默认Logger和Tensorboard日志，ONNX推理，修复vocab.txt多换行错误
2022年8月28更新：增加nl2sql示例, 增加自定义metrics，支持断点续训
2022年8月21更新：增加W2NER和DiffCSE示例，打印Epoch开始的时间戳，增加parallel_apply, 兼容torch<=1.7.1的torch.div无rounding_mode
2022年8月14更新：增加有监督句向量、关系抽取、文本生成实验指标，兼容torch<1.9.0的缺失take_along_dim，修复bart中位置向量514的问题，修复Sptokenizer对符号不转换
2022年7月27更新：增加mixup/manifold_mixup/temporal_ensembling策略, 修复pgd策略param.grad为空的问题，修改tokenizer支持批量，增加uie示例
2022年7月16更新：修复原来CRF训练中loss陡增的问题，修复xlnet的token_type_ids输入显存占用大的问题
2022年7月10更新：增加金融中文FAQ示例，天池新闻分类top1案例，增加EarlyStop，CRF中自带转bool类型
2022年6月29更新：增加ner的实验，测试crf不同初始化的效果，bert-whitening中文实验
2022年6月13更新：增加seq2seq+前缀树，增加SimCSE/ESimCSE/PromptBert等无监督语义相似度的中文实验
2022年6月05更新：增加PromptBert、PET、P-tuning示例，修改tokenizer对special_tokens分词错误的问题，增加t5_pegasus
2022年5月29更新：transformer_xl、xlnet模型, 修改sinusoid位置向量被init_weight的bug, EMA，sohu情感分类示例
2022年5月17更新：增加预训练代码，支持增加embedding输入(如词性，word粒度embedding)
2022年5月01更新：增加了混合梯度，梯度裁剪，单机多卡训练(DP、DDP)
2022年4月25更新：增加了VAT、GAU-alpha等示例，增加了梯度累积，自定义fit()示例
2022年4月15更新：增加了ner_mrc、ner_span、roformer_v2、roformer-sim等示例
2022年4月05更新：增加了GPLinker、TPlinker、SimBERT等示例
2022年3月29更新：增加了CoSENT、R-Drop、UDA等示例
2022年3月22更新：添加GPT、GPT2、T5模型
2022年3月12更新：初版提交

背景

用pytorch复现苏神的bert4keras
初版参考了bert4pytorch

预训练权重

部分权重是要加载修改的config.json

模型分类	权重来源	权重链接	备注(若有)
bert	谷歌原版bert	tf	转pytorch命令
bert	哈工大chinese-bert-wwm-ext	tf/pytorch, pytorch
bert	bert-base-chinese	pytorch	转换脚本
robert	哈工大chinese-robert-wwm-ext	tf/pytorch, pytorch
albert	brightmart	tf, pytorch
xlnet	哈工大xlnet	tf/pytorch	config
electra	哈工大electra	tf, pytorch
macbert	哈工大macbert	tf, pytorch
roformer	追一科技	tf, pytorch
roformer_v2	追一科技	tf, pytorch
simbert	追一科技	tf, pytorch
roformer-sim	追一科技	ft, pytorch
gau-alpha	追一科技	tf	转换脚本
nezha	华为	tf, pytorch
gpt	CDial-GPT	pytorch	转换脚本
gpt2	清华26亿 cmp_lm	pytorch	转换脚本
gpt2	中文GPT2_ML模型	tf, pytorch	转换脚本
t5	UER	pytorch	config
mt5	谷歌	pytorch	config
t5_pegasus	追一科技	tf	转换脚本
bart	复旦	pytorch	转换脚本

Name		Name	Last commit message	Last commit date
Latest commit History 301 Commits
bert4torch		bert4torch
examples		examples
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

bert4torch

下载安装

功能

快速上手

版本说明

更新：

背景

预训练权重

About

Uh oh!

Releases

Packages

Languages

License

Flywolfs/bert4torch

Folders and files

Latest commit

History

Repository files navigation

bert4torch

下载安装

功能

快速上手

版本说明

更新：

背景

预训练权重

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages