text_matching

文本匹配

文本匹配一直是自然语言处理（NLP）领域一个基础且重要的方向，一般研究两段文本之间的关系。文本相似度计算、自然语言推理、问答系统、信息检索等，都可以看作针对不同数据和场景的文本匹配应用。这些自然语言处理任务在很大程度上都可以抽象成文本匹配问题，比如信息检索可以归结为搜索词和文档资源的匹配，问答系统可以归结为问题和候选答案的匹配，复述问题可以归结为两个同义句的匹配。

文本匹配任务数据每一个样本通常由两个文本组成（query，title）。类别形式为 0 或 1，0 表示 query 与 title 不匹配； 1 表示匹配。

本项目包含面向搜索、推荐系统排序模块、召回模块的常规解决方案，具体如下:

基于单塔 Point-wise 范式的语义匹配模型 ernie_matching: 模型精度高、计算复杂度高, 适合直接进行语义匹配 2 分类的应用场景。
基于单塔 Pair-wise 范式的语义匹配模型 ernie_matching: 模型精度高、计算复杂度高, 对文本相似度大小的序关系建模能力更强，适合将相似度特征作为上层排序模块输入特征的应用场景。
基于双塔 Point-wise 范式的语义匹配模型 SimNet 和 Sentence Transformers, 这 2 种方案计算效率更高，适合对延时要求高、根据语义相似度进行粗排的应用场景。

ernie_matching

ernie_matching 展示了基于预训练模型 ERNIE-Gram 训练单塔 Point-wise & Pair-wise 语义匹配模型。

SimNet

SimNet 展示了如何使用CNN、LSTM、GRU等网络完成文本匹配任务。

Sentence Transformers

Sentence Transformers 展示了如何使用以 ERNIE 为代表的模型Fine-tune完成文本匹配任务。

Name		Name	Last commit message	Last commit date
parent directory ..
ernie_matching		ernie_matching
sentence_transformers		sentence_transformers
simnet		simnet
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

文本匹配

ernie_matching

SimNet

Sentence Transformers

FilesExpand file tree

text_matching

Directory actions

More options

Directory actions

More options

Latest commit

History

text_matching

Folders and files

parent directory

README.md

文本匹配

ernie_matching

SimNet

Sentence Transformers