Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Commit 9d30d00

Browse files
author
Yang Yang
committed
add chinese word vector repo
1 parent aa03e67 commit 9d30d00

File tree

1 file changed

+4
-1
lines changed

1 file changed

+4
-1
lines changed

README.md

Lines changed: 4 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,7 @@
22

33
很多包非常有趣,值得收藏,满足大家的收集癖!
44

5-
涉及内容包括:**中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库**
5+
涉及内容包括:**中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量**
66

77
**1\. textfilter: 中英文敏感词过滤** [observerss/textfilter](https://github.com/observerss/textfilter)
88
```
@@ -197,5 +197,8 @@ Hi,all。下周一下午三点开会
197197
>>> wordninja.split('heshotwhointhewhatnow')
198198
['he', 'shot', 'who', 'in', 'the', 'what', 'now']
199199
```
200+
**28\. 各种中文词向量:** [github repo](https://github.com/Embedding/Chinese-Word-Vectors)
201+
202+
中文词向量大全
200203

201204
[jieba](https://github.com/fxsjy/jieba)[hanlp](https://github.com/hankcs/pyhanlp)就不必说了吧。

0 commit comments

Comments
 (0)