Thanks to visit codestin.com
Credit goes to github.com

Skip to content

MengxuanWang/LSTM_for_Chinese_word_segment

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

基于LSTM的中文分词系统

运行环境

python3

theano

numpy

如何使用 

Train

$ python3 train.py

Test

$ python3 decoder.py

lstm model has been loaded.

在console输入句子回车显示分词结果

分词效果

[In]

《九州缥缈录》是江南的幻想史诗巨著,共6卷。以虚构的“九州”世界为背景,徐徐展开一轴腥风血雨的乱世长卷。

[Out]

['《', '九州缥缈录', '》', '是', '江南', '的', '幻想', '史诗', '巨著', ',', '共', '6卷', '。', '以', '虚构', '的', '“', '九州', '”', '世界', '为', '背景', ',', '徐徐展开', '一', '轴', '腥风', '血雨', '的', '乱世', '长卷', '。']

[In]

中国科学院大学软件研究所成立于1985年3月,是一个以计算机科学理论和应用研究为基础、以计算机软件研究开发和高新技术的 产业建设为主导的综合性基地型研究所。

[Out]

['中国科学院大学软件研究所', '成立', '于', '1985年3月', ',', '是', '一个', '以', '计算机', '科学', '理论', '和', '应用', '研究', '为', '基础', '、', '以', '计算机', '软件', '研究', '开发', '和', '高新技术', '的', '产业', '建设', '为', '主导', '的', '综合性', '基地', '型', '研究所', '。']

About

基于RNN的中文分词

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages