Jieba

Latest version: v0.39

Safety actively analyzes 630217 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

Page 2 of 5

0.34

1. 提升性能,词典结构由Trie改为Prefix Set,内存占用减少2/3, 详见:https://github.com/fxsjy/jieba/pull/187;by gumblex
2. 修复关键词提取功能的性能问题

0.33

1. 支持自定义stop words; by fukuball
2. 支持自定义idf词典; by fukuball
3. 修复自定义词典的词性不能正常显示的bug; by ShuraChow

0.32

1. 新增分词选项:可以关闭新词发现功能;详见:https://github.com/fxsjy/jieba/blob/master/test/test_no_hmm.pyL8
2. 修复posseg子模块的Bug;详见: https://github.com/fxsjy/jieba/issues/111 https://github.com/fxsjy/jieba/issues/132
3. ChineseAnalyzer提供了更好的英文支持(感谢jannson),例如单词Stemming; 详见:https://github.com/fxsjy/jieba/pull/106

0.31

1. 修改了代码缩进格式,遵循PEP8标准
2. 支持Jython解析器,感谢 piaolingxue
3. 修复中英混合词汇不能识别数字在前词语的Bug
4. 部分代码重构,感谢 chao78787
5. 多进程并行分词模式下自动检测CPU个数设置合适的进程数,感谢linkerlin
6. 修复了0.3版中jieba.extra_tags方法对whoosh模块的错误依赖

0.30

==========================
1) 新增jieba.tokenize方法,返回每个词的起始位置
2) 新增ChineseAnalyzer,用于支持whoosh搜索引擎
3)添加了更多的中英混合词汇
4)修改了一些py文件的加载方法,从而支持py2exe,cxfree打包为exe

0.29.1

==========================
1) 优化了viterbi算法的代码,分词速度提升15%
2) 去除了词典中的一些低质词

Page 2 of 5

© 2024 Safety CLI Cybersecurity Inc. All Rights Reserved.