Pythainlp

Latest version: v5.0.3

Safety actively analyzes 630052 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

Page 12 of 21

2.1.dev6

2.1.dev5

- Change from `marisa-trie` to a Trie implementation written in python

2.1.dev4

2.1.dev2

2.1dev

**ความสามารถใหม่**
- เพิ่ม pythainlp.benchmarks สำหรับทดสอบการตัดคำภาษาไทย
- เพิ่ม pythainlp.util.thai_time สำหรับใช้แปลงเวลาให้เป็นภาษาไทย เช่น 8:17 เป็น แปดนาฬิกาสิบเจ็ดนาที (24 ชั่วโมง) หรือ แปดโมงสิบเจ็ดนาที (6 ชั่วโมง)

**การตัดคำ**
- เพิ่ม ssg เข้ามาเป็นส่วนหนึ่งในการตัดพยางค์ภาษาไทย
- เพิ่มตัวตัดคำ attacut ซึ่งเป็นตัวตัดคำที่ใช้ deep learning ที่ถูกสร้างขึ้นเพื่อแก้ไขปัญหาด้านความเร็วตัดคำภาษาไทย
- เพิ่ม "newmm-safe" เข้ามาเพื่อแก้ไขปัญหาเวลาเจอข้อความที่กำกวมหรือใช้เวลาตัดคำนานจนผิดปกติ เช่น "หน้าด้านหน้าด้านหน้าด้านหน้าด้านหน้าด้าน"
- ปรับปรุงพจนานุกรมที่ใช้ในการตัดคำ

**Model updated**
- thai2rom เวอร์ชั่นใหม่ใช้ PyTorch ทำงานแทน TF แถมกินแรมน้อยกว่าเดิมมาก
- ThaiNER 1.3 รุ่นใหม่ล่าสุด (ThaiNER) HTML -> SGML พร้อมสามารถส่ง output ออกมาเป็นแท็ก html ได้แล้ว เช่น 'วันที่ <DATE>15 ก.ย. 61</DATE> ทดสอบระบบเวลา <TIME>14:49 น.</TIME>'

**Refactoring**
- ลบ marisa-trie ออกจาก PyThaiNLP ต่อไปใช้ PyThaiNLP ไม่ต้องเจอกับปัญหาติดตั้ง PyThaiNLP แล้ว (korakot เขียน Trie ใน Python)
- ลบ fastai ออกจาก dependencies ที่ถูกใช้ใน pythainlp.ulmfit
- ทำความสะอาดโค้ดและเพิ่มชุด Test โดยผ่าน coveralls กว่า 90%
- เพิ่ม MD5 checksum ให้กับโมเดลที่โหลดผ่าน pythainlp
- รองรับการเปลี่ยนตำแหน่งที่ตั้ง pythainlp-data ได้ง่าย ๆ โดยแก้ตัวแปร env var ชื่อ PYTHAINLP_DATA_DIR ใส่ path ที่ต้องการ

2.0.7

change log
* Bug fix: Include case THANTHAKHAT and SARA U, UU too (pythainlp.util.normalize) https://github.com/PyThaiNLP/pythainlp/pull/244

Upgrade : pip install -U pythainlp
Docs : https://thainlp.org/pythainlp/docs/2.0/
User guide: https://github.com/PyThaiNLP/pythainlp/blob/dev/notebooks/pythainlp-get-started.ipynb

Page 12 of 21

© 2024 Safety CLI Cybersecurity Inc. All Rights Reserved.