Skip to content

Commit 5cf1520

Browse files
authored
Update README.md
1 parent 8bcbf2b commit 5cf1520

File tree

1 file changed

+2
-0
lines changed

1 file changed

+2
-0
lines changed

README.md

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -77,6 +77,7 @@ $ pip install pythainlp[extra1,extra2,...]
7777

7878
where `extras` can be
7979
- `artagger` (to support artagger part-of-speech tagger)*
80+
- `attacut` Fast and Reasonably Accurate Word Tokenizer for Thai (**6x faster than DeepCut**)
8081
- `deepcut` (to support deepcut machine-learnt tokenizer)
8182
- `icu` (for ICU, International Components for Unicode, support in transliteration and tokenization)
8283
- `ipa` (for IPA, International Phonetic Alphabet, support in transliteration)
@@ -177,6 +178,7 @@ $ pip install pythainlp[extra1,extra2,...]
177178

178179
โดยที่ `extras` คือ
179180
- `artagger` (สำหรับตัวติดป้ายกำกับชนิดคำ artagger)*
181+
- `attacut` ตัวตัดคำแบบ Deep Learning ที่**เร็วกว่า deepcut 6 เท่า** และประสิทธิภาพการตัดคำแม่นกว่า `newmm` เมื่อเทียบกับชุดข้อมูล BEST
180182
- `deepcut` (สำหรับตัวตัดคำ deepcut)
181183
- `icu` (สำหรับการถอดตัวสะกดเป็นสัทอักษรและการตัดคำด้วย ICU)
182184
- `ipa` (สำหรับการถอดตัวสะกดเป็นสัทอักษรสากล (IPA))

0 commit comments

Comments
 (0)