Skip to content

Commit 94dd259

Browse files
authored
Update README.md
1 parent 5f0eb4f commit 94dd259

File tree

1 file changed

+6
-7
lines changed

1 file changed

+6
-7
lines changed

README.md

Lines changed: 6 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -27,13 +27,13 @@ PyThaiNLP is a Python package for text processing and linguistic analysis, simil
2727
## Capabilities
2828

2929
- Convenient character and word classes, like Thai consonants (```pythainlp.thai_consonants```), vowels (```pythainlp.thai_vowels```), digits (```pythainlp.thai_digits```), and stop words (```pythainlp.corpus.thai_stopwords```) -- comparable to constants like ```string.letters```, ```string.digits```, and ```string.punctuation```
30-
- Thai word segmentation (```word_tokenize```), including subword segmentation based on Thai Character Cluster (```tcc```) and ETCC (```etcc```)
31-
- Thai transliteration (```transliterate```) and experimental RTGS romanization (```romanize```)
30+
- Thai word segmentation (```word_tokenize```), including subword segmentation based on Thai Character Cluster (```subword_tokenize```)
31+
- Thai transliteration (```transliterate```)
3232
- Thai part-of-speech taggers (```pos_tag```)
3333
- Read out number to Thai words (```bahttext```, ```num_to_thaiword```)
3434
- Thai collation (sort by dictionoary order) (```collate```)
3535
- Thai-English keyboard misswitched fix (```eng_to_thai```, ```thai_to_eng```)
36-
- Thai misspellings detection and spelling correction (```spell```)
36+
- Thai spelling suggestion and correction (```spell``` and ```correct```)
3737
- Thai soundex (```lk82```, ```udom83```, ```metasound```)
3838
- Thai WordNet wrapper
3939
- and much more - see examples in [PyThaiNLP Get Started notebook](https://github.com/PyThaiNLP/pythainlp/blob/dev/notebooks/pythainlp-get-started.ipynb).
@@ -115,14 +115,13 @@ PyThaiNLP เป็นไลบารีภาษาไพทอนเพื่
115115
## ความสามารถ
116116

117117
- ชุดค่าคงที่ตัวอักษระและคำไทยที่เรียกใช้ได้สะดวก เช่น พยัญชนะ (```pythainlp.thai_consonants```), สระ (```pythainlp.thai_vowels```), ตัวเลขไทย (```pythainlp.thai_digits```), และ stop word (```pythainlp.corpus.thai_stopwords```) -- เหมือนกับค่าคงที่อย่าง ```string.letters```, ```string.digits```, และ ```string.punctuation```
118-
- Thai word segmentation (```word_tokenize```), including subword segmentation based on Thai Character Cluster (```tcc```) and ETCC (```etcc```)
119-
- ตัดคำภาษาไทย (```word_tokenize```) และรองรับ Thai Character Clusters (```tcc```) และ ETCC (```etcc```)
120-
- ถอดเสียงภาษาไทยเป็นอักษรละตินและสัทอักษร (```romanize```, ```transliterate```)
118+
- ตัดคำภาษาไทย (```word_tokenize```) และรองรับการตัดระดับต่ำกว่าคำโดยใช้ Thai Character Clusters (```subword_tokenize```)
119+
- ถอดเสียงภาษาไทยเป็นอักษรละตินและสัทอักษร (```transliterate```)
121120
- ระบุชนิดคำ (part-of-speech) ภาษาไทย (```pos_tag```)
122121
- อ่านตัวเลขเป็นข้อความภาษาไทย (```bahttext```, ```num_to_thaiword```)
123122
- เรียงลำดับคำตามพจนานุกรมไทย (```collate```)
124123
- แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา (```eng_to_thai```, ```thai_to_eng```)
125-
- ตรวจคำสะกดผิดในภาษาไทย (```spell```)
124+
- ตรวจคำสะกดผิดในภาษาไทย (```spell```, ```correct```)
126125
- soundex ภาษาไทย (```lk82```, ```udom83```, ```metasound```)
127126
- Thai WordNet wrapper
128127
- และอื่น ๆ ดูตัวอย่างได้ใน [PyThaiNLP Get Started notebook](https://github.com/PyThaiNLP/pythainlp/blob/dev/notebooks/pythainlp-get-started.ipynb)

0 commit comments

Comments
 (0)