Skip to content

Commit ea703f2

Browse files
Chakri LowphansirikulChakri Lowphansirikul
authored andcommitted
add test cases for new option tag
changes in this commit: - assert the output of the method `get_ner` when argument `tag` is set to True for all 13 tags as described in (https://github.com/wannaphongcom/thai-ner/tree/master/model/1.2) - assert the output of the method `get_ner` when argument `pos` is set to True - asser the output of the method `get_ner` when argument `pos` is set to False
1 parent d44b03f commit ea703f2

File tree

1 file changed

+99
-0
lines changed

1 file changed

+99
-0
lines changed

tests/test_tag.py

Lines changed: 99 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -87,6 +87,105 @@ def test_ner(self):
8787
จังหวัดหนองคาย 43000"""
8888
)
8989
)
90+
91+
# arguement `tag` is True
92+
self.assertEqual(
93+
ner.get_ner(
94+
"วันที่ 15 ก.ย. 61 ทดสอบระบบเวลา 14:49 น.",
95+
tag=True
96+
),
97+
"วันที่ <DATE>15 ก.ย. 61</DATE> "
98+
"ทดสอบระบบเวลา <TIME>14:49 น.</TIME>")
99+
100+
self.assertEqual(
101+
ner.get_ner(
102+
"url = https://thainlp.org/pythainlp/docs/2.0/",
103+
tag=True
104+
),
105+
"url = <URL>https://thainlp.org/pythainlp/docs/2.0/</URL>")
106+
107+
self.assertEqual(
108+
ner.get_ner(
109+
"example@gmail.com",
110+
tag=True
111+
),
112+
"<EMAIL>example@gmail.com</EMAIL>")
113+
114+
self.assertEqual(
115+
ner.get_ner(
116+
"รหัสไปรษณีย์ 19130",
117+
tag=True
118+
),
119+
"รหัสไปรษณีย์ <ZIP>19130</ZIP>")
120+
121+
self.assertEqual(
122+
ner.get_ner(
123+
"เบอร์โทรศัพท์ 00-120-1100",
124+
tag=True
125+
),
126+
"เบอร์โทรศัพท์ <PHONE>00-120-1100</PHONE>")
127+
128+
self.assertEqual(
129+
ner.get_ner(
130+
"อาจารย์เอกพล ประจำคณะวิสกรรมศาสตร์ ",
131+
tag=True
132+
),
133+
"<PERSON>อาจารย์เอกพล</PERSON> ประจำ<ORGANIZATION>"
134+
"คณะวิสกรรมศาสตร์</ORGANIZATION> ")
135+
136+
self.assertEqual(
137+
ner.get_ner(
138+
"มาตรา 80 ให้ใช้อัตราภาษีร้อยละ 10.0"
139+
" ในการคำนวณภาษีมูลค่าเพิ่ม",
140+
tag=True
141+
),
142+
"<LAW>มาตรา 80</LAW> ให้ใช้อัตราภาษี<PERCENT>ร้อยละ 10.0</PERCENT>"
143+
" ในการคำนวณภาษีมูลค่าเพิ่ม")
144+
145+
self.assertEqual(
146+
ner.get_ner(
147+
"ยาว 20 เซนติเมตร",
148+
tag=True
149+
),
150+
"ยาว <LEN>20 เซนติเมตร</LEN>")
151+
152+
self.assertEqual(
153+
ner.get_ner(
154+
"1 บาท",
155+
pos=True,
156+
tag=True),
157+
"<MONEY>1 บาท</MONEY>")
158+
159+
self.assertEqual(
160+
ner.get_ner(
161+
"ไทย",
162+
pos=False,
163+
tag=True
164+
),
165+
"<LOCATION>ไทย</LOCATION>")
166+
167+
# arguement `tag` is False and `pos` is True
168+
self.assertEqual(
169+
ner.get_ner(
170+
"ไทย",
171+
pos=True,
172+
tag=False
173+
),
174+
[('ไทย', 'PROPN', 'B-LOCATION')])
175+
176+
# arguement `tag` is False and `pos` is False
177+
self.assertEqual(
178+
ner.get_ner(
179+
"วันที่ 15 ก.ย. 61 ทดสอบระบบเวลา 14:49 น.",
180+
pos=False,
181+
tag=False
182+
),
183+
[('วันที่', 'O'), (' ', 'O'), ('15', 'B-DATE'),
184+
(' ', 'I-DATE'), ('ก.ย.', 'I-DATE'), (' ', 'I-DATE'),
185+
('61', 'I-DATE'), (' ', 'O'), ('ทดสอบ', 'O'), ('ระบบ', 'O'),
186+
('เวลา', 'O'), (' ', 'O'), ('14', 'B-TIME'), (':', 'I-TIME'),
187+
('49', 'I-TIME'), (' ', 'I-TIME'), ('น.', 'I-TIME')])
188+
90189
# self.assertEqual(
91190
# ner.get_ner("แมวทำอะไรตอนห้าโมงเช้า"),
92191
# [

0 commit comments

Comments
 (0)