Skip to content

Commit e05c5ec

Browse files
authored
Fix Thai valid text and add Thai illegal sequences
- Fix a invalid sequence in "valid text" `kScriptText` - Add two illegal sequence in `kBadlyFormedThaiWords`
1 parent bc3ea62 commit e05c5ec

File tree

1 file changed

+3
-2
lines changed

1 file changed

+3
-2
lines changed

unittest/normstrngs_test.cc

+3-2
Original file line numberDiff line numberDiff line change
@@ -76,7 +76,8 @@ const char kKorText[] = "이는 것으로";
7676
// Hindi words containing illegal vowel sequences.
7777
const char* kBadlyFormedHinWords[] = {"उपयोक्ताो", "नहीें", "प्रंात",
7878
"कहीअे", "पत्रिाका", "छह्णाीस"};
79-
const char* kBadlyFormedThaiWords[] = {"ฤิ", "กา้ํ", "กิำ"};
79+
// Thai illegal sequences.
80+
const char* kBadlyFormedThaiWords[] = {"ฤิ", "กา้ํ", "กิำ", "นำ้", "เเก"};
8081

8182
TEST(NormstrngsTest, DetectsCorrectText) {
8283
string chars;
@@ -287,7 +288,7 @@ TEST(NormstrngsTest, AllScriptsRegtest) {
287288
{"Thai",
288289
"อ้อ! กับนัง....แม่ยอดพระกลิ่น นั่นเอง ! หรับก็ย่อมจะรู้โดยชัดเจนว่า "
289290
"ถ้าตราบใดยังมีเรือปืนอยู่ใกล้ ๆ แล้ว ตราบนั้น "
290-
"พระดำรินี้ ที่มีคตีท่ำกรวยหมากและธปเทียน "
291+
"พระดำรินี้ ที่มีท่ากรวยหมากและธูปเทียน "
291292
"อันยานมีเรือเปนต้นฃ้ามยาก ฯ เพราะว่าแม่น้ำนั่นมีน้ำใสยิ่ง แม้เพียง"},
292293
{"Vietnamese",
293294
"vợ đến tai mụ hung thần Xăng-tô- mê-a. Mụ vô cùng "

0 commit comments

Comments
 (0)