ไม่ได้เป็นงานหรือทำขายอะไรครับ แค่ทำเล่นๆ รู้สึกสนใจ
ไอเดียผมคือจะทำเป็นคำถาม Yes No ไปเรื่อยๆครับ ซึ่งจะแยกได้หลายภาษามากๆ
แต่ผมไม่แน่ใจว่าควรเจาะเข้าทางไหน แล้วไปยังไง เพราะผมเองก็ไม่ได้มีความรู้ทางภาษาขนาดนั้น
คงต้องศึกษาอีกเยอะสุดๆเลยหละครับ เลยขอสอบถามทางลัดให้สำเร็จเร็วๆจากผู้รู้ครับ
แนวคิดผมคือ มองจากการที่ทุกคนรู้จักภาษาอังกฤษ และรู้จักอักษรอังกฤษ 26 ตัว
ถามก่อนเลยว่านี่ใช่ภาษาอังกฤษมั้ย ถ้าใช่ก็ได้คำตอบว่าอังกฤษ จบ
ถ้าไม่ใช่
1 ภาษานั้นมีอย่างน้อย 1 อักษรที่เป็นอักษรอังกฤษหรือเปล่า (ใช่ ไป 1.1 ไม่ใช่ไป 2.2)
1.1 ทุกอักษร เป็นอักษรอังกฤษหมดเลยมั้ย (ใช่ไป 1.1.1 ไม่ใช่ไป 1.2)
1.1.1 ส่วนใหญ่เป็นคำไม่มีตัวสะกดมั้ย หรือถ้ามีก็เป็นรูปแบบง่ายๆ เช่น ... (ใช่ไปสาย A ไม่ใช่ไป 1.1.2)
สาย A เช่น ภาษา เมารี ฮาวาย ก็เดี๋ยวลงลึกต่อ
1.1.2 สาย B เช่น ภาษา มาเลเซีย ฟิลิปปินส์ อิตาลี ไว้ลงลึกต่อ
จะมีบางภาษาเช่น สเปน ที่ใช้อักษรอังกฤษ + Ñ และเป็นภาษาเดียวที่มีเครื่องหมายกลับหัว เช่น ¡Mira!
รวมถึงบางภาษาที่มีอักษรเฉพาะตัว
ก็จะมีคำถามว่า แน่ใจนะว่าเป็นอังกฤษทุกตัวหมด ถ้าใช่ก็ต่อ ถ้าไม่ใช่ก็ไป 1.2.1 เผื่อบางทีดูตกหล่น
ถ้ามีก็ได้คำตอบว่าเป็นภาษานั้นเลย แต่ถ้าไม่มีก็จะไปแยกรูป ดูลักษณะคำต่อ
ซึ่งก็อาจจะกลับมาคำตอบเดิม เพราะอย่างสเปนที่มีเอกลักษณ์คือ Ñ หรือเครื่องหมายกลับหัว ก็ไม่ใช่ว่าจะต้องมีตลอด เราต้องเผื่อไว้ด้วย
1.2 ส่วนใหญ่เป็นอักษรอังกฤษแล้วมีตัวแปลกๆไม่กี่ตัวมั้ย (ใช่ไป 1.2.1 ไม่ใช่ไป 1.3)
1.2.1 แยกภาษาตามตัวแปลกเลย
อย่างสเปนจะเป็นภาษาเดียวที่มี Ã ก็ถ้าเจออันนี้จะตอบสเปนเลย
สรุป สเปนจะเข้าได้ 3 ทางคือ การเห็นชัดๆว่าภาษามันมีตัวแปลกแล้วเจอ Ã หรือ Ñ / การคิดว่าเป็นอักษรอังกฤษแล้วมาเจอตัวแปลกทีหลัง เช่น Ñ / การไม่เจอตัวแปลกเลย แต่รูปแบบการวร้างคำก็จะบอก
1.3 (ส่วนใหญ่เป็นตัวแปลกแล้วมีอังกฤษไม่กี่ตัว) สาย C เช่น กรีก รัสเซีย
ถ้าใช่ก็ไปต่อ ถ้าไม่ใช่ก็ไป 2
2 มีอักษรที่คล้ายกับอักษรอังกฤษ แต่ไม่เหมือนซะทีเดียวมั้ย (ใช่ไป 2.1 ไม่ใช่ไป 3)
2.1 อาจกลับเข้าสาย C หรือไปสาย D เป็นตัวที่คล้ายๆแต่ไม่มีอังกฤษเลย
2.2 เป็นอักษรอื่นเลย ไม่ได้มีความคล้ายอังกฤษจริงๆใช่มั้ย (ใช่ไป 3 ไม่ใช่ไป 2.1)
3 มีความแยกเป็นตัวอักษรชัดเจนมั้ย (ใช่ไป 3.1 ไม่ใช่ไป 4)
3.1 มีความเป็นอักษรในช่องมั้ย (แต่ละตัวใช้ระยะเท่าๆกัน) (ใช่ไป 3.1.1 ไม่ใช่ไป 3.2)
3.1.1 สาย E เช่น จีน ญี่ปุ่น เกาหลี
3.2 มีความเป็นวงกลมมั้ย (ใช่ไป 3.2.1 ไม่ใช่ไป 3.3)
3.2.1 แล้วโหนบาด้วยมั้ย (ใช่ไป 3.2.2 ไม่ใช่ไป 3.2.3)
3.2.2 สาย F เช่น คานนาดา
3.2.3 สาย G เช่น เตลูกู สิงหล ลาว ไทย
3.3 มีความโหนบามั้ย (ใช่ไป 3.3.1 ไม่ใช่ไป 3.4)
3.3.1 สาย H เช่น อัสสัม เบงกาลี อาจจะเข้าไปบางอันในสาย F ได้
3.4 no idea
4 มีความโหนบาเชื่อมติดกันมั้ย (ใช่ไป 4.1 ไม่ใช่ no idea beyond this)
4.1 สาย I เช่น ฮินดี สันสกฤต ปัญจาบ
no idea beyond this
อยากเขียนโปรแกรม ระบุว่าภาษาที่เห็นคือภาษาอะไรจากการดูเพียงตัวอักษร ควรเริ่มจากอะไรดีครับ
ไอเดียผมคือจะทำเป็นคำถาม Yes No ไปเรื่อยๆครับ ซึ่งจะแยกได้หลายภาษามากๆ
แต่ผมไม่แน่ใจว่าควรเจาะเข้าทางไหน แล้วไปยังไง เพราะผมเองก็ไม่ได้มีความรู้ทางภาษาขนาดนั้น
คงต้องศึกษาอีกเยอะสุดๆเลยหละครับ เลยขอสอบถามทางลัดให้สำเร็จเร็วๆจากผู้รู้ครับ
แนวคิดผมคือ มองจากการที่ทุกคนรู้จักภาษาอังกฤษ และรู้จักอักษรอังกฤษ 26 ตัว
ถามก่อนเลยว่านี่ใช่ภาษาอังกฤษมั้ย ถ้าใช่ก็ได้คำตอบว่าอังกฤษ จบ
ถ้าไม่ใช่
1 ภาษานั้นมีอย่างน้อย 1 อักษรที่เป็นอักษรอังกฤษหรือเปล่า (ใช่ ไป 1.1 ไม่ใช่ไป 2.2)
1.1 ทุกอักษร เป็นอักษรอังกฤษหมดเลยมั้ย (ใช่ไป 1.1.1 ไม่ใช่ไป 1.2)
1.1.1 ส่วนใหญ่เป็นคำไม่มีตัวสะกดมั้ย หรือถ้ามีก็เป็นรูปแบบง่ายๆ เช่น ... (ใช่ไปสาย A ไม่ใช่ไป 1.1.2)
สาย A เช่น ภาษา เมารี ฮาวาย ก็เดี๋ยวลงลึกต่อ
1.1.2 สาย B เช่น ภาษา มาเลเซีย ฟิลิปปินส์ อิตาลี ไว้ลงลึกต่อ
จะมีบางภาษาเช่น สเปน ที่ใช้อักษรอังกฤษ + Ñ และเป็นภาษาเดียวที่มีเครื่องหมายกลับหัว เช่น ¡Mira!
รวมถึงบางภาษาที่มีอักษรเฉพาะตัว
ก็จะมีคำถามว่า แน่ใจนะว่าเป็นอังกฤษทุกตัวหมด ถ้าใช่ก็ต่อ ถ้าไม่ใช่ก็ไป 1.2.1 เผื่อบางทีดูตกหล่น
ถ้ามีก็ได้คำตอบว่าเป็นภาษานั้นเลย แต่ถ้าไม่มีก็จะไปแยกรูป ดูลักษณะคำต่อ
ซึ่งก็อาจจะกลับมาคำตอบเดิม เพราะอย่างสเปนที่มีเอกลักษณ์คือ Ñ หรือเครื่องหมายกลับหัว ก็ไม่ใช่ว่าจะต้องมีตลอด เราต้องเผื่อไว้ด้วย
1.2 ส่วนใหญ่เป็นอักษรอังกฤษแล้วมีตัวแปลกๆไม่กี่ตัวมั้ย (ใช่ไป 1.2.1 ไม่ใช่ไป 1.3)
1.2.1 แยกภาษาตามตัวแปลกเลย
อย่างสเปนจะเป็นภาษาเดียวที่มี Ã ก็ถ้าเจออันนี้จะตอบสเปนเลย
สรุป สเปนจะเข้าได้ 3 ทางคือ การเห็นชัดๆว่าภาษามันมีตัวแปลกแล้วเจอ Ã หรือ Ñ / การคิดว่าเป็นอักษรอังกฤษแล้วมาเจอตัวแปลกทีหลัง เช่น Ñ / การไม่เจอตัวแปลกเลย แต่รูปแบบการวร้างคำก็จะบอก
1.3 (ส่วนใหญ่เป็นตัวแปลกแล้วมีอังกฤษไม่กี่ตัว) สาย C เช่น กรีก รัสเซีย
ถ้าใช่ก็ไปต่อ ถ้าไม่ใช่ก็ไป 2
2 มีอักษรที่คล้ายกับอักษรอังกฤษ แต่ไม่เหมือนซะทีเดียวมั้ย (ใช่ไป 2.1 ไม่ใช่ไป 3)
2.1 อาจกลับเข้าสาย C หรือไปสาย D เป็นตัวที่คล้ายๆแต่ไม่มีอังกฤษเลย
2.2 เป็นอักษรอื่นเลย ไม่ได้มีความคล้ายอังกฤษจริงๆใช่มั้ย (ใช่ไป 3 ไม่ใช่ไป 2.1)
3 มีความแยกเป็นตัวอักษรชัดเจนมั้ย (ใช่ไป 3.1 ไม่ใช่ไป 4)
3.1 มีความเป็นอักษรในช่องมั้ย (แต่ละตัวใช้ระยะเท่าๆกัน) (ใช่ไป 3.1.1 ไม่ใช่ไป 3.2)
3.1.1 สาย E เช่น จีน ญี่ปุ่น เกาหลี
3.2 มีความเป็นวงกลมมั้ย (ใช่ไป 3.2.1 ไม่ใช่ไป 3.3)
3.2.1 แล้วโหนบาด้วยมั้ย (ใช่ไป 3.2.2 ไม่ใช่ไป 3.2.3)
3.2.2 สาย F เช่น คานนาดา
3.2.3 สาย G เช่น เตลูกู สิงหล ลาว ไทย
3.3 มีความโหนบามั้ย (ใช่ไป 3.3.1 ไม่ใช่ไป 3.4)
3.3.1 สาย H เช่น อัสสัม เบงกาลี อาจจะเข้าไปบางอันในสาย F ได้
3.4 no idea
4 มีความโหนบาเชื่อมติดกันมั้ย (ใช่ไป 4.1 ไม่ใช่ no idea beyond this)
4.1 สาย I เช่น ฮินดี สันสกฤต ปัญจาบ
no idea beyond this