เก่งศัพท์จาก Thai <> ENG Dictionary ฟรีจาก LEXiTRON

กระทู้สนทนา
ปัจจุบันภาษาอังกฤษมีความสำคัญมาก หลายๆคนไม่สะดวกที่จะเปิดเล่มดิกชั่นนารี จึงหันมาหาซอฟต์แวร์พจานานุกรมต่างๆ ผมขอแนะนำ Free Dictionary จาก LEXiTRON ซึ่งพัฒนาโดย Nectec ซึ่งมั่นใจได้อยู่แล้วว่าไม่ใช่ซอฟต์แวร์เถื่อนแน่นอน

http://lexitron.nectec.or.th เป็นเวบไซต์ดิกชั่นนารี ออนไลน์ ให้คุณค้นหาคำศัพท์ที่ต้องการได้ง่ายแบบออนไลน์

พจนานุกรมสื่ออิเล็กทรอนิกส์ไทย <-> อังกฤษ LEXiTRON เวอร์ชัน 2.0 จัดทำโดยฝ่ายวิจัยและ
พัฒนาสาขาสารสนเทศ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ เป็นงานพัฒนาต่อเนื่องจาก
เวอร์ชัน 1.1 ซึ่งเพิ่มเติมฐานข้อมูลจากเดิมที่มีอยู่ให้เป็นคลังข้อความพจนานุกรมที่มีขนาดใหญ่
หลักการสำคัญของการพัฒนา LEXiTRON คือ การนำเทคโนโลยีฐานข้อมูลขนาดใหญ่เข้ามาช่วยในการวิจัยและพัฒนาในสาขาการประมวลผล
ภาษาธรรมชาติ เรียกว่า การสร้างพจนานุกรมจากฐานข้อมูลขนาดใหญ่ (Corpus-Based Dictionary)

วิธีการสร้างฐานข้อมูลขนาดใหญ่ (Corpus)
เป็นการใช้เทคโนโลยีทางคอมพิวเตอร์รวบรวมและคัดเลือกคำ ประโยค หรือข้อความ ที่มีใช้จริงและมีอัตราการปรากฏสูงในบริบทต่างๆ ของการใช้ภาษา จากแหล่งข้อมูลและข่าวสารที่เผยแพร่ทางอินเทอร์เน็ตและแหล่งข้อมูลอื่นๆ ที่เชื่อถือได้ เช่น วรรณกรรม
บทความ เอกสารทางวิชาการ ข้อมูลข่าวสารจากหนังสือพิมพ์ เป็นต้น



ลักษณะเด่น
แสดงความหมายและประเภทของคำพร้อมทั้งประโยคตัวอย่างที่มีใช้จริงและมีอัตราการปรากฏ
สูงในบริบทต่างๆ ของการใช้ภาษา

องค์ประกอบของการพัฒนา
1. ฐานข้อมูลพจนานุกรม
1.1 อังกฤษ-ไทย (53,000 คำ) ประกอบด้วย คำศัพท์ภาษาอังกฤษ คำแปลภาษาไทย คำอ่าน คำหลัก
คำค้นหา คำพ้องและคำตรงข้ามความหมายภาษาไทย คำพ้องและคำตรงข้ามความหมายภาษาอังกฤษ และตัวอย่างประโยคภาษาอังกฤษที่อ้างอิงจากคลังข้อความขนาดใหญ่ (Corpus-Based Sentence)
1.2 ไทย-อังกฤษ (35,000 คำ) ประกอบด้วย คำศัพท์ภาษาไทย คำแปลภาษาอังกฤษ คำพ้อง ความหมายภาษาไทย คำตรงข้ามความหมายภาษาไทย คำนิยามศัพท์ คำลักษณนาม และตัวอย่างประโยคภาษาไทย
2. การพัฒนาโปรแกรม
2.1 คลังข้อมูลประโยค คือ Orchid Corpus ที่พัฒนาโดย ฝ่ายวิจัยและพัฒนาสาขาสารสนเทศ
2.2 โปรแกรมสำหรับการพัฒนาคือ J builder และ Apache

Acknowledgements
1. เสียงภาษาอังกฤษ สร้างจาก Microsoft Concatenative Speech Synthesis Engine
2. เสียงภาษาไทย สร้างจาก Vaja Text-to-Speech Engine พัฒนาโดย RDI, NECTEC

ข้อมูลเพิ่มเติม http://lexitron.nectec.or.th

ข้อมูลจาก ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ

แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่