ปัจจุบันภาษาอังกฤษมีความสำคัญมาก หลายๆคนไม่สะดวกที่จะเปิดเล่มดิกชั่นนารี จึงหันมาหาซอฟต์แวร์พจานานุกรมต่างๆ ผมขอแนะนำ Free Dictionary จาก LEXiTRON ซึ่งพัฒนาโดย Nectec ซึ่งมั่นใจได้อยู่แล้วว่าไม่ใช่ซอฟต์แวร์เถื่อนแน่นอน
http://lexitron.nectec.or.th เป็นเวบไซต์ดิกชั่นนารี ออนไลน์ ให้คุณค้นหาคำศัพท์ที่ต้องการได้ง่ายแบบออนไลน์
พจนานุกรมสื่ออิเล็กทรอนิกส์ไทย <-> อังกฤษ LEXiTRON เวอร์ชัน 2.0 จัดทำโดยฝ่ายวิจัยและ
พัฒนาสาขาสารสนเทศ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ เป็นงานพัฒนาต่อเนื่องจาก
เวอร์ชัน 1.1 ซึ่งเพิ่มเติมฐานข้อมูลจากเดิมที่มีอยู่ให้เป็นคลังข้อความพจนานุกรมที่มีขนาดใหญ่
หลักการสำคัญของการพัฒนา LEXiTRON คือ การนำเทคโนโลยีฐานข้อมูลขนาดใหญ่เข้ามาช่วยในการวิจัยและพัฒนาในสาขาการประมวลผล
ภาษาธรรมชาติ เรียกว่า การสร้างพจนานุกรมจากฐานข้อมูลขนาดใหญ่ (Corpus-Based Dictionary)
วิธีการสร้างฐานข้อมูลขนาดใหญ่ (Corpus) เป็นการใช้เทคโนโลยีทางคอมพิวเตอร์รวบรวมและคัดเลือกคำ ประโยค หรือข้อความ ที่มีใช้จริงและมีอัตราการปรากฏสูงในบริบทต่างๆ ของการใช้ภาษา จากแหล่งข้อมูลและข่าวสารที่เผยแพร่ทางอินเทอร์เน็ตและแหล่งข้อมูลอื่นๆ ที่เชื่อถือได้ เช่น วรรณกรรม
บทความ เอกสารทางวิชาการ ข้อมูลข่าวสารจากหนังสือพิมพ์ เป็นต้น
ลักษณะเด่น
แสดงความหมายและประเภทของคำพร้อมทั้งประโยคตัวอย่างที่มีใช้จริงและมีอัตราการปรากฏ
สูงในบริบทต่างๆ ของการใช้ภาษา
องค์ประกอบของการพัฒนา
1. ฐานข้อมูลพจนานุกรม
1.1 อังกฤษ-ไทย (53,000 คำ) ประกอบด้วย คำศัพท์ภาษาอังกฤษ คำแปลภาษาไทย คำอ่าน คำหลัก
คำค้นหา คำพ้องและคำตรงข้ามความหมายภาษาไทย คำพ้องและคำตรงข้ามความหมายภาษาอังกฤษ และตัวอย่างประโยคภาษาอังกฤษที่อ้างอิงจากคลังข้อความขนาดใหญ่ (Corpus-Based Sentence)
1.2 ไทย-อังกฤษ (35,000 คำ) ประกอบด้วย คำศัพท์ภาษาไทย คำแปลภาษาอังกฤษ คำพ้อง ความหมายภาษาไทย คำตรงข้ามความหมายภาษาไทย คำนิยามศัพท์ คำลักษณนาม และตัวอย่างประโยคภาษาไทย
2. การพัฒนาโปรแกรม
2.1 คลังข้อมูลประโยค คือ Orchid Corpus ที่พัฒนาโดย ฝ่ายวิจัยและพัฒนาสาขาสารสนเทศ
2.2 โปรแกรมสำหรับการพัฒนาคือ J builder และ Apache
Acknowledgements
1. เสียงภาษาอังกฤษ สร้างจาก Microsoft Concatenative Speech Synthesis Engine
2. เสียงภาษาไทย สร้างจาก Vaja Text-to-Speech Engine พัฒนาโดย RDI, NECTEC
ข้อมูลเพิ่มเติม http://lexitron.nectec.or.th
ข้อมูลจาก ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
เก่งศัพท์จาก Thai <> ENG Dictionary ฟรีจาก LEXiTRON
http://lexitron.nectec.or.th เป็นเวบไซต์ดิกชั่นนารี ออนไลน์ ให้คุณค้นหาคำศัพท์ที่ต้องการได้ง่ายแบบออนไลน์
พจนานุกรมสื่ออิเล็กทรอนิกส์ไทย <-> อังกฤษ LEXiTRON เวอร์ชัน 2.0 จัดทำโดยฝ่ายวิจัยและ
พัฒนาสาขาสารสนเทศ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ เป็นงานพัฒนาต่อเนื่องจาก
เวอร์ชัน 1.1 ซึ่งเพิ่มเติมฐานข้อมูลจากเดิมที่มีอยู่ให้เป็นคลังข้อความพจนานุกรมที่มีขนาดใหญ่
หลักการสำคัญของการพัฒนา LEXiTRON คือ การนำเทคโนโลยีฐานข้อมูลขนาดใหญ่เข้ามาช่วยในการวิจัยและพัฒนาในสาขาการประมวลผล
ภาษาธรรมชาติ เรียกว่า การสร้างพจนานุกรมจากฐานข้อมูลขนาดใหญ่ (Corpus-Based Dictionary)
วิธีการสร้างฐานข้อมูลขนาดใหญ่ (Corpus)
เป็นการใช้เทคโนโลยีทางคอมพิวเตอร์รวบรวมและคัดเลือกคำ ประโยค หรือข้อความ ที่มีใช้จริงและมีอัตราการปรากฏสูงในบริบทต่างๆ ของการใช้ภาษา จากแหล่งข้อมูลและข่าวสารที่เผยแพร่ทางอินเทอร์เน็ตและแหล่งข้อมูลอื่นๆ ที่เชื่อถือได้ เช่น วรรณกรรม
บทความ เอกสารทางวิชาการ ข้อมูลข่าวสารจากหนังสือพิมพ์ เป็นต้น
ลักษณะเด่น
แสดงความหมายและประเภทของคำพร้อมทั้งประโยคตัวอย่างที่มีใช้จริงและมีอัตราการปรากฏ
สูงในบริบทต่างๆ ของการใช้ภาษา
องค์ประกอบของการพัฒนา
1. ฐานข้อมูลพจนานุกรม
1.1 อังกฤษ-ไทย (53,000 คำ) ประกอบด้วย คำศัพท์ภาษาอังกฤษ คำแปลภาษาไทย คำอ่าน คำหลัก
คำค้นหา คำพ้องและคำตรงข้ามความหมายภาษาไทย คำพ้องและคำตรงข้ามความหมายภาษาอังกฤษ และตัวอย่างประโยคภาษาอังกฤษที่อ้างอิงจากคลังข้อความขนาดใหญ่ (Corpus-Based Sentence)
1.2 ไทย-อังกฤษ (35,000 คำ) ประกอบด้วย คำศัพท์ภาษาไทย คำแปลภาษาอังกฤษ คำพ้อง ความหมายภาษาไทย คำตรงข้ามความหมายภาษาไทย คำนิยามศัพท์ คำลักษณนาม และตัวอย่างประโยคภาษาไทย
2. การพัฒนาโปรแกรม
2.1 คลังข้อมูลประโยค คือ Orchid Corpus ที่พัฒนาโดย ฝ่ายวิจัยและพัฒนาสาขาสารสนเทศ
2.2 โปรแกรมสำหรับการพัฒนาคือ J builder และ Apache
Acknowledgements
1. เสียงภาษาอังกฤษ สร้างจาก Microsoft Concatenative Speech Synthesis Engine
2. เสียงภาษาไทย สร้างจาก Vaja Text-to-Speech Engine พัฒนาโดย RDI, NECTEC
ข้อมูลเพิ่มเติม http://lexitron.nectec.or.th
ข้อมูลจาก ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ