การเรียงลำดับคำในประโยคภาษาไทยโดยใช้กฎ

Document type: NSC Document
Collection: Thai Language Processing Software Contest : Special Topics
Attached Files (Some files may be inaccessible until you login with your คลังความรู้ออนไลน์ credentials)
Name Description MIMEType Size Downloads
FullReport.pdf FullReport application/pdf 0
Proposal.pdf Proposal application/pdf 1020.50KB 0

Title การเรียงลำดับคำในประโยคภาษาไทยโดยใช้กฎ
Alternative Title Rule-based Thai Word Reordering
Creator(s) ยุพาพร เศษไธสง
วิมลรัตน์ คะอังกุ
Subject RFID Application for Industry
Keyword(s) การทำเหมืองข้อมูล
การประมวลผลภาษาธรรมชาติ
การเรียงลำดับคำ
ไวยากรณ์
ตรวจสอบข้อผิดพลาด
Data mining
Natural language processing
Thai word reordering
Grammar
Error Detection
Description การเรียงลำดับคำในประโยคภาษาไทยเป็นปัญหาสำคัญอย่างหนึ่งในการเรียนการสอนภาษาไทย สำหรับนักเรียนระดับประถมศึกษา รวมทั้งการเรียนรู้ภาษาไทยของผู้พิการทางการได้ยินหรือชาวต่างชาติ เหตุผลหนึ่งอาจเป็นเพราะความแตกต่างทางด้านไวยากรณ์ นอกจากนี้การเรียงลำดับคำยังเป็นขั้นตอนที่สำคัญในกระบวนการแปลภาษาด้วยเครื่อง (Machine Translation) อีกด้วย โปรแกรมเรียงลำดับคำในประโยคภาษาไทยจึงได้ถูกพัฒนาขึ้น โดยการพัฒนากฎการเรียงลำดับคำ ซึ่งอาศัยหลักการทำเหมืองข้อมูล (Data Mining) และการประมวลผลภาษาธรรมชาติ (Natural Language Processing) มาช่วยในการวิเคราะห์โครงสร้างประโยคภาษาไทย แล้วนำไปสร้างเป็นโมเดลหรือกฎในการเรียงลำดับ โมเดลนี้คือต้นไม้ตัดสินใจ (Decision Tree) ที่สร้างขึ้นจากโปรแกรม Weka 3.6.1 ด้วยอัลกอริทึม C4.5 จากประโยคตัวอย่าง จำนวน 1000 ประโยค โปรแกรมเรียงลำดับคำในประโยคภาษาไทยถูกพัฒนาเป็นแบบเว็บแอพพลิเคชั่นด้วยชุดโปรแกรม AppServ 2.5.9 เพื่อรองรับการใช้งานจากผู้ใช้ทั่วไป โปรแกรมสามารถใช้ตรวจสอบความถูกต้องของลำดับคำในประโยค และสามารถแนะนำประโยคที่เรียงลำดับได้ถูกต้องตามหลักไวยากรณ์ภาษาไทยในกรณีที่ลำดับคำในประโยคผิด ทำให้ผู้เรียนสามารถเรียนรู้โครงสร้างประโยคภาษาไทย เป็นการอำนวยความสะดวก และรวดเร็วสำหรับผู้ที่เริ่มต้นเรียนรู้โครงสร้างประโยคของภาษาไทยได้
For primary school students sequence of words in forming Thai sentence is one of the major problems in learning Thai. The problem has been found in the learning system of the hearing-impaired and the foreigners. This may be due to differences in languages grammar. Moreover word reordering system plays an important role in machine translation system. We developed the rule-based Thai word reordering system which is based on the principle of data mining and natural language processing. The Thai grammar is taken into account for developing the ordering rules. The rules generated from the decision tree were developed by using C4.5 algorithm in Weka 3.6.1 from 1005 sample sentences. The system so called the rule-based Thai word reordering program was implemented under AppServ 2.5.9 suite. It’s a web application available for all user access. The developed program can introduce grammatically correct sentence structures in accordance with the target sentence. By using the program learners will be able to study Thai grammatically correct sentences easily conveniently and fast.
Publisher มหาวิทยาลัยอุบลราชธานี
Editor/Contributor ณัฏฐ์ ดิษเจริญ
Date 2011
Identifier 13P33I862
Language Thai
Place of Publication อุบลราชธานี
 
Created: Tue, 23 Aug 2011, 20:58:16 ICT by saran dianprapai  -  Detailed History