A Node-Driven Parse Pruning Technique for
Probabilistic GLR Parsing


Virach Sornlertlamvanich
National Electronics and Computers Technology Center
22F Gypsum Metropolitan Tower, 539/2 Sriayudhya Rd.,
Rajthevi, Bangkok 10400, Thailand.
virach@links.nectec.or.th


ABSTRACT -- This paper proposed a new technique, a node-driven parse pruning technique, in pruning the less probable parses for GLR parsing algorithm. Without decreasing the efficiency of GLR parsing, this technique estimates the number of parses in the GSS(graph-structured stack) based on the number of expanded nodes during the parse process. We show the evaluation results of various beam width settings for pruning and compare the parse time and space consumption against full parsing results. Our node-driven parse pruning algorithm allows pruning in a left-to-right manner without modifying the GSS.
Keywords -- Probabilistic GLR parsing, parse pruning, GSS, beam search.

บทคัดย่อ -- บทความนี้เสนอวิธีการในการขจัดผลการแจงส่วนที่มีความเป็นไปได้ต่ำออกไป, สำหรับการใช้งานในการแจงส่วนแบบ GLR. วิธรการนี้ได้อาศัยจำนวนขั้นของการเคลื่อนสถานะมาเป็นตัวประมาณจำนวนของแขนงของการแจงส่วนใน GSS} จึงเรียกวิธีนี้ว่า "การขจัดผลการแจงส่วนโดยอาศัยจำนวนโนด". เราได้ทำการทดลองเพื่อเปรียบเทียบการใช้เวลาและหน่วยความจำสำหรับการขจัดผลการแจงส่วนในเกณฑ์ต่าง ๆ กับการแจงส่วนปกติ. วิธีการนี้มีข้อดีอีกอย่างหนึ่งคือสามารถคำนวณได้ตามการแจงส่วนจากซ้ายไปขวาโดยไม่ได้เปลี่ยนแปลงโครงสร้างของ GSS ซึ่งมีประสิทธิภาพของการเก็บข้อมูลของการแจงที่ดีอยู่แล้ว
คำสำคัญ -- การแจงส่วน GLR ด้วยความน่าจะเป็น, การขจัดแขนงของการแจงส่วน, GSS, การสืบค้นแบบบีม.


National Electronics and Computer Technology Center (NECTEC)
Copyright  © 2001 By Information System Service Section. All right reserved.