THAI TYPE STYLE RECOGNITION

Chularat Tanprasert, Sutat Sae-Tang
National Electronics and Computer Technology Center,
National Science and Technology Development Agency,
Ministry of Science, Technology and Environment,
539/2 Gypsum Metropolitan Tower, 22nd Floor,
Sriayudhya Rd., Rajthevi, Bangkok, THAILAND 10400
chulak@nectec.or.th, sutat@notes.nectec.or.th


ABSTRACT -- Thai typed character recognition has been a very most popular research topic in Thailand. There are three commercial Thai OCR softwares available to the public at the present. But none of them can preserve the type styles of the original document image such as bold, italics, normal, and bold & italics styles into the output text file. This paper presents the technique for preserving the specified Thai type styles by applying a specific preprocessing with a supervised neural networks (NNs) learning algorithm. Experiments have been conducted and the results confirm that the proposed technique effectively preserve the type styles of Thai typed fonts from the original document image into the output text file.

บทคัดย่อ -- การรู้จำตัวพิมพ์อักษรไทยเป็นหัวข้อวิจัยที่กำลังนิยมมากหัวข้อหนึ่งในประเทศไทย ปัจจุบันมีซอฟต์แวร์ทางด้านนี้ในท้องตลาดของประเทศไทย 3 ซอฟต์แวร์ด้วยกัน แต่ไม่มีซอฟต์แวร์ตัวใดเลยที่สามารถรู้จำรูปแบบตัวอักษรของเอกสารต้นฉบับได้ ตัวอย่างเช่น ตัวปกติ ตัวหนา ตัวเอียง และตัวหนาเอียง บทความนี้นำเสนอเทคนิคในการรู้จำรูปแบบตัวอักษรไทยโดยอาศัยโครงข่ายประสาทเทียมแบบมีผู้สอนช่วยในการรู้จำ ผลจากการทดลองสามารถสรุปได้ว่าเทคนิคที่พัฒนาขึ้นสามารถรู้จำรูปแบบตัวอักษรภาษาไทยจากภาพลักษณ์ตัวอักษรสู่แฟ้มข้อความได้อย่างมีประสิทธิภาพ

REPRINT --- This paper is reprint of the article appeared in the Proceedings of 1999 IEEEE Tnternational Symposium on Circuits and Systems, May 30 - June 2< 1999. Florida< USA. Vol. IV, pp. 336-339


National Electronics and Computer Technology Center (NECTEC)
Copyright  © 2001 By Information System Service Section. All right reserved.