ข่าวสาร

30 ปี ข้อกำหนด วทท. 2.0 “อักขรวิธีภาษาไทยสำหรับคอมพิวเตอร์” – โดย ดร.ทวีศักดิ์ กออนันตกูล

Share to...

บทความ | ดร.ทวีศักดิ์ กออนันตกูล
ประธานคณะกรรมการบริหารศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค สวทช.)
อดีตผู้อำนวยการเนคเทค สวทช. (พ.ศ. 2539-2547)
อดีตผู้อำนวยการสำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) (พ.ศ. 2553 – 2559)

10 ตุลาคม 2564 เป็นวันครบรอบ 30 ปีของการเผยแพร่ผลงานวิจัยเกี่ยวกับการจัดทำข้อกำหนดร่วมกันระหว่างภาควิชาการกับอุตสาหกรรมคอมพิวเตอร์ไทย ว่าจะใช้ภาษาไทยกันอย่างไรในระบบคอมพิวเตอร์

รายงานการวิจัยฉบับนี้ ไม่ได้เขียนเพื่อเอาตำแหน่งวิชาการหรือเพื่อเลื่อนวิทยฐานะ แต่เป็น “ร่างมาตรฐานผลิตภัณฑ์อุตสาหกรรม” เพื่อให้บรรดาผู้ผลิตคอมพิวเตอร์ และระบบ Operating systems นำไปใช้ประกอบการออกแบบให้คอมพิวเตอร์สามารถ “อ่านออกเขียนได้” เป็นภาษาไทย ได้อย่างถูกต้องและตรงกับความต้องการของสังคมไทยในสมัยนั้น

รายงานนี้ทำออกมาเป็นหนังสือ ชื่อว่า “คอมพิวเตอร์กับภาษาไทย: การพัฒนามาตรฐานเบื้องต้นสำหรับเทคโนโลยีสารสนเทศของไทย” โดยระบุชื่อผู้เขียน เป็น “ดร.ทวีศักดิ์ กออนันตกูล และ คณะทำงานร่างข้อกำหนดร่วมเพื่อการเขียนโปรแกรมซึ่งแสดงผลเป็นภาษาไทย” เผยแพร่เป็นครั้งแรกเมื่อวันที่ 10 ตุลาคม 2534 จัดพิมพ์เพียง 1000 เล่ม เพื่อเผยแพร่แก่ผู้ที่อยู่ในวงการพัฒนาระบบซอฟต์แวร์ของหน่วยงานต่างๆ รวมทั้งห้องสมุดของสถาบันการศึกษา

สำหรับท่านที่ต้องการอ่านเรื่องย่อของหนังสือ “คอมพิวเตอร์กับภาษาไทย” เป็นบทความทางวิชาการภาษาอังกฤษ สามารถอ่านได้จาก H.T.Koanantakool, T. Karoonboonyanan and Chai, Wutiwiwatchai, “Computers and the Thai Language”, IEEE Annals of the History of Computing, Jan-March 2009. ซึ่งเป็นบทความที่ IEEE ส่งหนังสือเชิญให้ดร.ทวีศักดิ์เขียนลงในวารสารสำคัญ และได้รับเกียรติจากเพื่อนร่วมงานในเนคเทค สวทช. สองท่านมาร่วมเขียน คือ คุณเทพพิทักษ์ การุณบุญญานันท์ และ ดร.ชัย วุฒิวิวัฒน์ชัย ผู้อำนวยการเนคเทค สวทช. ในปัจจุบัน

ในช่วงสองปีที่ดำเนินการวิจัย ถือว่าเป็นปีทองของความร่วมมือ เพราะก่อนหน้านั้น ในปีพ.ศ. 2529 ประเทศไทยได้ประกาศมาตรฐานรหัสของอักขระไทยที่ใช้ในคอมพิวเตอร์เป็นผลสำเร็จ โดยก่อนหน้าปี 2529 ดร.ทวีศักดิ์ กออนันตกูล ได้ตีพิมพ์รายงานเรื่อง การสำรวจรหัสอักขระที่ใช้ในคอมพิวเตอร์ในประเทศไทย ลงในวารสารไมโครคอมพิวเตอร์ (8 มิ.ย . 2527 และ 9 ส.ค. 2527) พบว่าแต่ละบริษัทที่นำคอมพิวเตอร์จากต่างประเทศมาขายมีการกำหนดรหัสภาษาไทยขึ้นเองแบบต่างคนต่างทำไม่น้อยกว่า 35 แบบ และเป็นผลให้สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม (สมอ.) ตั้งกรรมการวิชาการขึ้นมากำหนดรหัสมาตรฐานขึ้นจนเป็นผลสำเร็จ และเป็นมาตรฐานแบบไม่บังคับ ในปี 2529

ปัญหาหลักของอุตสาหกรรมคอมพิวเตอร์ คือ การขาดแคลนมาตรฐานอักขรวิธีภาษาไทย

เพียงแค่ปีเดียวหลังจากการประกาศมาตรฐาน บรรดาผู้ขายคอมพิวเตอร์ทุกราย ต่างก็ออกภาษาไทยรุ่นใหม่ที่ตรงตามสมอ.โดยทั่วหน้ากัน แต่ยังมีความแตกต่างกันที่พฤติกรรมของแป้นพิมพ์ การแก้ไขข้อความบนจอ ที่มีความแตกต่างกัน แต่ไม่มีคนกลางมาตัดสินได้ว่าของใครถูก ผิด หรือเหมาะสมกว่ากัน จึงจัดได้ว่า การขาดแคลนมาตรฐานอักขรวิธีภาษาไทย เป็นปัญหาหลักของอุตสาหกรรมคอมพิวเตอร์ไทยในขณะนั้น

ข้อกำหนดอักขรวิธีภาษาไทยสำหรับคอมพิวเตอร์ หากจะแปลเป็นภาษานักคอมพิวเตอร์ ก็จะเรียกว่า “input/output system for Thai language” ซึ่งหมายถึงชุดคำจำกัดความ ว่าอักษรไทยมีกี่ตัว แต่ละตัวเรียกชื่อว่าอะไร เวลานำมาป้อนเข้าสู่คอมพิวเตอร์ มีกฎกติกาอย่างไร และเวลานำแสดงผลบนจอ แต่ละตัวมีหน้าตาอย่างไร และมีพฤติกรรมอย่างไร เวลาป้อนข้อมูลเข้า หากจะลบ หรือถอย ต้องจัดการอย่างไร วาง cursor ไว้ตรงไหน เวลาเก็บเป็นถ้อยความในหน่วยความจำ ต้องจัดเรียงอย่างไร

ในการพัฒนาร่างข้อกำหนดดังกล่าว ได้มีการตั้งเป็นกลุ่มผู้ร่วมพัฒนา Thai Application Programming Interface เรียกชื่อกลุ่มว่า TAPIC (Thai API Consortium) ซึ่งบรรดากลุ่มอุตสาหกรรมซอฟต์แวร์ในขณะนั้น ล้วนแล้วแต่โหยหาหน่วยงานรัฐที่มีพลังในการกำหนดมาตรฐานช่วยพัฒนา จึงเกิดเป็นความร่วมมือที่แข็งแกร่งมาก ซึ่งประกอบกันระหว่างหน่วยงานรัฐ ได้แก่ เนคเทค สวทช สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม ราชบัณฑิตยสภา และเอกชนหลายบริษัท เช่น IBM, Olympia Thai, Datamat รวมถึงสถาบันอุดมศึกษา ได้แก่ มหาวิทยาลัยธรรมศาสตร์ เกษตรศาสตร์ และจุฬาฯ โดยมีดร.ทวีศักดิ์ ทำหน้าที่เป็นหัวหน้าโครงการวิจัยและผู้เขียนหลักของข้อกำหนดร่วมกับทีมจากม.ธรรมศาสตร์ช่วยทำหน้าที่เป็นเลขานุการของ TAPIC อย่างแข็งขัน

ผลงานที่ออกมาแม้จะไม่ยาว แต่ทุกหัวข้อเป็นสาระที่บริษัทต่าง ๆ ต้องรีบนำไปสร้างเป็นระบบ input/output ภาษาไทยในผลิตภัณฑ์ของตนเองขึ้นมาขายในตลาดที่มีพฤติกรรมต่อผู้ใช้ตรงกันหมด ในขณะนั้นพวกเราจึงตั้งชื่อระบบนี้ว่า “วทท” หมายถึง วิ่งทุกที่ ใช้งานได้กับคอมพิวเตอร์ของทุกค่ายได้เหมือนกันหมด

อุตสาหกรรมคอมพิวเตอร์ในตลาดสากล ได้ใช้ ร่างมาตรฐานนี้ ไป implement ระบบภาษาไทยในระบบ MS DOS 6.0 และ MacOS ตั้งแต่ปี พ.ศ.2535 เป็นต้นมา และจากนั้น เมื่อมีระบบ Windows หรือ Linux ออกมาใหม่ เขาทำให้คนไทยทั้งประเทศใช้ภาษาไทยกับระบบเหล่านี้ได้ทันที ภาษาไทยจึงมีความทัดเทียมกับอารยประเทศที่มีข้อกำหนดเกี่ยวกับการใช้ภาษาของตนกับคอมพิวเตอร์มาตั้งแต่สมัยนั้น โดยผมทราบว่า มีการแปลรายงานวิจัยนี้เป็นภาษาอังกฤษขึ้นใช้ในแต่ละบริษัทที่ทำการพัฒนาระบบภาษาไทยของระบบตนเอง แต่ไม่สามารถจะขอนำเอกสารเหล่านั้นมาเผยแพร่ได้

เมื่อ 17 มิถุนายน 2542 สมอ.ได้ประกาศ “มาตรฐานอุตสาหกรรมว่าด้วยอักขรวิธีภาษาไทยสำหรับคอมพิวเตอร์” ลงในราชกิจจานุเบกษา เรียกว่า มอก 1566-2541 ซึ่งใช้ข้อกำหนดในรายงานการวิจัย มาเป็นมาตรฐานแห่งชาติ ถือว่าประเทศไทยได้ประกาศอักขรวิธีของภาษาไทยอย่างเป็นทางการโดยสมบูรณ์

เวลาผ่านไปสามสิบปี วงการคอมพิวเตอร์ไทยก้าวไกลไปมาก วันนี้มีข้อมูลภาษาไทยมากมาย ที่เข้ารหัสตาม มอก 620-2529 และตัวอักขระต่างๆเก็บเรียงกันไว้ตามอักขรวิธีใน มอก 1566-2542 โดยที่คนไทยไม่ต้องทราบว่ามีมาตรฐานเหล่านี้รองรับประเทศอยู่มาตั้งแต่ปีพ.ศ. 2529

“คนรุ่นใหม่กำลังพัฒนา Machine Learning, Artificial Intelligence และบรรดาผู้ประกอบการขนาดใหญ่ ต่างก็เร่งกักตุน big data เข้ามาใช้ในการวิเคราะห์และวางแผนอนาคต เราอาจจะต้องการมาตรฐานผลิตภัณฑ์อุตสาหกรรมที่ดี ๆ มาสนับสนุนอัตราเร่งของการพัฒนาประเทศได้อีกพอสมควร จึงขอฝากอนาคตไว้กับคนรุ่นต่อไปด้วยความมั่นใจ ขอเพียงแค่รัฐบาลต้องแยกแยะให้ดี ๆ ว่างานวิจัยอะไรใช้เงินไม่มาก แต่มีผลกระทบสูง งานวิจัยอะไรแค่ดูข้อเสนอโครงการแล้วก็ทราบว่าใช้งบเยอะ แต่ไม่เป็นโล้เป็นพาย และกลับเป็นภัย หากให้ทุนวิจัยถูกทางนักวิจัยมีคุณธรรม ทำงานร่วมกับภาคเอกชนได้อย่างโปร่งใส ก็เพียงพอที่จะทำให้ประเทศชาติเจริญ ผมขอขอบคุณมหาวิทยาลัยธรรมศาสตร์ เนคเทค สวทช ที่สนับสนุนให้ผมได้ทำงานชิ้นนี้เมื่อสามสิบปีก่อนครับ” ดร.ทวีศักดิ์ กออนันตกูล กล่าวทิ้งท้าย

Tags: การพัฒนามาตรฐานเบื้องต้นสำหรับเทคโนโลยีสารสนเทศของไทย, คอมพิวเตอร์กับภาษาไทย, วทท. 2.0

October 14, 2021

10:53