ญี่ปุ่นบุกตั้งห้องปฏิบัติการสื่อสารในไทย

ญี่ปุ่น บุกตั้งห้องปฏิบัติการสื่อสารในไทย นำร่องสานความร่วมมือเอเชีย เทคโนแปลภาษา ดีเดย์สิงหาคมนี้ เน้นการวิจัยพื้นฐาน รวบรวมฐานข้อมูล ภาษาของเอเชีย เพื่อแปลข้ามภาษาระหว่างกัน โดยช่วงแรก เน้นระบบแปลภาษา อังกฤษ-ญี่ปุ่น และไทย-อังกฤษ ก่อนขยายผลถึงภาษาลาว

นายวิรัช ศรเลิศล้ำวาณิช ผู้อำนวยการ ฝ่ายวิจัยและพัฒนาสารสนเทศ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) กล่าวว่า ขณะนี้ได้มีความพยายามร่วมกันของประเทศกลุ่มเอเชีย ด้านการพัฒนาเทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP : Natural Language Processing) หรือ Asia Relation for NLP ซึ่งประกอบด้วย ญี่ปุ่น, จีน, ฮ่องกง, ไต้หวัน, มาเลเซีย และอินเดีย รวมทั้งแบ่งระดับความก้าวหน้าของการใช้เทคโนโลยีการแปลภาษาด้วยเครื่อง (Machine Translation : MT) ซึ่งเป็นศาสตร์หนึ่งในเอ็นแอลพี 3 ระดับ ประกอบด้วย

ระดับแรกประเทศที่ยังไม่มีมาตรฐานตัวอักษรที่ใช้ เช่น พม่า กัมพูชา และลาว

ระดับที่สอง มีมาตรฐานกลางของอักษรแล้ว หากยังไม่พัฒนาเทคโนโลยีเอ็นแอลพี แต่มีการพัฒนาพจนานุกรมอิเล็กทรอนิกส์ การตัดคำสะกดคำ และค้นหาคำแล้ว ได้แก่ เวียดนาม, มาเลเซีย, อินโดนีเซีย และฟิลิปปินส์

ระดับที่สาม มีประสบการณ์ก้าวหน้าวิจัยด้านเอ็มทีแล้ว ทั้งประเทศไทย ญี่ปุ่น จีน เกาหลี และฮ่องกง โดยประเทศที่มีการใช้งานเอ็มทีมาก จะมีระดับความแม่นยำการแปลภาษากว่า 80% ทั้งนี้ต้องขึ้นอยู่กับคู่ภาษาที่แปลด้วย ซึ่งในส่วนของประเทศไทยนั้น พัฒนาซอฟต์แวร์สนับสนุนการทำงานด้านนี้แล้วในชื่อ "โปรแกรมภาษิต" ซึ่งมีความแม่นยำระดับกว่า 70%

ด้านการดำเนินงานเบื้องต้นนั้น ประเทศญี่ปุ่น จะเข้ามาตั้งห้องปฏิบัติการสื่อสาร (Communication Research Center : CRL) ที่ประเทศไทย ภายใต้เขตอุทยานวิทยาศาสตร์แห่งชาติ ในเดือนสิงหาคมนี้

เน้นแปลข้ามภาษา

โดยแนวคิดหลักของห้องปฏิบัติการแห่งนี้ เน้นการวิจัยพื้นฐาน รวบรวมฐานข้อมูลภาษาของเอเชีย เพื่อให้สามารถแปลข้ามภาษาระหว่างกันได้ โดยช่วงแรกของการวิจัยจะเน้นระบบแปลภาษา อังกฤษ-ญี่ปุ่น และไทย-อังกฤษ และอาจขยายผลถึงภาษาลาวด้วย เนื่องจากมีรากคำใกล้เคียงกับภาษาไทย ขณะที่ หลักการทำงานของระบบแปลข้ามภาษาในทุกประเทศ จะจัดทำฐานข้อมูลพจนานุกรมภาษาของแต่ละประเทศ เมื่อผู้ใช้งานพิมพ์คำที่ต้องการค้นหาข้อมูลในอินเทอร์เน็ต และหากข้อมูลที่ต้องการค้นหานั้น ไม่มีการจัดทำเป็นภาษาท้องถิ่นเอง และอยู่ในเวบไซต์ภาษาอื่น ระบบก็จะแปลเป็นภาษาอื่น เพื่อค้นหาข้อมูลให้ตรงตามต้องการ และส่งข้อมูลกลับมายังผู้ค้นหาด้วยภาษาเดิมด้วย ระบบแปลภาษาข้ามกันนี้ ประโยชน์สูงสุดจะทำให้ผู้ใช้สามารถค้นหาข้อมูลด้วยภาษา หรือคีย์เวิร์ดเดียว แต่สามารถค้นหาข้อมูลข้ามภาษาได้ ซึ่งจะสนับสนุนให้การค้นหาข้อมูลทำได้กว้างขวางขึ้น

สร้างมาตรฐานลินิกซ์ เอเชีย

ผู้อำนวยการ กล่าวต่อว่า นอกจากนี้ยังมีความพยายามผลักดันความร่วมมือ ด้านโอเพ่นซอร์ซระดับเอเชียด้วย โดยมุ่งที่ระบบปฏิบัติการลินิกซ์ "Linux Asia" ให้แต่ละประเทศมีการประกาศมาตรฐานการใช้งานภาษาบนระบบปฏิบัติการดังกล่าวได้

โดยเป็นความพยายามจัดทำรหัสภาษามาตรฐาน และให้แต่ละประเทศ สามารถพัฒนาระบบงาน และทำให้ซอฟต์แวร์รู้จักภาษาท้องถิ่นที่ทำงานร่วมกับลินิกซ์ได้ สำหรับไทยเอง เนคเทคเตรียมวางตลาดโอเพ่น ออฟฟิศ ทะเล (Open Office TLE) ซึ่งเป็นโปรแกรมออฟฟิศ ที่ทำงานบนระบบปฏิบัติการลินิกซ์ทะเล และมีจุดเด่นระบบสะกดตรวจคำ ตัดคำไทย

ที่มา : กรุงเทพธุรกิจ ฉบับวันที่ 23 กรกฎาคม 2545

 
Home | About us | INET | ITE| PTEC | MTS | NTJ | Software Park
National Electronics and Computer Technology Center (NECTEC)
Copyright ©2001 By Information System Service Section. All rights reserved.