Logo - NECTEC and Backto NECTEC HomepageNational Electronics and Computer Technology

โครงการวิจัยและพัฒนาโปรแกรมสืบค้นข้อมูลจากฐานข้อมูลขนาดใหญ่ที่ไม่ขึ้นกับภาษา

ระบบค้นคืนข้อมูลทางอินเทอร์เน็ต ที่สามารถสืบค้นได้หลายภาษาเป็นที่ต้องการอย่างสูงในปัจจุบัน อย่างไรก็ตามระบบในปัจจุบันยังต้องอาศัยความรู้ด้านภาษาของภาษานั้น เช่น การใช้คำในพจนานุกรมมาตัดคำในการทำดัชนีเพื่อค้นหาข้อมูล ทำให้ประสิทธิภาพของระบบขึ้นกับพจนานุกรมและโปรแกรมตัดคำ ซึ่งการใช้พจนานุกรม ก็มีข้อจำกัดที่จะต้องใช้นักภาษาศาสตร์ มาปรับเปลี่ยนข้อมูลเสมอ และโปรแกรมตัดคำก็มีปัญหาในความกำกวมของคำ และคำที่ไม่มีในพจนานุกรมว่าจะตัดอย่างไร โดยเฉพาะอย่างยิ่งภาษาที่เขียนติดกันเช่นไทย ญี่ปุ่น จีน ดังนั้นจึงจำเป็นที่จะต้องมีโปรแกรมค้นคืนข้อมูล ที่ไม่ต้องอาศัยความรู้ด้านภาษา ที่สามารถค้นคืนข้อมูลหลายภาษาได้อย่างมีประสิทธิภาพ ทั้งด้านความเร็ว และผลลัพธ์ของการค้นคืนมีความถูกต้องตรงตามความต้องการของผู้ใช้ นอกจากนี้ส่วนค้นคืน เป็นส่วนพื้นฐานของการประมวลผลข้อมูล จึงมีความจำเป็นที่จะต้องพัฒนาส่วน Engine พื้นฐานในการค้นคืนเพื่อนำไปประยุกต์ใช้งานด้านต่างๆ ต่อไป

ในปี 2547 โครงการฯ จะมีการวิจัยและพัฒนาต่อเนื่องจากระบบหลักทั้ง 2 ระบบ ได้แก่ ระบบค้นคืนข้อมูลทางอินเทอร์เน็ต: สรรสาร และระบบแนะนำข้อมูล (SHARE: Social-content based Hybridized and Adaptive Recommender Engine) โดยที่การวิจัยจะเป็นไปในแนวปรับปรุงระบบ รวมทั้งเพิ่มความสามารถและคุณลักษณะให้กับระบบ รายละเอียดโดยย่อมีดังต่อไปนี้

  • สรรสาร: มีการออกแบบสถาปัตยกรรมของระบบใหม่ เพื่อลดเวลาในการค้นคืน และให้สามารถรองรับคุณลักษณะใหม่ที่เพื่มเติมได้ เช่น การค้นคืนข้ามภาษา (Cross-Lingual) การวิเคราะห์และปรับปรุงข้อความที่ผู้ใช้ต้องการค้นหา (Query Analysis and Expansion) การจัดเรียงความสำคัญของเอกสาร (Document Ranking) เป็นต้น
  • ระบบแนะนำข้อมูล

ข้อมูลเพิ่มเติม :
โทรศัพท์ 0-2564-6900 ต่อ 2249 - 2268
Website: https://www.nectec.or.th/rdi

 

ผู้รับผิดชอบ งานวิจัยโครงสร้างพื้นฐานสารสนเทศอัจฉริยะ (RDI-5) โทร. 0-2564-6900 ต่อ 2249 - 2268 
Mail to RDI

สงวนลิขสิทธิ์ โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ พรบ.ลิขสิทธิ์ พ.ศ.2537
112 อุทยานวิทยาศาสตร์ประเทศไทย ถนนพหลโยธิน ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120
โทร.02-564-6900 ต่อ 2346 - 2355
Mail to Web Master

Valid HTML 4.01 Transitional Valid CSS! Level A Conformance to Web Content Accessibility Guidelines 1.0 พัฒนาด้วย CSS Technology