Sansarn ​: สรรสาร เสิร์ชเอนจิ้นไทยของคนไทยทุกคน

Facebook
Twitter
ระบบสืบค้นข้อมูล search engine

 

สรรสาร เป็นระบบสืบค้นข้อมูล (Information Retrieval System) หรือเสิร์ชเอ็นจิน (Search Engine) สำหรับภาษาไทย ใช้สำหรับการค้นคืน และสืบค้นสารสนเทศที่อยู่ในรูปแบบข้อความและเอกสารเป็นหลัก ทั้งนี้ข้อความและเอกสารอาจจะถูกจัดเก็บในระบบบริหารจัดการฐานข้อมูล (Database Management System) หรือบนเว็บเซิร์ฟเวอร์ (Web Server) ระบบจะสร้างฐานดัชนี(Index) จากข้อความและเอกสารที่นําเข้า การใช้งานเริ่มจากผู้ใช้ป้อนคําสําคัญ (Keywords) ผ่านหน้าอินเตอร์เฟส (User Interface) และระบบนําเอาคําสําคัญไปตรวจสอบในฐานดัชนีเพื่อค้นหาข้อความหรือเอกสารที่มีคําเหล่านั้นปรากฏอยู่

คุณสมบัติของสรรสาร

  • ค้นหาข้อมูลจากเอกสาร (Documents) หน้าเว็บ (Web Rages) และฐานข้อมูล (Databases) สามารถค้นได้ทั้งที่เป็นต้น วลี และประโยค
  • ค้นหาข้อมูลที่อยู่ในรูปแบบมัลติมีเดียต่างๆ ได้หลายแบบ เช่น Text, Spreadsheet, Presentation, PDF, HTML, XML Images
  • ค้นหาข้อมูลจากอินเทอร์เน็ต (Internet) อินทราเน็ต (Intranet) และแบบไม่เชื่อมต่อกับอินเทอร์เน็ต (Offline)
  • มีความสามารถพิเศษทางภาษาไทย คือ
    • ค้นหาคำพ้องเสียง (Soundex Search) สามารถค้นคำที่อ่านออกเสียงเหมือนกันแต่สะกดต่างกันได้ เช่น บันใด บรรได
    • แนะนําคำค้นคืนที่ใช้บ่อย (Query Suggestion)
  • แก้คําคำค้นที่สะกดผิด(Query Approximation)
สรรสาร

 

ส่วนประกอบของระบบสืบค้นข้อมูล

โครงสร้างของระบบสืบค้นข้อมูลภายใต้ลิขสิทธิ์นี้ประกอบไปด้วยโมดูลและองค์ประกอบต่างๆ ดังแสดงในรูป

Search Technology

 

ผู้ใช้งานเทคโนโลยีเป้าหมาย

นักพัฒนาซอฟต์แวร์ และผู้ที่สนใจเทคโนโลยีการค้นคืนและสืบค้นข้อความ (Information Retrieval and Search Engine)

วิจัยพัฒนาโดย:

สนใจผลงาน/ถ่ายทอดเทคโนโลยี

ติดต่อ ฝ่ายพัฒนาธุรกิจและถ่ายทอดเทคโนโลยี (BTT)
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
โทร. 0 2564 6900 ต่อ 2346, 2351-2354, 2357, 2382, 2383, 2399
email: business[at]nectec.or.th.th