นวัตกรรมพร้อมใช้

Sansarn : สรรสาร เสิร์ชเอนจิ้นไทยของคนไทยทุกคน

Share to...

สรรสาร เป็นระบบสืบค้นข้อมูล (Information Retrieval System) หรือเสิร์ชเอ็นจิน (Search Engine) สำหรับภาษาไทย ใช้สำหรับการค้นคืน และสืบค้นสารสนเทศที่อยู่ในรูปแบบข้อความและเอกสารเป็นหลัก ทั้งนี้ข้อความและเอกสารอาจจะถูกจัดเก็บในระบบบริหารจัดการฐานข้อมูล (Database Management System) หรือบนเว็บเซิร์ฟเวอร์ (Web Server) ระบบจะสร้างฐานดัชนี(Index) จากข้อความและเอกสารที่นําเข้า การใช้งานเริ่มจากผู้ใช้ป้อนคําสําคัญ (Keywords) ผ่านหน้าอินเตอร์เฟส (User Interface) และระบบนําเอาคําสําคัญไปตรวจสอบในฐานดัชนีเพื่อค้นหาข้อความหรือเอกสารที่มีคําเหล่านั้นปรากฏอยู่

คุณสมบัติของสรรสาร

ค้นหาข้อมูลจากเอกสาร (Documents) หน้าเว็บ (Web Rages) และฐานข้อมูล (Databases) สามารถค้นได้ทั้งที่เป็นต้น วลี และประโยค
ค้นหาข้อมูลที่อยู่ในรูปแบบมัลติมีเดียต่างๆ ได้หลายแบบ เช่น Text, Spreadsheet, Presentation, PDF, HTML, XML Images
ค้นหาข้อมูลจากอินเทอร์เน็ต (Internet) อินทราเน็ต (Intranet) และแบบไม่เชื่อมต่อกับอินเทอร์เน็ต (Offline)
มีความสามารถพิเศษทางภาษาไทย คือ
- ค้นหาคำพ้องเสียง (Soundex Search) สามารถค้นคำที่อ่านออกเสียงเหมือนกันแต่สะกดต่างกันได้ เช่น บันใด บรรได
- แนะนําคำค้นคืนที่ใช้บ่อย (Query Suggestion)
แก้คําคำค้นที่สะกดผิด(Query Approximation)

ส่วนประกอบของระบบสืบค้นข้อมูล

โครงสร้างของระบบสืบค้นข้อมูลภายใต้ลิขสิทธิ์นี้ประกอบไปด้วยโมดูลและองค์ประกอบต่างๆ ดังแสดงในรูป

ผู้ใช้งานเทคโนโลยีเป้าหมาย

นักพัฒนาซอฟต์แวร์ และผู้ที่สนใจเทคโนโลยีการค้นคืนและสืบค้นข้อความ (Information Retrieval and Search Engine)

วิจัยพัฒนาโดย:

ห้องปฏิบัติการวิจัยเทคโนโลยีเสียง (SPT)

สนใจผลงาน/ถ่ายทอดเทคโนโลยี

ติดต่อ ฝ่ายพัฒนาธุรกิจและถ่ายทอดเทคโนโลยี (BTT)
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
โทร. 0 2564 6900 ต่อ 2346, 2351-2354, 2357, 2382, 2383, 2399
email: business[at]nectec.or.th.th

December 1, 2017
10:27