หน้าแรกลงทะเบียนสมาชิกคลังข้อความไทย-อังกฤษคลังศัพท์ไทย-อังกฤษคลังเสียงพูดไทยคลังข้อมูลภาพตัวอักษรคลังรูปร่างสามมิติคนไทยคลังภาพจากกล้องจราจรคลังฐานข้อมูลจีโนมคลังข้อมูล Anomaly Detection
คลังเสียงพูดไทย
ฐานข้อมูลเสียง LOTUS

เป็นฐานข้อมูลเสียงพูดภาษาไทยขนาดใหญ่ พัฒนาขึ้นเพื่อใช้ในงานวิจัยและพัฒนาระบบรู้จำเสียงพูดต่อเนื่อง (Large Vocabulary Continuous Speech Recognition: LVCSR) สำหรับภาษาไทย โดยมุ่งเน้นสำหรับพัฒนาระบบ Speech Dictation ซึ่งใช้ลักษณะการพูดแบบอ่าน (Reading style) ฐานข้อมูลประกอบด้วยชุดหน่วยเสียงสมดุล (Phonetically Balanced Set) และชุดเสียงอีก 3 ชุด ซึ่งครอบคลุมคำศัพท์ภาษาไทย จำนวนไม่ต่ำกว่า 5,000 คำ จากฐานข้อมูลบทความข่าวหรือบทความทั่วไป เสียงพูดในฐานข้อมูล LOTUS บันทึกผ่านไมโครโฟน 2 ประเภท คือ ไมโครโฟน Close-talk คุณภาพสูง และไมโครโฟน Unidirectional ระดับคุณภาพปานกลาง โดยทำการบันทึกเสียงใน 2 สภาพแวดล้อม คือ สภาพแวดล้อมแบบห้องเงียบ และ สภาพแวดล้อมแบบสำนักงาน

สามารถดูรายละเอียดเพิ่มเติมที่ http://hlt.nectec.or.th/speech/

เพื่อการนำไปใช้ประโยชน์ ท่านสามารถ

คลังข้อมูลเสียงพูดภาษาไทยผ่านเครือข่ายโทรศัพท์

คลังข้อมูลเสียงพูดภาษาไทยผ่านเครือข่ายโทรศัพท์ที่พัฒนาขึ้น จะมีขนาดของข้อมูลเสียงพูดรวมไม่ต่ำกว่า 100 ชั่วโมง จากผู้พูดจำนวนไม่ต่ำกว่า 200 คน โดยออกแบบให้ข้อมูลที่จัดเก็บมีความหลากหลายทั้งในแง่ของผู้พูด เครือข่ายโทรศัพท์ และอุปกรณ์โทรศัพท์ที่ใช้ โดยมีจุดมุ่งหมายหลักเพื่อนำข้อมูลที่ได้ไปพัฒนาระบบรู้จำเสียงพูดสำหรับระบบบริการข้อมูลอัตโนมัติ (Interactive Voice Response System) ผ่านเครือข่ายโทรศัพท์ ดังนั้นเนื้อหาของข้อมูลเสียงที่จัดเก็บจะมีเนื้อหาใกล้เคียงกับสถานการณ์ที่จะใช้งานระบบบริการข้อมูลอัตโนมัติ ทั้งระบบที่กำลังดำเนินการพัฒนาอยู่ และระบบที่มีแนวโน้มที่จะถูกพัฒนาขึ้นในอนาคต ข้อมูลในคลังข้อมูลเสียงพูดจะประกอบไปด้วย

  1. ข้อมูลเสียง
  2. ข้อความที่ได้จากการถอดความ
  3. การกำกับข้อความเสียงพูดที่บันทึกไว้ ตามมาตรฐานการกำกับเสียงพูดต่อเนื่องอย่างเป็นธรรมชาติ
  4. พจนานุกรมคำอ่านของรายการคำที่ได้จากการถอดความเสียงพูด

สามารถดูรายละเอียดเพิ่มเติมที่ http://hlt.nectec.or.th/speech/

เพื่อการนำไปใช้ประโยชน์ ท่านสามารถ

คลังข้อมูลเสียง LOTUS-BN

โครงการสร้างคลังข้อมูลเสียงจากรายการข่าวภาษาไทย เกิดขึ้นภายใต้ความร่วมมือระหว่าง Tokyo Institute of Technology และ NECTEC โดยมีข้อตกลงที่จะสร้างข้อมูลข่าวขนาด 100 ชั่วโมง โดยมีวัตถุประสงค์ของการจัดทำเพื่อนำไปใช้เป็นข้อมูลเบื้องต้น เพื่อต่อยอดไปยังการสร้างระบบสืบค้นข้อมูลสื่อประสม (multimedia) ที่มีประสิทธิภาพ สามารถสืบค้นข้อมูลที่มีความหลากหลาย เช่น วิดีโอ หรือ รายการทีวีได้ โดยการพัฒนาระบบดังกล่าวจำเป็นต้องมีคลังข้อมูลที่มีลักษณะตรงกับข้อมูลที่ ใช้จริง

โครงการนี้มีเป้าหมายที่จะสร้างฐานข้อมูลข่าว โดยแยกได้เป็น 3 ส่วนคือ

  1. ข้อมูลเสียงพูด และสคริปคำพูดที่ถอดความมาจากข่าว
  2. การกำกับข้อมูลเสียง เช่น ลักษณะของเสียงและสภาพแวดล้อม หัวข้อข่าว นิพจน์ระบุนาม (named entity) เป็นต้น
  3. พจนานุกรมคำอ่านของคำในฐานข้อมูลข่าว

สามารถดูรายละเอียดเพิ่มเติมที่ http://hlt.nectec.or.th/speech/

เพื่อการนำไปใช้ประโยชน์ ท่านสามารถ

TSynC-1 (Thai Speech Corpus for Speech Synthesis version 1)

เป็น ฐานข้อมูลเสียงพูดภาษาไทยสำหรับการสังเคราะห์เสียงสร้างขึ้นเพื่อ (1) ใช้เป็นฐานข้อมูลทางสัทสัมพันธ์ (Prosody) สำหรับสร้างโมเดลสัทสัมพันธ์อัตโนมัติโดยใช้ Machine learning (2) ใช้เป็นหน่วยเสียงพื้นฐานสำหรับโปรแกรมสังเคราะห์เสียงพูดภาษาไทยแบบ Unit selection โดยคัดเลือกประโยคภาษาไทยทั้งหมดจำนวน 5,200 ประโยค จาก Orchid Corpus ซึ่งแต่ละประโยคมีการตัดคำและกำหนดหน้าที่ของคำ (POS: Part of Speech) ไว้เรียบร้อยแล้ว เนื้อหาประกอบด้วย 2 ส่วนคือ
1.บทความวิชาการต่างๆ ของงานประชุมวิชาการของเนคเทค
2.สารานุกรมไทยสำหรับเยาวชนโดยพระราชประสงค์ในพระบาทสมเด็จพระเจ้าอยู่หัว

คุณสมบัติของฐานข้อมูล

  • ฐานข้อมูลข้อความภาษาไทย ตัวเลข และ สัญลักษณ์ต่างๆ
  • จำนวนเสียง: 1 เสียง(ผู้หญิง)
  • ขนาด 5,200 ประโยค
  • ส่วนข้อความจัดเก็บในรูปแบบ XML standard -โครงสร้างแบบ Hierarchical
  • ส่วนข้อมูลเสียงจัดเก็บแยกตามประเภทข้อมูล
    • บันทึกเสียงด้วยข้อกำหนดดังนี้
    • อัตราสุ่มสัญญาณ 44.1 kHz ที่ 16 bits/sample
    • ภาวะห้องเงียบ ( SNR > 36 dB)
    • กำกับข้อมูลทาง Linguistics และ Acoustics

สามารถดูรายละเอียดเพิ่มเติมที่ http://hlt.nectec.or.th/speech/

เพื่อการนำไปใช้ประโยชน์ ท่านสามารถ

คลังข้อมูลเสียง Voice Command

คลังข้อมูลเสียงคำสั่งภาษาไทย ฐานข้อมูลเสียงชุดคำสั่งในภาษาไทยนี้ได้รวบรวมขึ้นจากคำที่จะนำไปใช้ในการติดต่อกับเครื่องมืออิเล็กทรอนิกส์หรือคำที่ใช้เพื่อการสั่งงานอุปกรณ์ต่างๆเป็นคำสั้นๆ ความยาวประมาณ 1-3พยางค์ ซึ่งสามารถนำไปประยุกต์ใช้ในการสร้างระบบรู้จำเสียงพูด แบบสั่งงานด้วยเสียงหรือคำสั่งสั้นๆ (Voice Command) โดยออกแบบเพื่องานวิจัยหรือระบบที่ต้องการคำภาษาไทยสั้นๆโดยแบ่งเป็นประเภทต่างๆตามหัวข้อและอุปกรณ์ เช่น คำที่ใช้กับคีย์บอร์ด ตัวอักษรภาษาไทย ภาษาอังกฤษ เป็นต้น

สามารถดูรายละเอียดเพิ่มเติมที่ http://hlt.nectec.or.th/speech/

เพื่อการนำไปใช้ประโยชน์ ท่านสามารถ