ห้องปฏิบัติการวิจัยวิทยาการมนุษยภาษา
Human Language Technology Laboratory: HLT
ความสำคัญ
ห้องปฎิบัติการวิจัยวิทยาการมนุษยภาษา (Human Language Technology: HLT) ดำเนินการและสนับสนุนงานวิจัยและพัฒนาวิทยาการทางด้านภาษาพูดและภาษาเขียนของมนุษย์ งานวิจัยและพัฒนาทางด้านภาษาเป็นนวัตกรรมที่ช่วยอำนวยความสะดวกในการติดต่อสื่อสารระหว่างมนุษย์กับเครื่องจักร และระหว่างมนุษย์ด้วยกัน อาทิเช่น ระบบแปลภาษา ระบบค้นคืนข้อมูล และระบบประมวลผลสัญญาณเสียงพูด ภาษาพูดและเขียนถือเป็นสื่อพื้นฐานที่ขาดไม่ได้สำหรับการติดต่อสื่อสารของมนุษย์ แต่คงไว้ซึ่งความซับซ้อน ความหลากหลาย และความสวยงาม ที่เกิดจากการสร้างสรรและสืบทอดต่อกันมา เป็นองค์ความรู้และวัฒนธรรมที่แตกต่างกันในแต่ละภูมิภาึึค การประมวลผลภาษาจึงมีความน่าสนใจ และผลลัพธ์ของการวิจัยและพัฒนานี้สามารถประยุกต์ใช้ในงานต่างๆ ได้อย่างกว้างขวาง ช่วยลดช่องว่างในการสื่อสารต่างภาษา เพิ่มประสิทธิภาพในการเข้าถึงข้อมูลข่าวสารได้อย่างทั่วถึงและเท่าเทียม
ในหลายประเทศ วิทยาการประมวลผลทางด้านภาษานั้นมีการวิจัยมาอย่างต่อเนื่องโดยเน้นเฉพาะภาษาหลัก เช่น ภาษาอังกฤษ ภาษาในภาคพื้นยุโรป และภาษาจีน มีการประยุกต์ใช้ผลการวิจัยต่างๆ ในหลากหลายงาน อาทิเช่น การสืบค้นข้อมูลในเครือข่ายอินเทอร์เน็ต การใช้ข้อความเสียงในโทรศัพท์เคลื่อนที่ การแปลภาษาเพื่อช่วยในการติดต่อสื่อสาร และการพัฒนาเครื่องมืออำนวยความสะดวกสำหรับคนพิการและผู้ด้อยโอกาส ในโลกแห่งข้อมูลข่าวสารที่ไร้พรมแดน การติดตามวิทยาการใหม่ๆ เหล่านี้มิอาจหลีกเลี่ยงได้ การวิจัยและพัฒนาวิทยาการสำหรับการประมวลผลเฉพาะสำหรับภาษาไทยจึงเป็นภารกิจสำคัญของหน่วยฯ
ขีดความสามารถและความชำนาญ
งานประมวลผลเสียงพูด
- เทคโนโลยีการรู้จำเสียงพูด
- เทคโนโลยีการสังเคราะห์เสียงพูด
- เทคโนโลยีการรู้จำผู้พูด
- เทคโนโลยีการกำกับข้อมูลเสียง
งานประมวลผลข้อความ
- เครือข่ายพจนานุกรมอิเล็กทรอนิกส์
- เทคโนโลยีการแปลภาษา
- เทคโนโลยีการสรุปความ
- เทคโนโลยีล่ามอิเล็กทรอนิกส์
งานการสืบค้นข้อมูล
- เทคโนโลยีการสืบค้นข้อมูล
- เทคโนโลยีระบบถาม-ตอบอัตโนมัติ
- เทคโนโลยีออนโทโลยีและเว็บเชิงความหมาย
งานคลังข้อมูลและเครื่องมือพื้นฐาน
- ทฤษฎีด้านภาษาศาสตร์คำนวณ
- เทคโนโลยีด้านคลังข้อมูลและเครื่องมือพื้นฐานสำหรับการประมวลผลภาษาและเสียงพูด เช่น เครื่องมือแบ่งคำภาษาไทย
ภารกิจ
ห้องปฏิบัติการวิจัยวิทยาการมนุษยภาษาดำเนินการค้นคว้าวิจัยและพัฒนาเทคโนโลยีที่เกี่ยวข้องกับภาษาของมนุษย์ ในรูปแบบเสียงและภาษาเขียน ซึ่งเป็นสิ่งสำคัญสำหรับการติดต่อสื่อสารของมนุษย์ การประมวลผลภาษาจึงมีความน่าสนใจอย่างยิ่ง และผลลัพธ์ของการวิจัยและพัฒนานี้จะสามารถประยุกต์ใช้ในงานต่างๆ ได้อย่างกว้างขวาง ช่วยลดช่องว่างในการสื่อสารต่างภาษาและเพิ่มประสิทธิภาพในการเข้าถึงข้อมูลข่าวสารได้อย่างทั่วถึงและเท่าเทียม การวิจัยและพัฒนาวิทยาการสำหรับการประมวลผลเฉพาะสำหรับภาษาไทยจึงเป็นภารกิจสำคัญของห้องปฏิบัติการฯ
วิสัยทัศน์
หนึ่งในห้าผู้นำทางด้านวิทยาการมนุษยภาษาในเอเชีย
พันธกิจ
- วิจัยพื้นฐานทางด้านวิทยาการมนุษยภาษา
- สร้างความร่วมมือกับองค์กรวิจัยทางด้านวิทยาการมนุษยภาษา
- เสริมสร้างเครือข่ายนักวิจัย นักพัฒนา และผู้ใช้เทคโนโลยี
- พัฒนาและผลักดันการใช้งานผลิตภัณฑ์ทางด้านวิทยาการมนุษยภาษา
เป้าหมาย/แนวทางการดำเนินงาน
- วิจัยพื้นฐานและพัฒนาทรัพยากรมาตรฐาน ทางด้านวิทยาการมนุษยภาษา
- สร้างความร่วมมือกับองค์กรวิจัยทางด้านวิทยาการมนุษยภาษาทั้งในประเทศและต่างประเทศ
- เสริมสร้างเครือข่ายนักวิจัย นักพัฒนา และผู้ใช้เทคโนโลยีเพื่อเชื่อมโยงวิทยาการสู่การใช้งานจริง
- พัฒนาผลิตภัณฑ์ทางด้านวิทยาการมนุษยภาษา
เทคโนโลยีหลัก (Core Technology)
HLT มีการวิจัยและพัฒนาวิทยาการทางด้านภาษาพูดและภาษาเขียนของมนุษย์ ทั้งนี้สามารถแบ่งกลุ่ม Core Technology ออกได้เป็น 4 กลุ่ม ดังแผนภาพด้านล่าง

เทคโนโลยีโครงสร้างพื้นฐานอัจฉริยะ (Intelligent Information Infrastructure Technology)
เป้าหมายหลักของเทคโนโลยีพื้นฐานสารสนเทศอัจฉริยะ คือ การวิจัยและพัฒนาเทคนิครวมถึงระบบต่างๆ ที่เกี่ยวข้องกับเทคโนโลยีสารสนเทศ ตั้งแต่ระบบการจัดการฐานข้อมูล (Database Management System -DBMS) ระบบสืบค้นข้อมูล (Information Retrieval System) ไปจนถึงการวิเคราะห์ฐานข้อมูลขนาดใหญ่ (Data Mining) รวมทั้งการวิจัยเพื่อหาเทคนิคต่างๆ ที่จะทำให้ระบบสารสนเทศ มีความอัจฉริยะมากยิ่งขึ้น เช่น โครงสร้างสารสนเทศเชิงความหมาย (Ontology) และการประมวลผลสารสนเทศเชิงกราฟิก (Information Visualization)
เทคโนโลยีประมวลผลเสียงพูด (Speech Processing Technology)
เป็นเทคโนโลยีซึ่งเกี่ยวกับภาษาในรูปแบบของเสียง ได้แก่ การรู้จำเสียงพูดภาษาไทย การสังเคราะห์เสียงพูดภาษาไทย ซึ่งมีจุดมุ่งหมายเน้นการทำวิจัยพื้นฐานเพื่อนำไปต่อยอดในการพัฒนานวัตกรรมต่างๆ ในเชิงพาณิชย์ เช่น โปรแกรมอ่านอีเมล (MailTalk) เว็บบริการข้อมูลสื่อสารโดยใช้เสียงพูด (VIEW)
เทคโนโลยีประมวลผลข้อความ (Text Processing Technology)
เทคโนโลยีนี้มีวัตถุประสงค์เพื่อวิจัยและพัฒนาการแปลภาษาเขียนอัตโนมัติในระดับคำและข้อความให้มีความถูกต้องสูงสามารถใช้งานได้กับการแปลหลายภาษา ซึ่งเป็นการผสมผสานวิธีการแปลในรูปแบบต่างๆ กันทั้งการใช้กฎไวยากรณ์ ตัวอย่าง และสถิติ นอกจากนี้ยังรวมถึงวิธีการวัดประสิทธิภาพของระบบแปลภาษา
เทคโนโลยีทรัพยากรภาษาและเครื่องมือ (Language Resources and Tools)
เทคโนโลยีนี้มีวัตถุประสงค์เพื่อวิจัยและพัฒนาทรัพยากรภาษาที่จำเป็นสำหรับการวิจัยและพัฒนาเครื่องมือพื้นฐาน ตลอดจนเครื่องมือประยุกต์ทางการประมวลผลภาษาและเสียงพูด ผลการวิจัยได้แก่ คลังข้อมูลเสียงพูด คลังข้อความที่ได้รับการกำกับอย่างเป็นระบบ และเครื่องมือพื้นฐาน เช่น ระบบแบ่งคำภาษาไทย
ความเชี่ยวชาญของนักวิจัย
เทคโนโลยีโครงสร้างพื้นฐานอัจฉริยะ (Intelligent Information Infrastructure Technology)
- เทคโนโลยีการสืบค้นข้อมูล
- เทคโนโลยีระบบถาม-ตอบอัตโนมัติ
- เทคโนโลยีออนโทโลยีและเว็บเชิงความหมาย
เทคโนโลยีประมวลผลเสียงพูด (Speech Processing Technology)
- เทคโนโลยีการรู้จำเสียงพูด
- เทคโนโลยีการสังเคราะห์เสียงพูด
- เทคโนโลยีการรู้จำผู้พูด
- เทคโนโลยีการกำกับข้อมูลเสียง
เทคโนโลยีประมวลผลข้อความ (Text Processing Technology)
- เครือข่ายพจนานุกรมอิเล็กทรอนิกส์
- เทคโนโลยีการแปลภาษา
- เทคโนโลยีการสรุปความ
- เทคโนโลยีล่ามอิเล็กทรอนิกส์
เทคโนโลยีทรัพยากรภาษา (Language Resource Technology)
- เทคโนโลยีภาษาศาสตร์คำนวณ
- เทคโนโลยีคลังข้อมูลภาษา
บุคลากร
|
|
![]() |
|
ดร.ชัย วุฒิวิวัฒน์ชัย |
ทีมนักวิจัยห้องปฏิบัติการวิจัยวิทยาการมนุษยภาษา (HLT) |
การติดต่อ
ห้องปฏิบัติการวิจัยวิทยาการมนุษยภาษา 112 อุทยานวิทยาศาสตร์ประเทศไทย
ถนนพหลโยธิน ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120
โทรศัพท์ 02-564-6900 ต่อ 2233
http://www.hlt.nectec.or.th/
Twitter: @HLT_LAB












