Thailand The big Picture
Picture of NECTEC's logo
Picture of Thailand the Big Picture's logo เนคเทค
Picture of UK flag Picture of USA flag English/ Picture of Thai flag ไทย ทั่วโลก
เครื่องโทรศัพท์ฉลาด


ปัจจุบันเครื่องโทรศัพท์เป็นอุปกรณ์จำเป็นอย่างหนึ่งในชีวิตประจำวัน การเพิ่มความสามารถใช้งานพิเศษให้กับเครื่องโทรศัพท์ เช่น การรับฝากข้อความเสียงอัตโนมัติในกรณีที่ไม่ว่างรับสาย หรือ การโทรออกได้โดยการพูดชื่อคนแทนการกดเลขหมายปลายทาง ก็จะอำนวยความสะดวกให้กับผู้ใช้เป็นอย่างมาก

ระบบรับฝากข้อความเสียงทางโทรศัพท์ช่วยอำนวยความสะดวกในการติดต่อธุระให้กับผู้ใช้ และได้รับความนิยมใช้งานสูงขึ้น แม้ในปัจจุบันจะมีการให้บริการฝากข้อความเสียงไว้ที่ผู้ให้บริการโทรศัพท์ แต่การใช้งานยังไม่สะดวกและผู้ใช้ต้องเสียเงินในการโทรไปฟังข้อความแต่ละครั้ง ดังนั้นวิธีเก็บข้อความเสียงไว้ที่ผู้ใช้ปลายทางจึงเป็นวิธีที่ประหยัดกว่า การเก็บข้อความเสียงในระบบดิจิตอลจะให้คุณภาพเสียงดีกว่าระบบแอนาล็อก และสามารถทำให้อุปกรณ์ตอบรับโทรศัพท์ (Answering Machine) มีขนาดเล็กลงได้ การเก็บข้อความเสียง ในระบบดิจิตอลจำเป็นต้องมีการบีบอัดข้อมูลเสียง (Speech Compression) ให้มีปริมาณน้อยลงเพื่อเป็นการประหยัดหน่วยความจำ (Memory)

การโทรออกโดยการพูดชื่อคนแทนการกดปุ่มโทรศัพท์นั้นจะช่วยให้ผู้ใช้ไม่ต้องเสียเวลาค้นหาเลขหมายโทรศัพท์ แต่ก่อนจะใช้งานได้นั้นผู้ใช้จำเป็นต้องบันทึกเสียงชื่อและเลขหมายโทรศัพท์ของบุคคล ที่ต้องการติดต่อด้วยลงในเครื่องโทรศัพท์ล่วงหน้า ตอนใช้งานก็เพียงแต่พูดชื่อที่หูโทรศัพท์ หลังจากนั้นเครื่องโทรศัพท์จะนำเสียงไปวิเคราะห์หาว่าพูดชื่อใคร โดยเทียบจากเสียงชื่อที่ได้บันทึกไว้ พร้อมกับค้นหาเลขหมายของชื่อนั้นและทำการโทรออกให้ เครื่องโทรศัพท์ที่กล่าวถึงนี้จะต้องมีความสามารถในการรู้จำเสียงพูด (Speech Recognition)

โครงการนี้เป็นการพัฒนาอุปกรณ์ตอบรับโทรศัพท์อัตโนมัติในระบบดิจิตอลและโทรออกด้วยเสียงพูด โดยพัฒนาเป็นอุปกรณ์ต่อพ่วงกับเครื่องโทรศัพท์แบบธรรมดาที่มีอยู่เดิมโดยไม่ต้องดัดแปลง จึงทำให้ไม่ต้องซื้อเครื่องรุ่นใหม่อีก เป็นการเพิ่มความสามารถใช้งานพิเศษสองอย่างให้กับเครื่องโทรศัพท์ โครงการนี้เป็นการพัฒนาเทคโนโลยีบีบอัดสัญญาณเสียงและเทคโนโลยีการรู้จําเสียงพูดและนํามาใช้ร่วมกัน


คุณสมบัติ

  • สามารถต่ออุปกรณ์ฮาร์ดแวร์พ่วงเข้ากับโทรศัพท์ปกติตามบ้านได้โดย ไม่ต้องดัดแปลง
  • สามารถรับฝากข้อความเสียงอัตโนมัติในระบบดิจิตอลได้ 30 ข้อความ ความยาว 30 วินาทีต่อข้อความ
  • สามารถโทรออกได้โดยวิธีการพูดชื่อคนหรือวิธีการกดปุ่มตามแบบ ปกติได้
  • สามารถบันทึกเสียงชื่อคนเพื่อใช้โทรออกได้สูงสุด 40 ชื่อ และบันทึก เลขหมายโทรศัพท์ได้ 5 เลขหมายต่อชื่อ, ความยาวสูงสุด 16 ตัวเลข ต่อเลขหมาย
  • สามารถตรวจสัญญาณของสายไม่ว่างแล้วหมุนเลขหมายอื่นของชื่อ นั้นให้โดยอัตโนมัติ
  • มีอัตราการรู้จำเสียงชื่อคนถูกต้องมากกว่า 90 %
  • สามารถบันทึกชื่อคนเป็นอักษรไทยและแสดงผลการรู้จำบนจอ LCD

เกร็ดความรู้
การบีบอัดสัญญาณเสียงพูดที่เลือกใช้ในระบบนี้คือการบีบอัดตามมาตรฐาน G.729A ซึ่งเป็นการ quantize แบบพารามิเตอร์ สามารถบีบอัดข้อมูลได้มากถึง 8 เท่า (จากปริมาณข้อมูลปกติในระบบโทรศัพท์ที่อัตรา 64 kbits/s เหลือ 8 kbits/s) อัลกอริธึมที่ใช้ในมาตรฐานนี้คือ CS-ACELP ซึ่งจะนำเสียงที่ถูกสุ่มด้วยความถี่ 8000 Hz มาทีละ 10 มิลลิวินาที(เท่ากับสัญญาณ 80 จุด) แล้วทำการแปลงเป็นพารามิเตอร์ขนาด 80 บิท พารามิเตอร์ที่คำนวณได้นี้คือพารามิเตอร์ของส่วนประกอบที่ใช้ในการสร้างเสียง โดยมองว่าเสียงสร้างขึ้นจากสัญญาณกระตุ้น (ลมในช่องท้อง คือส่วน Excitation ในรูป) ที่ส่งผ่านวงจรกรอง (ช่องคอ, ทางเดินอากาศ, ช่องปากและลิ้น คือส่วน filter ทั้งหลายในรูป)

หลังจากทำการบีบอัดข้อมูลแล้วก็จะส่งข้อมูลออกไปทางช่องสื่อสารหรือทำการจัดเก็บข้อมูลแล้วแต่ลักษณะการนำไปใช้ เมื่อข้อมูลถูกส่งไปถึงปลายทางก็จะทำการขยายหรือแปลงข้อมูลจากค่าพารามิเตอร์เหล่านี้กลับมาเป็นเสียงพูดใหม่

Untitled Document
NSTDA  ||  NECTEC ||  BIOTEC  ||  MTEC ||  NITC ||  SOFTWARE PARK ||  GITS ||  e-Learning ||  BID ||  Courseware ||  ThaiCert  ||  CCP

สงวนลิขสิทธิ์โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
112 อุทยานวิทยาศาสตร์ประเทศไทย ถนนพหลโยธิน ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120 โทร 02-564-6900 ต่อ 2346-55
E-mail : หรือ
แผนที่