นวัตกรรมพร้อมใช้

“ระบบถอดความเสียงพูดเป็นตัวอักษรแบบทันเวลา” เปิดโลกสื่อสารคนพิการทางการได้ยิน

Share to...

ประเทศไทยมีคนพิการทางการได้ยินและสื่อความหมาย (คนหูหนวก) ประมาณ 300,000 คน ขณะที่ผู้สูงอายุที่อาจมีปัญหาทางการได้ยินมีแนวโน้มเพิ่มมากขึ้นเรื่อยๆ ซึ่งแน่นอนว่าการไม่ได้ยินเสียงย่อมนำมาซึ่งข้อจำกัดในการสื่อสาร และการขาดโอกาสการเข้าถึงข่าวสาร ความรู้ต่างๆ รวมถึงส่งผลกระทบไปสู่ปัญหาการใช้ชีวิตด้านอื่นๆ อีกมากมายด้วย ดังเช่น ในงานประชุม สัมมนา รายการโทรทัศน์ต่างๆ ที่มีการบรรยายสดหากไม่มีล่ามภาษามือที่คอยเป็นสื่อกลางในการสื่อสารให้คนพิการทางการได้ยินแล้ว ก็เท่ากับเสียโอกาสในการรับรู้ข้อมูลได้เทียบเท่ากับคนปกติ

เพื่อเปิดโลกเงียบของคนพิการทางการได้ยินให้มีโอกาสสื่อสาร เรียนรู้ รับรู้ข้อมูลต่างๆ ได้อย่างมีประสิทธิภาพ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) ได้พัฒนาเทคโนโลยี “ระบบถอดความเสียงพูดแบบทันต่อเวลาผ่านระบบสื่อสารทางไกล” นวัตกรรมที่ช่วยให้คนพิการและผู้สูงอายุที่มีปัญหาทางการได้ยินสามารถเข้าใจเนื้อหาข้อมูลในการประชุมสัมมนาหรือรายการโทรทัศน์แบบทันที

ดร.ณัฐนันท์ ทัดพิทักษ์กุล หัวหน้าห้องปฏิบัติการวิจัยและออกแบบนวัตกรรมที่เข้าถึงและใช้ประโยชน์ได้ จากสถาบันเทคโนโลยีเพื่อคนพิการและผู้สูงอายุ กล่าวว่า ระบบถอดความเสียงพูดแบบทันต่อเวลาผ่านระบบสื่อสารทางไกล เป็นนวัตกรรมที่ช่วยให้คนพิการทางการได้ยินและผู้สูงอายุที่มีปัญหาทางการได้ยิน สามารถเข้าใจเนื้อหาข้อมูลในการประชุมสัมมนาหรือรายการโทรทัศน์ได้ ด้วยการอ่านข้อความที่ได้จากการถอดความเสียงพูด

“ระบบถอดความเสียงพูดแบบทันต่อเวลาฯ ที่พัฒนาขึ้นนี้ มีจุดเด่น คือ ทันต่อเวลา โดยงานวิจัยต่างประเทศระบุว่า สิ่งสำคัญในการถอดเสียง คือ ข้อความที่ได้จากการถอดเสียงจะต้องปรากฏให้ทันภายใน 5 วินาที หลังจากที่ผู้บรรยายเริ่มพูด ไม่เช่นนั้นภาพและข้อความจะไม่สัมพันธ์กัน ทำให้ผู้อ่านไม่เข้าใจข้อความ หรือเนื้อหาที่ต้องการสื่อสารได้ ทั้งนี้ปกติคนจะพูดที่ความเร็วเฉลี่ย 160 คำต่อนาที หรือบางคนพูดเร็วๆ อาจจะอยู่ที่ 200 คำต่อนาที ขณะที่คนพิมพ์มีความเร็วเฉลี่ยในการพิมพ์ 60 คำต่อนาที ดังนั้นจึงต้องใช้คนหลายๆ คน มาช่วยพิมพ์ ซึ่งทีมวิจัยได้พัฒนาเทคโนโลยีและระบบบริหารจัดการที่จะเอาข้อความที่แต่ละคนพิมพ์มาต่อกันให้เป็นข้อความให้สมบูรณ์”

Cinque Terre — ขั้นตอนการทำงานของระบบ (คลิกเพื่อดาวน์โหลดภาพขนาดใหญ่)

สำหรับหลักการทำงานของระบบถอดความเสียงพูดแบบทันต่อเวลาฯ อาศัยเทคโนโลยีการสื่อสารทางไกลในการส่งสัญญาณเสียงพูดผ่านทางเครือข่ายอินเทอร์เน็ต ไปยังศูนย์ถอดความที่มีเจ้าหน้าที่ถอดความเสียงพูดเป็นข้อความ โดยใช้เทคนิคแบ่งพิมพ์และระบบบริหารจัดการคิวการถอดความ คือระบบจะทำหน้าที่แบ่งเสียงพูดส่งไปให้เจ้าหน้าที่แต่ละคนถอดความ และรวมข้อความจากเจ้าหน้าที่ตามลำดับเวลา เพื่อให้ได้ข้อความที่มีความถูกต้องสมบูรณ์ สำหรับส่งไปแสดงผลได้ทันกับเสียงพูดของผู้พูด ข้อความที่ได้จากการถอดความจะถูกส่งผ่านเทคโนโลยีการสื่อสารทางไกลกลับไปยังผู้ใช้แบบเวลาจริง (real-time) ซึ่งผู้ใช้สามารถเลือกรับชมได้หลายรูปแบบตามความต้องการ เช่น รับชมผ่านจอมอนิเตอร์ในงานประชุมสัมมนา หรือรับชมผ่านแอปพลิเคชันบนโทรศัพท์มือถือ ซึ่งผลการทดสอบการทำงานพบว่ามีความถูกต้องแม่นยำมากกว่า 90%

การเชื่อมต่อกับสถานีโทรทัศน์ระบบดิจิทัล

นอกจากนี้ระบบถอดความเสียงพูดแบบทันต่อเวลาฯ ยังสามารถนำไปต่อเชื่อมกับระบบบริการคำบรรยายแทนเสียงของสถานีโทรทัศน์ในระบบดิจิทัลเพื่อให้บริการคำบรรยายแทนเสียงแบบปิด (Closed Caption หรือ CC) ซี่งเป็นบริการที่คณะกรรมการกิจการกระจายเสียง กิจการโทรทัศน์ และกิจการโทรคมนาคมแห่งชาติ (กสทช.) กำหนดให้สถานีโทรทัศน์ทุกช่องต้องจัดให้มีตามประกาศเรื่อง “การส่งเสริมและคุ้มครองสิทธิของคนพิการ ให้เข้าถึงและรับรู้หรือใช้ประโยชน์จากรายการของกิจการโทรทัศน์ พ.ศ. 2559”

ดร.ณัฐนันท์ กล่าวว่า จุดเด่นของเทคโนโลยี ระบบถอดความเสียงพูดแบบทันต่อเวลาฯ ไม่เพียงเป็น Real-Time Communication Protocol คือ ถอดเสียงแสดงผลเป็นข้อความได้ทันต่อเวลาแล้ว ระบบยังทำงานได้ทั้งบนระบบปฏิบัติการ Windows version 7, 8 หรือ 10 ขึ้นไป หรือบนระบบปฏิบัติการ Android version 5.0 ขึ้นไป ขณะที่การแสดงผลข้อความก็แสดงผลได้ทั้งแบบข้อความอย่างเดียว หรือแบบภาพวิดีโอพร้อมข้อความที่แสดงใต้ภาพ ปัจจุบันระบบบริการถอดความเสียงพูดแบบทันต่อเวลาฯ ได้เปิดให้ทดสอบใช้งานระบบสำหรับการเรียนการสอนและงานประชุมสัมมนา และทดสอบเชื่อมต่อกับระบบบริการคำบรรยายแทนเสียงของสถานีโทรทัศน์ในระบบดิจิทัล

“สำหรับแนวทางการพัฒนาต่อยอดก็มีแผนนำเอานวัตกรรมเรื่องของ ปัญญาประดิษฐ์ (Artificial Intelligence) หรือ AI มาช่วยทำระบบแนะนำคำ ในกรณีที่เป็นคำศัพท์ที่ยากหรือว่าเป็นคำที่ผู้พิมพ์ต้องใช้เวลานานในการพิมพ์ ซึ่งจะช่วยให้ผู้พิมพ์ใช้เวลาพิมพ์เร็วขึ้น นอกจากนี้ในอนาคตทีมวิจัยยังมีแผนในการลดจำนวนคนที่ใช้ถอดความ ด้วยการนำเอาระบบรู้จำเสียงพูดอัตโนมัติมาใช้ร่วมกับคน โดยคนทำงานจะมีหน้าที่คอยตรวจแก้ไขข้อความจากระบบอัตโนมัติให้ถูกต้อง สมบูรณ์ยิ่งขึ้นเท่านั้น”

ระบบถอดความเสียงพูดแบบทันต่อเวลาฯ ถือเป็นเทคโนโลยีที่จะเข้ามีส่วนช่วยเพิ่มประสิทธิภาพในการสื่อสารให้คนพิการทางการได้ยินได้ดีขึ้น เนื่องจากการใช้ล่ามภาษามือนอกจากจะมีข้อจำกัดในส่วนของบุคลากรที่มีไม่เพียงพอแล้ว ภาษามือยังมีคำศัพท์อยู่ประมาณ 5,000-6,000 คำ ทำให้ไม่สามารถครอบคลุมถึงศัพท์เทคนิค ศัพท์เฉพาะ หรือคำใหม่ๆ ได้ทั้งหมด ทำให้ต้องใช้วิธีการสะกดด้วยภาษามือ ซึ่งใช้เวลานาน ขณะเดียวกันการใช้ภาษามือบางครั้งเป็นการแปลหรือสรุปความก็อาจจะทำให้ได้ข้อมูลไม่ครบถ้วนเท่ากับการถอดข้อความเสียง ดังนั้นการพัฒนาระบบถอดความเสียงพูดแบบทันต่อเวลาฯ จึงมีส่วนช่วยเพิ่มโอกาส และส่งเสริมให้คนพิการทางการได้ยินรวมถึงผู้สูงอายุมีคุณภาพชีวิตที่ดีขึ้น

September 28, 2018
10:31