อินเทลแข่งไมโครซอฟท์ผนวกคำสั่งเสียงและภาพ

อินเทลเร่งพัฒนาโปรแกรมแปลข้อมูลภาพ ประกาศเปิดตัวซอฟต์แวร์อ่านริมฝีปากเชื่อมโยงคำพูด ขณะที่เผยเตรียมดัดแปลงใช้สังเกตการณ์ผู้ป่วย และตรวจหาอาชญากร ด้านผู้เชี่ยวชาญชี้เทคนิคคล้ายจีวินโดว์ส

 

สำนักข่าวซีเน็ต รายงานว่า บริษัท อินเทล คอร์ป. ผู้ผลิตชิพรายใหญ่ของโลก ได้เปิดตัวซอฟต์แวร์จดจำคำพูดระบบโสตทัศนะ "ออดิโอ วิช่วล สปีช รีคอกนิชั่น" หรือเอวีเอสอาร์ (The Audio Visual Speech Recognition-AVSR) ซึ่งมีคุณสมบัติในการเชื่อมโยงลักษณะการเคลื่อนไหวของปากกับคำพูด เพื่อให้คอมพิวเตอร์สามารถรับคำสั่งด้วยเสียงได้แม้ในบริเวณที่มีเสียงอึกทึก

 

ตัวแทนอินเทล เปิดเผยว่า โปรแกรมเอวีเอสอาร์ เป็นส่วนหนึ่งของห้องสมุดโอเพ่น ซีวี ซึ่งเป็นศูนย์รวบรวมระบบงานโอเพ่นซอร์ส และเครื่องมือที่ช่วยให้คอมพิวเตอร์สามารถแปลความหมายข้อมูลภาพได้ โดยซอฟต์แวร์ตัวนี้ได้รับการพัฒนาขึ้นในห้องทดลองสาขาประเทศจีน ของอินเทล ทั้งนี้ ผู้ผลิตคอมพิวเตอร์ได้พยายามพัฒนาระบบงานจดจำเสียงมาเป็นเวลานานแล้ว แต่เทคโนโลยีดังกล่าวก้าวหน้าขึ้นหลังจากที่อุตสาหกรรมคอมพิวเตอร์เริ่มหันมาใช้ชิพความเร็ว 1.5-3 กิกะเฮิรตซ์ ซึ่งช่วยให้หน่วยประมวลผลพีซีสามารถรองรับระบบคำสั่งเช่นนี้ได้

 

ผู้เชี่ยวชาญกล่าวว่า เทคโนโลยีเอวีเอสอาร์ เป็นแนวคิดในการปรับปรุงระบบงานจดจำเสียงวิธีหนึ่ง ด้วยการนำสัญญาณภาพมารวมกับโปรแกรมจดจำเสียง คล้ายคลึงกับการพัฒนาระบบงานต้นแบบ "จีวินโดว์ส" (GWindows) ของไมโครซอฟท์ ซึ่งช่วยให้ผู้ใช้คอมพิวเตอร์สามารถอ่านชื่อไฟล์หรือเปลี่ยนหน้าจอวินโดว์สได้โดยการผนวกคำสั่งเสียงเข้ากับคำสั่งท่าทาง นายแอนดี้ วิลสัน ผู้ออกแบบโปรแกรมจีวินโดว์ส อธิบายว่า โปรแกรมดังกล่าวสามารถทำงานได้ดีกว่าระบบจดจำเสียงทั่วไป เนื่องจากการใช้ท่าทางประกอบ จะช่วยเพิ่มระดับความแม่นยำในการอ่านคำสั่ง

 

นอกจากนี้ ตัวแทนอินเทล เปิดเผยอีกว่า ทางบริษัทยังเตรียมพัฒนาระบบงานภาพอื่นๆ ที่อาศัยเทคโนโลยีเอวีเอสอาร์ อาทิ ซอฟต์แวร์ที่ใช้กล้องถ่ายภาพในการสังเกตการณ์ผู้ป่วยในโรงพยาบาล และซอฟต์แวร์ที่ใช้ข้อมูลจากกล้องรักษาความปลอดภัย เพื่อค้นหาผู้มีแนวโน้มเป็นอาชญากรตามที่จอดรถต่างๆ โดยโปรแกรมเหล่านี้ต่างอาศัยหลักการเดียวกันคือ การกำหนดให้เครื่องคอมพิวเตอร์ส่งสัญญาณเตือนเมื่อเห็นสถานการณ์ผิดปกติ เช่น เมื่อคลื่นสมองผู้ป่วยเริ่มเต้นช้าลง หรือพบคนเดินจากรถคันหนึ่งไปยังรถอีกคันหนึ่ง แทนที่จะเดินตรงไปยังห้าง

 

ขณะเดียวกัน อินเทลยังได้เปิดตัวโปรแกรมห้องสมุดทางเทคนิคสำหรับสร้างเครือข่ายเบยีเชี่ยน (Bayesian network) เวอร์ชั่นทดสอบ และมีกำหนดเปิดตัวห้องสมุดเวอร์ชั่นสมบูรณ์ ภายใต้ชื่อ "โพรเบบิลิตี้ เน็ตเวิร์ค ไลบรารี่" (Probability Network Library) ภายในช่วงสิ้นปีนี้

 

ที่มา : กรุงเทพธุรกิจ ฉบับวันที่ 30 เมษายน 2546

 
Home | About us | INET | ITE| PTEC | MTS | NTJ | Software Park
National Electronics and Computer Technology Center (NECTEC)
Copyright ©2001 By Information System Service Section. All rights reserved.