BigStream จบ! ทุกความยุ่งเหยิงของ Data

Facebook
Twitter
bigstream-interview

 

สัมภาษณ์ | คุณคำรณ อรุณเรื่อ ผู้ช่วยวิจัยอาวุโส
ทีมวิจัยการจำลองและระบบขับเคลื่อนด้วยข้อมูล (DSS) เนคเทค-สวทช.
บทความ | วลัยลักษณ์ คงพระจันทร์
วิดีโอสัมภาษณ์ | ศศิวิภา หาสุข

ในโลกดิจิทัล “ข้อมูล” หรือ Data มีค่าดั่งขุมทรัพย์ สู่การสรรค์สร้างเทคโนโลยีและบริการที่ตอบโจทย์ถูกใจผู้ใช้งาน แต่ก่อนจะไปถึงจุดนั้น ผู้พัฒนาต้องฝ่าด่านความยุ่งเหยิงของข้อมูลไปให้ได้เสียก่อน ด้วยข้อมูลมหาศาลในโลกออฟไลน์และออนไลน์ การนำข้อมูลไปใช้ประโยชน์จำเป็นต้องมีกระบวนการจัดการเพื่อให้ได้ข้อมูลที่ครบครันทั้งปริมาณและคุณภาพที่เหมาะสมกับการใช้งานต่อไป

ด้วยเรื่องราวความยุ่งเหยิงของข้อมูลนี้ เนคเทคชวน คุณคำรณ อรุณเรื่อ ผู้ช่วยวิจัยอาวุโส ทีมวิจัยการจำลองและระบบขับเคลื่อนด้วยข้อมูล (DSS) กลุ่มวิจัยวิทยาการข้อมูลและการวิเคราะห์ (DSARG) แลกเปลี่ยนเรื่องความสำคัญของการจัดการข้อมูลสู่รากฐานเทคโนโลยีสมัยใหม่ รวมถึงที่มาที่ไปของ “BigStream” แพลตฟอร์มที่จะช่วยจบทุกความยุ่งเหยิงของข้อมูลด้วยการจัดหา-จัดการ-จัดเก็บข้อมูลแบบเรียลไทม์ ซึ่งล่าสุดได้มีบทบาทในการจัดการข้อมูลในวิกฤต COVID-19 อีกด้วย

Interview | ชวนคุยเรื่องการจัดการความยุ่งเหยิงของข้อมูล กับ คุณคำรณ อรุณเรื่อ

เส้นบาง ๆ ระหว่างความล้ำค่าและภาระของ “ข้อมูล”

ยิ่งเทคโนโลยีดิจิทัลขับเคลื่อนอย่างรวดเร็วมากเท่าไหร่ ข้อมูล หรือ Data ก็ยิ่งทวีความล้ำค่ามากขึ้นเท่านั้น ด้วยเทคโนโลยีและการบริการในปัจจุบันจำเป็นต้องพึ่งพาข้อมูลเพื่อการพัฒนาทั้งสิ้น อย่างไรก็ตามแม้กิจกรรมในโลกออนไลน์จะเอื้อให้เกิดข้อมูลมหาศาล แต่การใช้ประโยชน์จากข้อมูลเหล่านั้นไม่ง่าย

คุณคำรณ เล่าว่า ในยุคสมัยใหม่นี้อาจจะเคยได้ยินคำว่า “Data is the new oil” คือ การมีข้อมูลเหมือนมีสมบัติอย่างหนึ่ง ในทางกลับกันข้อมูลถ้าเก็บเยอะก็ยิ่งเป็นภาระ ข้อมูลจำนวนมากเมื่อมากองรวมกันเหมือนเป็นขยะดี ๆ นี่เอง การนำข้อมูลไปใช้ประโยชน์ เราต้องจัดเก็บ จัดหาข้อมูลอย่างมีประสิทธิภาพก่อน ข้อมูลจะต้องมีจำนวนมากพอ ทันสมัย รวดเร็ว และถูกต้อง

อย่างเทคโนโลยีในปัจจุบันไม่ว่าจะเป็น Big Data เทคโนโลยีการสื่อสารยุค 5G หรือ IoT ล้วนแต่ต้องอาศัย หรือ เกี่ยวข้องกับข้อมูลทั้งสิ้น โดยเฉพาะด้านปัญญาประดิษฐ์ หรือ AI ส่วนสำคัญที่สุดคือจะต้องมีข้อมูลที่พร้อมจึงจะทำให้มันเก่งหรือตอบโจทย์ปัญหาที่เราต้องการได้ แต่ข้อมูลที่เราต้องการจะต้องดีพอ มากพอ ถูกต้อง และมีคุณภาพด้วย

“เราบอกว่ามีข้อมูลยิ่งมากยิ่งดี แต่พอมารวมกันแล้วมันไม่ถูกต้อง ไม่ดี จึงเกิดคำว่า การบูรณาการข้อมูล หรือ Data integration คือ ไม่ใช่แค่การนำข้อมูลมารวมกัน เพราะข้อมูลโดยธรรมชาติมีความแตกต่างกันอยู่แล้ว แต่เราจะต้องนำมันมาใช้ประโยชน์ร่วมกันให้ได้” คุณคำรณ กล่าวเสริม
bigstream-interview

 

ด้วยธรรมชาติของข้อมูลที่มีความแตกต่างกันทั้งในแง่ของฐานข้อมูล แอปพลิเคชัน มาตรฐาน ผู้ผลิต หรือผู้ใช้งาน ดังนั้น การจัดการข้อมูลที่คลาสสิคที่สุด คือ การแปลงข้อมูลให้เป็นมาตรฐานเดียวกัน อย่างไรก็ตามการจัดการดังกล่าวมีต้นทุนสูง โดยเฉพาะอย่างยิ่งเมื่อระบบมีการพัฒนามากขึ้น การมองหาแหล่งเก็บข้อมูลที่เหมาะสมก็เป็นด่านสำคัญที่ต้องเลือกและลงทุนเพื่อรักษาประสิทธิภาพของระบบ

ปัจจุบันมีแพลตฟอร์มที่ช่วยให้การบูรณาการข้อมูลเป็นเรื่องง่ายด้วยการผนวกรวม 3 กระบวนการสำคัญด้านการทำงานกับข้อมูล ได้แก่ จัดหา จัดการ และจัดเก็บข้อมูลไว้ในแพลตฟอร์มเดียว คือ “BigStream”

ครบครันและยืดหยุ่น: ความโดดเด่นของ BigStream

“BigStream” แพลตฟอร์มสําหรับการจัดการข้อมูลแบบเรียลไทม์ (Real time data platform) ที่โดดเด่นด้วยความสมาร์ต สามารถประยุกต์ในงานด้าน Big Data จากแหล่งข้อมูลหลากหลาย ทั้ง Open Data และ Internet of Things ได้อย่างมีประสิทธิภาพ

“BigStream เป็น Smart Data Integration คือ ระบบที่มีความยืดหยุ่น ไม่ใช่แค่การรวบรวมข้อมูลอย่างเดียว แต่จะต้องรองรับข้อมูลที่มีความแตกต่างหลากหลาย และมีการจัดการด้านข้อมูลครบวงจร ทั้งเรื่องของการจัดหา จัดการ จัดเก็บ พร้อมสามารถควบคุมคุณภาพของข้อมูลได้ รวมถึงช่วยให้ขยาย scale ง่าย โดยใช้ทรัพยากรต่ำ” คุณคำรณ อธิบาย

นอกเหนือจากความสมาร์ต อีกหนึ่งจุดเด่นสำคัญของ BigStream คือ ความยืดหยุ่น (scalability) ด้วย BigStream ไม่ใช่ระบบสำเร็จรูป แต่พร้อมใช้งาน พร้อมที่จะนำไปปรับและประยุกต์ใช้ให้เหมาะสมในงานหลากหลายประเภท

คุณคำรณ เล่าเรื่องความยืดหยุ่นของ BigStream อย่างน่าสนใจว่า “BigStream เหมือน บะหมี่กึ่งสำเร็จรูป” คือ ถ้าเราอยากกินแบบต้ม ก็นำไปต้ม อยากกินแบบผัด ก็นำไปผัด หรืออยากกินเปล่า ๆ ก็กินได้เลย จึงเป็นที่มาของความยืดหยุ่น เพราะถ้าเราทำอะไร “สำเร็จรูป” มันจะทำงานได้อย่างเดียว เมื่อข้อมูลเปลี่ยนรูปแบบไปก็ต้องทำใหม่ ลักษณะนี้ เรียกว่าไม่ยืดหยุ่น . . .”
bigstream-interview

 

อีกแง่มุมของความยืดหยุ่น คือ BigStream สามารถติดตั้งใช้งานได้ตั้งแต่อุปกรณ์หรือประมวลผลขนาดเล็ก ที่ใช้ทรัพยากรต่ำ ทำงานเร็ว และประหยัดพลังงาน ไปจนถึงการประมวลผลขนาดใหญ่ เช่น คลาวด์หรือคอมพิวเตอร์สมรรถนะสูง ดังนั้น BigStream สามารถต่อยอดหรือขยายผลได้ทุกระบบในทุกระดับโดยไม่จำกัดเรื่องขนาดของข้อมูล” คุณคำรณ อธิบาย

4 กระบวนการด้านข้อมูลที่โดดเด่นใน BigStream

1) Data Collector
BigStream สามารถเก็บข้อมูลจากหลายแหล่ง หลากรูปแบบโดยอัตโนมัติ โดยที่ไม่มีข้อจำกัดเรื่องโครงสร้างพื้นฐาน ไม่ว่าจะเป็น web service, application, ฐานข้อมูล, อุปกรณ์ IoT ภายในบ้านและอุตสาหกรรม เป็นต้น
2) Data Transformation
BigStream ไม่มีขีดจำกัดของรูปแบบของข้อมูลรับเข้า สามารถแปลงข้อมูลใด ๆ ให้อยู่ในรูปแบบเดียวกันโดยอิสระ และสามารถคัดกรองข้อมูล (fliter) รวมไปถึงการแปลง โปรโตคอล (protocol) สื่อสารได้
3) Data Automation
BigStream รองรับการควบคุมโดยมีพื้นฐานการตัดสินใจจากข้อมูล สามารถนำไปประยุกต์ใช้งานกับระบบควบคุมอัตโนมัติ เช่น งานด้าน Smart Home หรือ Smart Farm โดยสามารถเขียนสคริปต์ให้ระบบประมวลผลข้อมูลและตัดสินใจตามเงื่อนไขได้
4) Data Storage
BigStream มีระบบจัดเก็บข้อมูลในตัว สามารถรองรับข้อมูลได้ทุกชนิด ทั้งข้อความ ตาราง มัลติมีเดีย พร้อม APIs ในตัว และระบบ Access Control สำหรับเข้าถึง ควบคุม และให้บริการข้อมูลอย่างปลอดภัย
“BigStream มันครบจบในตัวเรื่องข้อมูล คือ “จัดหา จัดการ จัดเก็บ ให้บริการ” นอกจากนี้โจทย์เรื่องของโซเชียลเน็ตเวิร์ค เช่น line bot หรือ line notify โดยใช้ BigStream นั้นง่ายและใช้เวลาน้อย อาจต่อยอดร่วมกับระบบ AI สำหรับสังเคราะห์ข้อความ หรือนำไปเก็บข้อมูล Social Data Collector ได้” คุณคำรณ อธิบายเพิ่มเติม
bigstream-interview

จุดเริ่มต้นและก้าวต่อไปของ BigStream

BigStream มีจุดเริ่มต้นจากงานวิจัยในเนคเทค โดยนอกเหนือจากพันธกิจเรื่องของการทำวิจัย เนคเทคได้พัฒนาแอปพลิเคชัน หรือ ระบบสารสนเทศ เพื่อตอบโจทย์แก้ปัญหาให้กับประชาชนทั้งในระดับประเทศและชุมชน ตั้งแต่เรื่องของเกษตรกรรม การแพทย์สาธารณสุข หรือการจัดการภัยพิบัติ เป็นต้น

“โจทย์ด้านแอปพลิเคชันที่หลากหลายของเนคเทค มักมีปัญหาเรื่องข้อมูล ตั้งแต่การจัดการข้อมูลรวมไปถึงการบูรณาการ คือ เมื่อขึ้นระบบใหม่ก็ต้องทำใหม่อยู่ตลอดทั้งที่โจทย์คล้ายกัน ซึ่งส่วนนี้ใช้ต้นทุนสูง จึงมีแนวคิดจะทำ Data Platfrom ที่รับผิดชอบจัดการในระดับข้อมูลเพื่อให้ผู้พัฒนาไปโฟกัสในเรื่องที่สำคัญ เช่น User Interface, Data Analytics ช่วยลดเวลาและต้นทุนในการพัฒนาระบบจึงเป็นที่มาและความจำเป็นของแพลตฟอร์ม BigStream” คุณคำรณ กล่าว

ก้าวต่อไปของ BigStream มุ่งส่งเสริมการถ่ายทอดเทคโนโลยีเพื่อสนับสนุนภาคธุรกิจให้สามารถต่อยอดสร้างผลิตภัณฑ์และบริการบนเทคโนโลยีที่แต่ละภาคธุรกิจเชี่ยวชาญ สร้างเป็น Ecosystem ที่นอกจากจะนำ BigStream ไปใช้แล้ว ยังสามารถสร้างมูลค่าเพิ่มได้อีกด้วย

“ ด้วยความยืดหยุ่นของ BigStream ที่มี plug-in หรือซอฟต์แวร์สามารถติดตั้งเสริมให้เข้ากับอุปกรณ์ต่างยี่ห้อต่างชนิดกัน สามารถนำไปต่อยอดในเรื่องของธุรกิจได้ นอกจากนี้ในกลุ่มของนักพัฒนา เยาวชน หรือเมกเกอร์ BigStream ก็ถ่ายทอดให้ใช้งานได้ง่ายขึ้น” คุณคำรณ กล่าวเสริม
bigstream-interview

ลงสนามใช้งานจริง: BigStream กับการพัฒนาระบบในสถานการณ์วิกฤต

BigStream ได้เข้าไปมีบทบาทในงานของภาครัฐผ่านงานวิจัยเนคเทคจำนวนมาก ไม่ว่าจะเป็น “ทันระบาด” หรือ ชุดซอฟต์แวร์สนับสนุนการป้องกันและควบคุมการระบาดไข้เลือดออกเชิงรุก โดย BigStream ได้ช่วยสนับสนุนการบูรณาการข้อมูลจากหลายหน่วยงานที่จัดเก็บและจัดการข้อมูลด้วยวิธีการต่างยุคต่างสมัย เพื่อประโยชน์ในการตัดสินใจและพยากรณ์การระบาด สู่การควบคุมการระบาดได้อย่างมีประสิทธิภาพ พร้อมคำนึงถึงความปลอดภัยและความ เป็นส่วนตัวของข้อมูลอีกด้วย หรือ “KidBright” บอร์ดสมองกลฝังตัวในโครงการอุตุน้อย ที่มี BigStream อยู่เบื้องหลังในการบูรณาการข้อมูลจากสถานีวัดอากาศที่ติดตั้ง ณ โรงเรียนต่าง ๆ

bigstream-interview

 

นอกจากนี้ BigStream ยังเป็นฟันเฟืองสำคัญของระบบ DDC-Care หรือ ระบบติดตามและประเมินผู้ที่มีความเสี่ยงต่อโรคติดเชื้อ COVID-19 ที่สร้างขึ้นอย่างเร่งด่วนสำหรับสถานการณ์วิกฤต COVID-19 โดยเฉพาะ

คุณคำรณ “เล่าว่า COVID-19 เป็นวิกฤตที่เป็นโรคใหม่ เราต้องการระบบที่สามารถทำงานได้เร็ว ใช้เวลาพัฒนาไม่นาน ใช้งานได้ทันที โดยปกติการออกแบบระบบในลักษณะสำหรับ COVID-19 ถ้าใช้ต่อยอดยาว ๆ ใช้เวลาเป็นปี เพราะมีเรื่องให้ระมัดระวังหลายอย่าง โดย BigStream ตอบโจทย์ตรงที่สามารถติดตั้งใช้ระบบได้ภายใน 1 วัน”

bigstream-interview

 

แม้ระยะเวลาการพัฒนาระบบจะจำกัดในสถานการณ์วิกฤต แต่ด้วยความยืดหยุ่นของ BigStream ทำให้ DDC-Care สามารถเพิ่มเติมฟังก์ชันที่สำคัญและเหมาะสมกับสถานการณ์อย่างต่อเนื่อง พร้อมครอบคลุมถึงการรักษาความปลอดภัยและเป็นส่วนตัวของข้อมูลอย่างรัดกุม ด้วยเป็นระบบที่เกี่ยวข้องกับข้อมูลส่วนบุคคลของผู้ป่วยโดยตรง

“เราพัฒนา ให้บริการ และปรับไปพร้อม ๆ กัน เราไม่สามารถคิดได้อย่างครอบคลุมตั้งแต่ต้นว่าต้องมีข้อมูลใดบ้าง แต่หากต้องเพิ่มจะต้องไม่กระทบต่อข้อมูลหลัก ด้วยความยืดหยุ่นของ Data lake บน BigStream รวมไปถึงเรื่องความเป็นส่วนตัวและปลอดภัยของข้อมูล ไม่ใช่ว่าเป็นเรื่องเร่งด่วนแล้วจะมองข้ามหรือสูญเสียจุดนี้ไป โดย BigStream สามารถควบคุมการเข้าถึงข้อมูลตามสิทธิ์ได้” คุณคำรณ กล่าวเสริม

BigStream กับสถานการณ์วิกฤตยังไม่ได้จบที่เรื่องราวของ COVID-19 ย้อนกลับไปในปี 2561 BigStream ได้มีส่วนร่วมในภาระกิจค้นหาผู้สูญหาย ณ วนอุทยานถ้ำหลวง ขุนน้ำนางนอน จ.เชียงราย โดยเป็นฟันเฟืองภายใต้ระบบ “ทันพิบัติ” หรือระบบสนับสนุนการปฏิบัติงานของเจ้าหน้าที่ป้องกันและบรรเทาสาธารณภัยในการติดตามและเฝ้าระวังสถานการณ์ทางธรรมชาติแบบเรียลไทม์ โดยเชื่อมต่อกับสถานีตรวจวัดที่ติดตั้งบริเวณถ้ำฯ เพื่อบูรณาการข้อมูลด้านอุตุนิยมวิทยาสนับสนุนการตัดสินใจในภารกิจฯ ต่อไป

ลงสนามใช้งานจริง: BigStream กับการต่อยอดใช้งานโดยเอกชน

BigStream ไม่ได้หยุดอยู่ที่การเป็นฟันเฟืองเบื้องหลังงานของภาครัฐผ่านงานวิจัยเนคเทคเท่านั้น แต่ได้มีการถ่ายทอดเทคโนโลยี (lisence) ให้กับภาคเอกชนไปขยายผลต่อยอดทางธุรกิจ เพื่อสร้างผลิตภัณฑ์บนเทคโนโลยีที่ตนเองเชี่ยวชาญอีกด้วย

ยกตัวอย่าง แพลตฟอร์ม JetStream โดยบริษัท i-bitz ที่ได้รับสิทธิ์การใช้เทคโนโลยี (licensing) นำความสามารถของ BigStream ไปต่อยอดให้บริการ Cloud Computing และ Edge Computing ไม่ว่าจะเป็น ระบบให้บริการข้อมูล (Spatial Data Services) ที่รวบรวมและให้บริการข้อมูลจากเซ็นเซอร์ สถานีตรวจวัด และภาพถ่ายจากโพรโตคอล (protocol) หลากหลายรูปแบบได้โดยง่าย ไปจนถึงแพลตฟอร์มไอโอทีสำหรับอุตสาหกรรม (IIoT)

bigstream-interview

 

“คุณสมบัติของ BigStream ที่สามารถติดตั้งใช้งานได้แม้แต่ในอุปกรณ์ขนาดเล็กอย่าง IIoT Gateway ภาคเอกชนถึงสามารถจึงนำไปใช้ประโยชน์ในการเก็บข้อมูลและติดต่อสื่อการระหว่างเครื่องจักรในโรงงานอุตสาหกรรมที่ต่างระบบและผู้ผลิตได้ ช่วยยกระดับโรงงานอุตสหกรรมให้เป็น Smart Factory ได้โดยง่ายและใช้ต้นทุนต่ำ” คุณคำรณ กล่าวเสริม

ด้วยประสิทธิภาพและความยืดหยุ่นของ BigStream ร่วมกับความเชี่ยวชาญในเทคโนโลยีของภาคเอกชน ทำให้ภาคเอกชนสามารถต่อยอดใช้ประโยชน์จาก BigStream ในอุตสาหกรรมที่หลากหลาย

สนใจใช้งาน / สอบถามข้อมูลเพิ่มเติมเกี่ยวกับ BigStream

ทีมวิจัยการจําลองและระบบขับเคลื่อนด้วยข้อมูล (DSS)
กลุ่มวิจัยวิทยาการข้อมูลและการวิเคราะห์ (DSARG)
ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
โทร 0 2564 6900 ต่อ 2279
E-mail: naiyana.sahavechaphan[at]nectec.or.th

บทความที่เกี่ยวข้อง