Big Data การออกแบบกระบวนการวิเคราะห์ที่เหมาะสมควรทำอย่างไร
เทคโนโลยีข้อมูลขนาดใหญ่ (Big Data Teachnology) มีประโยชน์ต่อการแข่งขันในเชิงธุรกิจ การใช้ข้อมูลเชิงลึกเพื่อประกอบการตัดสินใจมักจะสร้างคุณค่ามหาศาลให้กับองค์กร ข้อมูลขนาดใหญ่สามารถเริ่มต้นทำได้โดยอาศัยการนำข้อมูลจากแหล่งข้อมูลชนิดต่างๆ มาวิเคราะห์เพื่อให้เกิดเป็นความเข้าใจที่ลึกซึ้ง (Insight) และเกิดความคิดเชาว์ปัญญา (Intelligence) มาช่วยในการตัดสินใจในเชิงธุรกิจ
ปัจจุบันมีหลายหน่วยงานที่นำเอาคำนี้ มากำหนดเป็นนโยบายหรือเป้าหมาย การใช้ประโยชน์จากเทคโนโลยีนี้หากยังขาดความรู้ความเข้าใจที่ดีในผู้ทำก็อาจทำให้เกิดปัญหา ไม่สามารถใช้ประโยนช์ข้อมูลที่มีได้ตรงตามที่คาดหวัง
องค์กรหลายแห่งที่สนใจในงานข้อมูลขนาดใหญ่ ยังคงมีสงสัยในอีกหลายเรื่อง เช่น จะต้องวางแผนสร้างทีมอย่างไร ใช้เวลานานเท่าไหร่ คาดหวังผลอะไรได้บ้าง และที่สำคัญควรจะเริ่มต้นเมื่อทำโครงการใช้วิธีอย่างไรจึงจะเหมาะสม
การออกแบบกระบวนการวิเคราะห์ที่เหมาะสม ต้องอาศัยประสบการณ์ของนักวิทยาศาสตร์ข้อมูลผู้มีความรู้ในด้านสถิติประยุกต์ (Statistics) การขุดเหมืองข้อมูล (Data Mining) การเรียนรู้ของเครื่องคอมพิวเตอร์ (Machine Learning) การแสดงผลข้อมูล (Visualization) และการออกแบบการทดลอง (Design of Experiment) รวมทั้งมีความคุ้นเคยกับขอบเขตของความรู้เชิงธุรกิจ (Business Domain) อีกด้วย ซึ่งการสร้างทีมวิเคราะห์ที่ประกอบด้วยบุคลากรจากหลายส่วนงานจะช่วยส่งเสริมให้เกิดความคิดเชิงวิเคราะห์ที่หลากหลายและช่วยให้การออกแบบและประยุกต์ใช้งานโมเดลวิเคราะห์มีโอกาสเป็นรูปธรรมมากขึ้น การออกแบบกระบวนการวิเคราะห์ที่เหมาะสม ประกอบด้วยขั้นตอน ดังนี้
ขั้นตอนที่ 1 การรบวรวมข้อมูลของนักขุดข้อมูล (Data Mining) ต้องให้ความสนใจก็คือ หาคำถามให้ชัดเจนก่อนว่า เรากำลังทำงานเพื่อตอบโจทย์อะไร ตอยสนองให้ใครเช่น ผู้บริหารหรือองค์กรหรือเราเอง เพื่อมาวางแผนการเลือกสรรข้อมูลที่จะใช้ในการวิเคราะห์ว่าควรจะหน้าตาเป็นอย่างไร และสามารถหามาได้จากแหล่งใดเช่น ข้อมูลภายในองค์กรที่มีอยู่แล้วแต่ยังไม่ได้ถูกนำมาใช้ประโยชน์ (ข้อมูลรายการธุรกรรมข้อมูลลูกค้า เว็บบล็อก ฯลฯ) ข้อมูลที่ต้องจัดซื้อเพิ่มเติม (ข้อมูลความคิดเห็น จากสื่อสังคม ข้อมูลเชิงประชากร ฯลฯ) และข้อมูลที่ต้องจัดเก็บเพิ่มจากการสำรวจ
ขั้นตอนที่ 2 การจัดเตรียมข้อมูล เมื่อได้ข้อมูลมาทีมวิเคราะห์ข้อมูลจะต้องทำการเตรียมข้อมูล การปรับเปลี่ยนข้อมูลที่ได้มา รวมถึงจัดการข้อมูลให้มีความถูกต้องเหมาะสม เพื่อให้ได้ข้อมูลที่พร้อมจะนำมาใช้งานได้ดีที่สุด ทำการแปรรูปและจัดเก็บในถังข้อมูลขนาดใหญ่เพื่อเตรียมสำหรับการใช้งานเชิงวิเคราะห์ต่อไป
ขั้นตอนที่ 3 การออกแบบข้อมูล เป็นการนำข้อมูลที่ได้มาทำการออกแบบสถาปัตยกรรมระบบ แนวทางในประมวลผลที่เหมาะสม ทำการตั้งค่าระบบที่จะใช้ในารนำเสนอ รวมถึงการพัฒนาส่วนที่ต้องใช้ในติดต่อของระบบที่มี เพื่อใช้ดึงข้อมูลจากแหล่งข้อมูลที่ได้ดำเนินการปรับปรุงในขั้นที่ 2 จนพร้อมนำมาช้มาเป็นรูปแบบที่กำหนดเพื่อใช้วิเคราะห์ข้อมูล โดยใช้สถิติ และนำไปใช้งานต่อไป
ขั้นตอนที่ 4 การพัฒนาสารสนเทศให้เป็นประโยชน์ คือ การนำข้อมูลที่ได้จากการประมวลผลแล้ว มาใช้ประโยชน์ในการบริหารตัดสินใจของผู้บริหาร ในส่วนนี้ข้อมูลที่ดีต้องสามารถสร้างตัวชี้วัดความสำเร็จให้เห็นได้อย่างชัดเจนเหมาะสม สามารถแสดงผลเพื่อการจัดการได้ง่าย
จุดสำคัญของงาน Big Data คือ การวางเป้าหมายให้ชัดเจน และการหาโจทย์ปัญหาให้สอดคล้องกับทิศทางขององค์กร ควรเริ่มด้วยโจทย์ที่มีมูลค่าและผลกระทบสูงแต่มีขอบเขตงานที่ชัดเจน อย่าปล่อยให้กรอบงานถูกบิดไปมาหรือขยายขึ้นอย่างไม่สมเหตุผล สร้างตัวชี้วัดความสำเร็จให้เหมาะสมและสามารถแสดงค่าผลตอบแทนการลงทุนได้ จากนั้นก็หาทีมนักวิทยาศาสตร์และวิศวกรข้อมูลที่มีความสามารถและประสบการณ์ เพียงเท่านี้ท่านก็จะสามารถเริ่มทำ Big Data ได้สำเร็จ
----------------------------------------------------------------
สนใจข้อมูลเพิ่มเติมดูที่
Big Data รวมข้อมูลและเรื่องราวที่เกี่ยวกับข้อมูลขนาดใหญ่ (Big Data)