Big Data เรื่องคลังข้อมูล (Data Warehouse)
Database คือ ชุดข้อมูลที่ใช้สำหรับทำการจัดเก็บข้อมูลในองค์กรทั่วไป จะมีการออกแบบไว้เฉพาะในแต่ละงานฐานข้อมูลที่ดีจะจัดเก็บเป็นหมวดหมู่แยกประเภทไว้เพื่อง่ายในการใช้งาน ตัวอย่างการออกแบบฐานข้อมูลในแต่ละงานเช่น ฐานข้อมูลสินค้าจะเก็บเฉพาะรายละเอียดของสินค้านั้น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะข้อมูลที่้กี่ยวข้องกับพนักงาน การจัดทำฐานข้อมูลที่ดีจะเป็นประโยชน์ไม่เพียงผู้ที่ใช้งานโดยตรงเท่านั้น แต่จะยังเป็นประโยชน์ต่อไปยังผู้บริหารในการวิเคราะห์ประสิทธิภาพหรือการวางแผนในการบริหารจัดการในองค์กรได้อีกด้วย
Data Warehouse คือ คลังเก็บข้อมูลที่มีการรวบรวมข้อมูลมาที่ต่างๆ เพื่อจัดเก็บไว้ในที่เดียวกันอาจเรียกที่จัดเก็บนี้ว่า คลังข้อมูลกลาง (Data Center) คลังข้อมูลจัดเก็บข้อมูลที่ผ่านกระบวนการสารสนเทศแล้ว คลังข้อมูลที่ดีควรออกแบบมาเพื่อรองรับการจัดเก็บข้อมูลที่มีปริมาณมากได้ ซึ่งต้องมีเป็นฐานข้อมูลขนาดใหญ่สามารถใช้เก็บรวบรวมข้อมูลจากหลายแหล่งที่สนใจ ทั้งภายในองค์กรทั้งหมดและภายนอกองค์กรที่สนใจ โดยคลังข้อมูลจะเก็บข้อมมูลที่มีทั้งหมดไว้ เป็นข้อมูลตั้งแต่อดีตจนถึงปัจจุบัน โดยข้อมูลที่เก็บจะต้องถูกจัดทำให้เป็นข้อมูลสารสนเทศก่อนนำมาจัดเก็บ (Data Information)
Data Warehouse คือ เป็นข้อมูลที่ออกแบบมาเพื่อเก็บรวบรวมข้อมูลในทุกส่วนขององค์กรธุรกิจทั้งข้อมูลเก่าและข้อมูลใหม่ โดยไม่มีการลบข้อมูลเก่าทิ้งทั้งที่ไม่ได้ใช้ในปัจจุบัน แต่จะเก็บข้อมูลที่มีประโยชน์โดยมีการจัดเก็บในหลายมิติ เพื่อทำการดึงเอาไปใช้ประโยชน์ตามวัตถุประสงค์ของโปรแกรมหรือระบบที่จะพัฒนาเพื่อดึงข้อมูลในคลังไปใช้
Data Mart คือ ข้อมูลที่มีการจัดการให้เหมาะสมเพื่อส่งต่อให้แก่ผู้ใช้ การส่งออกข้อมูลจะมีไม่มากนักจะส่งตามที่ผู้ใช้งานต้องการอาจไม่จำเ็นต้องส่งข้อมูลที่มีทั้งหมดในคลังสินค้า แต่จะมีขั้นตอนการผลิตข้อมูลเช่น Business Intelligence Analytic เพื่อให้ข้อมูลที่มีความหลากหลายในคลังข้อมูลให้กลายเป็นสารสนเทศ (สินค้า) ที่ผู้ใช้งาน (ลูกค้า) ต้องการ
Data Gathering คือ การรวบรวมข้อมูล เป็นการรวบรวมข้อมูลทุกอย่างที่คาดว่ามีประโยชน์หรือมีความเกี่ยวข้องในการวิเคราะห์ข้อมูลในเบื้องต้น ก่อนจะนำมาทำให้เป็นสารสนเทศเช่น สมุดจด กระดาษใบเสร็จ เอกสารที่มีต่างๆ เป็นต้น ผู้ที่จะทำการรวบรวมข้อมูลจะทำหน้าที่เหมือนผู้จัดการต้องสืบค้นตามหารวบรวมและวิเคราะห์หาความสัมพันธ์ของข้อมูลว่ามีอะไรบ้างที่จะเป็นประโยชน์ เพื่อจะนำไปจัดการ Data Cleansing ให้เป็นข้อมูลที่ดีเพื่อนำมาจัดเก็บและใช้งานต่อไป
Data Cleansing คือ การทำความสะอาดข้อมูล เป็นการจัดการข้อมูลที่มีการรวบรวมมาทั้งหมด เพื่อลบข้อมูลที่ไม่มีคุณภาพ ข้อมูลผิด หรือข้อมูลที่ไม่เกี่ยวข้องที่เรามักเรียกกันว่า ข้อมูลขยะ ทิ้งไป ซึ่งการทำงานในระบบข้อมูลจะใช้เวลาและความรู้ในการจัดการในส่วนนี้มาก เพราะต้องแยกข้อมูลให้ได้ว่าอะไรมีประโยชน์อะไรไม่มีประโยชน์ ควรจะจัดเก็บอะไรไม่จำเป็นต้องเก็บอะไร เพื่อหลีกเลี่ยงคำพูดที่นิยมพูดในงานฐษนข้อมูลที่พูดว่า การนำขยะเข้าระบบก็มักจะได้ขยะออกมา (Garbage In Garbage Out, GIGO)
Business Intelligence (BI) การประมวลผลและวิเคราะห์เพื่อจัดทำสารสนเทศ ซึ่งแนวคิดนี้จะมีการใช้งานมากในอนาคต เนื่องจากทิศทางการใช้งานในด้านธุรกิจกำลังต้องการข้อมูลมาใช้ในการวิเคราะห์ที่มีบทบาทมากขึ้น การประมวลผลที่มีไม่ได้เป็นแค่การใช้เครื่องมือธรรมดามาช่วยเท่านั้น แต่จะเป็นการใช้เครื่องมือที่มีให้เป็นส่วนสำคัญในการขับเคลื่อนองค์กรในธุรกิจ เพื่อใช้สร้างความได้เปรียบในการแข่งขันทางธุรกิจ (Competitive Advantage) ให้มีข้อมูลตัดสินใจตอบสนองความต้องการของลูกค้าได้อย่างรวดเร็ว
----------------------------------------------------------------
สนใจข้อมูลเพิ่มเติมดูที่
Big Data รวมข้อมูลและเรื่องราวที่เกี่ยวกับข้อมูลขนาดใหญ่ (Big Data)