- การวิเคราะห์ข้อมูลเชิงพรรณนา (Descriptive Analytics)
การสรุปข้อมูลด้วยสถิติเชิงพรรณนา (Descriptive Statistics)
สถิติเชิงพรรณนาเป็นเครื่องมือที่ใช้ในการสรุปและอธิบายลักษณะของข้อมูล เป็นวิธีการที่ใช้ในการสรุปและอธิบายลักษณะของข้อมูล สถิติเชิงพรรณนาสามารถแบ่งออกเป็นสองประเภทหลัก ๆ คือ สถิติเชิงสรุป (Summary Statistics) และสถิติเชิงการกระจาย (Distribution Statistics)
การวิเคราะห์ข้อมูลเชิงพรรณนา (Descriptive Analytics) หลังจากที่เราได้ทำความสะอาดและเตรียมข้อมูลให้พร้อมสำหรับการวิเคราะห์แล้ว ขั้นตอนต่อไปคือการวิเคราะห์ข้อมูลเชิงพรรณนา (Descriptive Analytics) ซึ่งเป็นการวิเคราะห์ข้อมูลเพื่อสรุปและอธิบายลักษณะของข้อมูลที่เรามีอยู่ โดยใช้สถิติเชิงพรรณนา (Descriptive Statistics) และการแสดงผลข้อมูลในรูปแบบต่างๆ เช่น ตาราง แผนภูมิ และกราฟ
การวิเคราะห์ข้อมูลเชิงพรรณนา (Descriptive Analytics) เป็นกระบวนการที่ใช้ในการสรุปข้อมูลและนำเสนอข้อมูลในรูปแบบที่เข้าใจง่าย โดยไม่จำเป็นต้องมีการสรุปหรืออนุมานใดๆ ข้อมูลที่ได้นำเสนอสามารถให้ภาพรวมและความเข้าใจเบื้องต้นเกี่ยวกับข้อมูลที่มีอยู่ได้อย่างชัดเจน ในบทนี้เราจะศึกษาเกี่ยวกับการสรุปข้อมูลด้วยสถิติเชิงพรรณนา การสร้างแผนภูมิและกราฟ และการวิเคราะห์การแจกแจงความถี่ ซึ่งทั้งหมดนี้มีส่วนช่วยในการแสดงข้อมูลในรูปแบบที่เข้าใจง่ายและมีความหมาย
สถิติเชิงสรุป เป็นการสรุปลักษณะสำคัญของข้อมูลในรูปแบบของค่าต่าง ๆ เช่น ค่าเฉลี่ย (Mean), มัธยฐาน (Median), ฐานนิยม (Mode), ค่าต่ำสุด (Minimum) และค่าสูงสุด (Maximum) ค่าต่าง ๆ เหล่านี้สามารถใช้เพื่อแสดงภาพรวมของข้อมูลได้อย่างดี เป็นสถิติเชิงพรรณนา เกี่ยวกับแนวโน้มสู่ส่วนกลาง (Measures of Central Tendency) เป็นสถิติที่ใช้วัดตำแหน่งกึ่งกลางของข้อมูล ได้แก่
- ค่าเฉลี่ย (Mean) ค่าเฉลี่ยเลขคณิตของข้อมูลทั้งหมด เป็นค่าที่ใช้บ่อยที่สุดในการสรุปข้อมูล เป็นการหาค่ากลางของข้อมูลทั้งหมด โดยการนำค่าทั้งหมดมารวมกันแล้วหารด้วยจำนวนข้อมูลทั้งหมด
- มัธยฐาน (Median) ค่ากลางของข้อมูลเมื่อเรียงลำดับจากน้อยไปมาก เป็นค่ากลางของชุดข้อมูลที่เรียงลำดับแล้ว โดยที่ครึ่งหนึ่งของข้อมูลจะอยู่ต่ำกว่าค่านี้และอีกครึ่งหนึ่งจะอยู่สูงกว่าค่านี้ มัธยฐานมีประโยชน์ในการวิเคราะห์ข้อมูลที่มีการกระจายตัวไม่สมมาตร
- ฐานนิยม (Mode) ค่าที่เกิดขึ้นบ่อยที่สุดในข้อมูล พบได้บ่อยที่สุดในชุดข้อมูล ซึ่งสามารถมีได้มากกว่าหนึ่งค่าในกรณีที่ข้อมูลมีค่าที่พบได้บ่อยเท่ากันหลายค่า
- ค่าต่ำสุดและค่าสูงสุด (Minimum and Maximum) ค่าต่ำสุดและค่าสูงสุด แสดงถึงค่าที่ต่ำที่สุดและค่าสูงที่สุดในชุดข้อมูล ซึ่งช่วยให้เราเห็นขอบเขตของข้อมูลได้อย่างชัดเจน
สถิติเชิงพรรณนาเกี่ยวกับการกระจาย (Measures of Dispersion) เป็นสถิติที่ใช้วัดการกระจายของข้อมูล ได้แก่
- พิสัย (Range) ผลต่างระหว่างค่าสูงสุดและค่าต่ำสุดในข้อมูล
- ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ค่าที่ใช้วัดการกระจายของข้อมูลรอบค่าเฉลี่ย
- ความแปรปรวน (Variance) ค่ากำลังสองของส่วนเบี่ยงเบนมาตรฐาน
ตัวอย่างการใช้สถิติเชิงพรรณนา
สมมติว่าเรามีข้อมูลคะแนนสอบของนักเรียน 10 คน ดังนี้ 80, 75, 90, 85, 60, 70, 95, 82, 78, 65
เราสามารถใช้สถิติเชิงพรรณนาเพื่อสรุปลักษณะของข้อมูลนี้ ได้ดังนี้
* ค่าเฉลี่ย: 78
* มัธยฐาน: 79
* ฐานนิยม: ไม่มี
* พิสัย: 35
* ส่วนเบี่ยงเบนมาตรฐาน: 10.69
* ความแปรปรวน: 114.26
จากสถิติเชิงพรรณนา เราสามารถสรุปได้ว่าคะแนนสอบของนักเรียนส่วนใหญ่อยู่ในช่วง 70-80 คะแนน และมีการกระจายตัวของคะแนนไม่มากนัก
การสร้างแผนภูมิและกราฟ (Charts and Graphs)
แผนภูมิและกราฟ เป็นเครื่องมือที่ช่วยให้เราสามารถนำเสนอข้อมูลได้อย่างชัดเจนและเข้าใจง่าย มีแผนภูมิและกราฟหลายประเภทที่สามารถใช้ได้ ขึ้นอยู่กับประเภทของข้อมูลและวัตถุประสงค์ของการนำเสนอ ประเภทของแผนภูมิและกราฟ
การสร้างแผนภูมิและกราฟ เป็นเครื่องมือที่มีประสิทธิภาพในการแสดงข้อมูลในรูปแบบที่เข้าใจง่ายและสามารถตีความได้อย่างรวดเร็ว แผนภูมิและกราฟสามารถแสดงข้อมูลในรูปแบบต่าง ๆ เช่น การเปรียบเทียบ การแสดงแนวโน้ม และการแจกแจงข้อมูล
- แผนภูมิแท่ง (Bar Chart) ใช้แสดงความถี่หรือจำนวนของข้อมูลแต่ละประเภท แผนภูมิแท่งเป็นแผนภูมิที่ใช้ในการเปรียบเทียบข้อมูลในรูปแบบของแท่ง โดยแต่ละแท่งจะแสดงค่าของข้อมูลแต่ละชุด แผนภูมิแท่งสามารถใช้ได้ทั้งข้อมูลเชิงปริมาณและข้อมูลเชิงคุณภาพ
- แผนภูมิวงกลม (Pie Chart) ใช้แสดงสัดส่วนของข้อมูลแต่ละประเภทเทียบกับข้อมูลทั้งหมด เป็นแผนภูมิที่ใช้ในการแสดงสัดส่วนของข้อมูลแต่ละส่วนต่อทั้งหมด โดยการแบ่งวงกลมออกเป็นส่วน ๆ ตามสัดส่วนของข้อมูล แผนภูมิวงกลมเหมาะสำหรับการแสดงข้อมูลที่มีความสัมพันธ์กันในเชิงสัดส่วน
- แผนภูมิกราฟเส้น (Line Chart) ใช้แสดงแนวโน้มของข้อมูลตามช่วงเวลา เป็นแผนภูมิที่ใช้ในการแสดงแนวโน้มของข้อมูลตามเวลา โดยการเชื่อมต่อจุดข้อมูลแต่ละจุดด้วยเส้น แผนภูมิกราฟเส้นเหมาะสำหรับการแสดงข้อมูลที่มีการเปลี่ยนแปลงตามเวลา
- แผนภูมิการกระจาย (Scatter Plot) ใช้แสดงความสัมพันธ์ระหว่างข้อมูลสองชุด เป็นแผนภูมิที่ใช้ในการแสดงความสัมพันธ์ระหว่างตัวแปรสองตัว โดยการวางจุดข้อมูลในพิกัดที่สัมพันธ์กับค่าของตัวแปรทั้งสอง แผนภูมิการกระจายเหมาะสำหรับการแสดงข้อมูลที่ต้องการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร
- การวิเคราะห์การแจกแจงความถี่ (Frequency Distribution) เป็นวิธีการจัดการและแสดงข้อมูลที่มีการแบ่งข้อมูลออกเป็นกลุ่ม ๆ และนับจำนวนข้อมูลในแต่ละกลุ่ม การแจกแจงความถี่ช่วยให้เราเห็นภาพรวมของการกระจายตัวของข้อมูลได้อย่างชัดเจน
- ตารางแจกแจงความถี่ (Frequency Table) เป็นตารางที่แสดงจำนวนข้อมูลที่อยู่ในแต่ละกลุ่มหรือช่วงของข้อมูล ตารางนี้ช่วยให้เราเห็นการกระจายตัวของข้อมูลได้อย่างชัดเจน โดยการจัดกลุ่มข้อมูลที่มีค่าคล้ายกันไว้ด้วยกัน
- ฮิสโทแกรม (Histogram) ใช้แสดงการแจกแจงความถี่ของข้อมูลที่เป็นตัวเลข เป็นแผนภูมิที่ใช้ในการแสดงการแจกแจงความถี่ของข้อมูลในรูปแบบของแท่งกราฟ โดยแต่ละแท่งจะแสดงจำนวนข้อมูลที่อยู่ในช่วงค่าที่กำหนด ฮิสโทแกรมเหมาะสำหรับการแสดงการกระจายตัวของข้อมูลเชิงปริมาณ
การประยุกต์ใช้สถิติเชิงพรรณนาในงานวิเคราะห์ข้อมูล มีหลายด้านที่สามารถนำไปประยุกต์ใช้ได้ เช่น การวิเคราะห์ข้อมูลลูกค้า การวิเคราะห์ประสิทธิภาพการผลิต การวิเคราะห์ยอดขาย และอื่น ๆ การสรุปข้อมูลด้วยสถิติเชิงพรรณนา การสร้างแผนภูมิและกราฟ และการวิเคราะห์การแจกแจงความถี่ช่วยให้เราเข้าใจข้อมูลได้อย่างรวดเร็วและสามารถนำข้อมูลไปใช้ในการตัดสินใจได้อย่างมีประสิทธิภาพ
การวิเคราะห์การแจกแจงความถี่ (Frequency Distribution Analysis)
การวิเคราะห์การแจกแจงความถี่ เป็นการวิเคราะห์ข้อมูลเพื่อดูว่าค่าของข้อมูลแต่ละค่าเกิดขึ้นบ่อยแค่ไหน โดยสามารถแสดงผลการวิเคราะห์ได้ในรูปแบบของตารางหรือกราฟ
**ตารางแจกแจงความถี่**
ตารางแจกแจงความถี่แสดงจำนวนครั้งที่ค่าของข้อมูลแต่ละค่าเกิดขึ้น เช่น
| คะแนน | ความถี่ |
|---|---|
| 60 | 1 |
| 65 | 1 |
| 70 | 1 |
| 75 | 1 |
| 78 | 1 |
| 80 | 1 |
| 82 | 1 |
| 85 | 1 |
| 90 | 1 |
| 95 | 1 |
สถิติเชิงการกระจาย
สถิติเชิงการกระจายใช้เพื่อแสดงการกระจายตัวของข้อมูลภายในชุดข้อมูล สถิติเหล่านี้ช่วยให้เราเข้าใจว่าข้อมูลนั้นมีความแปรปรวนมากน้อยเพียงใด
- ความแปรปรวน (Variance) เป็นการวัดว่าข้อมูลกระจายตัวจากค่าเฉลี่ยมากน้อยเพียงใด โดยการคำนวณความแตกต่างระหว่างค่าทุกค่ากับค่าเฉลี่ย แล้วนำค่าความแตกต่างเหล่านั้นมายกกำลังสองและหารด้วยจำนวนข้อมูล
- ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) เป็นการวัดความแปรปรวนของข้อมูลที่นิยมใช้มากที่สุด โดยเป็นรากที่สองของความแปรปรวน
- ช่วง (Range) เป็นการวัดการกระจายตัวของข้อมูลโดยการหาผลต่างระหว่างค่าสูงสุดและค่าต่ำสุดของชุดข้อมูล
- ควอร์ไทล์ (Quartiles) เป็นการแบ่งข้อมูลออกเป็นสี่ส่วนที่มีขนาดเท่า ๆ กัน ควอร์ไทล์ที่ 1 (Q1) เป็นค่าที่อยู่ตำแหน่ง 25% ของข้อมูลที่เรียงลำดับแล้ว ควอร์ไทล์ที่ 2 (Q2) คือมัธยฐาน และควอร์ไทล์ที่ 3 (Q3) เป็นค่าที่อยู่ตำแหน่ง 75% ของข้อมูล
กรณีศึกษา: การวิเคราะห์ข้อมูลยอดขาย
เพื่อให้เห็นภาพที่ชัดเจนของการประยุกต์ใช้สถิติเชิงพรรณนา เราจะยกตัวอย่างกรณีศึกษาการวิเคราะห์ข้อมูลยอดขายของบริษัทแห่งหนึ่ง โดยใช้เครื่องมือสถิติเชิงพรรณนาและการสร้างแผนภูมิและกราฟ
ขั้นตอนที่ 1: การรวบรวมและจัดเตรียมข้อมูล
ก่อนการวิเคราะห์ข้อมูล เราต้องรวบรวมข้อมูลยอดขายจากแหล่งต่าง ๆ และจัดเตรียมข้อมูลให้อยู่ในรูปแบบที่สามารถนำไปวิเคราะห์ได้ ข้อมูลที่รวบรวมมาอาจรวมถึงยอดขายรายเดือน ยอดขายรายผลิตภัณฑ์ และยอดขายรายภูมิภาค
ขั้นตอนที่ 2: การสรุปข้อมูลด้วยสถิติเชิงพรรณนา
เราสามารถใช้สถิติเชิงสรุปเพื่อหาค่าเฉลี่ยยอดขายรายเดือน มัธยฐานยอดขาย และค่าต่ำสุด-ค่าสูงสุดของยอดขาย ซึ่งจะช่วยให้เราเข้าใจภาพรวมของยอดขายได้ดีขึ้น
ขั้นตอนที่ 3: การสร้างแผนภูมิและกราฟ
เพื่อให้ข้อมูลที่ได้สามารถเข้าใจได้ง่ายขึ้น เราสามารถสร้างแผนภูมิแท่งเพื่อแสดงยอดขายรายเดือน แผนภูมิวงกลมเพื่อแสดงสัดส่วนยอดขายรายผลิตภัณฑ์ และแผนภูมิกราฟเส้นเพื่อแสดงแนวโน้มยอดขายตามเวลา
ขั้นตอนที่ 4: การวิเคราะห์การแจกแจงความถี่
การสร้างฮิสโทแกรมเพื่อแสดงการแจกแจงความถี่ของยอดขายจะช่วยให้เราเห็นการกระจายตัวของยอดขายในแต่ละช่วง และสามารถวิเคราะห์ได้ว่ายอดขายส่วนใหญ่อยู่ในช่วงใด
สรุป
การวิเคราะห์ข้อมูลเชิงพรรณนา เป็นขั้นตอนสำคัญในการทำความเข้าใจข้อมูล สถิติเชิงพรรณนา แผนภูมิและกราฟ และการวิเคราะห์การแจกแจงความถี่ เป็นเครื่องมือที่ช่วยให้เราสามารถสรุปและอธิบายลักษณะของข้อมูลได้อย่างชัดเจนและเข้าใจง่าย ซึ่งจะช่วยให้เราสามารถนำข้อมูลไปใช้ในการตัดสินใจและแก้ไขปัญหาได้อย่างมีประสิทธิภาพ เป็นเครื่องมือที่มีประโยชน์ในการแสดงข้อมูลในรูปแบบที่เข้าใจง่ายและมีความหมาย การประยุกต์ใช้สถิติเชิงพรรณนาในงานวิเคราะห์ข้อมูลสามารถช่วยให้การตัดสินใจในองค์กรมีความแม่นยำและมีประสิทธิภาพมากขึ้น
.
----------------------------------------------------------------
ที่มาข้อมูล
-
รวบรวมโดย
----------------------------------------------------------------
สนใจข้อมูลเพิ่มเติมดูที่
DA การวิเคราะห์ข้อมูล (Data Analytics) รวมข้อมูล
----------------------------------------------------------------