หากเรามีข้อมูลมากมายไปหมด ก็คงจะเป็นเรื่องที่ยากลำบากในการหา Insight จากข้อมูล รวมถึงการใช้ข้อมูลเพื่ออธิบายให้ผู้อื่นเข้าใจสิ่งที่เราต้องการจะสื่อสาร วิธีการที่ง่ายที่สุดก็คือการทำ Data Visualization – สร้างกราฟหรือแผนภาพจากข้อมูล แต่หลาย ๆ คน อาจจะสงสัยว่าจะเลือกกราฟหรือแผนภาพอย่างไร ให้เหมาะสมกับข้อมูลที่มีและตอบโจทย์ที่เราต้องการ

เลือกอย่างไร?

            แผนภาพแต่ละประเภทนั้นมีวิธีการใช้ที่แตกต่างกัน เราจึงต้องตอบคำถามเหล่านี้ก่อน

1. Visualization นี้ตอบคำถามอะไร

          การทำ Data Visualization ก็เปรียบเสมือนการเล่าเรื่อง (Story Telling) จากข้อมูลที่มีอยู่เพื่อตอบคำถามที่ผู้ชมอาจจะมี แน่นอนว่าถ้าเรื่องราว (Story) หรือ คำถามที่จะตอบแตกต่างกัน ก็จะต้องใช้แผนภาพคนละแบบในการอธิบาย ยกตัวอย่างเช่น หากเราต้องการตอบคำถามว่าผลิตภัณฑ์ประเภทใดที่ขายดีที่สุด ก็ควรจะใช้กราฟที่แสดงยอดขายที่แตกต่างกันของแต่ละประเภทให้เห็นชัดเจน แต่หากเราต้องการทราบว่าเวลาที่ใช้ในการจัดส่งสินค้าเป็นอย่างไร อาจจะต้องแสดงให้เห็นถึงการกระจายตัวของข้อมูลเวลาที่ใช้ในการจัดส่ง

2. ผู้ชม (Audience) เป็นคนประเภทไหน

การทำ Data Visualization ให้ผู้ชมที่เป็นกลุ่มผู้บริหารควรมีรูปแบบที่ต่างออกไปจาก Visualization ที่ทำสำหรับผู้ชมกลุ่มผู้ปฏิบัติการ เนื่องด้วยความสนใจที่แตกต่างกันระหว่างคนสองกลุ่ม นอกจากนี้ระดับความเข้าใจของผู้ชมเป้าหมายก็ส่งถึงตัวเลือกรูปแบบในการนำเสนอข้อมูล ตัวอย่างเช่น กราฟที่ดูง่าย ๆ และกระชับ เช่น แผนภูมิวงกลม (Pie Chart) อาจจะเหมาะสมกว่าการทำแผนที่ต้นไม้ (Treemap) ที่ต้องใช้เวลาดูและคิดมากกว่า ข้อมูลอาจจะละเอียดมากเกินไปเหมาะสำหรับผู้บริหาร เป็นต้น

3. ข้อมูลมีจำนวนมากขนาดไหน

          จำนวนของข้อมูลก็ส่งผลต่อแผนภาพที่เราจะสร้าง ตัวอย่างเช่น ถ้าทำแผนภาพการกระจาย (Scatter plot) ที่บอกถึงความสัมพันธ์ระหว่างยอดขายและราคา หากสินค้าซึ่งแทนด้วยจุดแต่ละจุดบนแผนภาพมีจำนวนมากก็จะทำให้แผนภาพนั้นดูเข้าใจได้ยาก (ซ้าย) ตัวอย่างเช่นนี้อาจจะต้องอาศัยการรวบแถวข้อมูล (Aggregate) ก่อนเพื่อจัดกลุ่มเป็นหมวดหมู่ (ขวา) เป็นต้น

4. ข้อมูลเป็นประเภทอะไร

          โดยทั่วไปแล้วข้อมูลอาจแบ่งออกเป็นสองประเภท คือ ข้อมูลประเภทหมวดหมู่ (Categorical) และข้อมูลประเภทตัวเลข (Numerical) การสร้างแผนภาพสำหรับข้อมูลต่างประเภทก็จะมีความแตกต่างกัน ตัวอย่างเช่น หากต้องการเปรียบเทียบจำนวนสินค้าในประเภทผลิตภัณฑ์แตกต่างกันก็จะใช้กราฟแท่ง แต่ถ้าเปรียบเทียบจำนวนสินค้ากับผลิตภัณฑ์ราคาต่าง ๆ กัน ก็อาจจะใช้ ฮิสโตแกรม (Histogram) เพราะว่า ประเภทผลิตภัณฑ์กับราคาสินค้าเป็นข้อมูลคนละประเภทกัน

5 องค์ประกอบของแผนภาพที่ใช้สื่อถึงอะไร

          หลักการของการทำแผนภาพ คือให้องค์ประกอบ (Element) แทนที่ตัวเลขหรือข้อมูลของเรา ตัวอย่างเช่น ในกราฟวงกลมเราให้ สีแสดงถึงหมวดหมู่ และมุมหรือพื้นที่ของพาย แสดงถึงจำนวนในหมวดหมู่นั้น ๆ แต่ละองค์ประกอบควรจะสื่อถึงปริมาณเพียงอย่างเดียว เพื่อให้สื่อสารได้อย่างแม่นยำ

การใช้สีในแผนภาพ ด้านซ้ายใช้สีในการสื่อถึงหมวดหมู่สินค้า แต่ในด้านขวาสีไม่ได้บอกถึงอะไรจึงไม่มีความจำเป็นเพราะอาจทำให้สับสน

ทีนี้มาดูตัวอย่างแผนภาพต่าง ๆ ที่ใช้ตอบคำถามหลากหลายรูปแบบ

1. ต้องการแสดงถึงขนาดที่ต่างกัน หรือ จัดลำดับ

  • แผนภูมิแท่ง (Bar Chart) เป็น แผนภาพที่ง่ายสุด ที่สามารถใช้เปรียบเทียบข้อมูลในแต่ละหมวดหมู่ สามารถแสดงถึงลำดับและขนาดได้ชัดเจน โดยแกนควรจะเริ่มต้นที่เลขศูนย์เพื่อให้ความสูงของแท่งแสดงถึงปริมาณที่ต้องการจะนำเสนอ ไม่ควรย่นกราฟ
  • แผนภูมิรูปภาพ (Pictogram) ในบางกรณี แผนภูมิรูปภาพอาจจะเป็นทางเลือกที่สวยและเข้าใจง่าย ควรใช้สำหรับกรณีที่นำเสนอเป็นจำนวนเต็มที่ไม่เยอะมากเท่านั้น (อย่าไปตัดแขนคนเพื่อแสดงเลขทศนิยม!)

โดยทั้งสองแบบอาจจะใช้สีในกรณีที่ต้องการแบ่งหมวดหมู่ ขนาดที่แตกต่างกันจะทำให้เห็นได้ชัดเจนว่าปริมาณในข้อมูลกลุ่มไหนมีขนาดใหญ่ที่สุด

2. ต้องการเห็นความสัมพันธ์

หากต้องการหาความสัมพันธ์ระหว่างสองตัวแปร เช่น ราคา กับ กำไร สัมพันธ์กันอย่างไร

  • แผนภาพการกระจาย (Scatter Plot) เป็นวิธีที่ดีที่สุดในการแสดงความสัมพันธ์ระหว่างตัวแปรประเภทตัวเลขสองตัวแปร สามารถใส่เส้นประกอบเพื่อแสดงให้เห็นถึงแนวโน้มได้
  • แผนภูมิฟอง (Bubble chart) หากมีตัวแปรที่สามที่ต้องการแสดงเป็นมิติเพิ่มเติมจากแผนภาพการกระจายทั่วไป อาจนำตัวแปรนั้นมาแสดงโดยใช้ขนาดหรือพื้นที่ของวงกลมได้
  • ตารางแผนภาพความร้อน (Heatmap) หากเป็นข้อมูลหมวดหมู่ แต่มีลำดับขั้น (Ordinal) และอยากแสดงถึงความสัมพันธ์ของตัวแปรเหล่านี้กับปริมาณที่สนใจ อาจจะใช้ตารางแผนภาพความร้อนหรือ หลายคนรู้จักกันในชื่อ Heatmap โดยใช้สีแสดงถึงปริมาณที่สนใจ

3. ต้องการเห็นการกระจายตัว

  • ฮิสโตแกรม (Histogram) ใช้แสดงการกระจายตัวได้ดีและละเอียด หากต้องการแสดงจำนวนของตัวแปรประเภทตัวเลข
  • Boxplot ใช้แสดงการกระจายตัวของข้อมูลเช่นเดียวกับฮิสโตแกรมแต่จะมีความกระชับกว่า และสามารถใช้ในการเปรียบเทียบของแต่ละหมวดหมู่ได้

4. ต้องการเห็นการเปลี่ยนแปลงตามช่วงเวลา

  • แผนภูมิเส้น/แผนภูมิแท่ง จะแสดงให้เห็นถึงการเชื่อมโยงของแต่ละช่วงเวลาได้ดีกว่ากราฟแท่ง แต่โดยทั่วไปสามารถใช้ได้ทั้งสองอย่าง หรือ อาจจะผสมกันถ้าต้องการแสดงสองปริมาณพร้อมกันและต้องการให้เห็นความแตกต่าง
  • แผนภูมิพื้นที่ (Area Chart) หากต้องการแสดงให้เห็นถึงองค์ประกอบในแต่ละช่วงเวลาประกอบกับการเปลี่ยนแปลงตามช่วงเวลาอาจเลือกใช้แผนภูมิพื้นที่นำเสนอข้อมูลชุดนั้น

5. ต้องการเห็นข้อมูลที่เบี่ยงเบนจากปกติ

หากต้องการเน้นว่าตัวเลขนั้นเบี่ยงเบนจากค่าอ้างอิง เช่น เป้าหมายหรือค่าเฉลี่ยมากน้อยแต่ไหน มีค่าบวกหรือลบมากน้อยเพียงใด เราสามารถใช้สีในการช่วยสื่อถึงว่าตัวเลขมีค่าสูงหรือต่ำกว่าเป้าหมายที่ต้องการแสดงเพียงใด

  • แผนภูมิแท่งสี อาจจะใช้สีในแท่งมาช่วยสื่อให้เห็นว่าเป็นตัวเลขเชิงบวก เช่น กำไร หรือ เชิงลบ เช่นขาดทุนได้
  • แผนภูมิเส้นสี ลักษณะเดียวกันแต่ใช้เส้นสำหรับข้อมูลตามเวลา

6. ต้องการแสดงถึงองค์ประกอบ

  • แผนภูมิวงกลม (Pie Chart) จะใช้กับตัวแปรประเภทหมวดหมู่ว่าเพื่อแสดงให้เห็นว่าแต่ละหมวดหมู่มีจำนวนหรือปริมาณที่เกี่ยวข้องเท่าใด โดยใช้ขนาดมุมหรือพื้นที่เป็นตัวบ่งชี้ ทั้งนี้ไม่ควรใช้ในกรณีที่มีหมวดหมู่มากเกินไป (บางคนบอกว่าไม่ควรเกิน 5 หมวดหมู่) ปริมาณที่ใช้ควรรวมเป็น 100% ไม่ควรใช้ในกรณีที่ปริมาณนั้นไม่สามารถนำมาบวกกันได้ เช่น ค่าเฉลี่ยของยอดขายในแต่ละประเภทผลิตภัณฑ์
  • แผนภูมิโดนัท (Donut Chart) เหมือน Pie Chart แต่มีพื้นที่ตรงกลางไว้ที่สามารถใช้แสดงข้อความ หรือ ปริมาณรวมได้
  • แผนที่ต้นไม้ (Treemap) คล้าย Pie Chart แต่สามารถใช้แบ่งหมวดหมู่เป็นลำดับชั้นได้ และหากมีหลายหมวดหมู่ก็จะดูรู้เรื่องกว่า โดยจะใช้พื้นที่สี่เหลี่ยมในการแสดงถึงปริมาณ และสีอาจจะใช้ในการแบ่งหมวดหมู่หรือจัดลำดับได้
ภาพประกอบจาก Workpoint News
  • แผนภูมิแท่งแบบต่อกัน (Stacked Bar Chart) หากต้องการเปรียบเทียบองค์ประกอบภายในแต่ละหมวดหมู่ ก็ใช้ประเภทนี้ได้ โดยอาจแสดงเป็นเปอร์เซ็นต์หากต้องการเน้นถึงองค์ประกอบ (ซ้าย) หรือจำนวนดิบหากต้องการเน้นถึงปริมาณมากน้อยด้วย (ขวา)

  • แผนภูมิน้ำตก (Waterfall Chart) แสดงให้เห็นว่ายอดรวมทั้งหมดแตกได้เป็นอะไรบ้าง มักใช้กับข้อมูลจำนวนเงิน เช่น งบบัญชี
จาก FusionCharts Blog

7. ต้องการแสดงถึงข้อมูลเชิงพื้นที่

  • แผนที่โคโรเพลท (Choropleth Map) คือการใช้สีในการแสดงปริมาณต่าง ๆ บนพื้นที่นั้น มีข้อควรระวังคือหากพื้นที่มีขนาดใหญ่ บริเวณที่มีสีก็จะใหญ่ตามไปด้วยซึ่งอาจจะทำให้ผู้อ่านเข้าใจผิด ดังนั้นปริมาณที่นำมาใช้แสดงโดยสีใน Choropleth map ควรจะเป็นปริมาณที่ไม่ขึ้นกับขนาดพื้นที่ เช่น ความหนาแน่นประชากรต่อพื้นที่ มากกว่าปริมาณที่อาจจะขึ้นกับพื้นที่ เช่น จำนวนประชากรรวม (สามารถอ่านเพิ่มเติมได้ที่ สร้างแผนที่การระบาดโควิด-19 อย่างถูกหลักการ)
  • แผนที่แสดงด้วยสัญลักษณ์สัดส่วน (Proportional Symbol Map) ใช้ขนาดของสัญลักษณ์ เช่น วงกลม แสดงถึงปริมาณ การใช้แผนภาพลักษณะนี้จะทำให้แสดงข้อมูลได้โดยไม่ต้องกังวลถึงขนาดของพื้นที่ ตัวอย่าง เช่น จำนวนผู้ติดเชื้อในแต่ละประเทศมักจะใช้แผนภาพแบบนี้ แทนที่จะเป็น Choropleth Map

ตัวอย่างการใช้ Proportional Symbol Map เพื่อแสดงจำนวนประชากร จะแสดงให้เห็นถึงการกระจุกตัวได้ชัดเจนกว่าการใช้สีแสดงจำนวนประชากร
  • แผนที่แสดงข้อมูลด้วยจุด (Dot Map) / แผนที่ความร้อน (Heatmap) หากข้อมูลมีความละเอียดถึงขั้นละติจูด ลองจิจูด อาจแสดงข้อมูลเป็นจุดตามแผนที่ แต่หากข้อมูลมีจำนวนมากสามารถใช้ Heatmap ในการแสดงถึงความหนาแน่นของข้อมูลบนพื้นที่แทน
(ซ้าย) Dot map (ขวา) Heat map

แหล่งที่มา

https://public.tableau.com/en-us/gallery/visual-vocabulary

Data Scientist
Government Big Data Institute (GBDi)

Recommended Posts