Taking too long? Close loading screen.

เลือกแผนภาพอย่างไรสำหรับการทำ Data Visualization

Mar 19, 2021

หากเรามีข้อมูลมากมายไปหมด ก็คงจะเป็นเรื่องที่ยากลำบากในการหา Insight จากข้อมูล รวมถึงการใช้ข้อมูลเพื่ออธิบายให้ผู้อื่นเข้าใจสิ่งที่เราต้องการจะสื่อสาร วิธีการที่ง่ายที่สุดก็คือการทำ Data Visualization – สร้างกราฟหรือแผนภาพจากข้อมูล แต่หลาย ๆ คน อาจจะสงสัยว่าจะเลือกกราฟหรือแผนภาพอย่างไร ให้เหมาะสมกับข้อมูลที่มีและตอบโจทย์ที่เราต้องการ

เลือกอย่างไร?

            แผนภาพแต่ละประเภทนั้นมีวิธีการใช้ที่แตกต่างกัน เราจึงต้องตอบคำถามเหล่านี้ก่อน

1. Visualization นี้ตอบคำถามอะไร

          การทำ Data Visualization ก็เปรียบเสมือนการเล่าเรื่อง (Story Telling) จากข้อมูลที่มีอยู่เพื่อตอบคำถามที่ผู้ชมอาจจะมี แน่นอนว่าถ้าเรื่องราว (Story) หรือ คำถามที่จะตอบแตกต่างกัน ก็จะต้องใช้แผนภาพคนละแบบในการอธิบาย ยกตัวอย่างเช่น หากเราต้องการตอบคำถามว่าผลิตภัณฑ์ประเภทใดที่ขายดีที่สุด ก็ควรจะใช้กราฟที่แสดงยอดขายที่แตกต่างกันของแต่ละประเภทให้เห็นชัดเจน แต่หากเราต้องการทราบว่าเวลาที่ใช้ในการจัดส่งสินค้าเป็นอย่างไร อาจจะต้องแสดงให้เห็นถึงการกระจายตัวของข้อมูลเวลาที่ใช้ในการจัดส่ง

2. ผู้ชม (Audience) เป็นคนประเภทไหน

การทำ Data Visualization ให้ผู้ชมที่เป็นกลุ่มผู้บริหารควรมีรูปแบบที่ต่างออกไปจาก Visualization ที่ทำสำหรับผู้ชมกลุ่มผู้ปฏิบัติการ เนื่องด้วยความสนใจที่แตกต่างกันระหว่างคนสองกลุ่ม นอกจากนี้ระดับความเข้าใจของผู้ชมเป้าหมายก็ส่งถึงตัวเลือกรูปแบบในการนำเสนอข้อมูล ตัวอย่างเช่น กราฟที่ดูง่าย ๆ และกระชับ เช่น แผนภูมิวงกลม (Pie Chart) อาจจะเหมาะสมกว่าการทำแผนที่ต้นไม้ (Treemap) ที่ต้องใช้เวลาดูและคิดมากกว่า ข้อมูลอาจจะละเอียดมากเกินไปเหมาะสำหรับผู้บริหาร เป็นต้น

3. ข้อมูลมีจำนวนมากขนาดไหน

          จำนวนของข้อมูลก็ส่งผลต่อแผนภาพที่เราจะสร้าง ตัวอย่างเช่น ถ้าทำแผนภาพการกระจาย (Scatter plot) ที่บอกถึงความสัมพันธ์ระหว่างยอดขายและราคา หากสินค้าซึ่งแทนด้วยจุดแต่ละจุดบนแผนภาพมีจำนวนมากก็จะทำให้แผนภาพนั้นดูเข้าใจได้ยาก (ซ้าย) ตัวอย่างเช่นนี้อาจจะต้องอาศัยการรวบแถวข้อมูล (Aggregate) ก่อนเพื่อจัดกลุ่มเป็นหมวดหมู่ (ขวา) เป็นต้น

4. ข้อมูลเป็นประเภทอะไร

          โดยทั่วไปแล้วข้อมูลอาจแบ่งออกเป็นสองประเภท คือ ข้อมูลประเภทหมวดหมู่ (Categorical) และข้อมูลประเภทตัวเลข (Numerical) การสร้างแผนภาพสำหรับข้อมูลต่างประเภทก็จะมีความแตกต่างกัน ตัวอย่างเช่น หากต้องการเปรียบเทียบจำนวนสินค้าในประเภทผลิตภัณฑ์แตกต่างกันก็จะใช้กราฟแท่ง แต่ถ้าเปรียบเทียบจำนวนสินค้ากับผลิตภัณฑ์ราคาต่าง ๆ กัน ก็อาจจะใช้ ฮิสโตแกรม (Histogram) เพราะว่า ประเภทผลิตภัณฑ์กับราคาสินค้าเป็นข้อมูลคนละประเภทกัน

5 องค์ประกอบของแผนภาพที่ใช้สื่อถึงอะไร

          หลักการของการทำแผนภาพ คือให้องค์ประกอบ (Element) แทนที่ตัวเลขหรือข้อมูลของเรา ตัวอย่างเช่น ในกราฟวงกลมเราให้ สีแสดงถึงหมวดหมู่ และมุมหรือพื้นที่ของพาย แสดงถึงจำนวนในหมวดหมู่นั้น ๆ แต่ละองค์ประกอบควรจะสื่อถึงปริมาณเพียงอย่างเดียว เพื่อให้สื่อสารได้อย่างแม่นยำ

การใช้สีในแผนภาพ ด้านซ้ายใช้สีในการสื่อถึงหมวดหมู่สินค้า แต่ในด้านขวาสีไม่ได้บอกถึงอะไรจึงไม่มีความจำเป็นเพราะอาจทำให้สับสน

ทีนี้มาดูตัวอย่างแผนภาพต่าง ๆ ที่ใช้ตอบคำถามหลากหลายรูปแบบ

1. ต้องการแสดงถึงขนาดที่ต่างกัน หรือ จัดลำดับ

  • แผนภูมิแท่ง (Bar Chart) เป็น แผนภาพที่ง่ายสุด ที่สามารถใช้เปรียบเทียบข้อมูลในแต่ละหมวดหมู่ สามารถแสดงถึงลำดับและขนาดได้ชัดเจน โดยแกนควรจะเริ่มต้นที่เลขศูนย์เพื่อให้ความสูงของแท่งแสดงถึงปริมาณที่ต้องการจะนำเสนอ ไม่ควรย่นกราฟ
  • แผนภูมิรูปภาพ (Pictogram) ในบางกรณี แผนภูมิรูปภาพอาจจะเป็นทางเลือกที่สวยและเข้าใจง่าย ควรใช้สำหรับกรณีที่นำเสนอเป็นจำนวนเต็มที่ไม่เยอะมากเท่านั้น (อย่าไปตัดแขนคนเพื่อแสดงเลขทศนิยม!)

โดยทั้งสองแบบอาจจะใช้สีในกรณีที่ต้องการแบ่งหมวดหมู่ ขนาดที่แตกต่างกันจะทำให้เห็นได้ชัดเจนว่าปริมาณในข้อมูลกลุ่มไหนมีขนาดใหญ่ที่สุด

2. ต้องการเห็นความสัมพันธ์

หากต้องการหาความสัมพันธ์ระหว่างสองตัวแปร เช่น ราคา กับ กำไร สัมพันธ์กันอย่างไร

  • แผนภาพการกระจาย (Scatter Plot) เป็นวิธีที่ดีที่สุดในการแสดงความสัมพันธ์ระหว่างตัวแปรประเภทตัวเลขสองตัวแปร สามารถใส่เส้นประกอบเพื่อแสดงให้เห็นถึงแนวโน้มได้
  • แผนภูมิฟอง (Bubble chart) หากมีตัวแปรที่สามที่ต้องการแสดงเป็นมิติเพิ่มเติมจากแผนภาพการกระจายทั่วไป อาจนำตัวแปรนั้นมาแสดงโดยใช้ขนาดหรือพื้นที่ของวงกลมได้
  • ตารางแผนภาพความร้อน (Heatmap) หากเป็นข้อมูลหมวดหมู่ แต่มีลำดับขั้น (Ordinal) และอยากแสดงถึงความสัมพันธ์ของตัวแปรเหล่านี้กับปริมาณที่สนใจ อาจจะใช้ตารางแผนภาพความร้อนหรือ หลายคนรู้จักกันในชื่อ Heatmap โดยใช้สีแสดงถึงปริมาณที่สนใจ

3. ต้องการเห็นการกระจายตัว

  • ฮิสโตแกรม (Histogram) ใช้แสดงการกระจายตัวได้ดีและละเอียด หากต้องการแสดงจำนวนของตัวแปรประเภทตัวเลข
  • Boxplot ใช้แสดงการกระจายตัวของข้อมูลเช่นเดียวกับฮิสโตแกรมแต่จะมีความกระชับกว่า และสามารถใช้ในการเปรียบเทียบของแต่ละหมวดหมู่ได้

4. ต้องการเห็นการเปลี่ยนแปลงตามช่วงเวลา

  • แผนภูมิเส้น/แผนภูมิแท่ง จะแสดงให้เห็นถึงการเชื่อมโยงของแต่ละช่วงเวลาได้ดีกว่ากราฟแท่ง แต่โดยทั่วไปสามารถใช้ได้ทั้งสองอย่าง หรือ อาจจะผสมกันถ้าต้องการแสดงสองปริมาณพร้อมกันและต้องการให้เห็นความแตกต่าง
  • แผนภูมิพื้นที่ (Area Chart) หากต้องการแสดงให้เห็นถึงองค์ประกอบในแต่ละช่วงเวลาประกอบกับการเปลี่ยนแปลงตามช่วงเวลาอาจเลือกใช้แผนภูมิพื้นที่นำเสนอข้อมูลชุดนั้น

5. ต้องการเห็นข้อมูลที่เบี่ยงเบนจากปกติ

หากต้องการเน้นว่าตัวเลขนั้นเบี่ยงเบนจากค่าอ้างอิง เช่น เป้าหมายหรือค่าเฉลี่ยมากน้อยแต่ไหน มีค่าบวกหรือลบมากน้อยเพียงใด เราสามารถใช้สีในการช่วยสื่อถึงว่าตัวเลขมีค่าสูงหรือต่ำกว่าเป้าหมายที่ต้องการแสดงเพียงใด

  • แผนภูมิแท่งสี อาจจะใช้สีในแท่งมาช่วยสื่อให้เห็นว่าเป็นตัวเลขเชิงบวก เช่น กำไร หรือ เชิงลบ เช่นขาดทุนได้
  • แผนภูมิเส้นสี ลักษณะเดียวกันแต่ใช้เส้นสำหรับข้อมูลตามเวลา

6. ต้องการแสดงถึงองค์ประกอบ

  • แผนภูมิวงกลม (Pie Chart) จะใช้กับตัวแปรประเภทหมวดหมู่ว่าเพื่อแสดงให้เห็นว่าแต่ละหมวดหมู่มีจำนวนหรือปริมาณที่เกี่ยวข้องเท่าใด โดยใช้ขนาดมุมหรือพื้นที่เป็นตัวบ่งชี้ ทั้งนี้ไม่ควรใช้ในกรณีที่มีหมวดหมู่มากเกินไป (บางคนบอกว่าไม่ควรเกิน 5 หมวดหมู่) ปริมาณที่ใช้ควรรวมเป็น 100% ไม่ควรใช้ในกรณีที่ปริมาณนั้นไม่สามารถนำมาบวกกันได้ เช่น ค่าเฉลี่ยของยอดขายในแต่ละประเภทผลิตภัณฑ์
  • แผนภูมิโดนัท (Donut Chart) เหมือน Pie Chart แต่มีพื้นที่ตรงกลางไว้ที่สามารถใช้แสดงข้อความ หรือ ปริมาณรวมได้
  • แผนที่ต้นไม้ (Treemap) คล้าย Pie Chart แต่สามารถใช้แบ่งหมวดหมู่เป็นลำดับชั้นได้ และหากมีหลายหมวดหมู่ก็จะดูรู้เรื่องกว่า โดยจะใช้พื้นที่สี่เหลี่ยมในการแสดงถึงปริมาณ และสีอาจจะใช้ในการแบ่งหมวดหมู่หรือจัดลำดับได้
ภาพประกอบจาก Workpoint News
  • แผนภูมิแท่งแบบต่อกัน (Stacked Bar Chart) หากต้องการเปรียบเทียบองค์ประกอบภายในแต่ละหมวดหมู่ ก็ใช้ประเภทนี้ได้ โดยอาจแสดงเป็นเปอร์เซ็นต์หากต้องการเน้นถึงองค์ประกอบ (ซ้าย) หรือจำนวนดิบหากต้องการเน้นถึงปริมาณมากน้อยด้วย (ขวา)

  • แผนภูมิน้ำตก (Waterfall Chart) แสดงให้เห็นว่ายอดรวมทั้งหมดแตกได้เป็นอะไรบ้าง มักใช้กับข้อมูลจำนวนเงิน เช่น งบบัญชี
จาก FusionCharts Blog

7. ต้องการแสดงถึงข้อมูลเชิงพื้นที่

  • แผนที่โคโรเพลท (Choropleth Map) คือการใช้สีในการแสดงปริมาณต่าง ๆ บนพื้นที่นั้น มีข้อควรระวังคือหากพื้นที่มีขนาดใหญ่ บริเวณที่มีสีก็จะใหญ่ตามไปด้วยซึ่งอาจจะทำให้ผู้อ่านเข้าใจผิด ดังนั้นปริมาณที่นำมาใช้แสดงโดยสีใน Choropleth map ควรจะเป็นปริมาณที่ไม่ขึ้นกับขนาดพื้นที่ เช่น ความหนาแน่นประชากรต่อพื้นที่ มากกว่าปริมาณที่อาจจะขึ้นกับพื้นที่ เช่น จำนวนประชากรรวม (สามารถอ่านเพิ่มเติมได้ที่ สร้างแผนที่การระบาดโควิด-19 อย่างถูกหลักการ)
  • แผนที่แสดงด้วยสัญลักษณ์สัดส่วน (Proportional Symbol Map) ใช้ขนาดของสัญลักษณ์ เช่น วงกลม แสดงถึงปริมาณ การใช้แผนภาพลักษณะนี้จะทำให้แสดงข้อมูลได้โดยไม่ต้องกังวลถึงขนาดของพื้นที่ ตัวอย่าง เช่น จำนวนผู้ติดเชื้อในแต่ละประเทศมักจะใช้แผนภาพแบบนี้ แทนที่จะเป็น Choropleth Map

ตัวอย่างการใช้ Proportional Symbol Map เพื่อแสดงจำนวนประชากร จะแสดงให้เห็นถึงการกระจุกตัวได้ชัดเจนกว่าการใช้สีแสดงจำนวนประชากร
  • แผนที่แสดงข้อมูลด้วยจุด (Dot Map) / แผนที่ความร้อน (Heatmap) หากข้อมูลมีความละเอียดถึงขั้นละติจูด ลองจิจูด อาจแสดงข้อมูลเป็นจุดตามแผนที่ แต่หากข้อมูลมีจำนวนมากสามารถใช้ Heatmap ในการแสดงถึงความหนาแน่นของข้อมูลบนพื้นที่แทน
(ซ้าย) Dot map (ขวา) Heat map

แหล่งที่มา

https://www.tableau.com/solutions/gallery/visual-vocabulary

Nontawit Cheewaruangroj, PhD

Project Manager and Senior Data Scientist at Government Big Data Institute (GBDi)

Pakhapoom Sarapat, PhD

Data Scientist Government Big Data Institute (GBDi)

Sign up to join Big Data Community Thailand

Make comments, write articles, and contribute to our community.