

คำถามเหล่านี้เป็นคำถามเกี่ยวกับความเสมอภาคในการเข้าถึงและใช้ประโยชน์ของข้อมูลในองค์กร ซึ่งเป็นคนละประเด็นกับสิทธิ์ในการเข้าถึงข้อมูลบางประเภท (User Type) ทำให้หลายๆองค์กรเริ่มมองถึงความไม่เสมอภาคนี้และเป็นที่มาของการทำข้อมูลให้เป็นประชาธิปไตย หรือ Data Democratization


ประชาธิปไตยข้อมูล (Data Democratization) ไม่ใช่แค่เรื่องของ การเข้าถึงข้อมูล (Data Access)
การทำข้อมูลให้เป็นประชาธิปไตยนั้นมักจะถูกเข้าใจว่าเป็นการให้ทุกคนสามารถเข้าถึงข้อมูลได้อย่างทั่วถ้วนเท่านั้น ซึ่งไม่ถูกเสียทั้งหมด เพราะผู้บริหารก็คงไม่อยากให้พนักงานเห็นข้อมูลความลับของบริษัท หรือฝ่ายบุคคลก็คงไม่อยากให้เราเห็นเงินเดือนของเพื่อนร่วมงานด้วยเช่นกัน ซึ่งหลักการใหญ่ๆในการทำข้อมูลให้เป็นประชาธิปไตย สรุปได้ดังนี้
- มีเครื่องมือที่เหมาะสมกับความสามารถของบุคคลในการเข้าถึงและใช้งานข้อมูล
- สร้างบรรยากาศให้พนักงานรู้สึกผ่อนคลายในการใช้ข้อมูลและตั้งคำถามที่ตอบด้วยข้อมูล
- ทำเรื่องนี้ให้เป็นกระบวนการต่อเนื่องจนเกิดเป็นวัฒนธรรมขององค์กรในที่สุด
เกิดขึ้นเพื่อ แก้ ปัญหาความท้าทายของการใช้ข้อมูล
ทำไมองค์กรถึงควรให้ความสำคัญกับเรื่องนี้ ก็เป็นเพราะว่าเรื่องนี้เพื่อจะช่วยแก้ปัญหาที่คนในองค์กรต้องเผชิญเกี่ยวกับการใช้ข้อมูลในวันต่อวัน ซึ่งเป็นอุปสรรคใหญ่ที่ทำให้องค์กรไม่เป็น Data-driven สักที ลองพิจารณาประเด็นต่อไปนี้
- ฉันเข้าถึงข้อมูลที่ต้องการใช้ไม่ได้
- กว่าจะได้ข้อมูลมาทำงานใช้เวลานานมาก (ก.ไก่หลายตัว)
- ไม่รู้ว่าข้อมูลที่ได้มาถูกต้องหรือเปล่า
- ไม่รู้ว่าจะตอบคำถามของฉันจากข้อมูลเหล่านี้ยังไง
- โปรแกรมวิเคราะห์ที่บริษัทซื้อมาใช้ยากมาก ก็มีแต่ทีม Analyse เท่านั้นแหละที่ใช้ได้
- ทีม Data Science ไม่ว่างมาช่วยซักที
ปัญหาทั่วไปที่ฟังๆดูแล้วก็น่าจะแก้ได้ด้วยการทำ Data Governance ในองค์กรได้ (ขอแนะนำให้ลองอ่านกรอบการวิเคราะห์ข้อมูลขนาดใหญ่ภาครัฐ) ซึ่งก็ถูกต้องในแง่ของการการทำโครงสร้างให้มั่นคงพร้อมรับสถานการณ์การใช้ข้อมูลแบบต่างๆ แต่อีกปัญหาใหญ่ที่ยังไม่ถูกแก้ด้วย Data Governance คือ เครื่องมือที่เหมาะสมกับผู้ใช้งาน
การมีเครื่องมือที่เหมาะสม คือ ความเสมอภาค
“จอบที่เหมือนกัน ไม่ได้ทำให้ทุกคนได้หัวมันที่เท่ากัน และหัวมันที่เท่ากันก็ไม่ได้ทำให้คนอิ่มเท่ากันได้”
“ความเสมอภาค” คือการเข้าถึงโอกาสได้เหมือนกัน บางคนต้องการน้อย บางคนต้องการมาก เช่นเดียวกับการเข้าถึงและใช้งานข้อมูล อันดับแรกในการสร้างความเสมอภาคคือ ต้องเข้าใจว่าผู้ใช้ต้องการอะไร เช่น
- ฝ่ายขาย ต้องการใช้ข้อมูลเพื่อหาโอกาส ที่จะกลายเป็นลูกค้าจริงๆได้
- ฝ่ายการตลาด ต้องการใช้ข้อมูลเพื่อหาทางจัดแคมเปญเด็ด ๆ โดนใจคนจะได้กลายมาเป็นลูกค้า
- ฝ่ายโลจิสติกส์ ต้องการใช้ข้อมูลเพื่อปรับปรุงกระบวนการขนส่งให้รวดเร็วยิ่งขึ้น
- ฝ่าย E-Commerse ต้องการข้อมูลเพื่อหาช่องทางขยายฐานลูกค้าในโลกออนไลน์
- ฝ่ายบุคคล ต้องการข้อมูลเพื่อเลื่อนตำแหน่งและอัดฉีดเงินเดือนให้พนักงานที่มีประโยชน์กับบริษัทจริงๆ
- ผู้บริหาร ต้องการข้อมูลเพื่อหาทางทำให้บริษัทคงอยู่ได้และเจริญเติบโต
จะดีกว่าไหมหากให้เครื่องมือที่แต่ละฝ่ายสามารถใช้วิเคราะห์ง่ายๆได้เอง เช่น ทำ Dashboards หรือวิเคราะห์ทำนายผลพื้นฐาน และเหลือเพียงงานหินๆให้ทีม Data Science ได้ลงมือได้เต็มที่ ซึ่งในปัจจุบันก็มี Software มากมายที่ให้ผู้ใช้งานสร้าง Dashbaords ได้ภายในไม่กี่นาที ด้วยการลากวาง หรือการสร้าง Model ทำนายผล ที่ไม่ต้องเขียนโค้ด สามารถลากวาง กำหนดค่า และแปรผลให้เราได้เอง ส่วนที่องค์กรต้องสนับสนุนเพิ่มคือ การอบรมใช้เครื่องมือ และความเข้าใจทางสถิติให้แก่พนักงาน
Modern Data Stack เป็นชุดของเครื่องมือที่องค์กรควรลงทุนเพื่อตอบสนองความต้องการใช้ข้อมูลของส่วนต่าง ๆ ในองค์กร ทั้งนี้องค์กรก็ควรพิจารณาถึงขนาดความต้องการและความพร้อมของข้อมูล (Data Maturity) ในองค์กรประกอบด้วย โดยส่วนใหญ่แล้วองค์กรด้านธุรกิจมักจะลงทุนในเครื่องมือเหล่านี้
- Data Warehouse เพื่อให้ข้อมูลพร้อมที่จะถูกใช้วิเคราะห์หรือใช้ประโยชน์อื่น ยกตัวอย่างเช่น Snowflake, BigQuery, Firebolt เป็นต้น
- ELT & Reversed ELT เพื่อการโอนย้ายถ่ายเทข้อมูล ยกตัวอย่างเช่น Airbyte, Firetran, Meltano, Census, Hightouch, Grouparoo เป็นต้น
- Business Intelligence (BI) เครื่องมือที่ถูกวางไว้เหนือฐานข้อมูลเพื่อทำให้ผู้ใช้งานสามารถทำการวิเคราะห์ด้วยตนเองได้ (Self-serve analytics) ยกตัวอย่างเช่น Tableau, Microsoft Power BI, Google Data Studio, Looker, Mode, Superset เป็นต้น
- Low-code Analytics Platform เพื่อการวิเคราะห์ข้อมูลสำหรับผู้ที่ไม่ถนัดการเขียนโปรแกรม ยกตัวอย่างเช่น Alteryx, RapidMiner Studio, Loginom เป็นต้น


Dataportal กรณีศึกษา Data Democratization ที่ Airbnb
ลองมาดูตัวอย่างการทำให้ข้อมูลเป็นประชาธิปไตยอย่างเป็นรูปธรรมกัน ที่ Airbnb ซึ่งเป็นเทคสตาร์ทอัพด้านการจองที่พักที่มีการเติบโตในจำนวนพนักงานและจำนวนข้อมูลที่พร้อม ๆ กัน ปัญหาที่เกิดขึ้นคือการเข้าถึงสิ่งที่ต้องการในทะเลของข้อมูล (Data Lake) อย่างไรให้มีประสิทธิภาพและประสิทธิผลสูงสุด จึงเป็นที่มาของ Dataportal เครื่องมือและช่องทางให้พนักงานของ Airbnb เข้าถึงและเข้าใช้ข้อมูล ด้วยการอำนวยความสะดวกดังต่อไปนี้


- Search – ค้นหาชุดข้อมูลและผลการวิเคราะห์ที่ได้จัดทำไว้แล้ว
- Context and Metadata – อธิบายรายละเอียดชุดข้อมูล (Metadata) ให้มีความชัดเจนและนำไปใช้ได้จริง
- Employee-centric Data – สามารถดูข้อมูลในมุมมองของผู้ใช้งานแต่ละคนได้ว่าใครสร้างหรือใช้งานหรือชื่นชอบข้อมูลอะไรบ้าง คล้ายๆ โปรไฟล์ใน Facebook
- Team-centric Data – สามารถดูข้อมูลในมุมมองของทีมว่ามีข้อมูลหรือ Dashboards อะไรที่เป็นประโยชน์ต่อการทำงานของตนเองบ้าง
การขับเคลื่อนองค์กรด้วยข้อมูลเริ่มต้นจากประชาธิปไตยของข้อมูล
ความเสมอภาค คือคำสำคัญหลักที่ทำให้เกิดประชาธิปไตย การทำให้คนในองค์กรสามารถเข้าถึงและใช้ข้อมูลตามสิทธิของตนเองได้ ด้วยเครื่องมือที่เหมาะสมกับความสามารถและลักษณะของงาน จะสร้างให้เกิดบรรยากาศการทำงานกับข้อมูลอย่างเป็นรูปธรรม ซึ่งจะนำไปสู่การเกิดวัฒนธรรมที่คนในองค์กรจะหยิบยกข้อมูลมาพูดคุยและถกเถียงกัน เมื่อข้อมูลถูกวิเคราะห์ ตกตะกอน กลายเป็นข้อสรุป เกิดเป็นการตัดสินใจ องค์กรนั้นก็สามารถเรียกตัวเองได้ว่าเป็น Data-driven
แหล่งอ้างอิง
- DataDemocratization By Arpit Choudhury https://amplitude.com/blog/data-democratization
- Democratizing Data at Airbnb By Chris Williams, Eli Brumbaugh, Jeff Feng, John Bodley, and Michelle Thomas https://medium.com/airbnb-engineering/democratizing-data-at-airbnb-852d76c51770
- What Is DataDemocratization? A Super Simple Explanation And The Key Pros And Cons By Bernard Marr https://www.forbes.com/sites/bernardmarr/2017/07/24/what-is-data-democratization-a-super-simple-explanation-and-the-key-pros-and-cons/?sh=12f4d5446013