รูปที่ 1 ผลสำรวจพฤติกรรมคนไทยกับมาตรการ COVID-19 (สามารถเข้าชมเพิ่มเติมได้ที่นี่)

ในขณะที่สถานการณ์บ้านเมืองยังเต็มไปด้วยการระบาดของ COVID-19 ผู้คนต่างต้องกักกันตัวเองอยู่แต่ในบ้าน สามารถออกไปข้างนอกได้เท่าที่จำเป็นเท่านั้น และทุกครั้งที่ไปข้างนอกก็ต้องสวมใส่หน้ากากอนามัยหรือหน้ากากผ้าตลอดเวลา ต้องรักษาระยะห่างระหว่างบุคคล ต้องล้างมือ และหมั่นตรวจสอบสุขภาพอนามัยของตัวเองให้สะอาดอยู่เสมอตามมาตรการของรัฐ ซึ่งเรียกได้ว่าแทบจะเปลี่ยนพฤติกรรมของคนไทยส่วนใหญ่เลยทีเดียว คำถามคือคนไทยมีความพร้อมในการปรับตัวให้เข้ากับสถานการณ์ในปัจจุบันอย่างไร 

ด้วยความสงสัยนี้เองทำให้กรมควบคุมโรคร่วมมือกับมหาวิทยาลัยมหิดลและสถาบันส่งเสริมการวิเคราะห์และบริหารข้อมูลขนาดใหญ่ภาครัฐ (GBDi) จัดทำแบบสำรวจความพร้อมในการรับมือ COVID-19 ของคนไทย โดยได้เปิดให้เข้าร่วมทำแบบสอบถามได้เป็นเวลา 30 ชั่วโมง และมีจำนวนผู้ร่วมทำแบบสอบถามทั้งสิ้น 146,372 คน จากทั่วประเทศ 

รูปที่ 2 ผลสำรวจการป้องกันตัวเองจากเชื้อไวรัสโคโรน่า

ในรูปที่ 2 แสดงผลสำรวจพฤติกรรมคนไทยในภาพรวม ซึ่งทำให้ภาครัฐได้เข้าใจถึงพฤติกรรมการป้องกันตัวของประชาชน เช่น ประชาชน 94% สวมหน้ากากอนามัยเวลาออกนอกบ้าน, 65% รักษาระยะห่างกับผู้อื่น และ 29% วัดอุณหภูมิร่างกายทุกวัน ซึ่งผลที่เห็นก็คือประชาชนส่วนใหญ่มีการป้องกันตัวเองค่อนข้างดี

รูปที่ 3 ผลสำรวจมาตรการการกักตัว (Self-quarantine) หลังจากเดินทางกลับจากต่างประเทศ
รูปที่ 4 ผลสำรวจมาตรการทำงานที่บ้าน (Work from home)

หรือในแง่ของมาตรการที่ภาครัฐกำหนดขึ้น ก็จะทำให้ทราบได้ว่าประชาชนจำนวนกี่เปอร์เซ็นต์ทำตามมาตรการอย่างเคร่งครัด เช่น มาตรการกักตัวเองหลังจากเดินทางกลับมาจากต่างประเทศ (รูปที่ 3) ทำให้เห็นว่าส่วนใหญ่มีการกักตัวเอง แต่ก็มีจำนวนไม่น้อยเลยที่ไม่ได้ทำตามมาตรการนี้ หรือ ในส่วนของมาตรการทำงานอยู่ที่บ้าน หรือ Work From Home (รูปที่ 4) นั้นทำได้ยากสำหรับคนส่วนใหญ่ ที่ยังมีความจำเป็นที่ต้องออกไปทำงานข้างนอก

จะเห็นได้ว่ามีข้อมูลหลากหลายมิติจากแบบสอบถามนี้ ซึ่งสามารถตอบคำถามได้หลายอย่างที่ทั้งภาครัฐและประชาชนมี แต่จะมีวิธีอะไรที่สามารถทำให้เห็นภาพโดยรวมต่อมาตรการ มากกว่าดูกราฟแท่งทีละชุด จุดนี้เองที่สามารถใช้ Data Science เข้ามาช่วยได้

การใช้ Data Science ในการวิเคราะห์ผลแบบสอบถาม

เทคนิคที่ใช้ใน Data Science เมื่อเราไม่มีคำถามที่ชัดเจน แต่อยากใช้ Machine Learning ในการหารูปแบบของข้อมูลก็คือ Unsupervised Learning และเทคนิคที่ง่ายและเป็นที่นิยมที่สุดก็คือการแบ่งกลุ่มข้อมูลหรือ Clustering นั่นเอง 

ในแบบสอบถามนี้มีคำถามว่าผู้ตอบแบบสอบถามมีอาการป่วยหรือไม่  นั่นให้เกิดความสงสัยว่า รูปแบบพฤติกรรมของผู้ที่มีอาการป่วยจะเหมือนหรือแตกต่างผู้ที่ไม่มีอาการป่วยอย่างไร และมากกว่านั้นคือในกลุ่มผู้ที่มีอาการป่วยหรือกลุ่มผู้ที่ไม่มีอาการป่วยจะมีพฤติกรรมในลักษณะเดียวกันหรือไม่ 

เพื่อวิเคราะห์ความคล้ายคลึงภายในและภายนอกกลุ่มผู้ที่มีอาการป่วยและไม่มีอาการป่วย จึงทำการกรองข้อมูลออกเป็น 2 กลุ่มก่อน โดยข้อมูลของกลุ่มที่มีอาการป่วยมีอยู่ 11,570 คน (8%) และสำหรับข้อมูลผู้ไม่มีอาการป่วยมี 110,464 คน (77%) โดยที่เหลืออีก 15% ไม่แน่ใจว่ามีอาการหรือไม่จึงถูกตัดออกไปจากการวิเคราะห์นี้ จากนั้นจึงทำการแบ่งกลุ่มข้อมูล แต่เนื่องจากว่าผลสำรวจจากแบบสอบถามมีทั้งข้อมูลที่เป็นตัวเลข (Numerical feature) และข้อมูลที่เป็นหมวดหมู่ (Categorical feature) ดังที่แสดงในรูปที่ 5 การวิเคราะห์นั้นจึงทำด้วยเทคนิคที่เรียกว่า K-prototypes (อ่านเพิ่มเติมได้ที่ อีกขั้นของ k-means algorithm ที่สามารถแบ่งกลุ่มข้อมูลได้ทุกประเภท) ซึ่งสามารถประยุกต์ใช้หลักการทำการแบ่งกลุ่มข้อมูลเพื่อจัดกลุ่มข้อมูลที่มีลักษณะเหมือนกันให้อยู่กลุ่มเดียวกัน และข้อมูลที่แตกต่างกันให้อยู่คนละกลุ่มกัน 

 รูปที่ 5 ตัวอย่างผลสำรวจ 2 แถวแรก

สำหรับเกณฑ์ในการเลือกจำนวนกลุ่มที่ดีที่สุดจะพิจารณาจาก Silhouette score (โดยจะอธิบายในโอกาสถัดไป) ซึ่งพบว่าจำนวนกลุ่มที่ได้จากการแบ่งกลุ่มควรเป็น 2 หรือ 3 กลุ่ม โดยในบทความนี้จะเลือกใช้จำนวนในการแบ่งกลุ่มเป็น 3 กลุ่ม โดยพบว่าพฤติกรรมที่สำคัญในการจำแนกกลุ่มแต่ละกลุ่มคือ จำนวนครั้งในการล้างมือ การได้ทำงานจากที่บ้าน การไม่ไปในพื้นที่เสี่ยง การรักษาระยะห่างจากคนอื่นอย่างน้อย 1-2 เมตร การปิดปากและจมูกด้วยกระดาษทิชชูเวลาจามหรือและล้างมือทันที การวัดอุณภูมิร่างกายตัวเองทุกวัน การหลีกเลี่ยงการจับใบหน้า ตา จมูก และปาก การเช็ดโทรศัพท์มือถือด้วยน้ำยาฆ่าเชื้อ การกินอาหารที่มีประโยชน์ เช่น ผัก ผลไม้ เพิ่มขึ้น และการกินวิตามินบำรุง โดยสามารถสรุปลักษณะพฤติกรรมที่สำคัญของแต่ละกลุ่มได้ดังแสดงที่ในตารางที่ 1

ตารางที่ 1 ลักษณะพฤติกรรมที่สำคัญของแต่ละกลุ่ม

กลุ่มผู้ที่มีอาการป่วย

รูปภาพประกอบด้วย ข้อความคำอธิบายที่สร้างโดยอัตโนมัติ
รูปที่ 6 ลักษณะพฤติกรรมของกลุ่มผู้ที่มีอาการป่วย

กลุ่มที่มีอาการป่วย กลุ่มที่ 1 กลุ่มที่ได้ทำงานที่บ้าน คิดเป็น 50% ของผู้ที่มีอาการป่วยทั้งหมด เป็นกลุ่มที่ได้ทำงานจากบ้าน ได้พูดคุยกับคนอื่นในระยะประชิดน้อย และล้างมือเฉลี่ยประมาณ 0-7 ครั้ง

กลุ่มที่มีอาการป่วย กลุ่มที่ 2 กลุ่มที่ป้องกันตัวเองอย่างดี คิดเป็น 35% ของผู้ที่มีอาการป่วยทั้งหมด เป็นกลุ่มที่ยังคงต้องไปทำงานอยู่ แต่มีการดูแลตัวเองอย่างดีเยี่ยม กล่าวคือมีการรักษาระยะห่างระหว่างบุคคล ปิดปากเวลาไอหรือจาม วัดอุณภูมิร่างกายตัวเองทุกวัน หลีกเลี่ยงการสัมผัส เช็ดโทรศัพท์มือถือด้วยน้ำยาฆ่าเชื้อ และกินอาหารที่มีประโยชน์

กลุ่มที่มีอาการป่วย กลุ่มที่ 3 กลุ่มที่ป้องกันอยู่บ้าง คิดเป็น 15% ของผู้ที่มีอาการป่วยทั้งหมด เป็นกลุ่มที่ไม่ได้ทำงานจากที่บ้านเป็นส่วนใหญ่ แต่ไม่ได้ดูแลสุขอนามัยดีเท่ากลุ่มที่ 2  มีการป้องกันเพียงแค่ปิดปากและจมูกเวลาไอหรือจาม และกินอาหารที่มีประโยชน์เพิ่มขึ้น

กลุ่มผู้ที่ไม่มีอาการป่วย

รูปภาพประกอบด้วย ภาพหน้าจอคำอธิบายที่สร้างโดยอัตโนมัติ
รูปที่ 7 ลักษณะพฤติกรรมของกลุ่มผู้ที่ไม่มีอาการป่วย

กลุ่มที่ไม่มีอาการป่วย กลุ่มที่ 1 กลุ่มที่ได้ทำงานจากที่บ้าน  คิดเป็น 65% ของผู้ที่ไม่มีอาการป่วยทั้งหมด เป็นกลุ่มที่ได้ทำงานจากที่บ้าน มีการป้องกันตัวเองเพียงแค่รักษาระยะห่างระหว่างตนเองกับคนอื่น หลีกเลี่ยงการสัมผัสใบหน้า และกินอาหารที่มีประโยชน์ ซึ่งคล้ายกับกลุ่มทำงานที่บ้านในคนที่มีอาการป่วย

กลุ่มที่ไม่มีอาการป่วย กลุ่มที่ 2  กลุ่มที่ดูแลตัวเองดีเยี่ยม    คิดเป็น 20% ของผู้ที่ไม่มีอาการป่วยทั้งหมด เป็นกลุ่มคนที่ไม่ได้ทำงานจากที่บ้าน และดูแลตัวเองเป็นอย่างดี นอกจากสวมใส่หน้ากากอนามันและล้างมือแล้วยังมีการวัดอุณหภูมิตัวเองทุกวัน การเช็ดโทรศัพท์มือถืออยู่เสมอ และการกินวิตามินบำรุงตัวเอง

กลุ่มที่ไม่มีอาการป่วย กลุ่มที่ 3 กลุ่มที่ป้องกันอยู่บ้าง   คิดเป็น 15% ของผู้ที่ไม่มีอาการป่วยทั้งหมด จะคล้ายกับกลุ่มที่ไม่มีอาการป่วย กลุ่มที่ 1 แต่แตกต่างตรงที่คนในกลุ่มนี้ไม่ได้ทำงานจากที่บ้านเป็นส่วนใหญ่ และในเมื่อหลีกเลี่ยงการออกจากบ้านไม่ได้ จึงจำเป็นที่จะต้องเพิ่มการป้องกันดูแลตัวเองนอกเหนือจากการสวมใส่หน้ากากอนามัยและล้างมือแล้ว ก็มีการเช็ดโทรศัพท์มือถือเพิ่มเข้ามา และปิดปากเวลาไอหรือจามและล้างมือในทันที

ผู้ที่ไม่มีอาการป่วยจะมีสัดส่วนการทำงานจากที่บ้านมากกว่าซึ่งอาจจะแสดงว่าการทำงานจากที่บ้านมีผลต่อการลดโอกาสการเจ็บป่วย

ผลการวิเคราะห์

จะเห็นได้ว่าทั้งคนที่ป่วยและไม่ป่วยนั้นต่างแบ่งได้คร่าว ๆ เป็นสามกลุ่มทั้งคู่ โดยกลุ่มที่ทำงานนอกบ้านโดยรวมแล้วมักจะมีพฤติกรรมการล้างมือและป้องกันตัวมากกว่ากลุ่มที่ทำงานจากบ้าน สำหรับคนที่ป่วยจะมีการระวังตัวและไปในพื้นที่เสี่ยงน้อยกว่าคนไม่ป่วยแสดงถึงความร่วมมือต่อมาตรการในผู้ที่ทำแบบสอบถาม นอกจากนี้คนที่ไม่ป่วยจะมีสัดส่วนการทำงานจากที่บ้านมากกว่าซึ่งอาจจะแสดงว่าการทำงานจากที่บ้านมีผลต่อการเจ็บป่วย การแบ่งกลุ่มข้อมูลแบบนี้ทำให้เราเห็นภาพรวมของพฤติกรรมที่แตกต่างกันของประชาชนและทำให้ภาครัฐสามารถวางแผนได้ดีขึ้นเมื่อต้องออกมาตรการใหม่สำหรับสถานการณ์ที่ไม่เคยเจอมาก่อนแบบครั้งนี้ครับ

Recommended Posts