ข้อมูลจากสถาบันสุขภาพเด็กแห่งชาติมหาราชินี กรมการแพทย์ กระทรวงสาธารณสุข ได้กล่าวถึงสาเหตุที่ทำให้เด็กพูดจาหยาบคาย ส่วนหนึ่งเกิดจาก “พฤติกรรมเลียนแบบจากสื่อต่างๆ” ซึ่งสื่อสารด้วย “คำพูดหยาบคาย” กันจนดูเหมือนเป็นเรื่องปกติ แต่ที่น่าเป็นห่วงที่สุดคือ การปล่อยปละละเลยโดยเฉพาะอย่างยิ่งในเด็กเล็กตั้งแต่ชั้นอนุบาล ที่มักจดจำและเลียนแบบจากบุคคลหรือสิ่งรอบตัวจนเติบโตกลายเป็นผู้ใหญ่ที่มีปัญหาทางบุคลิกภาพ จากการชอบพูดคำหยาบคาย และก้าวร้าวรุนแรงจนเป็นนิสัย

อัลกอริทึม “FALCoN”

ผู้ร่วมคิดค้นอัลกอริทึม FALCoN “AI ตรวจจับคำหยาบ”

รองศาสตราจารย์ ดร.ศุภวงศ์ ทั่วรอบ และ อาจารย์ ดร.ธนพล นรเสฏฐ์ กลุ่มวิทยาการคอมพิวเตอร์ รวมถึงนักศึกษาคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล ในฐานะ “ปัญญาของแผ่นดิ” ได้ร่วมกันคิดค้นอัลกอริทึม “FALCoN” (Foul and Abusive Language detection using Co-training in social Networks) ด้วยทุนสนับสนุนจาก สำนักงานคณะกรรมการส่งเสริมวิทยาศาสตร์ วิจัย และนวัตกรรม (สกสว.) เพื่อหาทางออกจาก “มุมมืดของสื่อสังคมออนไลน์” ดังกล่าว ด้วยการใช้เทคโนโลยีปัญญาประดิษฐ์ (AI) ในการตรวจจับคำพูดหยาบภาษาไทยในสื่อสังคมออนไลน์ และเป็นผลงานที่ได้รับการตีพิมพ์แล้วในวารสารวิชาการระดับโลก “Information Processing & Management”

โดย รองศาสตราจารย์ ดร.ศุภวงศ์ ทั่วรอบ รับผิดชอบในการออกแบบ และควบคุมทางเทคนิค ด้วยความเชี่ยวชาญที่มากด้วยประสบการณ์จากการใช้ AI วิเคราะห์สื่อสังคมออนไลน์ที่ผ่านมา โดยมี อาจารย์ ดร.ธนพล นรเสฏฐ์ ผู้เชี่ยวชาญด้านการประมวลผลภาษาธรรมชาติ (NLP) ร่วมให้การดูแล และให้คำปรึกษานักศึกษาของคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล ที่เป็นส่วนสำคัญในการร่วมสร้างชุดข้อมูลเพื่อทดสอบระบบ “FALCoN” คำพูดที่ไม่เหมาะสมในสื่อสังคมออนไลน์ ประกอบด้วยคำพูดหยาบ คำเปรียบเปรยเสียดสี คำก้าวร้าวรุกราน และคำที่ส่อไปในทางลามกอนาจาร

เทคนิค Co-Training ในการฝึกสอนปัญญาประดิษฐ์ให้เรียนรู้ลักษณะของภาษาหยาบคาย จากทั้งคำพูดเองและข้อสังเกตจากบริบท

จุดท้าทายอยู่ที่จะทำอย่างไรให้ AI สามารถทำงานตรวจจับคำพูดที่ไม่เหมาะสมในสื่อสังคมออนไลน์ได้อย่างครอบคลุม โดยภาษาไทยบางคำ เมื่อปรากฏเป็นคำเดี่ยว จะไม่เป็นคำหยาบคาย ต้องอาศัยการตีความเมื่อปรากฏในบริบทที่เกี่ยวข้องด้วย ดังนั้น “FALCoN” จึงใช้เทคนิค Co-Training ในการฝึกสอนปัญญาประดิษฐ์ให้เรียนรู้ลักษณะของภาษาหยาบคาย จากทั้งคำพูดเองและข้อสังเกตจากบริบท เช่น Reaction และข้อความที่อยู่รอบๆ เนื่องจากสื่อสังคมออนไลน์เป็น "ภาษาดิ้นได้" หรือภาษาที่มีการเปลี่ยนแปลงตลอดเวลา จึงจำเป็นต้องอาศัย “คนรุ่นใหม่” เพื่อทำความเข้าใจการใช้ภาษานี้ นักศึกษาของคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล จึงมีบทบาทสำคัญในการร่วมพัฒนา “FALCoN”

จากการ “ติดฉลาก” ข้อมูล และเขียนโปรแกรมเพื่อทำการทดลองซึ่งเป็นงานที่ต้องอาศัยการใช้วิจารณญาณ และความเชี่ยวชาญเฉพาะทาง ภายใต้การดูแลโดยอาจารย์ที่ปรึกษา และต้องใช้เวลา กว่าจะเสร็จสิ้น และสามารถนำไปใช้ได้จริงจะต้องมี "คลังข้อความ" ที่มากพอ และทดสอบการใช้กับกลุ่มตัวอย่างจนกว่าจะได้ผลจนเป็นที่แน่ใจ

“FALCoN” สามารถนำไปพัฒนาต่อยอดเป็นโปรแกรมอัตโนมัติสมบูรณ์แบบเพื่อใช้คัดกรองภาษาที่ไม่เหมาะสมในสื่อสังคมออนไลน์ ซึ่งจะช่วยทำให้ประหยัดเวลา และงบประมาณ เทียบกับการเฝ้าระวังและคัดกรองด้วยมนุษย์ อย่างไรก็ดี “FALCoN” ยังคงต้องการทุนสนับสนุนเพื่อพัฒนาศักยภาพและต่อยอดเป็นโปรแกรมที่สมบูรณ์แบบก่อนการเปิดใช้ได้จริงในอนาคต

งานวิจัย “FALCoN” เป็นอีกหนึ่งตัวอย่างของการมีส่วนร่วมของนักศึกษาในการเรียนรู้และร่วมแก้ไขโจทย์ปัญหาทางสังคมไทย ด้วยองค์ความรู้ทางวิทยาการคอมพิวเตอร์และปัญญาประดิษฐ์ จากคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล เพื่อ “สังคมออนไลน์ที่สร้างสรรค์” สำหรับน้องๆ รุ่นเยาว์ที่ยังอ่อนด้อยประสบการณ์ทางสังคม ให้พร้อมเติบโตเป็นผู้ใหญ่ที่สมบูรณ์ และเป็นกำลังสำคัญร่วมพัฒนาสังคมและเศรษฐกิจของประเทศชาติให้ยั่งยืนสืบไป