รศ.ดร.สุขุม เฉลยทรัพย์

ที่ปรึกษาสวนดุสิตโพล มหาวิทยาลัยสวนดุสิต

“ข้อมูล” ในอดีตกับยุคดิจิทัลแตกต่างกันแน่นอน!!! ซึ่งเป็นผลมาจากความก้าวหน้าของเทคโนโลยีทั้งในด้านการจัดเก็บข้อมูล การประมวลผลข้อมูล การวิเคราะห์ข้อมูล และการรวมข้อมูล

ในอดีตการจัดเก็บข้อมูล (Data Storage) จะจัดเก็บแบบกายภาพ เช่น บันทึกกระดาษ เทปแม่เหล็ก และฟลอปดิสก์ ซึ่งมีข้อจำกัดในการจัดเก็บและการเข้าถึงที่จำกัด ส่วนยุคดิจิทัลข้อมูลจัดเก็บแบบดิจิทัลในรูปฐานข้อมูล ข้อมูลบนคลาวด์ และคลังข้อมูล ทำให้มี
ความจุในการจัดเก็บข้อมูลที่กว้างขวางและเข้าถึงได้ง่าย

การประมวลผลข้อมูล (Data Processing) ในอดีตเป็นแบบ Manual และใช้เวลานาน เนื่องจากเกี่ยวข้องกับเอกสารจำนวนมากและการคำนวณแบบ Manual แต่ยุคดิจิทัล การประมวลผลข้อมูลเป็นแบบอัตโนมัติโดยใช้ซอฟต์แวร์และอัลกอริธึม ทำให้ลดเวลาได้อย่างมาก

ในอดีตการวิเคราะห์ข้อมูล (Data Analysis) จะกระทำผ่านวิธีการทางสถิติและสเปรดชีต ซึ่งเป็นกระบวนการที่ใช้เวลาและแรงงานอย่างมาก แต่ยุคดิจิทัลได้นำเอาเครื่องมือขั้นสูงมาใช้เพิ่ม เช่น Data Visualization Software (ซอฟต์แวร์แสดงภาพข้อมูล)
Machine Learning (การเรียนรู้ของเครื่อง) และ Artificial Intelligence (ปัญญาประดิษฐ์) ทำให้สามารถประมวลผลชุดข้อมูลขนาดใหญ่ได้อย่างรวดเร็ว สวยงาม และให้ข้อมูลเชิงลึก

การรวมข้อมูล (Data Integration)  ในอดีตถือเป็นความท้าทาย และเป็นเรื่องยากที่จะรวมข้อมูลจากแพลตฟอร์มแหล่งต่าง ๆ แต่ในยุคดิจิทัลการรวมข้อมูลจะสะดวก รวดเร็ว และง่ายขึ้นมากโดยการใช้ API  (Application Programming Interface) ที่เป็นซอฟต์แวร์ตัวกลางที่ทำให้ระบบซอฟต์แวร์ต่าง ๆ เชื่อมต่อเข้าหากัน ทั้งการเชื่อมต่อข้อมูลและแพลตฟอร์มบนคลาวด์ และการรวมข้อมูลจากแหล่งต่าง ๆ

กล่าวกันว่าในยุคดิจิทัล “ข้อมูล” ที่มาถูกจังหวะและเวลา “ข้อมูล” จะกลายเป็น “New Oil” ที่สร้างทั้งมูลค่าและคุณค่า

เมื่อข้อมูลมีการผลิตในปริมาณมากจากองค์กรหรือหน่วยต่าง ๆ และแบบส่วนบุคคล ประกอบกับการนำเข้าข้อมูลหรือ การเผยแพร่ข้อมูลก็ทำได้อย่างเสรีไร้ข้อจำกัดซึ่งเป็นผลมาจากความก้าวหน้าของเทคโนโลยีดิจิทัลทั้งซอฟต์แวร์และฮาร์ดแวร์ (ชิป) ส่งผลให้โลกออนไลน์กลายเป็นแหล่งข้อมูล “Big Data” ที่อัดแน่นไปด้วยข้อมูลที่หลากหลายและขนาดใหญ่มากทุกรูปแบบ ทั้งข้อมูลที่มีโครงสร้าง (ฐานข้อมูลและสเปรดชีต) ข้อมูลกึ่งโครงสร้าง (ไฟล์ XML และ JSON) และข้อมูลที่ไม่มีโครงสร้าง (เอกสารข้อความ โพสต์บนโซเชียลมีเดีย และเนื้อหามัลติมีเดียหรือคลิป)

เมื่อข้อมูล (Data) ซึ่งเปรียบเสมือนเป็น “วัตถุดิบ” บนโลกออนไลน์มีปริมาณมหาศาล ซึ่งอาจจะมีคุณภาพหรือไม่มีคุณภาพก็ได้เพราะไม่มีการควบคุมการนำเข้า แต่ข้อมูลเหล่านี้ก็เป็นปัจจัยพื้นฐาน (Foundation) ของการนำไปสร้าง เจน (Generate) หรือเทรน (Train) โดยการป้อนคำสั่งจากมนุษย์ (Human-provided prompts or instructions) ผ่านเทคโนโลยีอันทรงพลังคือ LLM (Large Language Models) ซึ่งเป็นวิธีการหนึ่งที่ทำให้คอมพิวเตอร์ฉลาดผ่านการเรียนรู้ข้อมูล (Machine Learning)

LLM เป็นโมเดลภาษาขนาดใหญ่ ผ่านการจำลองสมองการเรียนรู้ของมนุษย์ (Deep Learning) ทำให้ ‘คาดเดา’ หรือ ‘สร้างคำ’ ภาษาได้เหมือนมนุษย์จริง LLM เปรียบเป็นหลังบ้านของ “Generative AI” (GenAI) ส่วน GenAI ก็คือปัญญาประดิษฐ์ประเภทหนึ่งที่สามารถสร้างข้อมูลหรือเนื้อหาต้นฉบับ เช่น ข้อความ ภาพ เสียง คลิป หรือโค้ด โดยอิงตามข้อมูลคำสั่งของผู้ใช้ ซึ่งในขณะนี้ GenAI มีให้เลือกใช้งานได้หลากหลายค่ายและแบรนด์ขึ้นกับวัตถุประสงค์ของการนำไปใช้ ซึ่งแต่ละค่ายต่างก็กำลังแข่งขันกันอย่างดุเดือดเพื่อครองส่วนแบ่งตลาด

“ข้อมูล” ที่มาจากการสร้าง เจน หรือเทรนด้วย GenAI นับเป็นข้อมูลรูปแบบใหม่ล่าสุดที่เกิดขึ้นในยุคดิจิทัล กำลังเป็นที่สนใจก็เพราะเป็นข้อมูลใหม่ที่สร้างขึ้นจากฐานข้อมูลเก่าบนโลกออนไลน์ด้วยฝีมือมนุษย์ แต่สามารถนำเอามาใช้งานต่อจริงทั้งออนไลน์และออฟไลน์จนสร้างกระแสความตื่นตัวไปทั่วโลก เช่น การเปิดตัวของ ChatGPT แล้วมียอดผู้ใช้งานกว่า 100 ล้านคนในช่วงเวลาอันสั้น หรือการแจกหรือการขาย Prompt เพื่อนำไปสร้างภาพดิจิทัล (สินทรัพย์ดิจิทัล) แล้วนำภาพดิจิทัลที่สร้างจาก GenAI ไปปล่อยขายตามเว็บ เช่น Freepix, Shutterstock, Esty, Adobe Stock ฯลฯ และสร้างรายได้จากการที่มีคนเข้าไปดาวน์โหลดภาพไปใช้งาน

กล่าวได้ว่าพลังของข้อมูลที่ได้จาก GenAI  เป็น “การปฏิวัติทางดิจิทัล” หรือ “การปฏิวัติข้อมูล” ที่มาพร้อมกับอารมณ์และความรู้สึกของผู้คนที่ปนเปทั้ง “ความกลัว” และ “ความกล้า” ไม่แตกต่างกับการปฏิวัติอุตสาหกรรมในอดีต และแม้ว่า GenAI จะมีศักยภาพที่สำคัญในการสร้างมูลค่าและคุณค่าโดยการทำงานอัตโนมัติ สร้างเนื้อหา และขับเคลื่อนนวัตกรรม อย่างไรก็ตาม ยังมีความเสี่ยงที่ GenAI จะถูกนำไปใช้ในทางที่ผิดหรือก่อให้เกิดอันตรายทั้งโดยไม่ได้ตั้งใจและตั้งใจ โดยเฉพาะจากบรรดาเหล่าแฮกเกอร์ “มิจฉาชีพ-AI” อาจนำ GenAI ไปใช้ก่ออาชญกรรมไซเบอร์เพื่อขโมยข้อมูลที่สร้างความเสียหายเฉลี่ยต่อวันไม่ต่ำกว่า 150 ล้านบาท และมีผู้เสียหายหรือผู้ที่ได้รับผลกระทบราว 950-1000 เคสต่อวัน

ไม่ว่าจะยุคสมัยใด “ข้อมูล” จะถูกใช้เป็นเครื่องมือหรืออาวุธเสมอ ข้อมูลจะให้ “คุณ” เมื่อนำไปใช้อย่างถูกต้องและสร้างสรรค์ แต่ข้อมูลจะให้ “โทษ” เช่นกัน เมื่อนำไปใช้ในทางที่ผิดหรือทำลายกัน และที่น่าเห็นอกเห็นใจที่สุดคือ แม้แต่เจ้าของข้อมูลก็ใช่ว่าจะปลอดภัยจากข้อมูลตนเองเช่นกัน!!!