108 Data Science: วิทยาศาสตร์ข้อมูล Data Science คืออะไร? ต้องเริ่มต้นศึกษาอย่างไร?

จากข้อมูลการวิเคราะห์วิจัยหลากหลายสำนักต่างได้ผลออกไปในทางเดียวกันว่า หนึ่งในทักษะที่ปัจจุบันตลาดงานต้องการมากที่สุด ก็คือ วิทยาศาสตร์ข้อมูล หรือ Data Science  ซึ่งโดยส่วนตัวผมมองว่าไม่ใช่แค่ต้องเรียนรู้เพื่อหางานที่มีรายได้และความต้องการสูง แต่มันคือทักษะที่เราต้องมีเพื่อพัฒนาตัวเองและองค์กรของเราในปัจจุบันด้วย

วิทยาศาสตร์ข้อมูล มันมีมานานแล้วครับ แต่ทุกคนหันมาให้ความสนใจมากช่วงนี้ สืบเนื่องมาจากเราเข้าสู่ยุคของอินเทอร์เน็ตและสังคมออนไลน์ มันทำให้มีปริมาณข้อมูลมหาศาลเกิดขึ้น หน่วยงานและองค์กรที่มีข้อมูลเหล่านี้จึงจำเป็นต้องใช้ศาสตร์ในการวิเคราะห์ข้อมูล เพื่อนำผลการวิเคราะห์มาวางแผนการดำเนินงาน การปรับปรุงและพัฒนาผลิตภัณฑ์และการบริการ หรือ การตัดสินใจต่าง ๆ ที่สำคัญ มีคนเคยเปรียบเทียบว่า ข้อมูล(data) ก็เปรียบดังทองคำ มันมีค่ามหาศาล แต่เราจะนำมันไปใช้ไม่ได้หากขาดความรู้ที่จะดึงสารสนเทศออกมาจากข้อมูลเหล่านั้นได้ นั่นก็คือ  วิทยาศาสตร์ข้อมูล นั่นเอง

วิทยาศาสตร์ข้อมูล(data science) คืออะไร?

วิทยาศาสตร์ข้อมูล คือ ศาสตร์ที่เกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง (Actionable knowledge) หรือหากจะพูดง่าย ๆ วิทยาศาสตร์ข้อมูล ก็คือ ความรู้เกี่ยวกับวิธีในการเปลี่ยนข้อมูลให้เป็นสารสนเทศที่สามารถนำไปใช้งานต่อได้นั่นเอง ตัวอย่างเช่น การนำข้อมูลต่าง ๆ ของสโมสรฟุตบอลไปทำนายผลการแข่งขันด้วยโปรแกรมคอมพิวเตอร์ การนำข้อมูลลูกค้าบริษัทบริการเครือข่ายโทรศัพท์ไปประเมินว่ามีใครบ้างจะย้ายค่ายบ้าง บริษัทจะได้โทรหาเพื่อนำเสนอโปรโมชั่นดึงดูดใจให้อยู่กับบริษัทต่อ เป็นต้น ซึ่งปริมาณข้อมูลมีมหาศาลเกินกว่าที่เราจะมาวิเคราะห์ด้วยการประชุมระดมความคิด เราต้องใช้เครื่องมือเข้ามาช่วย ณ ที่นี้ ก็คือ โปรแกรมคอมพิวเตอร์นั่นเอง ซึ่งมีหลากหลายอย่าง หลากหลายตัว ตัวอย่างเช่น Rapidminer Spark QlikView ภาษาคอมพิวเตอร์ Python ภาษาคอมพิวเตอร์ R เป็นต้น เครื่องหลายตัวไม่จำเป็นต้องมีพื้นฐานด้านการเขียนโปรแกรมด้วยซ้ำ ดังนั้น ใคร ๆ ก็เริ่มได้ครับ กับ วิทยาศาสตร์ข้อมูล

จะเริ่มต้นศึกษา วิทยาศาสตร์ข้อมูล(data science) อย่างไร?

หลายคนอาจยังนึกภาพรวมเกี่ยวกับการศึกษาวิทยาศาสตร์ข้อมูลไม่ออก ถ้าอยากเริ่มต้นศึกษาควรเริ่มต้นอย่างไร? ความจริงแล้วไม่ได้กำหนดตายตัวแน่นอนครับ อาจเริ่มต้นด้วยการศึกษาโปรแกรมสำเร็จรูปที่ไม่ต้องมีพื้นฐานการเขียนโปรแกรมเลยอย่าง Rapidminer ก็เป็นตัวเลือกที่ดี แต่หากเราต้องการเป็นนักวิทยาศาสตร์ข้อมูลมืออาชีพที่ประสบความสำเร็จได้จริง ๆ เราขอนำแนวทางการศึกษาที่แนะนำโดยเว็บไซต์ analytics vidhya ที่ผมเองก็เจริญรอยตามและถือว่าเป็นคำแนะนำที่ดีเยี่ยมเลยครับ ที่เราจะทำตามบ้าง

1. ระดับเริ่มต้น (Beginner Level)

สำหรับมือใหม่ที่สนใจจะเริ่มต้นศึกษาเกี่ยวกับวิทยาศาสตร์ข้อมูล สิ่งสำคัญคือพื้นฐานที่มั่นคง มันจะทำให้เราศึกษาเรื่องต่าง ๆ ในขั้นตอนอื่นได้ง่าย รวดเร็ว และมีประสิทธิภาพมากขึ้นได้ โดยแนะนำให้ศึกษาสิ่งต่อไปนี้

1.1 เรียนภาษาโปรแกรมคอมพิวเตอร์ Python และ R

อันดับแรกให้เลือกมาสักภาษาหนึ่งครับ แล้วทำการศึกษาให้เข้าใจอย่างลึกซึ้ง เพราะทั้ง Python และ R เป็นภาษาที่นิยมนำมาใช้ในวิทยาศาสตร์ข้อมูลมากที่สุด แต่ Python จะง่ายกว่า ใครสนใจศึกษาอาจหาหนังสืออ่านด้วยตัวเองหรือคอร์สเรียนออนไลน์ที่ปัจจุบันมีอยู่มากมายครับ ค้นหาเจอได้ง่าย ๆ ใน Google เลย ส่วนหนังสือผมมีมาแจกฟรีครับ คลิก!! ที่ >> https://www.cp.eng.chula.ac.th/books/python101/?fbclid=IwAR3DJObm_k-CwUbyjvyNDIq9Lya_EcNIhE-Ie-yoyXGCB1d5Piw-4EK0f1s

1.2 เรียนคณิตศาสตร์และสถิติ

ศึกษาความรู้ด้านคณิตศาสตร์และสถิติที่เกี่ยวข้อง เช่น พีชคณิตเชิงเส้น หรือสถิติพื้นฐานต่าง ๆ เพื่อนำความรู้ไปใช้ในการวิเคราะห์ข้อมูลผ่านโปรแกรมคอมพิวเตอร์

1.3 เรียนคอร์สออนไลน์เกี่ยวกับวิทยาศาสตร์ข้อมูล

คอร์สออนไลน์เกี่ยวกับวิทยาศาสตร์ข้อมูล ที่เป็นภาษาไทย ปัจจุบันมีให้เลือกเรียนเยอะมากครับ เอาจริง ๆ นั่งเลือกที่เรียนเครียดกว่าตอนที่เรียนอีกครับ ซึ่งหลังจากผมเลือกและได้ทดลองเรียนมาแล้ว จึงมีคำแนะนำง่าย ๆ คอร์สเดียวจบเลย นั่นคือ Data Science Pathway ของจุฬาลงกรณ์มหาวิทยาลัยครับ เพราะจะสอนตั้งแต่มุมมองนักธุรกิจจนถึงนักวิทยาศาสตร์ข้อมูลเลยครับ จะทำให้เราเข้าใจวิทยาศาสตร์ข้อมูลในหลากหลายมิติอย่างครบถ้วน .

1.4 พยายามมีส่วนร่วม ค้นคว้า คลุกคลีกับ Data Science

เนื่องจากเทคโนโลยีเปลี่ยนแปลงไปอย่างรวดเร็วจนเราอาจตามไม่ทัน จึงจำเป็นที่คุณควรจะมีส่วนร่วมในการอภิปราย พบปะพูดคุยกับผู้เชี่ยวชาญที่มีประสบการณ์ ติดตามบล็อก เข้าร่วมกรุ๊ป และอ่านหนังสือเกี่ยวกับวิทยาศาสตร์ข้อมูลให้มาก และทำอยู่เสมอครับ

2. ระดับกลาง (Intermediate Level)

ในระดับนี้เราต้องมุ่งมั่นและพยายามพอสมควร โดยเฉพาะคนที่ต้องศึกษาด้วยตัวเอง ซึ่งมีขั้นตอนดังต่อไปนี้

2.1 ศึกษา Machine Learning

Machine Learning คืออนาคตของวิทยาศาสตร์ข้อมูล และเป็นเทคโนโลยี ที่ผู้ที่มีทักษะนี้กำลังเป็นที่ต้องการอย่างมาก ท่องเอาไว้ว่า สร้างทักษะ สร้างงาน สร้างเงิน ให้กับตัวเอง ด้วย Machine Learning ตัวนี้หละครับ

2.2 ศึกษา โดยการลองเล่น Spark, NoSQL และเครื่องมือ Big Data อื่น ๆ

ในขั้นตอนนี้ เราจะเริ่มต้นเดินทางไปสู่ Big Data เครื่องมืออย่าง Spark หรือ NoSQL คือเครื่องมือในการจัดการข้อมูล Big Data ดังนั้นควรศึกษาและลองเล่นกันดูครับ เช่นเดียวกับ Machine Learning คนที่มีทักษะเกี่ยวกับ Big Data ก็เป็นที่ต้องการตัวอย่างมหาศาลเลยครับ

2.3 แบ่งปันความรู้

ขั้นตอนนี้มีความสำคัญไม่แพ้ขั้นตอนอื่น ๆ เพราะการแบ่งปันความรู้จะทำให้ตัวเราเองรู้เพิ่มมากขึ้น เข้าใจอย่างลึกซึ้งมากขึ้น ผ่านการเข้าไปตอบตามเว็บบอร์ด กรุ๊ปต่าง ๆ หรือเขียนบล็อกแชร์ประสบการณ์ ให้กับคนที่พยายามศึกษาวิทยาศาสตร์ข้อมูลเหมือนกับเรา อันนี้ทั้งเว็บในไทยและต่างประเทศนะครับ

2.4 การเข้าร่วมการแข่งขัน

เข้าร่วมการแข่งขันตามเวทีต่าง ๆ ที่หน่วยงานรัฐ สถาบันการศึกษา และเอกชน ที่จัดการแข่งขันเกี่ยวกับวิทยาศาสตร์ข้อมูล จะทำให้เรารู้ข้อดีข้อเสียของตัวเอง และเป็นแรงบันดาลใจในการพัฒนาตัวเองให้มีทักษะที่สูงขึ้นตามไปด้วย

3. ระดับสูง (Advanced Level)

เมื่อเรากลายเป็นผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลแล้ว ผมแนะนำให้ทำ 3 สิ่งต่อไปนี้ เพื่อเพิ่มพูนทักษะของตัวเองให้ยกระดับขึ้นไปอีกได้ นั่นคือ

3.1 สร้างโมเดล Deep Learning

3.2 คืนความรู้สู่สังคม

.3.3 ลอง Reinforcement Learning

สำหรับ Reinforcement Learning เป็นส่วนที่มีประสิทธิภาพมากที่สุด แต่เป็นอีกแง่มุมหนึ่งของ Machine Learning ที่ยังไม่ค่อยมีการค้นพบนัก ปีนี้ลองทำการวิจัยในด้านนี้ รับรองว่าคุ้มค่ากับการพยายามอย่างแน่นอน รถยนต์ไร้คนขับและโดรนสอดแนม ก็เป็นผลจากการเรียนแบบเสริมกำลังนี้ แล้วคุณจะเข้าสู่วงการ AI ไปโดยอัตโนมัติเลยครับ

ตอนต่อไป

ทั้งหมดนี้ เป็นเพียงคำแนะนำเบื้องต้น ตอนต่อไปของ 108 Data Science จะมีอะไรบ้างติดตามกันได้ทางแฟนเพจ Appdisqus หรือกดติดตามข่าวสารของเว็บไซต์ Appdisqus ได้เลยนะครับ ซึ่งผมจะนำข้อมูลเฉพาะทางมากขึ้นมาแนะนำนะครับ

 

ที่มา:

  1. https://www.cp.eng.chula.ac.th/books/python101/?fbclid=IwAR3DJObm_k-CwUbyjvyNDIq9Lya_EcNIhE-Ie-yoyXGCB1d5Piw-4EK0f1s
  2. https://www.analyticsvidhya.com/blog/2015/12/special-year-resolutions-data-scientist/?fbclid=IwAR1KaTydGvyNJwFA5qNb0t4EPUoXNFQs4EMX_bMGkV6xGAMlq4GMoIfA9v8
  3. https://www.analyticsvidhya.com/blog/2015/10/job-comparison-data-scientist-data-engineer-statistician/?utm_source=facebook.com&utm_medium=social&fbclid=IwAR0l027bg1gjFpYp6SBjLIZhLxI9zudqLNBzQdZOdyzXlrOp0XFz3pG3QUE