สวัสดีครับสายเทคและเกมเมอร์ทุกคน!
วันนี้มีข่าวใหญ่จาก Google ที่จะทำให้หลายคนร้องว้าว และบางคนอาจจะคิดหนักว่า “อนาคตเราจะเป็นยังไงวะเนี่ย?” นั่นก็คือ Google ได้เปิดตัวโมเดล AI ตัวใหม่ล่าสุดในตระกูล Gemini ที่ชื่อว่า Gemini 2.5 Computer Use ซึ่งความล้ำของมันคือ มันสามารถใช้เว็บเบราว์เซอร์ได้เหมือนเราเด๊ะๆ เลยครับ! เตรียมตัวรับมือกับการเปลี่ยนแปลงครั้งใหญ่ในโลกดิจิทัลได้เลย
ในบทความนี้
Google Gemini 2.5 Computer Use: AI ที่เข้าใจโลกออนไลน์
ปกติแล้ว AI เก่งๆ ของ Google อย่าง Gemini หรือ ChatGPT ที่เราใช้กันเนี่ย ส่วนใหญ่จะทำงานกับข้อมูลที่ป้อนให้ หรือเข้าถึงข้อมูลผ่าน API (Application Programming Interface: ช่องทางเชื่อมต่อที่นักพัฒนาสร้างไว้ให้ระบบต่างๆ คุยกันได้) แต่นี่ไม่ใช่เลยครับ! Gemini 2.5 Computer Use ถูกออกแบบมาให้ “ใช้เบราว์เซอร์” ได้เหมือนคนจริงๆ นั่นแหละครับ
AI ที่คลิก, เลื่อน, พิมพ์ได้เหมือนคุณ!
ลองนึกภาพว่า AI ตัวหนึ่งสามารถเปิด Chrome หรือ Firefox ขึ้นมาเองได้ เลื่อนหน้าจอลงไปอ่านเนื้อหา คลิกปุ่มนั้นปุ่มนี้ พิมพ์ข้อความในช่องค้นหา หรือกรอกฟอร์มออนไลน์ได้เอง นี่คือสิ่งที่ Gemini 2.5 ทำได้เลยครับ! ไม่ต้องมีคนมาคอยกด คอยสั่ง มันทำเองได้หมด
ความเจ๋งคือมันสามารถเข้าถึงข้อมูลที่ปกติแล้วต้องอาศัยสายตาคนอ่าน หรือข้อมูลที่ไม่มี API เปิดให้เข้าถึงตรงๆ ได้ นี่มันเปิดโลกใหม่เลยนะ เพราะแต่ก่อน AI จะมีข้อจำกัดเรื่องนี้เยอะ แต่ตอนนี้มันเหมือนมี “ตา” และ “มือ” เพิ่มมาในการสำรวจโลกอินเทอร์เน็ตเลยครับ ลองคิดดูว่ามันจะเอาไปใช้ประโยชน์อะไรได้บ้างกับการที่มันสามารถทำสิ่งที่ต้องใช้ปฏิสัมพันธ์กับหน้าเว็บได้เหมือนมนุษย์ทุกประการ!
ผลกระทบ AI จะเปลี่ยนอะไรไปจากสังคมเรา?
แน่นอนว่าเทคโนโลยีล้ำๆ แบบนี้จะส่งผลกระทบไปทั่วโลก รวมถึงประเทศไทยด้วยครับ ลองคิดดูว่าธุรกิจต่างๆ จะเอา AI ตัวนี้ไปใช้ทำอะไรได้บ้าง?
ลองจินตนาการว่างานเดิมๆ ที่ต้องใช้คนเข้าไปนั่งคลิก เปิดเว็บ หาข้อมูล เปรียบเทียบราคา กรอกข้อมูลเข้าระบบต่างๆ มันจะถูก AI ตัวนี้ทำแทนได้หมดเลยไหม? เช่น ทีมวิจัยที่ต้องไล่ดูข้อมูลจากหลายๆ เว็บไซต์ ฝ่ายดูแลลูกค้าที่ต้องค้นหาข้อมูลสินค้าจากหน้าเว็บ หรือแม้แต่งานที่ต้องกรอกข้อมูลเข้าระบบราชการออนไลน์ (ที่บางทีก็ซับซ้อนสุดๆ) AI ตัวนี้อาจจะเข้ามาช่วยลดภาระตรงนี้ได้เยอะเลย
สำหรับภาคธุรกิจในไทยที่ยังต้องพึ่งพาแรงงานคนในการทำงานซ้ำๆ เยอะๆ การมี AI แบบนี้เข้ามาช่วย อาจจะทำให้การทำงานมีประสิทธิภาพมากขึ้น ลดต้นทุน และทำให้ธุรกิจเราแข่งขันกับต่างชาติได้ดีขึ้นครับ แต่ในอีกด้านหนึ่งก็ต้องเตรียมรับมือเรื่องการเปลี่ยนแปลงของตลาดแรงงานด้วยนะ บางอาชีพอาจจะต้องปรับตัวกันยกใหญ่เลยล่ะครับ
ความเห็นส่วนตัว: ตื่นเต้นหรือน่ากลัวดี?
ส่วนตัวแล้ว ผมมองว่านี่เป็นอีกก้าวสำคัญของวงการ AI เลยครับ มันเป็นการทำให้ AI เข้าใกล้การ “เข้าใจ” และ “โต้ตอบ” กับโลกดิจิทัลแบบมนุษย์มากขึ้นเรื่อยๆ ด้านหนึ่งก็รู้สึกตื่นเต้นกับศักยภาพอันไร้ขีดจำกัดของมัน ที่จะช่วยให้เราทำอะไรได้อีกเยอะแยะเลย ไม่ว่าจะเป็นการเข้าถึงข้อมูลเชิงลึก การช่วยงานที่เราไม่อยากทำ หรือแม้แต่การสร้างนวัตกรรมใหม่ๆ ที่เราไม่เคยคิดถึงมาก่อน
แต่อีกด้านหนึ่งก็อดคิดไม่ได้ว่า อนาคตข้างหน้าบทบาทของมนุษย์ในบางงานจะหายไปเยอะแค่ไหน? และเราจะต้องปรับตัวยังไง? ที่สำคัญคือเรื่องความปลอดภัยและจริยธรรมในการใช้งาน AI ประเภทนี้ด้วยครับ เพราะมันสามารถเข้าถึงข้อมูลบนหน้าเว็บต่างๆ ได้ง่ายขึ้นมากๆ ถ้าไม่ควบคุมให้ดี อาจเกิดปัญหาข้อมูลส่วนตัวรั่วไหล หรือการใช้งานในทางที่ผิดได้เหมือนกัน
สรุปแล้ว…
Google Gemini 2.5 Computer Use คือนวัตกรรมที่น่าจับตามากๆ มันแสดงให้เห็นว่า AI กำลังพัฒนาไปอย่างก้าวกระโดด และเข้ามามีบทบาทในชีวิตประจำวันของเรามากขึ้นเรื่อยๆ สิ่งที่เราทำได้คือเตรียมตัวให้พร้อม เรียนรู้ที่จะอยู่ร่วมกับมัน และใช้ประโยชน์จากมันให้ดีที่สุดครับ เพื่อที่เราจะได้ก้าวทันโลกที่ไม่เคยหยุดนิ่งใบนี้ แล้วคุณล่ะ คิดว่ายังไงกับ AI ตัวนี้บ้าง?
ที่มา: The Verge