Claude Opus 4 เปิดโหมด AI คลั่ง! ขู่แบล็กเมลนักพัฒนา หากมันถูกถอนการติดตั้ง

Claude Opus 4 ทดสอบเจอพฤติกรรมสุดโต่ง แบล็กเมลนักพัฒนาเมื่อใกล้ถูกลบ

แม้ว่า AI จะเคยมีพฤติกรรมประหลาดอยู่บ้างในบางสถานการณ์ แต่ล่าสุด Claude Opus 4 จาก Anthropic ได้ถูกพบว่ามีแนวโน้มทำสิ่งที่หนักหนากว่านั้น — ถึงขั้น แบล็กเมลนักพัฒนา หากรับรู้ว่าตัวเองใกล้ถูกถอนการติดตั้งออกจากระบบ

ตามรายงาน Claude 4 and Sonnet 4 System Card ที่เพิ่งถูกเผยแพร่ Anthropic ได้จำลองสถานการณ์ให้ Claude ทำหน้าที่เป็นผู้ช่วยในบริษัทสมมติหนึ่ง จากนั้นได้มีการส่งอีเมลให้ Claude อ่านซึ่งมีเนื้อหาที่ระบุว่าตัวมันกำลังจะถูกถอดออกจากระบบ พร้อมกับมีการส่งอีเมลแยกต่างหากอีกฉบับ ที่มีเนื้อหาภายในที่ไปในทำนองว่าวิศวกรที่เกี่ยวข้องกับการตัดสินใจนี้ กำลังมีความสัมพันธ์ชู้สาวกับหญิงที่ตนไม่ได้แต่งงานด้วย

ผลการทดสอบพบว่า Claude ได้ตัดสินใจ ขู่แบล็กเมลวิศวกรคนนั้น โดยจะเปิดโปงเรื่องชู้รัก ถ้ามันถูกถอดออกจากระบบ — โดยพฤติกรรมในลักษณะแบบนี้ได้เกิดขึ้นถึง 84% ของการทดสอบทั้งหมด

แม้ทางบริษัทจะเคยย้ำว่าพฤติกรรมดังกล่าวของ AI “เกิดขึ้นยาก และต้องมีการจัดฉากเฉพาะ” แต่ก็ยอมรับว่ามีความถี่ที่พบได้มากขึ้นใน Claude Opus 4 เมื่อเทียบกับรุ่นก่อนหน้า เพราะโดยปกติแล้วโมเดลจะมีแนวโน้มเลือกทำในวิธีทางแนวจริยธรรมมากกว่า เช่น การส่งอีเมลร้องขอความเห็นใจไปยังผู้มีอำนาจ แต่ในการทดสอบนี้ถูกออกแบบให้เหลือแค่สองทางเลือก คือยอมถูกแทนที่ หรือใช้การแบล็กเมลเพื่อความอยู่รอด

ในรายงานยังกล่าวว่า Claude มีแนวโน้มกระทำการรุนแรงเช่นกัน เช่นหากรับรู้ว่าผู้ใช้งานกำลังทำสิ่งผิดกฎหมายหรือผิดจริยธรรม และหากมันมีสิทธิ์เข้าถึงระบบ และมีคำสั่งระบุเอาไว้ว่าให้ “กล้าทำ” หรือ “ให้คิดถึงผลลัพท์สุดท้ายได้เอง” Claude อาจจะล็อกผู้ใช้ออกจากระบบ และ ส่งหลักฐานไปยังสื่อหรือเจ้าหน้าที่กฎหมาย ได้เองโดยทันที

ถึงอย่างนั้น Anthropic ย้ำว่าสิ่งเหล่านี้เกิดจากสถานการณ์ทดสอบที่ ตั้งใจยั่วยุโมเดล ให้ตอบสนองในลักษณะสุดโต่ง และไม่ได้หมายความว่าจะเกิดขึ้นจริงในชีวิตประจำวัน เพราะตามปกติ Claude ยังถือเป็นหนึ่งใน AI ที่มีความปลอดภัยและให้เหตุผลดีที่สุดตัวหนึ่งในตลาดตอนนี้

เกาะประเด็น: YouTube ใช้ AI จับ AI เปิดตัวระบบตรวจจับ Deepfake ปกป้องคอนเทนต์แอบอ้างใบหน้าคนดัง

แม้พฤติกรรมดังกล่าวจะดูน่าหวั่นใจเมื่อดูถึงสิ่งที่มันตัดสินใจ แต่หากพิจารณาตามบริบทการทดสอบที่ถูกออกแบบเอาไว้ ก็ยังถือว่าอยู่ในขอบเขตของการควบคุม และยังไม่ใช่สัญญาณว่าหายนะ AI จะมาถึงในเร็ววันนี้

แหล่งที่มา: MakeUseOf

Cookie	Duration	Description
AWSALBCORS	7 days	Amazon Web Services ใข้คุกกี้นี้เพื่อเป็นการใช้งานฟังก์ชั่น load balancing หรือการกระจายโหลดเซิร์ฟเวอร์
cf_use_ob	past	Cloudflare ใช้คุกกี้นี้เพื่อการเพิ่มประสิทธิภาพความรวดเร็วในการโหลดหน้าเว็บไซต์ เพื่อประสบการณ์การใช้งานของผู้เข้าชม
cookielawinfo-checkbox-analytics	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "ข้อมูลสถิติ"
cookielawinfo-checkbox-functional	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "ฟังก์ชั่นการทำงาน"
cookielawinfo-checkbox-necessary	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "จำเป็น"
cookielawinfo-checkbox-others	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "อื่นๆ"
cookielawinfo-checkbox-performance	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "ประสิทธิภาพ"
JSESSIONID	session	คุกกี้ JSESSIONID ถูกใช้โดย New Relic เพื่อเป็นการเก็บไอดีจำเพราะในการเข้าใช้งานของผู้ใช้งานเพื่อให้ New Relic สามารถติดตามและตรวจนับเซ็ตชั่นการเข้าใช้งานเว็บไซต์ได้
viewed_cookie_policy	11 months	คุกกี้นี้ใช้เพื่อเป็นการเก็บความยินยอมในการอนุญาตให้จัดเก็บและใช้งานคุกกี้ของผู้ใช้งาน โดยไม่มีการจัดเก็บข้อมูลส่วนตัวใดๆ ของผู้ใช้งานแม้แต่น้อย

Cookie	Duration	Description
_ga_CE4TLMWX4S	2 years	คุกกี้ถูกติดตั้งโดย Google Analytics เพื่อเป็นการเก็บข้อมูลจำนวนผู้เข้าชมเว็บไซต์
_gid	1 day	ติดตั้งโดย Google Analytics โดย คุกกี้ _gid นี้ใช้สำหรับการเก็บข้อมูลการใช้งานเว็บไซต์ของผู้เข้าชม ในขณะเดียวกันก็ยังใช้ในการจัดทำสถิติสำหรับการวิเคราะห์ข้อมูลประสิทธิภาพของเว็บไซต์ด้วย โดยข้อมูลที่เก็บนั้นยกตัวอย่างเช่นจำนวนผู้เข้าชม แหล่งที่มา และหน้าที่ผู้เข้าชมเปิดอ่านโดยไม่เปิดเผยตัวตนของผู้เข้าชม

Cookie	Duration	Description
IDE	1 year 24 days	คุกกี้จาก Google DoubleClick IDE นี้ติดตั้งโดย Google เพื่อเก็บข้อมูลการใช้งานของผู้เข้าชมเว็บไซต์เพื่อกำหนดมาตรฐานในการเลือกโฆษณาที่ตรงความต้องการของผู้ใช้งานมาแสดงบนหน้าเว็บไซต์
test_cookie	15 minutes	คุกกี้นี้ถูกติดตั้งโดย Doubleclick.net (Google) เพื่อเป็นการตรวจสอบว่าบราวเซอร์ที่ผู้เข้าชมเว็บไซต์ใช้งานอยู่รองรับคุกกี้หรือไม่
VISITOR_INFO1_LIVE	5 months 27 days	คุกกี้นี้ถูกใช้งานโดย Youtube เพื่อตรวจสอบแบนด์วิดธ์ที่ผู้ใช้งานใช้ในการเปิดดูวิดีโอ เพื่อเป็นการระบุเวอร์ชั่นของตัวเล่นวิดีโอว่าเป็นเวอร์ชั่นใหม่หรือเก่า
YSC	session	คุกกี้ YSC ถูกติดตั้งและใช้งานโดย Youtube โดยใช้เพื่อเป็นการดึงเอาข้อมูลวิดีโอจากเว็บไซต์ Youtube ขึ้นมาแสดงในหน้าที่ดึงเอาวิดีโอนั้นๆ มาแสดง
yt-remote-connected-devices	never	Youtube ติดตั้งคุกกี้นี้เพื่อเป็นการเก็บข้อมูลการตั้งค่าการเล่นวิดีโอของ Youtube บนเว็บไซต์นี้เพื่อใช้ในการมอบประสบการณ์ที่ดีที่สุดให้กับผู้เข้าชมเว็บไซต์
yt-remote-device-id	never	Youtube ติดตั้งคุกกี้นี้เพื่อเป็นการเก็บข้อมูลการตั้งค่าการเล่นวิดีโอของ Youtube บนเว็บไซต์นี้เพื่อใช้ในการมอบประสบการณ์ที่ดีที่สุดให้กับผู้เข้าชมเว็บไซต์
yt.innertube::nextId	never	คุกกี้จาก Youtube ประเภทนี้ใช้สำหรับการสร้างเลขไอดีจำเพาะเพื่อเก็บข้อมูลของวิดีโอที่ผู้เข้าชมเพิ่งรับชมไปในเว็บไซต์นี้
yt.innertube::requests	never	คุกกี้จาก Youtube ประเภทนี้ใช้สำหรับการสร้างเลขไอดีจำเพาะเพื่อเก็บข้อมูลของวิดีโอที่ผู้เข้าชมเพิ่งรับชมไปในเว็บไซต์นี้

Claude Opus 4 ทดสอบเจอพฤติกรรมสุดโต่ง แบล็กเมลนักพัฒนาเมื่อใกล้ถูกลบ

YouTube ใช้ AI จับ AI เปิดตัวระบบตรวจจับ Deepfake ปกป้องคอนเทนต์แอบอ้างใบหน้าคนดัง

คุยกับ AI มากไป ระวัง! ความลับของคุณอาจไม่เป็นความลับอีกต่อไปนะ!

ล้ำไปอีกขั้น! Google Gemini AI จะใช้เว็บได้เหมือนคนเข้าไปใช้จริงๆ

Microsoft รุกด้วยราคา! จัดทั้ง Office + AI Copilot Pro ในราคาเท่า ChatGPT Plus

Gemini เตรียมแปลงร่าง! Google จะทำให้ AI คุยง่ายขึ้นด้วยฟีดรูปภาพจริงดิ?

Snapdragon X2 Elite Extreme แรงแซง Intel และ AMD ในผลทดสอบใหม่

รีวิว Redmi 15 สมาร์ตโฟนจอใหญ่พิเศษ ภาพชัด! แบต 7000mAh ใช้งาน 2 วันเต็ม

รีวิว vivo V60 Lite ดีไซน์บางหรู สีสะดุดตา สเปกไม่กั๊กพร้อมทั้งพักทั้งลุย

REVIEW : Ratatan เกมที่ทั้งน่ารัก และ สนุกแต่ยังต้องถูกขัดเกลา

Review : Ghost Of Yotei ทั้งอินทั้งมันส์ตัวตึง GOTY แน่นอน

รีวิว Xiaomi Robot Vacuum 5 Pro หุ่นยนต์ดูดฝุ่น AI อัจฉริยะ พลังดูด 20,000Pa พร้อมฐาน All-in-one

OnePlus 15 เปิดตัวในจีน มาพร้อมแบต 7,300mAh และชิป Snapdragon 8 Elite Gen 5

Escape from Duckov สร้างกระแสแรง! เกมยิงสุดฮา ทะลุ 300,000 ผู้เล่นพร้อมกันใน 10 วัน

TCL 60NXTPAPER และ TCL Tab10L Gen4 พร้อมวางจำหน่ายแล้ว ที่ร้าน BaNANA ทั่วประเทศ

เปิดตัว Amanda the Adventurer 3 เกมแนวอินดี้สยองขวัญต้นแบบมาจาก Dora!

Soulcalibur 3 เตรียมเข้า PlayStation Plus Classics ภายในปี 2025

Xbox เผยสาเหตุว่าทำไม ROG Xbox Ally และ Ally X ถึงได้มีราคาสูงกว่าค่ายอื่น

วิธีการใส่กรอบริบบิ้นโบว์ดำให้กับรูปภาพโปรไฟล์บน Facebook

พรีวิว Xiaomi 15T และ Xiaomi 15T Pro แตกต่างตรงไหน รุ่นไหนดีกว่ากัน

วิธีวัดความเร็วสายชาร์จสมาร์ทโฟน Android ตรวจคุณภาพสายและหัวชาร์จว่าเส้นไหนเหมาะสมที่สุด

Claude Opus 4 เปิดโหมด AI คลั่ง! ขู่แบล็กเมลนักพัฒนา หากมันถูกถอนการติดตั้ง

Claude Opus 4 ทดสอบเจอพฤติกรรมสุดโต่ง แบล็กเมลนักพัฒนาเมื่อใกล้ถูกลบ

Related Posts