Xiaomi เปิดตัว MiMo V2.5 รวม AI พูดฉลาดและฟังเก่ง ไว้ในระบบเดียว

Xiaomi เปิดตัว MiMo-V2.5-TTS และ MiMo-V2.5-ASR ชุดโมเดลเสียงแบบครบวงจรที่รวมทั้งการ “พูด” และ “ฟัง” ของ AI ไว้ในระบบเดียว รองรับการใช้งานยุค AI ผู้ช่วยอัจฉริยะที่ต้องโต้ตอบได้สมจริง เข้าใจหลายภาษา หลายสำเนียง และทำงานในสภาพแวดล้อมจริงได้ดีขึ้น

การอัปเดตนี้ต่อยอดจาก MiMo-V2-TTS ที่เปิดตัวในเดือนมีนาคม โดยขยายจากระบบสังเคราะห์เสียง ไปสู่ voice pipeline แบบเต็มรูปแบบ ซึ่ง Xiaomi เรียกว่า “full-link voice model” เพื่อทำหน้าที่เป็นผู้ช่วยอัจฉริยะ ซึ่งจะรับคำสั่งเรา สนทนากับเรา ตอบสนองและทำงานให้ผู้ใช้ได้มากขึ้น

ฝั่งสร้างเสียง “พูด” (Text-to-Speech) Xiaomi เปิดตัว 3 โมเดลหลัก ได้แก่

โมเดลพื้นฐาน MiMo-V2.5-TTS รองรับการปรับความเร็ว น้ำเสียง อารมณ์ และสไตล์การพูดละเอียดขึ้น
ขณะที่ MiMo-V2.5-TTS-VoiceDesign สามารถสร้างโทนเสียงใหม่จากประโยคตัวอย่างสั้นๆ
ส่วน MiMo-V2.5-TTS-VoiceClone เน้นโคลนเสียงต้นฉบับจากตัวอย่างเพียงไม่กี่ชุด พร้อมรักษาเอกลักษณ์เสียงแม้เปลี่ยนสไตล์การพูด

ด้านระบบ “ฟัง” หรือ Automatic Speech Recognition (ASR) Xiaomi เปิดซอร์ส MiMo-V2.5-ASR พร้อมน้ำหนักโมเดลและโค้ดให้ใช้งานได้โดยตรง รองรับการใช้งานจริงในสภาพแวดล้อมซับซ้อน เช่น เสียงรบกวนสูง การประชุมหลายคนพูดพร้อมกัน หรือการรับเสียงระยะไกล

หนึ่งในจุดเด่นคือการสั่งงานด้วยภาษาธรรมชาติ ผู้ใช้ไม่จำเป็นต้องตั้งค่าพารามิเตอร์ซับซ้อน แต่สามารถบอก AI ได้ตรงๆ เช่นให้พูดแบบจริงจัง อ่อนโยน หรือเหมือนนักพากย์ นอกจากนี้ยังรองรับการเขียนสคริปต์หลายชั้นสำหรับงานซับซ้อนอย่างตัวละครเกมหรือออดิโอดรามา โดยปรับบุคลิก ฉาก และบทสนทนาแยกกันได้โดยคงความต่อเนื่องของเสียง

เกาะประเด็น: ศึกเรือธงเดือด! Apple, Huawei, Xiaomi, vivo และ OPPO จ่อเปิดตัวพร้อมกันเดือนกันยายน

Xiaomi ยังเพิ่มระบบ inline audio tags สำหรับฝังคำสั่งควบคุมอารมณ์หรือวิธีเปล่งเสียงไว้ในข้อความเดียว รองรับทั้งภาษาจีนและอังกฤษ ช่วยให้การพากย์หรือสร้างบทสนทนาสมจริงขึ้น

ในโมเดลยังรองรับหลายสำเนียงของภาษาจีนที่ต่างกันด้วย เช่น Wu, Cantonese, Minnan และ Sichuanese รวมถึงรองรับบทสนทนาสลับจีน-อังกฤษ (Code-Switching) ได้โดยไม่ต้องระบุภาษาไว้ล่วงหน้า อีกทั้งยังถอดเสียงเนื้อเพลงได้แม้มีดนตรีประกอบ

อีกจุดที่น่าสนใจคือระบบแยกผู้พูดในบทสนทนาซ้อนทับ และการใส่เครื่องหมายวรรคตอนอัตโนมัติตามเสียงและบริบท ทำให้ข้อความที่ถอดออกมาแทบพร้อมใช้งานทันที ลดงาน post-processing ลงได้มาก

Xiaomi ระบุว่าโมเดลทำผลลัพธ์ระดับ state-of-the-art หรือใกล้เคียงแนวหน้าของวงการในหลาย benchmark โดยเฉพาะด้านการรู้จำสองภาษา สำเนียง และสถานการณ์สลับภาษา

ภาพรวมการเปิดตัวครั้งนี้ทำให้รู้ว่า Xiaomi ไม่ได้มอง AI แค่ฟีเจอร์บนสมาร์ตโฟน แต่กำลังวางรากฐานด้าน voice infrastructure สำหรับทำหน้าที่เป็น AI Agent ในอนาคต ไม่ว่าจะใช้กับผู้ช่วยอัจฉริยะ อุปกรณ์ IoT หุ่นยนต์ คอนเทนต์เสียง หรือแอปพลิเคชันสนทนาแบบใหม่ ซึ่งจะต่อยอดถูกใช้ได้อีกมากมายในอนาคต

gizmochina

Cookie	Duration	Description
AWSALBCORS	7 days	Amazon Web Services ใข้คุกกี้นี้เพื่อเป็นการใช้งานฟังก์ชั่น load balancing หรือการกระจายโหลดเซิร์ฟเวอร์
cf_use_ob	past	Cloudflare ใช้คุกกี้นี้เพื่อการเพิ่มประสิทธิภาพความรวดเร็วในการโหลดหน้าเว็บไซต์ เพื่อประสบการณ์การใช้งานของผู้เข้าชม
cookielawinfo-checkbox-analytics	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "ข้อมูลสถิติ"
cookielawinfo-checkbox-functional	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "ฟังก์ชั่นการทำงาน"
cookielawinfo-checkbox-necessary	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "จำเป็น"
cookielawinfo-checkbox-others	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "อื่นๆ"
cookielawinfo-checkbox-performance	11 months	คุกกี้นี้จัดเก็บความยินยอมของผู้ใช้งานให้กับคุกกี้ในหมวดประเภท "ประสิทธิภาพ"
JSESSIONID	session	คุกกี้ JSESSIONID ถูกใช้โดย New Relic เพื่อเป็นการเก็บไอดีจำเพราะในการเข้าใช้งานของผู้ใช้งานเพื่อให้ New Relic สามารถติดตามและตรวจนับเซ็ตชั่นการเข้าใช้งานเว็บไซต์ได้
viewed_cookie_policy	11 months	คุกกี้นี้ใช้เพื่อเป็นการเก็บความยินยอมในการอนุญาตให้จัดเก็บและใช้งานคุกกี้ของผู้ใช้งาน โดยไม่มีการจัดเก็บข้อมูลส่วนตัวใดๆ ของผู้ใช้งานแม้แต่น้อย

Cookie	Duration	Description
_ga_CE4TLMWX4S	2 years	คุกกี้ถูกติดตั้งโดย Google Analytics เพื่อเป็นการเก็บข้อมูลจำนวนผู้เข้าชมเว็บไซต์
_gid	1 day	ติดตั้งโดย Google Analytics โดย คุกกี้ _gid นี้ใช้สำหรับการเก็บข้อมูลการใช้งานเว็บไซต์ของผู้เข้าชม ในขณะเดียวกันก็ยังใช้ในการจัดทำสถิติสำหรับการวิเคราะห์ข้อมูลประสิทธิภาพของเว็บไซต์ด้วย โดยข้อมูลที่เก็บนั้นยกตัวอย่างเช่นจำนวนผู้เข้าชม แหล่งที่มา และหน้าที่ผู้เข้าชมเปิดอ่านโดยไม่เปิดเผยตัวตนของผู้เข้าชม

Cookie	Duration	Description
IDE	1 year 24 days	คุกกี้จาก Google DoubleClick IDE นี้ติดตั้งโดย Google เพื่อเก็บข้อมูลการใช้งานของผู้เข้าชมเว็บไซต์เพื่อกำหนดมาตรฐานในการเลือกโฆษณาที่ตรงความต้องการของผู้ใช้งานมาแสดงบนหน้าเว็บไซต์
test_cookie	15 minutes	คุกกี้นี้ถูกติดตั้งโดย Doubleclick.net (Google) เพื่อเป็นการตรวจสอบว่าบราวเซอร์ที่ผู้เข้าชมเว็บไซต์ใช้งานอยู่รองรับคุกกี้หรือไม่
VISITOR_INFO1_LIVE	5 months 27 days	คุกกี้นี้ถูกใช้งานโดย Youtube เพื่อตรวจสอบแบนด์วิดธ์ที่ผู้ใช้งานใช้ในการเปิดดูวิดีโอ เพื่อเป็นการระบุเวอร์ชั่นของตัวเล่นวิดีโอว่าเป็นเวอร์ชั่นใหม่หรือเก่า
YSC	session	คุกกี้ YSC ถูกติดตั้งและใช้งานโดย Youtube โดยใช้เพื่อเป็นการดึงเอาข้อมูลวิดีโอจากเว็บไซต์ Youtube ขึ้นมาแสดงในหน้าที่ดึงเอาวิดีโอนั้นๆ มาแสดง
yt-remote-connected-devices	never	Youtube ติดตั้งคุกกี้นี้เพื่อเป็นการเก็บข้อมูลการตั้งค่าการเล่นวิดีโอของ Youtube บนเว็บไซต์นี้เพื่อใช้ในการมอบประสบการณ์ที่ดีที่สุดให้กับผู้เข้าชมเว็บไซต์
yt-remote-device-id	never	Youtube ติดตั้งคุกกี้นี้เพื่อเป็นการเก็บข้อมูลการตั้งค่าการเล่นวิดีโอของ Youtube บนเว็บไซต์นี้เพื่อใช้ในการมอบประสบการณ์ที่ดีที่สุดให้กับผู้เข้าชมเว็บไซต์
yt.innertube::nextId	never	คุกกี้จาก Youtube ประเภทนี้ใช้สำหรับการสร้างเลขไอดีจำเพาะเพื่อเก็บข้อมูลของวิดีโอที่ผู้เข้าชมเพิ่งรับชมไปในเว็บไซต์นี้
yt.innertube::requests	never	คุกกี้จาก Youtube ประเภทนี้ใช้สำหรับการสร้างเลขไอดีจำเพาะเพื่อเก็บข้อมูลของวิดีโอที่ผู้เข้าชมเพิ่งรับชมไปในเว็บไซต์นี้

ศึกเรือธงเดือด! Apple, Huawei, Xiaomi, vivo และ OPPO จ่อเปิดตัวพร้อมกันเดือนกันยายน

POCO X8 ผ่าน กสทช. ไทยแล้ว จ่อเปิดตัวเร็ว ๆ นี้ พร้อมแบต 9,000mAh

REDMI 17 4G หลุดภาพเรนเดอร์ใหม่ ดีไซน์ปรับโฉม พร้อมแบตฯ 7,500mAh

ลือ Xiaomi 18 Ultra เสี่ยงถูกยกเลิก ขณะที่ OPPO และ vivo ยังเดินหน้ามือถือ Ultra รุ่นใหม่

Xiaomi EV เผยโฉม ‘SkyNomad’ ซีรีส์รถยนต์ SUV พื้นที่กว้างสุดอัจฉริยะ ปรับเปลี่ยนฟังก์ชันได้ดั่งใจ

รีวิว Xiaomi Watch 5 สมาร์ตวอทช์ Wear OS ที่ใช้งานลงตัว แบตอึดเกินคาด พร้อมฟีเจอร์สุขภาพครบ

รีวิว Xiaomi Watch 5 สมาร์ตวอทช์ Wear OS ที่ใช้งานลงตัว แบตอึดเกินคาด พร้อมฟีเจอร์สุขภาพครบ

รีวิว OPPO Enco Air5 หูฟัง ANC 52dB ใส่สบาย ฟีเจอร์จัดเต็ม คุ้มเกินในราคาไม่ถึง 2,000.-

รีวิว OPPO Reno16 5G และ Reno16 F 5G อัปเกรดกล้อง 50MP รอบตัว พร้อม OPPO Bubble ตัวช่วยเซลฟี่สุดเทรนดี้

รีวิว ACEFAST Z9 สเตชั่นชาร์จไร้สาย + USB 6-in-1 80W ตัวจบสำหรับโต๊ะทำงานและสายเดินทาง

รีวิว Lenovo Idea Tab Pro Gen 2 แท็บเล็ต Android ครบเครื่องที่สุดในงบ 20,000 บาท

Honor Robot Phone ประกาศเปิดตัว 12 สิงหาคม พร้อมปล่อยคลิปแกะกล่อง

vivo X300 E เปิดตัวในจีน ชู Zeiss Camera พร้อม Snapdragon 8 Gen 5 แบต 7,200mAh

OPPO ยืนยัน A7 Pro Max ชูแบตเตอรี่ใหญ่ที่สุดของแบรนด์ที่เคยทำมา 10,000mAh

CXMT ผู้ผลิตชิปหน่วยความจำ DRAM ของจีน เข้าตลาดหุ้นวันแรกพุ่งกว่า 500% ขึ้นแท่นบริษัทมูลค่าสูงสุดในจีน

ศึกเรือธงเดือด! Apple, Huawei, Xiaomi, vivo และ OPPO จ่อเปิดตัวพร้อมกันเดือนกันยายน

iQOO 15 Ultra ผ่านรับรอง EEC จ่อเปิดตัวตลาดโลก พร้อมสเปกเกมมิ่งตัวท็อป

Windows 11 26H2 อัปเดตใหญ่ปี 2026 ใกล้มาแล้ว เช็ก 10 เรื่องสำคัญก่อนอัปเกรด

Lenovo เปิดตัว LOQ 17 รุ่นใหม่ ใช้ RTX 5070 12GB VRAM เล่นเกม AAA ลื่นกว่าเดิม

รีวิว Samsung Galaxy Buds Core หูฟัง ANC ตัวประหยัด เสียงชัด แบตอึด รองรับ Galaxy AI

Xiaomi เปิดตัว MiMo V2.5 รวม AI พูดฉลาดและฟังเก่ง ไว้ในระบบเดียว

Related Posts