oogle เปิดตัว Gemini Omni โมเดล AI รุ่นใหม่ที่รวมความสามารถด้านการให้เหตุผลเข้ากับการสร้างสรรค์คอนเทนต์ โดยสามารถรับอินพุตได้ทั้งภาพ เสียง วิดีโอ และข้อความ แล้วสร้างวิดีโอคุณภาพสูงที่อิงความรู้โลกจริงของ Gemini ได้ทันที ผู้ใช้ยังสามารถแก้ไขวิดีโอผ่านการสนทนาแบบธรรมชาติได้แบบต่อเนื่อง รุ่นแรกที่เปิดตัวคือ Gemini Omni Flash ซึ่งเริ่มใช้งานได้แล้วใน Gemini App, Google Flow และ YouTube Shorts
Gemini Omni: จุดรวมของ “การคิด” และ “การสร้าง”
Google ระบุว่า Omni คือก้าวต่อไปของ Gemini หลังจากปีที่แล้ว Nano Banana นำความสามารถด้านภาพมาสู่ผู้ใช้จำนวนมาก Omni ถูกออกแบบให้เป็นโมเดลที่ “สร้างอะไรก็ได้จากทุกอินพุต” โดยเริ่มจากวิดีโอ
ผู้ใช้สามารถป้อนภาพ เสียง วิดีโอ หรือข้อความ แล้วให้ Omni สร้างวิดีโอใหม่ที่มีความสมจริง grounded ด้วยความรู้โลกจริงของ Gemini เช่น ฟิสิกส์ วัฒนธรรม ประวัติศาสตร์ หรือบริบททางสังคม
แก้ไขวิดีโอด้วยการพูดคุย — ทุกคำสั่งต่อยอดจากคำสั่งก่อนหน้า
หนึ่งในความสามารถเด่นคือการแก้ไขวิดีโอด้วยภาษาธรรมชาติ เช่น
- เปลี่ยนวัตถุในฉาก
- เพิ่มตัวละคร
- ปรับสภาพแวดล้อม
- เปลี่ยนสไตล์ภาพ
- แก้รายละเอียดเฉพาะจุด
Omni จะรักษาความต่อเนื่องของฉาก ตัวละคร และฟิสิกส์ของวัตถุ ทำให้การแก้ไขหลายรอบยังคงความสมจริงเหมือนเดิม
สร้างวิดีโอที่ “เข้าใจฟิสิกส์” และ “เข้าใจความหมาย” มากขึ้น
Omni ไม่ได้แค่สร้างภาพที่ดูเหมือนจริง แต่ยัง “เข้าใจ” ว่าฉากควรเกิดอะไรขึ้นต่อ เช่น
- การเคลื่อนที่ของวัตถุตามแรงโน้มถ่วง
- พลังงานจลน์
- การไหลของของเหลว
- ความสัมพันธ์ของวัตถุในโลกจริง
นอกจากนี้ Omni ยังเชื่อมโยงความรู้เข้ากับภาพ เช่น การสร้างวิดีโออธิบายวิทยาศาสตร์แบบ claymation หรือการสร้างลำดับภาพตามตัวอักษร A–Z ด้วยไอเท็มที่สอดคล้องกับแต่ละตัวอักษร

สร้างวิดีโอจากอินพุตหลายแบบพร้อมกัน
Omni สามารถรับอินพุตหลายชนิดพร้อมกัน เช่น
- ภาพตัวละคร
- วิดีโออ้างอิง
- ไฟล์เสียง
- คำบรรยาย
แล้วรวมทั้งหมดเป็นวิดีโอเดียวที่สอดคล้องกัน เช่น สร้างวิดีโอไซไฟโดยใช้ภาพหนึ่งใบ วิดีโอหนึ่งคลิป และเพลงหนึ่งไฟล์เป็นต้นแบบ

สร้างวิดีโอด้วย “อวาตาร์ดิจิทัล” ของตัวเอง
Google เปิดให้ผู้ใช้สร้างวิดีโอด้วย Avatar ซึ่งเป็นเวอร์ชันดิจิทัลของตัวเอง ทั้งใบหน้าและเสียง เพื่อสร้างวิดีโอที่ดูเหมือนผู้ใช้จริง
Google ย้ำว่าฟีเจอร์ด้านเสียงและการแก้ไขคำพูดยังอยู่ระหว่างการทดสอบเพื่อให้ใช้งานได้อย่างรับผิดชอบ
วิดีโอที่สร้างด้วย Omni ทุกชิ้นจะมี SynthID ลายน้ำดิจิทัลแบบตรวจไม่เห็นด้วยตา เพื่อให้ตรวจสอบแหล่งที่มาได้ผ่าน Gemini App, Chrome และ Google Search
เริ่มใช้งานได้แล้วใน Gemini App, Google Flow และ YouTube Shorts
รุ่นแรกของตระกูล Omni คือ Gemini Omni Flash ซึ่งเริ่มปล่อยให้ใช้งานแล้วสำหรับ
- ผู้ใช้ Google AI Plus, Pro และ Ultra
- ผู้ใช้ YouTube Shorts และ YouTube Create (ใช้ฟรี)
และจะเปิดให้ใช้งานผ่าน API สำหรับนักพัฒนาและองค์กรในสัปดาห์ถัดไป
ข้อมูลเพิ่มเติม Google









