AI & MACHINE LEARNING

Google เปิดตัว Gemini Omni Flash โมเดล AI สร้างวิดีโอและแก้ไขผ่านการแชท

Google DeepMind Blog17 May 2026

1 min read

Key Takeaways

Gemini Omni Flash ช่วยให้การสร้างและตัดต่อวิดีโอทำได้ง่ายขึ้นผ่านการสั่งงานด้วยเสียงและข้อความ โดยมีความแม่นยำทางฟิสิกส์สูงขึ้น

ทำไมเรื่องนี้ถึงสำคัญ

เทคโนโลยีนี้ยกระดับการสร้างเนื้อหาวิดีโอจาก AI ไปสู่อีกขั้น โดยการนำเอาความเข้าใจโลก (World Knowledge) มาผสมผสานกับการสร้างสรรค์ ทำให้วิดีโอที่ได้ดูสมจริงและมีเนื้อหาที่สมเหตุสมผลมากขึ้นในเชิงการเล่าเรื่อง

Google DeepMind เปิดตัว Gemini Omni Flash สมาชิกตัวแรกในตระกูลโมเดล Omni ที่เน้นความสามารถในการ 'สร้าง' (Create) นอกเหนือจากการใช้เหตุผลเพียงอย่างเดียว โดยจุดเด่นอยู่ที่การสร้างวิดีโอที่มีคุณภาพสูงและมีความสม่ำเสมอของตัวละคร รวมถึงความเข้าใจในหลักฟิสิกส์ เช่น การเคลื่อนที่ของของไหลและแรงโน้มถ่วง

ความพิเศษของ Gemini Omni คือการรองรับ Input หลากหลายรูปแบบพร้อมกัน (Multimodal) นักพัฒนาและผู้ใช้สามารถนำรูปภาพ วิดีโออ้างอิง และไฟล์เสียงมาผสมผสานเพื่อสร้างวิดีโอใหม่ได้ นอกจากนี้ยังรองรับการแก้ไขวิดีโอแบบ 'Conversational Editing' ที่ผู้ใช้สามารถสั่งเปลี่ยนมุมกล้อง เปลี่ยนสไตล์ หรือเพิ่มวัตถุได้ง่ายๆ ผ่านการแชท โดยที่ระบบยังคงรักษาความต่อเนื่องของฉากเดิมไว้ได้อย่างแม่นยำ

สรุปประเด็นหลัก

รองรับการสร้างวิดีโอจาก Input ผสม (ภาพ + เสียง + ข้อความ) อย่างลงตัว

สามารถแก้ไขวิดีโอแบบต่อเนื่องผ่านแชท โดยรักษาความคงที่ของตัวละครและสภาพแวดล้อม

รวมเทคโนโลยี SynthID สำหรับการใส่ลายน้ำดิจิทัลเพื่อความโปร่งใสของเนื้อหา

นวัตกรรมและเทคโนโลยี

creative ai

Multimodal Input Reference

สามารถนำภาพถ่าย วิดีโอสั้น หรือเสียงมาเป็นต้นแบบในการสร้างวิดีโอใหม่ที่มีความสอดคล้องกัน

models

Conversational Video Editing

การตัดต่อและเปลี่ยนแปลงรายละเอียดในวิดีโอผ่านคำสั่งภาษาธรรมชาติ โดยไม่ต้องเริ่มต้นสร้างใหม่ทั้งหมด

research

Physics-Aware Generation

ปรับปรุงความเข้าใจเรื่องแรงโน้มถ่วง พลศาสตร์ของของไหล และแสงเงา เพื่อให้วิดีโอที่สร้างมีความสมจริง

Developer Impact

นักพัฒนาแอปพลิเคชันสาย Creative และการตลาดสามารถนำ API นี้ไปสร้างเครื่องมือตัดต่อวิดีโออัจฉริยะที่ใช้งานง่ายสำหรับผู้ใช้ทั่วไป รวมถึงการสร้างคอนเทนต์ในโซเชียลมีเดียที่สมจริงมากขึ้น

Keywords

#gemini omni #video generation #multimodal ai #google deepmind #synthid

Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

Google DeepMind Blog