Google DeepMind เปิดตัว Gemini Omni Flash สมาชิกตัวแรกในตระกูลโมเดล Omni ที่เน้นความสามารถในการ 'สร้าง' (Create) นอกเหนือจากการใช้เหตุผลเพียงอย่างเดียว โดยจุดเด่นอยู่ที่การสร้างวิดีโอที่มีคุณภาพสูงและมีความสม่ำเสมอของตัวละคร รวมถึงความเข้าใจในหลักฟิสิกส์ เช่น การเคลื่อนที่ของของไหลและแรงโน้มถ่วง
ความพิเศษของ Gemini Omni คือการรองรับ Input หลากหลายรูปแบบพร้อมกัน (Multimodal) นักพัฒนาและผู้ใช้สามารถนำรูปภาพ วิดีโออ้างอิง และไฟล์เสียงมาผสมผสานเพื่อสร้างวิดีโอใหม่ได้ นอกจากนี้ยังรองรับการแก้ไขวิดีโอแบบ 'Conversational Editing' ที่ผู้ใช้สามารถสั่งเปลี่ยนมุมกล้อง เปลี่ยนสไตล์ หรือเพิ่มวัตถุได้ง่ายๆ ผ่านการแชท โดยที่ระบบยังคงรักษาความต่อเนื่องของฉากเดิมไว้ได้อย่างแม่นยำ