ภาพระยะใกล้ เด็กผู้หญิงเอเชียเป่าลมหายใจใส่กระจกรถที่เย็นจัด จนเกิดฝ้าหนาทึบบนกระจก เธอใช้นิ้ววาดหน้ายิ้มบนกระจกที่มีฝ้า ภาพสมจริงมาก แสงแบบภาพยนตร์ รายละเอียดหยดน้ำและการควบแน่นคมชัด
HappyHorse-1.0 คือโมเดลโอเพนซอร์สระดับแนวหน้าสำหรับการสร้างวิดีโอ AI ที่ได้รับการสนับสนุนอย่างมากจาก Alibaba Taotian Group โดยมีพารามิเตอร์มากถึง 15 พันล้าน (15B) ในฐานะโมเดล Transformer แบบรวมศูนย์ มันสามารถก้าวข้ามข้อจำกัดแบบเดิมและสร้างวิดีโอความละเอียด 1080p ระดับภาพยนตร์พร้อมเสียงที่ซิงก์อย่างสมบูรณ์ได้โดยตรงจากพรอมป์ต์ข้อความหรือรูปภาพ
HappyHorse-1.0 รองรับภาษาหลัก 6 ภาษาแบบเนทีฟ ได้แก่ จีน อังกฤษ ญี่ปุ่น เกาหลี เยอรมัน และฝรั่งเศส ไม่เพียงแต่ให้สีหน้าขนาดเล็กบนใบหน้าที่แสดงอารมณ์ได้ดีและการเคลื่อนไหวร่างกายที่เป็นธรรมชาติมากเท่านั้น แต่ยังทำลิปซิงก์หลายภาษาได้อย่างแม่นยำสูงอีกด้วย มันสามารถสร้างบทสนทนาที่ซิงก์กัน เสียงบรรยากาศ และเสียงประกอบไปพร้อมกับเฟรมวิดีโอ ทำให้ไม่ต้องเสียเวลาพากย์เสียงในขั้นตอนหลังการผลิตอีกต่อไป ด้วยการปรับแต่งอัลกอริทึมอย่างหนัก โมเดลนี้ไม่ต้องใช้ classifier-free guidance (CFG) และยังคงคุณภาพภาพระดับสูงได้ด้วยการ denoising เพียง 8 ขั้นตอนในความเร็วระดับทำลายสถิติ ปัจจุบัน HappyHorse-1.0 ครองอันดับหนึ่งใน Artificial Analysis Text-to-Video Arena อย่างมั่นคงด้วยคะแนน Elo สูงถึง 1333
บน WeryAI, HappyHorse-1.0 อยู่ใกล้แค่ปลายนิ้วของคุณ โมเดลขนาด 15 พันล้านพารามิเตอร์โดยปกติแล้วต้องการ GPU ในเครื่องที่ทรงพลังมาก แต่ตอนนี้ผ่านแพลตฟอร์ม WeryAI คุณไม่จำเป็นต้องลงทุนกับฮาร์ดแวร์ราคาแพงอีกต่อไป ทีมของคุณสามารถทดสอบพรอมป์ต์ ปรับแต่งสื่ออ้างอิง และดาวน์โหลดผลงานสุดท้ายที่สมบูรณ์พร้อมเสียงแบบเนทีฟที่ซิงก์กันได้ทันทีจากเบราว์เซอร์ ช่วยให้ไอเดียสร้างสรรค์ของคุณเกิดขึ้นจริงได้อย่างราบรื่น