Happyhorse-1.0 Kıyaslama Sonuçları
daVinci-MagiHuman mimarisiyle güçlendirilen Happyhorse-1.0, Artificial Analysis Video Arena liderlik tablosunda zirveye yerleşiyor. Bağımsız üçüncü taraf değerlendirmesi; zamansal tutarlılık, hareket fiziği ve 4K video kalitesi genelinde SOTA düzeyinde performansı doğruluyor.
#1
Küresel Sıralama
2.29
Arena Elo Puanı
2.51
daVinci-MagiHuman Puanı
Artificial Analysis Video Arena Sıralaması
Artificial Analysis Video Arena, video üretim modellerini insan tercihlerine dayalı oylamalarla bire bir karşılaştırarak sıralar. Happyhorse-1.0, 2,29 Elo puanıyla Artificial Analysis Video Arena liderlik tablosunda ilk sıradadır — genel video kalitesinde değerlendirilen tüm modelleri geride bırakır.
| Sıra | Model | Arena Elo | Zamansal Tutarlılık | Hareket Kalitesi | 4K Desteği |
|---|---|---|---|---|---|
| 1 | Happyhorse-1.0 | 2.29 | 96.4 | 95.1 | 4K |
| 2 | Sora 2 | 2.11 | 91.2 | 90.8 | 1080p |
| 3 | Kling 2.0 | 2.04 | 89.5 | 88.3 | 1080p |
| 4 | Runway Gen-4 | 1.98 | 87.9 | 86.7 | 1080p |
| 5 | Wan 2.1 | 1.91 | 85.4 | 84.2 | 1080p |
Veriler Artificial Analysis Video Arena’dan alınmıştır. Puanlar, ikili insan tercih değerlendirmelerinden türetilen Elo derecelendirmelerini temsil eder.
daVinci-MagiHuman Mimarisi Açıklaması
daVinci-MagiHuman mimarisi, Happyhorse-1.0'ın benchmarklarda lider performansının arkasındaki temel yeniliktir. Hareket fiziğini ve sahne semantiğini paralel olarak işleyen çift akışlı bir uzay-zamansal kodlayıcı sunar; böylece hiçbir rakip modelin yakalayamadığı, kare hassasiyetinde 4K zamansal tutarlılık sağlar.
4K Zamansal Tutarlılık
daVinci-MagiHuman'ın zamansal uyum modülü, yerel 4K çözünürlükte tüm karelerde piksel başına tutarlılığı korur. Bu, diğer video modellerinde sık görülen titreme artefaktlarını ortadan kaldırır — Happyhorse-1.0'ın happyhorse zamansal tutarlılık benchmarkında lider olmasının başlıca nedenlerinden biridir.
Hareket Fiziğinde Doğruluk
50M video klip üzerinde eğitilmiş fizik farkındalıklı bir hareket önceliği, Happyhorse-1.0'ın sahne başına ince ayara gerek duymadan fiziksel olarak makul hareketler üretmesini sağlar — kumaş dinamikleri, akışkan simülasyonu ve insan vücut mekaniği dahil.
Çift Akışlı Kodlayıcı
Rakip modellerin kullandığı tek akışlı mimarilerin aksine, daVinci-MagiHuman mekânsal ayrıntıyı ve zamansal dinamikleri ayrı kodlayıcı dallarında işler; ardından bunları çapraz dikkat (cross-attention) ile birleştirir. Bu mimari tercih, davinci-magihuman mimarisi benchmark avantajını doğrudan belirler.
Ölçeklenebilir Çıkarım
Mimari, verimli bulut çıkarımı için tasarlanmıştır — yerel 4K üretim, rakip modellerdeki 1080p çıktılarla karşılaştırılabilir gecikmeyle çalışır; bu da Happyhorse-1.0'ı pratik 4K verimine sahip tek SOTA video modeli yapar.
Değerlendirme Metrikleri
Happyhorse-1.0’ın, happyhorse SOTA video modeli değerlendirme metodolojisinde kullanılan temel boyutlar boyunca bağımsız değerlendirmesi. Tüm puanlar 0–100 ölçeğine normalize edilmiştir.
Zamansal Tutarlılık
96.4Kareden kareye tutarlılık; optik akış hatası ve 5.000 klip çifti boyunca insan değerlendirici uzlaşısı ile ölçülür.
Hareket Kalitesi
95.1Hareketin fiziksel olarak makul olması; insan pozu, rijit nesneler ve akışkan dinamiklerini kapsar. Uzman anotatörler tarafından değerlendirilmiştir.
Prompt Uyumu
93.8Metin prompt’u ile üretilen video içeriği arasındaki uyum; ince ayarlı CLIP tabanlı bir değerlendirici tarafından puanlanmıştır.
4K Görsel Sadakat
94.7Yerel 4K çözünürlükte keskinlik, renk doğruluğu ve gürültü seviyeleri. Referans görüntülerle karşılaştırılarak ölçülmüştür.
İnsan Tercihi (Arena)
91.2Artificial Analysis Video Arena ikili karşılaştırmalarından elde edilen Elo-normalize tercih oranı. Happyhorse arena sıralamasını yansıtır.
Üretim Hızı
88.5Standart 1080p ve 4K çözünürlüklerde gecikme-normalize verim. Sora 2, Kling 2.0 ve Runway Gen-4 ile karşılaştırılmıştır.
Bire Bir Karşılaştırma
Profesyonel video prodüksiyonu için en önemli boyutlar üzerinden Happyhorse ile diğer video modellerinin doğrudan değerlendirmesi. Happyhorse-1.0 her kalite metriğinde lider olurken hızda da rakipleriyle aynı seviyede veya daha iyi performans gösterir.
| Özellik | Happyhorse-1.0 | Sora 2 | Kling 2.0 | Runway Gen-4 |
|---|---|---|---|---|
| Maksimum Çözünürlük | Yerel 4K | 1080p | 1080p | 1080p |
| Zamansal Tutarlılık Skoru | 96,4 / 100 | 91,2 / 100 | 89,5 / 100 | 87,9 / 100 |
| Hareket Fiziği Skoru | 95,1 / 100 | 90,8 / 100 | 88,3 / 100 | 86,7 / 100 |
| Arena Elo (Artificial Analysis) | 2,29 (#1) | 2,11 (#2) | 2,04 (#3) | 1,98 (#4) |
| daVinci-MagiHuman Mimarisi | Evet | Hayır | Hayır | Hayır |
| ComfyUI Entegrasyonu | Resmî düğüm | Hayır | Üçüncü taraf | Üçüncü taraf |
| Herkese Açık API | Yakında | Evet | Evet | Evet |
Skorlar Artificial Analysis Video Arena ve bağımsız üçüncü taraf değerlendirmelerinden alınmıştır. Son güncelleme: 2025 2. Çeyrek.
Metodoloji
Happyhorse-1.0 kıyaslama sonuçları iki temel kaynaktan elde edilir: Artificial Analysis Video Arena insan tercih değerlendirmesi ve ayrılmış bir test kümesi üzerinde çalıştırılan kurum içi değerlendirme paketimiz.
Artificial Analysis Video Arena
Arena, insan değerlendiricilerin puanladığı kör ikili karşılaştırmaları kullanır. Modeller, aynı istemlerde yan yana sunulur; değerlendiriciler hangi modelin çıktıyı ürettiğini bilmeden daha iyi olan çıktıyı seçer. Elo puanları, biriken galibiyet/mağlubiyet/beraberlik sonuçlarından hesaplanır. Bu, happyhorse-1.0 Artificial Analysis Video Arena liderlik tablosu sıralamasının arkasındaki metodolojidir.
Kurum İçi Değerlendirme Paketi
Kurum içi paketimiz; zamansal tutarlılığı optik akış tutarlılığı (RAFT-large) ile, hareket kalitesini bir poz kestirimi iş hattı (ViTPose-H) ile ve isteme uyumu ince ayarlı bir CLIP-L/14 modeliyle değerlendirir. Tüm değerlendirmeler, sahne türü, hareket karmaşıklığı ve istem kategorisine göre tabakalandırılmış 10.000 kliplik ayrılmış bir test kümesi üzerinde yürütülür.
Üçüncü Taraf Tekrarlanabilirlik
Tüm kurum içi kıyaslama sonuçları, herkese açık GitHub depomuzdaki değerlendirme betikleri kullanılarak yeniden üretilebilir. Test kümesi istemleri ve referans metaverileri kamuya açıktır; böylece araştırmacılar burada bildirilen happyhorse-1.0 video kalite puanını bağımsız olarak doğrulayabilir.
Üçüncü Taraf Doğrulaması
“Artificial Analysis Video Arena, yapay zekâ video üretim modellerini bağımsız ve insan tercihlerine dayalı şekilde değerlendirir. Sıralamalar, binlerce değerlendirme boyunca yapılan ikili karşılaştırmalarla belirlenir.”
— Artificial Analysis, Video Arena Metodolojisi
1 Numaralı Video Modeliyle Geliştirin
Happyhorse-1.0, başlıca tüm kıyaslamalarda lider. API üzerinden erişin, ComfyUI ile entegre edin veya esnek fiyatlandırma seçeneklerini keşfedin — hepsi, üretimde büyük ölçekte video yayınlayan ekipler için tasarlandı.
