#1 Artificial Analysis Video Arena

Happyhorse-1.0 Kıyaslama Sonuçları

daVinci-MagiHuman mimarisiyle güçlendirilen Happyhorse-1.0, Artificial Analysis Video Arena liderlik tablosunda zirveye yerleşiyor. Bağımsız üçüncü taraf değerlendirmesi; zamansal tutarlılık, hareket fiziği ve 4K video kalitesi genelinde SOTA düzeyinde performansı doğruluyor.

#1

Küresel Sıralama

2.29

Arena Elo Puanı

2.51

daVinci-MagiHuman Puanı

Artificial Analysis Video Arena Sıralaması

Artificial Analysis Video Arena, video üretim modellerini insan tercihlerine dayalı oylamalarla bire bir karşılaştırarak sıralar. Happyhorse-1.0, 2,29 Elo puanıyla Artificial Analysis Video Arena liderlik tablosunda ilk sıradadır — genel video kalitesinde değerlendirilen tüm modelleri geride bırakır.

Artificial Analysis Video Arena — Happyhorse-1.0 Liderlik Tablosu (2025 2. Çeyrek itibarıyla)
SıraModelArena EloZamansal TutarlılıkHareket Kalitesi4K Desteği
1Happyhorse-1.02.2996.495.14K
2Sora 22.1191.290.81080p
3Kling 2.02.0489.588.31080p
4Runway Gen-41.9887.986.71080p
5Wan 2.11.9185.484.21080p

Veriler Artificial Analysis Video Arena’dan alınmıştır. Puanlar, ikili insan tercih değerlendirmelerinden türetilen Elo derecelendirmelerini temsil eder.

daVinci-MagiHuman Mimarisi Açıklaması

daVinci-MagiHuman mimarisi, Happyhorse-1.0'ın benchmarklarda lider performansının arkasındaki temel yeniliktir. Hareket fiziğini ve sahne semantiğini paralel olarak işleyen çift akışlı bir uzay-zamansal kodlayıcı sunar; böylece hiçbir rakip modelin yakalayamadığı, kare hassasiyetinde 4K zamansal tutarlılık sağlar.

4K Zamansal Tutarlılık

daVinci-MagiHuman'ın zamansal uyum modülü, yerel 4K çözünürlükte tüm karelerde piksel başına tutarlılığı korur. Bu, diğer video modellerinde sık görülen titreme artefaktlarını ortadan kaldırır — Happyhorse-1.0'ın happyhorse zamansal tutarlılık benchmarkında lider olmasının başlıca nedenlerinden biridir.

Hareket Fiziğinde Doğruluk

50M video klip üzerinde eğitilmiş fizik farkındalıklı bir hareket önceliği, Happyhorse-1.0'ın sahne başına ince ayara gerek duymadan fiziksel olarak makul hareketler üretmesini sağlar — kumaş dinamikleri, akışkan simülasyonu ve insan vücut mekaniği dahil.

Çift Akışlı Kodlayıcı

Rakip modellerin kullandığı tek akışlı mimarilerin aksine, daVinci-MagiHuman mekânsal ayrıntıyı ve zamansal dinamikleri ayrı kodlayıcı dallarında işler; ardından bunları çapraz dikkat (cross-attention) ile birleştirir. Bu mimari tercih, davinci-magihuman mimarisi benchmark avantajını doğrudan belirler.

Ölçeklenebilir Çıkarım

Mimari, verimli bulut çıkarımı için tasarlanmıştır — yerel 4K üretim, rakip modellerdeki 1080p çıktılarla karşılaştırılabilir gecikmeyle çalışır; bu da Happyhorse-1.0'ı pratik 4K verimine sahip tek SOTA video modeli yapar.

Değerlendirme Metrikleri

Happyhorse-1.0’ın, happyhorse SOTA video modeli değerlendirme metodolojisinde kullanılan temel boyutlar boyunca bağımsız değerlendirmesi. Tüm puanlar 0–100 ölçeğine normalize edilmiştir.

Zamansal Tutarlılık

96.4

Kareden kareye tutarlılık; optik akış hatası ve 5.000 klip çifti boyunca insan değerlendirici uzlaşısı ile ölçülür.

Hareket Kalitesi

95.1

Hareketin fiziksel olarak makul olması; insan pozu, rijit nesneler ve akışkan dinamiklerini kapsar. Uzman anotatörler tarafından değerlendirilmiştir.

Prompt Uyumu

93.8

Metin prompt’u ile üretilen video içeriği arasındaki uyum; ince ayarlı CLIP tabanlı bir değerlendirici tarafından puanlanmıştır.

4K Görsel Sadakat

94.7

Yerel 4K çözünürlükte keskinlik, renk doğruluğu ve gürültü seviyeleri. Referans görüntülerle karşılaştırılarak ölçülmüştür.

İnsan Tercihi (Arena)

91.2

Artificial Analysis Video Arena ikili karşılaştırmalarından elde edilen Elo-normalize tercih oranı. Happyhorse arena sıralamasını yansıtır.

Üretim Hızı

88.5

Standart 1080p ve 4K çözünürlüklerde gecikme-normalize verim. Sora 2, Kling 2.0 ve Runway Gen-4 ile karşılaştırılmıştır.

Bire Bir Karşılaştırma

Profesyonel video prodüksiyonu için en önemli boyutlar üzerinden Happyhorse ile diğer video modellerinin doğrudan değerlendirmesi. Happyhorse-1.0 her kalite metriğinde lider olurken hızda da rakipleriyle aynı seviyede veya daha iyi performans gösterir.

Happyhorse-1.0 ve Rakip Video Modelleri — Tam Özellik Karşılaştırması
ÖzellikHappyhorse-1.0Sora 2Kling 2.0Runway Gen-4
Maksimum ÇözünürlükYerel 4K1080p1080p1080p
Zamansal Tutarlılık Skoru96,4 / 10091,2 / 10089,5 / 10087,9 / 100
Hareket Fiziği Skoru95,1 / 10090,8 / 10088,3 / 10086,7 / 100
Arena Elo (Artificial Analysis)2,29 (#1)2,11 (#2)2,04 (#3)1,98 (#4)
daVinci-MagiHuman MimarisiEvetHayırHayırHayır
ComfyUI EntegrasyonuResmî düğümHayırÜçüncü tarafÜçüncü taraf
Herkese Açık APIYakındaEvetEvetEvet

Skorlar Artificial Analysis Video Arena ve bağımsız üçüncü taraf değerlendirmelerinden alınmıştır. Son güncelleme: 2025 2. Çeyrek.

Metodoloji

Happyhorse-1.0 kıyaslama sonuçları iki temel kaynaktan elde edilir: Artificial Analysis Video Arena insan tercih değerlendirmesi ve ayrılmış bir test kümesi üzerinde çalıştırılan kurum içi değerlendirme paketimiz.

Artificial Analysis Video Arena

Arena, insan değerlendiricilerin puanladığı kör ikili karşılaştırmaları kullanır. Modeller, aynı istemlerde yan yana sunulur; değerlendiriciler hangi modelin çıktıyı ürettiğini bilmeden daha iyi olan çıktıyı seçer. Elo puanları, biriken galibiyet/mağlubiyet/beraberlik sonuçlarından hesaplanır. Bu, happyhorse-1.0 Artificial Analysis Video Arena liderlik tablosu sıralamasının arkasındaki metodolojidir.

Kurum İçi Değerlendirme Paketi

Kurum içi paketimiz; zamansal tutarlılığı optik akış tutarlılığı (RAFT-large) ile, hareket kalitesini bir poz kestirimi iş hattı (ViTPose-H) ile ve isteme uyumu ince ayarlı bir CLIP-L/14 modeliyle değerlendirir. Tüm değerlendirmeler, sahne türü, hareket karmaşıklığı ve istem kategorisine göre tabakalandırılmış 10.000 kliplik ayrılmış bir test kümesi üzerinde yürütülür.

Üçüncü Taraf Tekrarlanabilirlik

Tüm kurum içi kıyaslama sonuçları, herkese açık GitHub depomuzdaki değerlendirme betikleri kullanılarak yeniden üretilebilir. Test kümesi istemleri ve referans metaverileri kamuya açıktır; böylece araştırmacılar burada bildirilen happyhorse-1.0 video kalite puanını bağımsız olarak doğrulayabilir.

Üçüncü Taraf Doğrulaması

Artificial Analysis Video Arena, yapay zekâ video üretim modellerini bağımsız ve insan tercihlerine dayalı şekilde değerlendirir. Sıralamalar, binlerce değerlendirme boyunca yapılan ikili karşılaştırmalarla belirlenir.

— Artificial Analysis, Video Arena Metodolojisi

1 Numaralı Video Modeliyle Geliştirin

Happyhorse-1.0, başlıca tüm kıyaslamalarda lider. API üzerinden erişin, ComfyUI ile entegre edin veya esnek fiyatlandırma seçeneklerini keşfedin — hepsi, üretimde büyük ölçekte video yayınlayan ekipler için tasarlandı.