🚨 Microsoft-un 60 dəqiqəlik səs yazısını bir anda tanıyan AI-ni indiyə qədər eşitməmişdiniz?
Çünki əksər alətlər belə işləyir: Səsi kiçik hissələrə böl → hər parçanı ayrı işlət → nəticəni yenidən birləşdir.
Hər kəsimde kontekst itirilir. Kim danışdığını unudur. Mövzu dağılır.
VibeVoice fərqli düşünür. 60 dəqiqəlik audio faylı başdan sona — tək keçişdə emal edir. Kim danışdı. Nə vaxt danışdı. Nə dedi. Hamısı eyni anda. Hissə-hissə deyil.

Bunu mümkün edən texnologiya sadədir amma güclüdür: Saniyədə cəmi 7.5 token. Ultra aşağı sürətli işləmə. Beləcə 60 dəqiqəlik audio — 64.000 token daxilində qalır. Heç nə itirilmir. Heç kim unudulmur.
Üstəlik: → 50+ dil dəstəyi — dil seçiminə ehtiyac yoxdur → Özəl söz siyahısı əlavə edə bilərsiniz — şirkət adları, terminlər → Hugging Face Transformers kitabxanasına inteqrasiya olunub → 7B parametrli ASR modeli — Hugging Face-də hazırdır Açıq mənbəlidir. Kodunu götürə, üzərində qura, fərdiləşdirə bilərsiniz. Artıq "Vibing" adlı səs əsaslı daxiletmə aləti VibeVoice üzərində qurulub — macOS və Windows-da işləyir. Azərbaycan kontekstinə baxın: Hər həftə neçə iclasın yazısı mənuəl şəkildə aparılır? Hər saatlıq audionu redaktə etmək neçə iş saatı aparır? Sual budur: Hansı Azərbaycan şirkəti bu texnologiyadan ən tez faydalana bilər? Hüquq? Tibb?

⚠️ Qeyd: VibeVoice araşdırma məqsədli bir layihədir. Böyük GPU resursu tələb edir. Kommersiya istifadəsindən əvvəl ətraflı test edin.