Meta Səs Emalında İnqilab Edir
Meta, vizual dünyanı inqilab edən Segment Anything Model (SAM) texnologiyasını audio dünyasına gətirərək yeni nəsil SAM Audio modelini rəsmi olaraq elan etdi. Peşəkar səs redaktə proseslərində yeni bir standart qoyan bu süni intellekt modeli, çoxmodal girişlərdən istifadə edərək istənilən mənbələri mürəkkəb və bir-birinə bağlı səs fayllarından ayıra bilər.
Meta Yeni Səs Modelini Təqdim Edir
Ənənəvi metodlardan fərqli olaraq, model istifadəçilərə mətn əmrləri, vizual annotasiyalar və ya vaxt qurşağı spesifikasiyası kimi təbii qarşılıqlı təsir metodlarından istifadə edərək müəyyən səsləri təcrid etməyə imkan verir. Bu texnologiya sayəsində videodakı bir obyektin səsini sadəcə həmin obyektə klikləyərək təcrid etmək və ya "it hürməsi" kimi sadə bir mətn əmri ilə istənməyən səsləri silmək mümkün olur.
Modelin texniki infrastrukturu, səs və vizual məlumatları zaman oxunda dəqiq şəkildə uyğunlaşdıran Qavrayış Encoder Audiovizual (PE-AV) mühərriki ilə təchiz edilmişdir. SAM Audio, 500 milyondan 3 milyard parametrə qədər müxtəlif miqyaslarda konfiqurasiya edilə bilər və real vaxt rejimində işləmə sürətlərini aşaraq RTF ≈ 0.7 performans təmin edir.
Arxitektura baxımından axın uyğunlaşdırma diffuziya çeviricisi üzərində qurulmuş bu generator sistemi həm real, həm də sintetik məlumatlardan ibarət böyük bir təlim dəsti ilə dəstəklənir. Sistem eyni zamanda giriş kimi verilən qarışıq audio faylından həm hədəf səsini, həm də qalan "qalıq" audio parçaları yarada bilər.
SAM Audio tərəfindən təklif olunan üç əsas təhlil metodu istifadəçiyə misilsiz rahatlıq təmin edir. Mətn əsaslı metodda istifadəçi "piano səsi" və ya "vokal" yazmaqla hədəfi birbaşa təyin edə bilər; vizual metodda videodakı alətlərə və ya dinamiklərə klikləmək kifayətdir. Sənayedə ilk hesab edilən zaman aralığına əsaslanan sorğu metodu, bütün fayl boyunca müəyyən bir zaman intervalının audio xüsusiyyətlərini süzgəcdən keçirmək üçün istifadə olunur.
Texnologiya bölməsindən digər xəbərlər
Anker MWC 2026-da Yeni Məhsullarını Təqdim Edir
Apple iOS 26.4 və iPadOS 26.4 Beta 3-ü Buraxdı
Bakcell müştəri xidmətlərində rəqəmsallaşmanı genişləndirir
Məşhur Kompüter İstehsalçılarının Veb Sayt Qadağası Ləğv Edildi!
iOS 26.4 Beta 2 Yeniləməsi Nə Təklif Edir?
Elektrikli Lamborghini Xəyalı Bitdi!
Panasonic Rəsmi olaraq İstehsalını Dayandırır!
Süni İntellekt Pulsuz Tətbiqlərə Son Qoyacaq
Meta və AMD süni intellektdə yeni bir dövrə başlayır
Telegram-ın qurucusu Pavel Durov terrorizmi dəstəkləyirmi?
Firefox Süni İntellekti Söndürmə Düyməsini Əldə Edir
Tesla Dövləti Məhkəməyə Verir!
Forza Horizon 6 Hekayəsi Açıqlandı
Apple-ın Yeni Ağıllı Eynəkləri Samsung-u Hədəfləyir
Klod Təqdimat Saatlarını Sonlandırır!
Xbox-un yeni baş direktoru açıqlandı
Xiaomi 17T və 17T Pro gözləniləndən daha tez gəlir!
iOS və Android arasında şifrələnmiş mesajlaşma başlayır
OpenAI Yeni 100 dollarlıq ChatGPT Paketini Təqdim Edir
Google NotebookLM Dizaynını Tamamilə Yeniləyir
Büdcəyə Uyğun Honor X6d 5G Təqdim Edildi
NVIDIA RTX 5090 Ti Oyunu Dəyişdirəcək
DJI Osmo Pocket 4 üçün Yeni Sızıntılar
iOS 26.3.1 Yeniləməsi Yolda! Nələr Gələcək?
Tesla ölümcül avtopilot qəzasına görə 243 milyon dollar ödəyəcək!
Nvidia OpenAI-yə 30 Milyard Dollar İnvestisiya Edir
Samsung RAM-da əvvəlki gücünü bərpa edibmi?
Həftənin ən çox oxunanları
Xiaomi 17T və 17T Pro gözləniləndən daha tez gəlir!
iOS və Android arasında şifrələnmiş mesajlaşma başlayır
OpenAI Yeni 100 dollarlıq ChatGPT Paketini Təqdim Edir
Məşhur Kompüter İstehsalçılarının Veb Sayt Qadağası Ləğv Edildi!
iOS 26.4 Beta 2 Yeniləməsi Nə Təklif Edir?
Telegram-ın qurucusu Pavel Durov terrorizmi dəstəkləyirmi?
Forza Horizon 6 Hekayəsi Açıqlandı
Tesla Dövləti Məhkəməyə Verir!



BTC / USD
ETH / USD
LTC / USD
ZEC / USD



