Kabar baik! Kartu permainan sekarang dapat menggunakan SAM-Audio! Sehari sebelum kemarin, saya menguji model segmentasi trek audio baru Meta, SAM-Audio, tetapi masalah terbesar dengan model ini adalah terlalu besar, dan versi besar harus memakan memori video 90GB ketika saya mengukurnya. Sekarang kabar baiknya adalah bahwa seorang blogger telah menghapus bagian yang tidak penting dari model (encoder dan sequencer, pada kenyataannya, model ini juga mendukung penentuan instrumen video dalam video untuk ekstraksi, tetapi juga dimungkinkan untuk secara langsung menggambarkan instrumen apa yang disebutkan dalam teks. Jadi bagian fitur ini dihapus). Saat ini, versi kecil hanya membutuhkan memori video 4-6GB, dan versi besar hanya membutuhkan memori video 10GB. Jika Anda harus mengekstrak BGM lagu atau memisahkan instrumen, teman-teman yang membutuhkan vokal dapat mencobanya. Alamat Proyek: