好消息!游戏卡就能用SAM-Audio了! 前天给大家测了Meta新出的音轨分割大模型,SAM-Audio,不过这个模型最大的问题是它太大了,我实测的时候large版本要吃90GB显存。现在好消息来了,一个博主把模型中不重要的部分剔除了(编码器和排序器,其实这个模型还支持在视频中指定视频的乐器进行提取,但用文本直接描述提起什么乐器也是可以的。所以把这部分功能移除了)。 目前small 版本只需要4-6GB显存,large版本也只要10GB显存,基本好一点的游戏卡都能跑了,而且作者还搞了个一键安装包,直接点击即安装使用,啥也不用管。有提取歌曲BGM或者分离乐器,人声需求的朋友可以试试。 项目地址: