从任何音频和视频中提取人声、伴奏和各种乐器