小规模会议场景(小于 10 人)下的说话人分割,希望能流式处理,请问什么模型延迟和准确性比较好呢?
提前感谢大佬回复!
(目前试过 funasr 的 cam++,分割效果不太好)
2
q0000001 194 天前 via Android
多嘴问问,funasr 可以流式识别说话人?
|
3
BMPixel 194 天前
我之前自己试了几个,WhisperX 效果是最好的,不过好像不能流式。
|
6
q0000001 194 天前
@Leon6868 我也看到有,但是基本上都是非实时语音识别才有加载 cam++,看到 issue 里面说流式没有,所以一直没看到。
能再问问你是用 paraformer-zh-streaming 这个,再加载 cam++吗? |
7
roding 194 天前
为什么要分割人😱
|