持续跟进最新ASR语音识别算法, 识别准确率领先
支持wav、mp3、m4a、flac、aac、ogg、wma、amr、mka等多种音频格式
支持mp4、avi、mkv、mov、wmv、flv、webm、m4v视频格式(PC版)
数据加密处理,保护隐私安全
本地运行数据安全
支持说话人区分
语音识别(ASR):支持离线和实时语音识别
语音端点检测(VAD):检测语音信号的起始和结束
标点恢复:自动添加标点符号,提高文本可读性
语言模型:支持多种语言模型的集成
说话人分离:区分不同说话人的语音
多人对话语音识别:支持多人同时对话的语音识别