热门

StreamSpeech

12个月前发布 44 00

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略，有效识别流式语音输入中的翻译时机，实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能，并能提供低延迟的中间结果，如ASR或翻译结果。

收录时间：

2025-05-29

打开网站手机查看

智能翻译 # 多任务学习 # 实时翻译 # 语音合成 # 语音识别

StreamSpeech

StreamSpeech

StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略，有效识别流式语音输入中的翻译时机，实现高质量的实时通信体验。该模型在CVSS基准测试中取得了领先的性能，并能提供低延迟的中间结果，如ASR或翻译结果。

数据统计

相关导航

Moocat

Moocat是一款AI驱动的智能输入法，它通过内置的人工智能技术，为用户提供实时的打字建议、语法纠正和上下文感知的回复，从而提高打字速度和准确性。Moocat输入法还具备语言翻译功能，消除语言障碍，让沟通更加顺畅。此外，用户可以个性化定制键盘的外观和功能，以匹配个人风格和偏好。适用于专业人士、学生、旅行者等不同用户群体，提高日常沟通体验。

Real-time-translation-typing

Real-time-translation-typing 是一款集成了实时打字翻译、语音实时打字和翻译、LOL 语音打字功能的软件。它通过AutoHotkey技术实现，支持多种翻译API，如搜狗、百度、有道等，为用户提供了高效、便捷的翻译体验。软件适用于需要快速翻译文本和语音的商务人士、学生和游戏玩家。

Pipio | Video Dubbing

该产品通过AI技术实现视频语音的自动配音和口型同步,可以轻松实现视频的多语种翻译,并保留原始音色。主要特点包括:1)33%以上的同步精度,媲美人工口型同步;2)无损视频分辨率;3)高保真语音翻译。面向的群体包括:企业培训部门、销售人员、营销团队和内容创作者。提供免费入门版和付费专业版,欢迎体验。

VideoTrans视频翻译配音工具

VideoTrans是一款免费开源的视频翻译配音工具。它可以一键识别视频字幕、翻译成其他语言、进行多种语音合成,最终输出带字幕和配音的目标语言视频。该软件使用简单,支持多种翻译和配音引擎,能大幅提高视频翻译的效率。

暂无评论

您必须登录才能参与评论！

none

暂无评论...