蛐蛐 (QuQu) - 开源免费的 Wispr Flow 替代方案 | 为中文而生的下一代智能语音工作流

https://github.com/yan5xu/ququ

离线语音输入,无需会员,不连云端,保证隐私。


蛐蛐 (QuQu) 是 一个开源免费的 Wispr Flow 替代方案, 专为中文用户打造的注重隐私的桌面端语音输入与文本处理工具。

它集成了阿里巴巴开源的 FunASR 本地语音识别模型, 并支持配置国内顶尖的大语言模型, 提供高精度的中文语音转文字和智能文本优化功能。

完全免费开源, 数据本地处理, 保护用户隐私
专为中文优化, 支持国产 AI 模型如通义千问、Kimi 等
独创 "ASR 精准识别 + LLM 智能优化 " 的两段式引擎
能准确识别并格式化编程术语, 支持自定义 AI 指令
提供全局快捷键唤醒, 实时识别和无缝粘贴功能

#AI #Voice #Tool #GitHub GitHub - yan5xu/ququ: 开源免费的 Wispr Flow 替代方案 | 集成FunASR本地模型和可配置大语言模型的下一代中文桌面语音工作流
WhisperLiveKit - 本地语音转录工具(开源语音识别转文字)

https://github.com/QuentinFuxa/WhisperLiveKit

WhisperLiveKit 是一个开源的本地语音转录工具,集实时语音转文本、翻译和说话人分离于一体。 它使用了最新的语音识别和语音分离技术,可以提供低延迟和高准确度的转录结果,能用于会议实时记录和跨语言交流。

提供实时语音转文本功能,支持多达 100 种语言的翻译
支持实时说话人识别和分离
提供简单易用的前端和后端 API
支持在浏览器和 Chrome 扩展中使用
支持在 Docker 容器中部署

#Voice #AI #Tool #GitHub GitHub - QuentinFuxa/WhisperLiveKit: Simultaneous speech-to-text model
Klic Studio - 音视频处理工具(翻译 / 配音 )

https://github.com/krillinai/KlicStudio

多平台发布 / 搬运视频好帮手

Klic Studio 是由 Krillin AI 开发的多功能音视频本地化和增强解决方案。

集成了视频翻译、配音和语音克隆,支持横屏和竖屏格式,确保在所有主要平台(Bilibili、小红书、抖音、微信视频、快手、YouTube、TikTok 等)上完美呈现。

通过端到端的工作流程,您只需几次点击即可将原材料转化为精美的跨平台内容。

视频获取:支持 yt-dlp 下载或本地文件上传
准确识别:基于 Whisper 的高精度语音识别
智能分段:使用 LLM 进行字幕分段和对齐
术语替换:一键替换专业词汇
专业翻译:基于上下文的 LLM 翻译,保持自然语义
语音克隆:提供 CosyVoice 中选择的语音音调或自定义语音克隆
视频合成:自动处理横屏和竖屏视频及字幕布局
跨平台:支持 Windows、Linux、macOS,提供桌面和服务器版本

#Video #Voice #Tool #GitHub GitHub - krillinai/KrillinAI: Video translation and dubbing tool powered by LLMs. The video translator offers 100 language translations…
 
 
Back to Top