#AI #换脸 #开源

Deep Live Cam

AI 换脸工具,仅需一张图片即可实现高质量的实时人脸替换,并支持视频深伪、人脸增强与多脸处理等功能,兼容多平台,适用于视频制作与动画创作等场景,完全免费。

主页 项目地址

频道 @Edgebyte
自动生成短视频,从视频文案、素材、字幕到配音和背景音乐,一键搞定,效率翻倍。

MoneyPrinterTurbo 利用强大的 AI 大模型,支持多种视频比例(9:16竖屏、16:9横屏),还能批量生成,适合做抖音、快手、YouTube等平台内容创作。

核心亮点:
- 自动生成视频文案,支持中英双语,灵活定制
- 高清无版权视频素材,支持上传本地素材
- AI智能语音合成,多种声音风格实时试听
- 字幕自动生成,支持字体、颜色、位置多样化调整
- 背景音乐随机或自定义,音量自由调节
- 支持OpenAI、Azure、文心一言等多家大模型接入
- 完整MVC架构,提供Web界面和API接口,方便集成部署

适用场景:内容创作者、短视频运营、小白用户快速上手。
#资源参考 #工具 #AI #短视频生成工具 GitHub - harry0703/MoneyPrinterTurbo: 利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
#AI #视频处理 #音频处理

🔊 Voice-Pro - 免费开源的 AI 语音识别、翻译和多语言配音解决方案

Voice-Pro 是一个开源的音频/语音处理工具集合,现已宣告完全免费(此前收费)

Features

▫️一键下载 YouTube 视频 + 人声分离:yt-dlp 下载 + Demucs 分离人声/背景乐
▫️强大的语音识别:支持 Whisper / Faster-Whisper / WhisperX / Whisper-Timestamped
▫️多语言实时/批量翻译:100+ 语言互译
▫️...


📮投稿 📢频道 💬群聊 🔎索引
Vibe Voice - 微软开源 AI 语音框架

https://github.com/microsoft/VibeVoice

VibeVoice 是微软开源的 AI 语音框架,用于从文本生成富有表现力的长篇多说话人对话音频(如播客),通过 LLM 理解文本上下文和对话流,生成高保真音频。

长篇多说话人模型:支持最长 90 分钟音频、最多 4 个不同说话人的对话式语音合成
实时流式 TTS 模型:初始音频延迟约 300 毫秒,支持流式文本输入的实时语音生成
超低帧率语音分词器:以 7.5Hz 帧率的连续语音分词器保持音频保真度同时提升计算效率
多语言支持:支持英文、中文以及实验性支持 9 种语言(德、法、意、日、韩、荷、波、葡、西班牙语)
风格化语音:提供 11 种不同的英文风格语音供用户选择

#TTS #Voice #AI #GitHub GitHub - microsoft/VibeVoice: Open-Source Frontier Voice AI
Huntly - 个人 AI 驱动信息中心

https://github.com/lcomplete/huntly

AI 驱动的个人信息中心,配备强大的浏览器扩展,可使用 AI 捕获、处理和组织网页内容 —— 将您的浏览转化为可操作的知识。

AI 内容处理 利用 AI 进行摘要、翻译和智能内容分析,支持自定义快捷指令
● 智能网页归档 使用 Mozilla Readability 自动保存和归档网页,AI 驱动的内容提取
● RSS 订阅管理 集中管理所有 RSS 订阅,支持智能分类、OPML 导入 / 导出和全文搜索
● 强大的全文搜索 Apache Lucene 搜索引擎,IK 分词器支持中文分词,布尔运算符和模糊搜索
● 社交媒体集成 特殊处理 Twitter/X 内容,自动重建推文线程并保存媒体
● GitHub 集成 同步和组织您的 GitHub stars,提取仓库元数据和 README
● 隐私与自托管 100% 自托管,SQLite 数据库,Docker 部署,完全掌控您的数据
● 多平台支持 Web 应用、Chrome 扩展 (Manifest V3) 和桌面应用 (Tauri)

#Tool #AI #GitHub #Chrome #Extension GitHub - lcomplete/huntly: Your Personal AI-Powered Information Hub
UI UX Pro Max Skill - UI / UX 前端页面设计 AI Agent Skill

https://github.com/nextlevelbuilder/ui-ux-pro-max-skill

设计效果相比其一般 AI 生成的 “Demo” 页面还是好很多的


一个 前端页面设计 AI Agent Skill 项目。

它将 UI 样式、调色板、字体搭配、图表类型、产品推荐、UX 指南以及特定技术栈的最佳实践全部做成一个可以搜索的知识库。

可集成于 Claude Code、Cursor、Windsurf 等多个 AI Coding Agent 中。

#Design #AI #Tool #GitHub
Lumen - AI 增强的 Git 命令行工具

https://github.com/jnsahaj/lumen

Lumen 是一个利用 AI 技术简化 Git 工作流程的命令行工具。

可用于查看代码变更,也可生成规范的 Commit 信息,帮助开发者更高效地使用 Git 版本控制。

美观的终端 Diff 查看器:支持侧边栏导航、文件过滤、监听模式和 PR 预览
智能 Commit 信息生成:基于暂存区变更自动生成规范提交信息,支持上下文增强
Git 命令生成:通过自然语言查询生成相应的 Git 命令
变更解释:分析代码变更内容、原因和潜在影响
交互式模式:使用 fzf 进行模糊搜索查找提交记录
AI 提供商支持:兼容 OpenAI、Claude、Gemini、Groq、Ollama 等

#AI #Shell #Tool #GitHub #DevOps GitHub - jnsahaj/lumen: Beautiful git diff viewer, generate commits with AI, get summary of changes, all from the CLI
YouMedHub - AI 视频分析工具 | 拆解镜头和口播结构

https://github.com/kociii/youmedhub

一个基于 Vue 3 + TypeScript 的智能视频分析应用,使用阿里云通义千问视觉模型自动分析视频内容,生成详细的脚本拆解表格。

视频分析:上传视频或提供视频 URL,AI 自动分析视频内容
脚本拆解:生成包含景别、运镜、画面内容、口播等详细信息的结构化表格
视频片段预览:鼠标悬停即可播放对应时间段的视频片段
安全存储:API Key 本地存储,保护隐私
实时流式输出:Markdown 流式显示,所见即所得
Token 统计:实时显示输入 / 输出 / 总计 Token 使用量

#AI #Tool #Video #GitHub GitHub - kociii/youmedhub: 一个基于 AI的视频分析、剪辑工具
Lumen - AI 增强的 Git 命令行工具

https://github.com/jnsahaj/lumen

Lumen 是一个利用 AI 技术简化 Git 工作流程的命令行工具。

可用于查看代码变更,也可生成规范的 Commit 信息,帮助开发者更高效地使用 Git 版本控制。

美观的终端 Diff 查看器:支持侧边栏导航、文件过滤、监听模式和 PR 预览
智能 Commit 信息生成:基于暂存区变更自动生成规范提交信息,支持上下文增强
Git 命令生成:通过自然语言查询生成相应的 Git 命令
变更解释:分析代码变更内容、原因和潜在影响
交互式模式:使用 fzf 进行模糊搜索查找提交记录
AI 提供商支持:兼容 OpenAI、Claude、Gemini、Groq、Ollama 等

#AI #Shell #Tool #GitHub #DevOps GitHub - jnsahaj/lumen: Beautiful git diff viewer, generate commits with AI, get summary of changes, all from the CLI
Huntly - 个人 AI 驱动信息中心

https://github.com/lcomplete/huntly

AI 驱动的个人信息中心,配备强大的浏览器扩展,可使用 AI 捕获、处理和组织网页内容 —— 将您的浏览转化为可操作的知识。

AI 内容处理 利用 AI 进行摘要、翻译和智能内容分析,支持自定义快捷指令
● 智能网页归档 使用 Mozilla Readability 自动保存和归档网页,AI 驱动的内容提取
● RSS 订阅管理 集中管理所有 RSS 订阅,支持智能分类、OPML 导入 / 导出和全文搜索
● 强大的全文搜索 Apache Lucene 搜索引擎,IK 分词器支持中文分词,布尔运算符和模糊搜索
● 社交媒体集成 特殊处理 Twitter/X 内容,自动重建推文线程并保存媒体
● GitHub 集成 同步和组织您的 GitHub stars,提取仓库元数据和 README
● 隐私与自托管 100% 自托管,SQLite 数据库,Docker 部署,完全掌控您的数据
● 多平台支持 Web 应用、Chrome 扩展 (Manifest V3) 和桌面应用 (Tauri)

#Tool #AI #GitHub #Chrome #Extension GitHub - lcomplete/huntly: Your Personal AI-Powered Information Hub
▎MTranServer
一个超低资源消耗速度超快的离线翻译模型服务器,无需显卡。单个请求平均响应时间 50 毫秒。支持全世界主要语言的翻译。

本地模型,适合私有化部署到自己项目上,可以实现无限免费翻译的模板,和主流大模型相比数据较小,翻译质量会逊于主流模型。主要优点还是无限免费。
#项目 #GitHub #翻译 #ai

地址:GitHub
▎WhisperJAV
一款用于日本成人视频的字幕生成器。采用了针对日语会话语音优化的HuggingFace模型

支持DeepSeek(廉价)、Gemini(免费套餐)、Claude、GPT-4和OpenRouter。

不过操作起来还是挺麻烦得,下载得前置软件有ffmpeg等,可以详细看下说明。
应该项目还是早期,感兴趣的可以尝鲜下,或者等后期完善。无中文界面
#ai #视频 #翻译 #GitHub

地址:GitHub
AI 验证码求解器 - Chrome扩展
一个功能完整的Chrome扩展程序,使用AI大模型自动识别和填充验证码。

支持OpenAI、Claude、Google Gemini等
自动识别img/canvas/svg类型的验证码
识别后自动填充到输入框,模拟真实用户输入
#浏览器 #插件 #ai #GitHub

地址:GitHub
#电子书 #阅读 #开源 #AI

Anx Reader

电子书阅读器,支持 EPUB、MOBI、AZW3、FB2、TXT、PDF 等主流格式,可基于阅读内容生成心智图、提供随需翻译与词典查询、整理章节摘要与视角分析,阅读界面可调节字体、行间距、段落间距、边距、主题风格、对齐方式,还支持字体样式与背景调整,支持标注、笔记、文本转语音、整书中英翻译、简繁转换等特性,另外通过 WebDAV 实现书籍、笔记与阅读进度的同步,免费开源,适用于 Android、iOS、Windows、macOS 甚至 Linux 平台。

❤️主页 🐙GitHub

频道 @WidgetChannel
AI工程不断迭代升级,想掌握LLM、RAG和智能代理的实战技巧?

AI Engineering Hub 是一个集深度教程与实战案例于一体的开源项目,覆盖大语言模型、检索增强生成、AI代理等前沿内容。无论你是入门者、开发者还是研究者,都能在这里找到丰富资源,助力项目落地和技能提升。

主要特色:
- 系统讲解大型语言模型(LLM)和检索增强生成(RAG)技术
- 丰富的AI智能代理实战案例,展示真实业务应用
- 详细示例代码,方便快速上手和二次开发
- 免费数据科学电子书赠送,涵盖150+核心课程,订阅即得
#资源参考 #AI Engineering Hub #LLM #RAG #AI前沿内容 GitHub - patchy631/ai-engineering-hub: In-depth tutorials on LLMs, RAGs and real-world AI agent applications.
日常工作、学习和创作中,信息海量且杂乱,如何高效整理和利用上下文成为挑战。

MineContext 是一个开源的主动式上下文感知AI助手,通过截屏和内容理解(未来支持多模态多源信息),实时捕获你的数字世界全貌,自动生成日/周总结、待办事项和活动记录,帮助你理清思路,提升效率。

主要功能:

- 自动截屏,持续捕捉你的数字工作环境,轻松收集海量上下文;
- 智能重现相关内容,创作时快速调取关键资料;
- 主动推送洞见和总结,让信息主动找上你;
- 本地存储,隐私安全有保障;
- 支持多API接入,灵活定制,完美贴合你的需求。

适合知识工作者、内容创作者、项目经理等多种角色。无需频繁切换工具,MineContext让你的数字生活更智能、更高效。
#资源参考 #AI #开源 MineContext/README_zh.md at main · volcengine/MineContext
#AI #编程

Antigravity Tools - 一款专业的 Antigravity 账号管理与切换工具

工具支持 API 反代、智能账号轮询、完美上下文、Token 自动保活等强大功能!

➡️相关阅读:Google 推出 AI 编程工具「Antigravity」

📮投稿 📢频道 💬群聊 🔎索引
#iOS #BUG #AI

Misaka26

iOS/iPadOS 高级系统定制工具,利用 TrollRestore 漏洞实现无需越狱即可启用系统增强功能,包括多任务、动态岛、充电限制、开机声音、Always-On 显示、Apple Pencil 优化、Action Button、自定义时钟界面、相机静音等,最重要的是可以开启 Apple Intelligence ,即苹果 AI ,需要下载 IPA 文件后重启才能生效,免费开源。

注意!使用此工具可能会导致系统无限重启,因此请在使用前创建备份。

🐙 GitHub

频道 @WidgetChannel
Visual Story-Writing 是一套创新系统,能够自动将文本故事可视化呈现,展示事件的时间线、角色及其行为。

用户可通过便捷的工具编辑故事。

核心功能包括:通过时间轴交互查看事件、在合并或移动角色时编辑文本,以及重新排列事件顺序。

该系统采用GPT-4o进行信息提取与修改建议。

该程序采用TypeScript开发,结合React和Vite框架,确保与现代浏览器兼容。

🧬 https://github.com/m-damien/VisualStoryWriting

#AI #tools GitHub - m-damien/VisualStoryWriting: 🧙‍♂️ Writing by manipulating visual representations of stories
 
 
Back to Top