Visual Story-Writing 是一套创新系统,能够自动将文本故事可视化呈现,展示事件的时间线、角色及其行为。
用户可通过便捷的工具编辑故事。
核心功能包括:通过时间轴交互查看事件、在合并或移动角色时编辑文本,以及重新排列事件顺序。
该系统采用GPT-4o进行信息提取与修改建议。
该程序采用TypeScript开发,结合React和Vite框架,确保与现代浏览器兼容。
🧬 https://github.com/m-damien/VisualStoryWriting
#AI #tools
用户可通过便捷的工具编辑故事。
核心功能包括:通过时间轴交互查看事件、在合并或移动角色时编辑文本,以及重新排列事件顺序。
该系统采用GPT-4o进行信息提取与修改建议。
该程序采用TypeScript开发,结合React和Vite框架,确保与现代浏览器兼容。
🧬 https://github.com/m-damien/VisualStoryWriting
#AI #tools
Readify
基于 AI 实现的电子书转有声书工具,兼容 TXT、PDF、EPUB、MOBI、AZW3、DOCX 等主流电子书格式,内置 100+ 种高保真 AI 音色,支持 40+ 种语言,支持站内智能搜书、多设备同步、定时关闭、自定义书库布局等,且针对无障碍用户进行了优化,目前免费无广告,适用于 iOS 和 Android 系统。
https://readifyai.com
频道 @WidgetChannel
https://codewiki.google/
加强版的 DeepWiki,由 Google Gemini AI 驱动的代码仓库理解工具。
用于代码仓库的文档维护和交互,帮助开发者快速理解代码库,支持与代码“聊天”查询,并生成持续更新的结构化文档。
#Google #AI #Tool #URL
目前免费,支持公开仓库,未来将扩展到私有仓库和 Gemini CLI。
How to Sketch
图片转素描风格,上传图片点击转换即可,效果看着还不错,可能会过于精致,支持 JPG、PNG 和 GIF 格式,文件大小上限为 5MB,图像会在 24 小时后自动删除,免费使用,无需注册。
https://howtosketch.net
频道 @WidgetChannel
SpleeterGUI
音源分离工具,可将歌曲或音频文件拆分为鼓点、贝斯、人声等独立轨道,可用于重新混音或去除录音中的背景噪音,如鸟鸣、路声或喇叭声。使用前需下载完整模型(约 1.2GB),免费使用。
https://spleetergui.com/
频道 @Edgebyte
神奇弹幕 - 哔哩哔哩/抖音直播万能场控机器人
https://github.com/iwxyi/Bilibili-MagicalDanmaku
整合弹幕姬+答谢姬+点歌姬+回复姬+多种大模型AI+工作流(workflow),支持弹幕聊天、观众互动与管理、数据统计与分析、自动点歌、私信处理、AI自动闲聊、AI直播建议等。最大的特点是可编程控制,像搭积木一样设置各种互动规则,打造专属直播风格!
#Video #Tool #AI #GitHub
https://github.com/iwxyi/Bilibili-MagicalDanmaku
整合弹幕姬+答谢姬+点歌姬+回复姬+多种大模型AI+工作流(workflow),支持弹幕聊天、观众互动与管理、数据统计与分析、自动点歌、私信处理、AI自动闲聊、AI直播建议等。最大的特点是可编程控制,像搭积木一样设置各种互动规则,打造专属直播风格!
#Video #Tool #AI #GitHub
《Agentic Design Patterns》中文翻译版
https://github.com/ginobefun/agentic-design-patterns-cn
Antonio Gulli 所著《Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems》的中英文对照翻译。该书是一部全面的技术指南,涵盖了现代人工智能系统中智能体 (Agent) 设计的核心概念和实践方法。
#AI #Doc
https://github.com/ginobefun/agentic-design-patterns-cn
Antonio Gulli 所著《Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems》的中英文对照翻译。该书是一部全面的技术指南,涵盖了现代人工智能系统中智能体 (Agent) 设计的核心概念和实践方法。
#AI #Doc
MineContext:洞察本质,激发创造
一个开源、主动的上下文感知 AI 伙伴,致力于让您的工作、学习与创作更加清晰高效。
https://github.com/volcengine/MineContext
基于屏幕截图 + 内容理解的方式(未来还将支持其他来源的多模态信息,包括文档、图片、视频、代码、外部应用数据),能够看到并看懂用户的数字世界上下文,然后再基于底层的上下文工程框架,主动推送洞察、日 / 周总结 、待办、活动记录等高质量信息,同时支持用户基于 Context 和生成的信息进行再创作。
MineContext 专注于四个核心功能:无负担收集、主动推送、智能浮现和上下文工程架构。
#AI #Tool #GitHub
一个开源、主动的上下文感知 AI 伙伴,致力于让您的工作、学习与创作更加清晰高效。
https://github.com/volcengine/MineContext
基于屏幕截图 + 内容理解的方式(未来还将支持其他来源的多模态信息,包括文档、图片、视频、代码、外部应用数据),能够看到并看懂用户的数字世界上下文,然后再基于底层的上下文工程框架,主动推送洞察、日 / 周总结 、待办、活动记录等高质量信息,同时支持用户基于 Context 和生成的信息进行再创作。
MineContext 专注于四个核心功能:无负担收集、主动推送、智能浮现和上下文工程架构。
#AI #Tool #GitHub
News Hacker|极客洞察
一个总结 Hacker News 最新条目及其讨论的网站,可以快速了解讨论背景和讨论焦点,而且附带了术语解释,喜欢看 HN 的朋友可以体验一下,界面 UI 做的感觉也还挺好的,免费使用,无需注册。
https://newshacker.me
频道 @WidgetChannel
Chat4Data
网页结构化数据提取插件,可在任意网页上通过自然语言指定所需信息,如商品详情、图片、链接、邮箱或电话号码等,具备自动识别网页内容、智能处理分页与动态加载、提取隐藏元素等能力,支持一次性获取完整列表内容,并将结果直接导出为 Excel 文件,注册有 100 万免费 tokens,有需要的可以体验一下。
https://chat4data.ai
频道 @WidgetChannel
📩 接读者来稿,TA 向我们推荐了自己开发的 AI 有声书软件
🎧 Readify:让 AI 为每个人朗读世界
🔗:Web | App Store | Google Play
Readify 是一款 完全免费的 AI 听书应用,让你轻松把任何电子书变成自然流畅的有声书。无论你在通勤、休息,还是想在夜晚闭眼聆听故事,Readify 都能让阅读变得更自由。
✨ 核心功能亮点
📖 多格式文件支持
兼容 TXT、PDF、EPUB、MOBI、AZW3、DOCX 等主流电子书格式,上传即可自动转换为可听内容。
🎙️ AI 音色库
内置 100+ 种高保真AI音色,支持 40+ 种语言。我们的AI语音拥有顶级自然效果,语气丰富、有温度,媲美真人朗读。
🔍 AI 搜书
支持站内智能搜书,只需挂梯子即可免费下载书籍。
不知道看什么?在搜索栏描述你的喜好类型,AI 会为你推荐合适的作品。
💬 AI 问答助手
听书不止于听。任何书中人物、概念或情节疑问,都能即时提问,让 AI 帮你更深度理解书籍。
其他功能
- 定时关闭:睡前听书不怕忘记关。
- 自定义书库布局:列表/宫格模式随心切换。
- 纯净体验:无任何广告打扰,只专注于阅读与聆听。
🌍 无障碍优化,为视障用户发声
Readify 正在持续推进 应用无障碍优化。
我们的社群就聚集了超过 100名视障用户,根据他们的实际反馈进行定向改进。
目前,iOS 端的 VoiceOver 旁白模式已可完整使用包括听书、搜书在内的全部功能。
并且还在持续优化中
我们相信 —— 阅读的权利,不应被视觉所限制。
👏 100%免费使用,欢迎大家体验!
频道:@NewlearnerChannel
Anthropic Skills
https://www.anthropic.com/news/skills
Skills 是包含指令、脚本和资源的文件夹,Claude 可动态加载以提升特定任务的执行能力,支持企业品牌指南、数据分析工作流或个人任务自动化。支持在 Claude Code、Claude.ai 和 Claude API 中使用。
● 创意设计类:算法艺术生成、画布设计、Slack GIF 创建器
● 开发技术类:artifacts 构建器、MCP 服务器创建、Web 应用测试
● 企业沟通类:品牌指南、内部通信、主题工厂
● 元技能类:skill-creator(技能创建指南)、template-skill(基础模板)
● 文档技能:包含 docx、pdf、pptx、xlsx 等高级文档处理技能,展示如何处理复杂文件格式和二进制数据。
#AI
https://www.anthropic.com/news/skills
Skills 是包含指令、脚本和资源的文件夹,Claude 可动态加载以提升特定任务的执行能力,支持企业品牌指南、数据分析工作流或个人任务自动化。支持在 Claude Code、Claude.ai 和 Claude API 中使用。
● 创意设计类:算法艺术生成、画布设计、Slack GIF 创建器
● 开发技术类:artifacts 构建器、MCP 服务器创建、Web 应用测试
● 企业沟通类:品牌指南、内部通信、主题工厂
● 元技能类:skill-creator(技能创建指南)、template-skill(基础模板)
● 文档技能:包含 docx、pdf、pptx、xlsx 等高级文档处理技能,展示如何处理复杂文件格式和二进制数据。
#AI
蛐蛐 (QuQu) - 开源免费的 Wispr Flow 替代方案 | 为中文而生的下一代智能语音工作流
https://github.com/yan5xu/ququ
蛐蛐 (QuQu) 是 一个开源免费的 Wispr Flow 替代方案, 专为中文用户打造的注重隐私的桌面端语音输入与文本处理工具。
它集成了阿里巴巴开源的 FunASR 本地语音识别模型, 并支持配置国内顶尖的大语言模型, 提供高精度的中文语音转文字和智能文本优化功能。
● 完全免费开源, 数据本地处理, 保护用户隐私
● 专为中文优化, 支持国产 AI 模型如通义千问、Kimi 等
● 独创 "ASR 精准识别 + LLM 智能优化 " 的两段式引擎
● 能准确识别并格式化编程术语, 支持自定义 AI 指令
● 提供全局快捷键唤醒, 实时识别和无缝粘贴功能
#AI #Voice #Tool #GitHub
https://github.com/yan5xu/ququ
离线语音输入,无需会员,不连云端,保证隐私。
蛐蛐 (QuQu) 是 一个开源免费的 Wispr Flow 替代方案, 专为中文用户打造的注重隐私的桌面端语音输入与文本处理工具。
它集成了阿里巴巴开源的 FunASR 本地语音识别模型, 并支持配置国内顶尖的大语言模型, 提供高精度的中文语音转文字和智能文本优化功能。
● 完全免费开源, 数据本地处理, 保护用户隐私
● 专为中文优化, 支持国产 AI 模型如通义千问、Kimi 等
● 独创 "ASR 精准识别 + LLM 智能优化 " 的两段式引擎
● 能准确识别并格式化编程术语, 支持自定义 AI 指令
● 提供全局快捷键唤醒, 实时识别和无缝粘贴功能
#AI #Voice #Tool #GitHub
Fake News Detector - AI 虚假新闻检测器
https://github.com/CaptainYifei/fake-news-detector
一个基于事实核查的智能新闻验证系统,支持多语言、多模型提供商,使用先进的语义嵌入技术和大型语言模型进行准确的事实核查。
#AI #Tool #GitHub
https://github.com/CaptainYifei/fake-news-detector
在 AI 不产生幻觉的场景下,打假还是可靠的
一个基于事实核查的智能新闻验证系统,支持多语言、多模型提供商,使用先进的语义嵌入技术和大型语言模型进行准确的事实核查。
#AI #Tool #GitHub
WhisperLiveKit - 本地语音转录工具(开源语音识别转文字)
https://github.com/QuentinFuxa/WhisperLiveKit
WhisperLiveKit 是一个开源的本地语音转录工具,集实时语音转文本、翻译和说话人分离于一体。 它使用了最新的语音识别和语音分离技术,可以提供低延迟和高准确度的转录结果,能用于会议实时记录和跨语言交流。
● 提供实时语音转文本功能,支持多达 100 种语言的翻译
● 支持实时说话人识别和分离
● 提供简单易用的前端和后端 API
● 支持在浏览器和 Chrome 扩展中使用
● 支持在 Docker 容器中部署
#Voice #AI #Tool #GitHub
https://github.com/QuentinFuxa/WhisperLiveKit
WhisperLiveKit 是一个开源的本地语音转录工具,集实时语音转文本、翻译和说话人分离于一体。 它使用了最新的语音识别和语音分离技术,可以提供低延迟和高准确度的转录结果,能用于会议实时记录和跨语言交流。
● 提供实时语音转文本功能,支持多达 100 种语言的翻译
● 支持实时说话人识别和分离
● 提供简单易用的前端和后端 API
● 支持在浏览器和 Chrome 扩展中使用
● 支持在 Docker 容器中部署
#Voice #AI #Tool #GitHub
▫️隐私保护:无需登录注册,任务记录保存在本地。
▫️前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg。
▫️多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
▫️AI 对话:支持针对视频内容进行 AI 二次问答。
▫️支持字幕导出: 结果一键导出为字幕文件。
▫️智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
▫️支持自定义 Prompt:支持在前端自定义配置 prompt。
▫️一键部署:支持 Docker 一键部署。
▫️支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。
📮投稿 📢频道 💬群聊