01
Claude Code 的开源外挂
开源项目 agents是一个专门为 Claude Code 设计的智能自动化和多智能体编排系统。
使用这个开源项目, CC 不再是独自面对一个 AI 助手,而是可以根据需要,随时聘请不同的专家团队。
比如 63 个插件、85 个智能体、47 个 Skills 啥的:
而且开发者也考虑到了 Token 消耗,这个项目的核心优势就是极致的 Token 效率和混合模型编排策略。
上下文加载方式不臃肿,只需要安装所需的插件,利用渐进式披露技术在任务需要时才加载相关技能知识。
而且系统智能地分配任务,让擅长推理的 Claude 3.5 Sonnet 负责规划与架构,让速度更快的 Haiku 模型负责具体执行,从而在保证高质量输出的同时降低成本并提升响应速度。
开源地址:https://github.com/wshobson/agents02
微软开源播客神器
VibeVoice 是微软开源的一款前沿语音 AI 框架,专门用来生成富有表现力、超长时长、多说话人对话音频的框架。
VibeVoice 最炸裂的功能是支持 90 分钟超长生成 & 4 人群聊。
支持长达 90 分钟的对话生成,而且,它能让 4 个不同的说话人在同一个音频里聊天,非常适合用来制作 AI 播客、广播剧或者长篇有声读物。
除了录播,直播也能行,最新发布的 VibeVoice-Realtime-0.5B 模型,专为低延迟设计。
它能做到~300 毫秒的首字响应速度,支持流式文本输入。你可以用它来搭建几乎无延迟的 AI 语音助手,体验丝滑的实时对话。
开源地址:https://github.com/microsoft/VibeVoice03
AI 浏览器自动化冲浪助手
VibeSurf是一个AI Agent 驱动的智能浏览器助手,专为 Vibe Surfing(沉浸式冲浪)而生。
你只需要告诉它你的目标,它就能通过 AI 智能规划任务,自动执行深度搜索、内容爬取、总结归纳等操作。
项目采用 Chrome DevTools Protocol 替代 Playwright,显著提升了抗检测能力。而且支持在不同标签页中同时运行多个 AI Agent 进行并行处理,大幅提高效率。
此外,VibeSurf 坚持隐私优先,支持 Ollama 等本地大模型及自定义 LLM API,确保用户浏览数据的安全。
在生态与扩展性方面,VibeSurf 计划集成包括 Gmail、Notion 在内的数百种第三方工具,并支持针对小红书、抖音等平台 API 操作。
其路线图还包含了拖拽式工作流创建、浏览器内代码执行代理以及具备记忆功能的个性化伴侣系统,旨在成为全能的 AI 浏览器伴侣。
开源地址:https://github.com/vibesurf-ai/VibeSurf04
浏览器控制和爬虫合二为一
DrissionPage 是一个基于 Python 的网页自动化工具。它的名字其实就暴露了野心:Drission = Driver + Session。
简单来说,它创造性地将浏览器自动化(Driver 模式)和数据包发送(Session 模式)合二为一。
你可以在同一个脚本中,先用浏览器模式登录复杂的网站,拿到 Cookies 后瞬间切换到发包模式抓取数据。
或者在发包模式搞不定时,一键切换回浏览器模式继续操作。它不仅是为了替代 Selenium,更是为了解决自动化与高效率难以兼得的痛点
开源地址:https://github.com/g1879/DrissionPage05
点击下方卡片,关注逛逛 GitHub
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了: