news 2026/5/8 20:38:50

RWKV DevDay 2025 圆满落幕,看见 RWKV-8 的无限可能!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RWKV DevDay 2025 圆满落幕,看见 RWKV-8 的无限可能!

2025 年 12 月 13 日,RWKV 在上海漕河泾举办了主题为《RWKV-8 与未来趋势》的 2025 RWKV DevDay。

十位来自 RWKV 开源社区的重磅嘉宾带来了深度分享,内容涵盖 RWKV-8 的核心 ROSA 机制、并发推理、端侧推理优化、评测方法,以及 RWKV 最新生态进展等多个维度。现场气氛热烈,观众与嘉宾进行了深入的互动与探讨。

分享嘉宾精彩回顾

侯皓文,人工智能与数字经济广东省实验室(深圳)副研究员,分享主题:《RWKV-8 介绍及 RWKV embedding》

郑云骜,来自北京邮电大学, 分享主题:《ROSA-tuning》

ROSA-Tuning 提供了一种基于 RWKV ROSA 思想的微调方法,使所有 LLM(例如 Qwen3) 使用滑动窗口注意力(SWA)+ ROSA 就能处理任意长的输入,同时获得比完整的全局注意力更好的性能

在推理过程中,ROSA 只需缓存与输入序列对应的rosa_token_id,而不是代价昂贵的 kv_cache,从而实现了显著更低的时空复杂度。

目前 ROSA-Tuning 已经支持多 GPU、多节点和多核训练。

黄文杰,浙江大学博士生,分享主题:《rosa_soft》

rosa_soft 提供了一个端到端可训练的 ROSA 算子实现,将原本离散、不可微的 ROSA 机制成功融入现代深度学习训练流程。

该方法在前向传播严格执行离散、高效的 Hard ROSA 后缀自动机逻辑,保证推理效率与语义忠实性;在反向传播则引入新设计 SUFA(Suffix Attention) 作为梯度代理,并结合 Value Detach + 几何衰减(VDD) 训练策略,使 Q/K 学会对齐最长公共后缀、V 保持结构化与清晰表达,从而实现稳定有效的训练。

rosa_soft 算子源自 RWKV-8 ROSA 的“无限长、无损信息传播”思想,因此具备无 KV Cache、无点积 Softmax、CPU 高效并行推理等优势,目前已提供高性能 C++ 内核与 PyTorch 接口。

顾真牛,RWKV 社区核心开发者、Ai00 作者,分享主题:《RWKV State Tuning 实战》

李韦乐,RWKV 社区核心开发者,分享主题:《RWKV 高并行 Demo》

王策,元始智能应用开发工程师,分享主题:《RWKV 端侧 Chat》

康嘉乐,元始智能高级算法工程师,分享主题:《ModRWKV:RWKV 端侧 See 和 Talk》

张恺之,SSPU AILab RA、RWKV 社区核心开发者,分享主题:《RWKV Benchmark》

Jellyfish042,深圳大学研究生,分享主题:《RWKV Uncheatable Eval》

罗璇,元始智能联合创始人,分享主题:《RWKV 生态进展》

大会现场还通过三个具体的 Demo,直观展示了 RWKV 在不同领域的实际应用能力:

  • 批量网页生成:通过高并行推理 Demo,展示了 RWKV 批量同时生成几十个网页代码的能力,体现了模型在多 agent 等高并发场景下的效率优势
  • 端侧多模态交互(Chat & See & Talk): 在端侧设备上直接运行 RWKV 多模态模型,无需联网即可实现流畅的视觉识别与语音对话,展现了 RWKV 低功耗、低资源占用的特性
  • 音乐生成(RWKV 作曲家 APP):基于 RWKV 模型的作曲工具,模型可以离线生成连贯且动听的乐曲

RWKV DevDay 2025 已圆满落幕,来自 RWKV 社区开发者与核心团队的精彩分享,让我们看见了 RWKV-8 的无限可能。

感谢每一位嘉宾和参会者的参与和支持。期待在下一次 DevDay,与大家再次相见!

精彩预告:《RWKV 论文研讨会》即将启动

RWKV 社区将于近期举办《RWKV 论文研讨会》。论文研讨会将以线上直播形式开展,进一步协助推广 RWKV 社区的学术研究工作。欢迎各位 RWKV 论文作者联系我们提交议题!(可在公众号后台留言)

《RWKV 论文研讨会》将于 2026 年开始定期播出,具体的议程及主题,敬请留意公众号后续通知。

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。

  • 📖 RWKV 中文文档:https://www.rwkv.cn
  • 💬 RWKV 论坛:https://community.rwkv.cn/
  • 🐧 QQ 频道:https://pd.qq.com/s/9n21eravc | QQ 交流群:224287095
  • 📺 BiliBili 视频教程:https://space.bilibili.com/3546689096910933
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 5:55:16

芯片失效分析

芯片失效分析总结 芯片失效分析是一门结合材料科学、电子工程、物理学和化学的综合性学科,其核心目标是定位失效点、确定失效机理、找出失效根因,从而改进设计、工艺和封装,提升产品良率、可靠性和寿命。 一、 核心价值与目的 提升良率&#…

作者头像 李华
网站建设 2026/5/8 0:14:22

everything到指定文件夹搜索

1、概述 在 Everything 中输入“搜索文件”时,默认会进行全盘搜索。但在某些场景下,我们可能希望只在特定文件夹中查找内容。例如,我想搜索 animation.h,但只想在 E:\chromium 目录下查找,而不是在整个 E 盘和 F 盘中…

作者头像 李华
网站建设 2026/5/2 5:57:50

8 个自考论文降重工具,AI 写作推荐与对比

8 个自考论文降重工具,AI 写作推荐与对比 论文路上的“重担”:自考人的真实写照 对于每一位自考学子来说,毕业论文从来不是一件轻松的事。它不仅是一次学术能力的考验,更是时间与精力的双重挑战。尤其是在论文写作过程中&#x…

作者头像 李华
网站建设 2026/5/4 9:14:04

如何将公司内部知识库(Word/PDF)接入大模型?

2025 年 12 月,OpenAI 正式发布以 “职场效率革新” 为核心的 GPT-5.2 大模型,其在长文档分析、多模态理解、专业场景推理等领域的突破性表现,为企业激活内部知识资产提供了全新可能。对于企业而言,GPT-5.2 的强大能力不至于通用问…

作者头像 李华
网站建设 2026/5/5 14:03:41

视频帧检索响应延迟高?3步完成Dify索引深度优化

第一章:视频帧检索响应延迟高?3步完成Dify索引深度优化在处理大规模视频分析任务时,Dify平台常用于构建智能检索系统。然而,当视频帧数据量激增,原始索引策略往往导致检索响应延迟显著上升。通过针对性的索引优化&…

作者头像 李华
网站建设 2026/4/30 5:53:17

视频帧提取的Dify存储优化(百万级帧处理核心技术曝光)

第一章:视频帧提取的 Dify 存储优化在高并发视频处理场景中,视频帧提取的效率与存储管理直接影响系统整体性能。Dify 作为支持 AI 工作流编排的平台,其存储机制在处理大量临时帧文件时面临 I/O 压力与资源浪费问题。通过优化存储路径、引入缓…

作者头像 李华