news 2026/7/1 11:59:47

【Rust日报】 ffmpReg 简介:一个完全用纯 Rust 重写的 ffmpeg

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Rust日报】 ffmpReg 简介:一个完全用纯 Rust 重写的 ffmpeg

AMD Zen 5 的性能突破 & SIMD 编程在纯 ffmpReg 简介:一个完全用纯 Rust 重写的 ffmpeg 库。](https://rustcc.cn/article?id=1568fafd-f7e8-4ccd-bf58-957425bcd82d)

  • 嗨,各位 Rustaceans,我今年 21 岁,我一直在开发ffmpReg,它是用纯 Rust 语言完全重写的 ffmpeg。

    过去五天我一直专注于扩展容器和编解码器支持。目前,ffmpreg 可以转换 WAV 格式(pcm_s16le → pcm_s24le → pcm_f32le),并能部分读取 MKV 流,显示容器、编解码器和时基信息。完整的容器支持即将推出。

    如果你觉得这个项目有趣,给它点个赞真的能帮助它保持势头🥺。

    r/rust - ffmpReg 简介,一个完全用 Rust 重写的 ffmpeg 库。

【实验性】通过二进制协议使用 SolidJS 驱动 Zed 的 GPUI——一种“无 DOM” GUI 架构

嗨,各位Rustaceans🦀,

我一直在尝试一个想法:如果我们能将 SolidJS 的 DX 与 Zed 的 GPUI 引擎的原始性能结合起来,会怎么样?

我没有使用 WebView(如 Tauri/Electron),而是构建了一个名为Alloy 的原型。

建筑设计:

  1. 逻辑层:SolidJS(已编译)运行在嵌入式 QuickJS 运行时环境中。

  2. 协议:自定义二进制命令缓冲区(不使用 JSON 序列化)。JS 线程将字节码(CreateNode、SetStyle、UpdateText 等)写入 Uint8Array。

  3. 渲染层:Rust 每帧消耗一次缓冲区,更新“Shadow DOM”结构,并直接使用GPUI进行渲染。

“Vibe Coding”免责声明:这是一个“第0阶段”的概念验证。为了快速验证架构,我使用了LLM(Claude/Gemini)生成了大量样板代码,特别是JS到Rust的粘合代码。

  • 好消息:管道运行正常!我有一个可用的计数器示例,它通过细粒度的响应式控制原生像素。🚀

  • 缺点:代码不够完善。具体来说,样式引擎存在缺陷(GPUI 修饰符的动态映射比较棘手)。

我发帖的目的是:我认为这种架构(通过二进制流实现逻辑/渲染分离)是实现高性能 GUI 的可行方案。我正在寻求关于该架构的反馈,并希望熟悉 GPUUI 内部机制的人士能够帮助我改进样式系统。

仓库:Alex6357/alloy:一个“无 DOM” GUI 运行时:SolidJS 逻辑驱动 Rust GPUI 渲染。

Haagenti v0.1.0 - 在单个消费级 GPU(24GB 显存)上进行 70B 模型推理

Haagenti v0.1.0 - 在单个消费级 GPU(24GB 显存)上进行 70B 模型推理

今天我发布了 Haagenti,这是一个纯 Rust 压缩库,它能让你在现有硬件上实现前沿的 AI 推理。请原谅我的啰嗦,因为并非每个人都了解下面的数学原理。

声称:一个 700 亿参数模型可以在单个RTX 4500 Ada(24GB 显存)上运行。

不合理的计算:FP16 精度下 700 亿参数约需 140GB 内存。即使是 INT4 量化也需要约 35GB 内存。RTX 4500 Ada 显卡只有 24GB 内存。

方法:Haagenti 实现了HoloTensor编码——一种用于神经网络权重的全息压缩和渐进式重构技术。权重以压缩形式存储在显存 (VRAM) 中,并在推理过程中按需解压缩。

真实的数字:

当前测得吞吐量:1.3 个令牌/秒

目标吞吐量:25 个令牌/秒

是的,1.3 tk/s 的速度确实很慢。但问题是——它不是哈根蒂处理器

我们发现瓶颈在于张量库的开销。每次加载 448MB 的张量需要 306 毫秒,而理论上的最短时间仅为 18 毫秒。这是库层而非压缩层造成的 17 倍性能损耗。完整分析:docs/CANDLE-CEILING-ANALYSIS.md

Haagenti 的任务是将 140GB 的数据装进 24GB 的存储空间。它做到了。吞吐量问题出在上游。

接下来是Nihil——一个基于Sigil的张量库,专为全息内存访问模式而设计。我们预计它的速度将达到25+ tk/s。

为什么发布速度定在 1.3 tk/s?因为 Haagenti 算法有效。压缩算法有效。显存适配算法有效。而且,也许有人会在我之前解决张量库的问题。

从更宏观的角度来看:前沿人工智能不应该需要云基础设施或企业级硬件。如果这种模式可行,你就可以在本地私有地运行自己的 700 亿模型,而且可以使用你实际可以购买的 GPU。

28 个 crate。纯 Rust 编写。支持 SIMD 加速。可选 CUDA。MIT 许可。

链接:GitHub:https://github.com/Daemoniorum-LLC/haagenti crates.io:https://crates.io/crates/haagenti(发布中)由 Lilith Crook 和 Claude (Opus 4.5) 构建

From 日报小组 时光

社区学习交流平台订阅:

Rustcc论坛: 支持rss 微信公众号:Rust语言中文社区

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/17 14:39:47

Google AI帮我写的“炸裂”的产品介绍文案,我跪了!

老铁们,晚上好!这两天,晓衡微店上架了两款重量级的 Cocos 商业源码—— 《吃个火锅》 和 《亿万疆尸》 。以往上新,我都要憋半天,绞尽脑汁写产品介绍。但这一次,我偷了个懒,但我敢保证&#xff…

作者头像 李华
网站建设 2026/6/23 11:09:06

敏捷咨询实战:如何让DevOps从理念到高效落地

“我们引入了先进的DevOps工具,为什么效率提升不明显?”、“开发与运维之间的墙似乎变薄了,但并未消失。”——这是许多企业在推行DevOps过程中遇到的真实困惑,也是敏捷咨询服务常常需要解决的核心问题。DevOps不仅仅是工具链的堆…

作者头像 李华
网站建设 2026/6/19 11:45:55

专著评职称加多少分?—专著加分影响因素分析

专著评职称加多少分?评职称的著作是怎么加分的?下面淘淘学术来回答作者的这个疑问。一、专著评职称加多少分学术专著是一项重要的学术成果,但是在评职称的时候具体加分多少,是有一些区别的。因为不同省份,不同类的单位…

作者头像 李华
网站建设 2026/6/22 1:27:05

SGM圣邦微 SGM2036S-1.1XXDH4G/TR DFN-4 线性稳压器(LDO)

特性 工作输入电压范围:1.6V至5.5V固定输出电压:0.8V、0.9V、1.0V、1.05V、1.1V、1.2V、1.3V、1.35V、1.5V、1.8V、1.85V、2.1V、2.2V、2.3V、2.5V、2.6V、2.7V、2.8V、2.85V、2.9V、3.0V、3.1V、3.3V、3.6V、4.2V、4.4V和5.0V输出电压可从0.8V调节至5.…

作者头像 李华