news 2026/3/26 16:09:59

mHC:流形约束超连接

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
mHC:流形约束超连接

摘要

https://arxiv.org/pdf/2512.24880
近期,以超连接(Hyper-Connections, HC)为代表的研究扩展了过去十年确立的无处不在的残差连接范式,通过扩展残差流宽度和多样化连接模式。虽然这带来了显著的性能提升,但这种多样化从根本上损害了残差连接固有的恒等映射特性,导致严重的训练不稳定性和受限的可扩展性,并且额外产生了显著的内存访问开销。为了解决这些挑战,我们提出了流形约束超连接(Manifold-Constrained Hyper-Connections, mHC),这是一个通用框架,通过将HC的残差连接空间投影到特定流形上来恢复恒等映射特性,同时结合严格的基础设施优化以确保效率。实证实验表明,mHC在大规模训练中是有效的,提供了切实的性能改进和卓越的可扩展性。我们预期mHC作为HC的灵活实用扩展,将有助于更深入地理解拓扑架构设计,并为基础模型的演进指明有前途的方向。

图1 | 残差连接范式示意图。该图比较了(a)标准残差连接,(b)超连接(HC)和(c)我们提出的流形约束超连接(mHC)的结构设计。与不受约束的HC不同,mHC通过将矩阵投影到约束流形上来优化残差连接空间,以确保稳定性。

1. 引言

自从ResNets(He等,2016a)提出以来,深度神经网络架构经历了快速演变。如图1(a)所示,单层的结构可以表述如下:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/22 6:48:28

OpenWebRX+:构建个人在线无线电接收平台的完整指南

OpenWebRX:构建个人在线无线电接收平台的完整指南 【免费下载链接】openwebrx Open source, multi-user SDR receiver software with a web interface 项目地址: https://gitcode.com/gh_mirrors/open/openwebrx 在数字化时代,无线电技术正经历着…

作者头像 李华
网站建设 2026/3/26 3:56:31

有声漫画自动配音:图文转语音提升阅读体验

有声漫画自动配音:图文转语音提升阅读体验 在短视频与播客席卷内容生态的今天,静态图文正面临前所未有的注意力挑战。用户不再满足于“看”故事——他们想“听”到情绪、“感受”到语气,甚至希望角色用熟悉的乡音与自己对话。这种对多感官沉浸…

作者头像 李华
网站建设 2026/3/20 7:59:36

终极指南:如何在Windows上一键调节LG Ultrafine显示器亮度

终极指南:如何在Windows上一键调节LG Ultrafine显示器亮度 【免费下载链接】LG-Ultrafine-Brightness A tool to adjust brightness of LG Ultrafine 4k/5K on Windows 项目地址: https://gitcode.com/gh_mirrors/lg/LG-Ultrafine-Brightness 还在为Windows系…

作者头像 李华
网站建设 2026/3/18 5:51:56

DxWrapper:Windows 10/11老游戏兼容性终极解决方案

DxWrapper:Windows 10/11老游戏兼容性终极解决方案 【免费下载链接】dxwrapper Fixes compatibility issues with older games running on Windows 10 by wrapping DirectX dlls. Also allows loading custom libraries with the file extension .asi into game pro…

作者头像 李华
网站建设 2026/3/19 10:40:29

AugmentCode智能续杯:测试账户自动生成的效率革命

AugmentCode智能续杯:测试账户自动生成的效率革命 【免费下载链接】free-augment-code AugmentCode 无限续杯浏览器插件 项目地址: https://gitcode.com/gh_mirrors/fr/free-augment-code 你是否曾经在开发测试过程中,为了创建多个测试账户而反复…

作者头像 李华
网站建设 2026/3/22 15:16:01

CosyVoice3声音克隆技术深度解析:自然语言控制语气情绪,打造个性化TTS

CosyVoice3声音克隆技术深度解析:自然语言控制语气情绪,打造个性化TTS 在短视频博主为一条旁白反复录制十遍仍不满意时,在视障人士渴望用“自己的声音”朗读孩子作文却只能依赖机械音时——我们正站在语音合成技术变革的临界点。阿里开源的 C…

作者头像 李华