news 2026/4/22 7:34:05

IQuest-Coder-V1:国产大模型出现了新玩家

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
IQuest-Coder-V1:国产大模型出现了新玩家

前天,除了DeepSeek发布了新工作之外,另一个国内量化团队也搞了一个大动静。

九坤投资在去年成立的至知创新研究院团队发布了 IQuest-Coder-V1。

这是一个专注于代码领域的垂类模型,参数仅40B,不是MoE结构,而是Dense架构。

模型已开源在Hugging Face[1]上,共包括四款:

  • IQuest-Coder-V1-40B-Base-Stage1
  • IQuest-Coder-V1-40B-Base
  • IQuest-Coder-V1-40B-Instruct
  • IQuest-Coder-V1-40B-Loop-Instruct

前两个都是试验中间状态产物。

后两个是最终的完全体,带Loop表示引入LoopCoder机制的模型。

它公布的评测结果相当惊人,在各种评估基准上,比claude sonnet-4.5都要好。

核心亮点:LoopCoder

这个模型的训练过程从预训练、SFT到强化学习都比较常规。

核心亮点是提出了LoopCoder这个机制。

根据其代码仓库里的这篇论文[2]所述,LoopCoder主要是为了解决复杂问题推理。

LoopCoder这个机制是要求模型在中间状态时“思考”两遍。

如图所示,第一次输入Input Token,得到潜空间的结果Latent Input。

这个结果会被共享到第二次输入,进行第二轮迭代。

在第二次迭代中,计算两种注意力:全局注意力(查询关注第一次迭代的所有键值对)和局部注意力(查询仅关注第二次迭代中的先前令牌以保持因果关系)。

两种注意力输出通过一个基于查询表示的学习门控机制进行组合,该门控制全局上下文细化和局部因果依赖的加权混合,最后输出最终结果。

这个机制乍一看有点像Agent的自我迭代:将第一轮的输出再输入到模型中得到第二轮更好的结果。

但不同的是,LoopCoder是内部进行的,效率会更高,也可以针对性优化。

看完这个机制,想到了DeepSeek提出的思维链(CoT)。

思维链是要求模型在输出时,强制把思考过程作为结果一同输出出来。

而LoopCoder是直接让模型在“脑中”思考两遍,比如让它写一个代码,它第一遍先思考要用什么技术栈,代码架构怎么做,第二遍再具体去做。

这样去理解LoopCoder的动机,似乎有几分道理。

混合语言训练

大模型对不同编程语言的掌握情况是不一样的,在做预训练时,作者团队提出了一个有价值的发现:用混合语言的方式对模型训练,优于用单一语言进行微调。

他们进一步试验出了分配比例,在最佳比例下,不同语言的协同增益效果如下表所示:

从表中能够看出,Java对其它语言的增益非常显著,特别是C#和Java语法比较接近,相比基线有20%的增幅,看来还是Java的高质量代码最多。

从最终效果上看,大模型对语言的掌握情况从弱到强满足:

C# < Java ≈ Rust < Go < TypeScript < JavaScript < Python

评估结果对比

开头的图片仅展示了部分模型对比。

对于代码生成任务而言,更详细的对比如下表所示。

从数值上看,这个模型只能做到部分领先,没领先的几个基准上,指标也不是很差。

它没有提供API,如果要测它的实际表现,必须要本地部署才行。

网友All In AI的测试表明[3],该模型引入的LoopCoder机制会导致处理速度缓慢,实用价值不高。

此外,还有人发现[4],这个模型在 SWE-bench 基准上评测时,无意触发了该基准的漏洞:在评测中“看到了未来的 Git 提交”,等于提前拿到了标准答案,因此它的 SWE-bench 成绩会虚高。

这不是研究人员刻意“作弊”,而是评测数据集的问题,去年九月前就有人发现过[5]。

总结

这个模型在架构上的创新还是有点新意的,国产开源大模型赛道又增加了一个玩家。

他们的起步策略还是挺聪明的,不直接上来就搞通用大模型,而是在已经充分被市场验证价值的编程领域开始切入。

模型更小,领域更垂直,有可能成为今年的新趋势。

参考

[1] https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Instruct
[2] https://github.com/IQuestLab/IQuest-Coder-V1/blob/main/papers/LoopCoder_arxiv.pdf
[3] https://x.com/HaohaoHenr56041/status/2006843118969303382
[4] https://x.com/xeophon/status/2006969664346501589
[5] https://x.com/giffmana/status/1963327672827687316

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 1:27:44

Umi-OCR离线部署全攻略:从环境配置到性能优化的7大实战方案

Umi-OCR离线部署全攻略&#xff1a;从环境配置到性能优化的7大实战方案 【免费下载链接】Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件&#xff0c;适用于Windows系统&#xff0c;支持截图OCR、批量OCR、二维码识别等功能。 项目地址: https://gitcode.com…

作者头像 李华
网站建设 2026/4/18 7:40:49

dnSpyEx调试器实战指南:10个高效.NET程序逆向分析技巧

dnSpyEx调试器实战指南&#xff1a;10个高效.NET程序逆向分析技巧 【免费下载链接】dnSpy 项目地址: https://gitcode.com/gh_mirrors/dns/dnSpy 还在为复杂的.NET程序调试而头疼吗&#xff1f;面对无源码的第三方程序集是否感到束手无策&#xff1f;dnSpyEx作为专业的…

作者头像 李华
网站建设 2026/4/19 21:24:50

AI伦理讨论焦点:lora-scripts让深度伪造技术平民化了吗?

AI伦理讨论焦点&#xff1a;LoRA-Scripts让深度伪造技术平民化了吗&#xff1f; 在某社交媒体平台上&#xff0c;一段视频悄然走红&#xff1a;一位公众人物“亲口”发表了一段从未公开过的言论。画面流畅、表情自然、语调真实——直到有人指出&#xff0c;这人根本没说过这话。…

作者头像 李华
网站建设 2026/4/20 4:35:45

PyCharm版本控制系统集成Git管理HunyuanOCR项目代码

PyCharm 与 Git 深度集成&#xff1a;高效管理 HunyuanOCR 项目代码的实战之道 在 AI 应用开发日益复杂的今天&#xff0c;一个典型的 OCR 项目不再只是跑通几个推理脚本那么简单。以腾讯混元OCR&#xff08;HunyuanOCR&#xff09;为例&#xff0c;从模型加载、接口封装到 We…

作者头像 李华
网站建设 2026/4/22 1:08:29

HunyuanOCR GitHub仓库星标破万:开发者社区活跃度分析

HunyuanOCR GitHub星标破万&#xff1a;一场轻量化端到端OCR的工程实践革命 在智能文档处理领域&#xff0c;我们正经历一场静默却深刻的变革。过去几年里&#xff0c;开发者面对OCR任务时&#xff0c;几乎默认要搭建一套复杂的级联流水线&#xff1a;先用检测模型框出文字区域…

作者头像 李华
网站建设 2026/4/22 0:38:02

OBS StreamFX终极教程:5步打造电影级直播画面

OBS StreamFX终极教程&#xff1a;5步打造电影级直播画面 【免费下载链接】obs-StreamFX StreamFX is a plugin for OBS Studio which adds many new effects, filters, sources, transitions and encoders! Be it 3D Transform, Blur, complex Masking, or even custom shader…

作者头像 李华