news 2026/6/9 22:12:15

大模型推理不确定性的根因和解决方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型推理不确定性的根因和解决方法

根因:

不确定性是浮点运算导致的

  • 浮点运算中顺序不同,计算结果会有微小差异,即 a + b ≠ b + a
  • 推理过程由于需要加速运算,导致计算顺序不是固定的

解决方法:

  • api调用层面:设置确定性相关的参数
  • 服务端层面:控制底层的模型部署

https://zhuanlan.zhihu.com/p/1961192621759242664

实践效果:

api调用层面

对于短问题,仅采用该方法确定性已经较高。对长问题,效果很差

req_body = { "model": deepseek-v3-0324, # 假设LLMConf是您的配置对象 "messages": [ { "role": "user", "content": "假如美联储有降息的倾向,黄金会增值还是贬值,简要回答" } ], "max_tokens": 500, "temperature": 0, # 设为0,完全消除随机性 "top_p": 1, #
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/6 21:18:55

Tastepoint by IFF预测2026年十大风味趋势

从樱桃到印度茶香料,Tastepoint趋势专家揭晓本年度将脱颖而出的十大风味。 创新风味创作与味觉解决方案领域的领导者Tastepoint by IFF (NYSE: IFF)已评选出有望在2026年塑造北美食品和饮料行业格局的十大风味。这些预测聚焦于未来一年将在零售、餐饮服务等多个领域…

作者头像 李华
网站建设 2026/6/6 21:18:25

基于STM32的太阳能自动寻光充电系统设计

基于STM32的太阳能自动寻光充电系统设计 第一章 绪论 传统太阳能充电装置多采用固定安装方式,受光照角度变化影响,光电转换效率普遍偏低,仅能达到额定效率的60%-70%,难以满足便携式设备、户外监测终端等场景的高效供电需求。STM32…

作者头像 李华
网站建设 2026/6/6 21:45:26

【毕业设计】基于Python计算机视觉答题卡的设计与实现

💟博主:程序员陈辰:CSDN作者、博客专家、全栈领域优质创作者 💟专注于计算机毕业设计,大数据、深度学习、Java、小程序、python、安卓等技术领域 📲文章末尾获取源码数据库 🌈还有大家在毕设选题…

作者头像 李华
网站建设 2026/6/7 1:27:48

Enhancing Multi-Image Understanding through Delimiter Token Scaling

Enhancing Multi-Image Understanding through Delimiter Token Scaling Authors: Minyoung Lee, Yeji Park, Dongjun Hwang, Yejin Kim, Seong Joon Oh, Junsuk Choe Deep-Dive Summary: 通过缩放分隔符标记增强多图像理解 Minyoung Lee 1 ^1 1, Yejir Park 1 ^1 1, Don…

作者头像 李华
网站建设 2026/6/7 2:46:33

AIGS赋能Java企业:从范式革新到架构支撑的落地路径

在人工智能技术的演进历程中,从AIGC(人工智能生成内容)到AIGS(人工智能生成服务)的跨越,标志着AI技术从“内容辅助”走向“系统重塑”。对于以Java技术栈为核心的企业而言,如何将AIGS能力融入现…

作者头像 李华
网站建设 2026/6/9 4:18:10

苹果质检分割数据集labelme格式5842张8类别

数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件)图片数量(jpg文件个数):5842标注数量(json文件个数):5842标注类别数:8标注类别名称:["Apple","Leg","Receptacle&q…

作者头像 李华