news 2026/5/4 0:31:02

互联网与机器学习:不必强求,却能出色运行!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
互联网与机器学习:不必强求,却能出色运行!

计算复杂度分享

兰斯·福诺(Lance Fortnow)和比尔·加萨尔(Bill Gasarch)分享计算复杂度以及数学和计算机科学中其他有趣内容。

2026 年 4 月 29 日观点

最喜欢的关于网络的一句话来自吉姆·库罗斯(Jim Kurose):“互联网之所以运行得如此出色,是因为它不必强求。”互联网协议栈的 IP 层及更低层并不保证数据一定能送达,完全的传输失败也符合协议要求,这使得协议更简单、更强大,无需为保证成功增加额外复杂性。TCP 基本上是在 IP 通信失败时重新启动通信来实现数据传输的,还能向更高层报告传输失败。

同样的观点也适用于现代人工智能,“机器学习之所以效果出色,是因为它不必强求”。神经网络使用 softmax 函数确定输出概率,从不完全排除任何一种可能性,总会给每种可能性分配至少一个极小的概率。在问题复杂度极高时,神经网络会给出几种具有显著概率的可能性,就像在相关文章中描述的,机器学习模型会生成一个均匀分布来捕捉伪随机生成器的输出。我们允许模型犯错,观察分布情况,而不强硬要求模型给出特定答案。当机器学习模型面对过于复杂、无法直接求解的情况时,概率性猜测也能得出正确结果,达到最佳性能,因为允许犯错让它们有更大灵活性去更频繁地解决复杂问题。

评论与回复

匿名用户于 2026 年 4 月 29 日上午 11:23 询问对可解释人工智能(XAI)的看法,兰斯·福诺于同日下午 12:28 回复,认为在大多数情况下,可解释性带来的能力损失并不值得,这会是未来一篇文章的好主题。

匿名用户于 2026 年 4 月 29 日下午 3:41 表示目前人工智能的状态像早期的互联网,还不是安全可靠的系统,过去 30 年人们投入大量工作和资金才让互联网系统变得可靠和安全,成本也需大幅降低,未来十年一些问题可能会得到解决,但目前未达理想状态,且像互联网泡沫时期一样,很多投资者会赔钱,大公司如思科(Cisco)也不例外。

匿名用户于 2026 年 4 月 29 日下午 3:55 指出构建可能输出的概率树成本高,验证输出成本也高,最终要归结为几个固定结果,用户得到的不是概率输出,而是从分布中随机抽取或通过启发式方法得到的样本。探索的错误路径数量是衡量智能的重要指标,与解决问题所需计算量有关,目前人们推理时需动用大型数据中心全部算力解决优秀学生在国际数学奥林匹克竞赛(IMO)中就能解决的数学问题,虽然已取得很大进展,未来值得期待,但仍处于人工智能发展的早期阶段。

匿名用户于 2026 年 5 月 1 日下午 2:17 认为 P 与 NP 问题似乎与神经网络的能力没有任何关系,兰斯·福诺于同日下午 4:09 表示完全不同意这种观点,并给出查看原因的链接。

书籍、动态与链接

可通过亚马逊链接购买相关书籍并赚取佣金。还有 Mastodon 动态。博客链接包括比尔的主页、兰斯的主页、最喜欢的定理等众多链接。热门文章有“因为不必强求”“托尼·霍尔(1934 - 2026)”等。复杂度相关链接有复杂度会议、ACM 算法与计算理论特别兴趣小组(SIGACT)等。博客存档有 2026 年相关内容。

思考提问

人工智能未来究竟会如何发展,能否像互联网一样逐渐变得安全可靠呢?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 0:29:02

MoE模型高效训练:正交增长与检查点回收技术

1. 模型高效预训练的核心挑战 在自然语言处理领域,大规模预训练模型已经成为主流技术路线。但随着模型参数量的指数级增长,训练成本和时间开销成为制约技术迭代的关键瓶颈。以1750亿参数的GPT-3为例,其完整训练需要数千张高端GPU运行数月时间…

作者头像 李华
网站建设 2026/5/4 0:28:44

从零开始将Taotoken接入自动化工作流的完整配置指南

从零开始将Taotoken接入自动化工作流的完整配置指南 1. 获取API Key与模型选择 在开始自动化工作流集成前,首先需要登录Taotoken平台创建API Key。进入控制台后,在「API密钥管理」页面点击「新建密钥」,建议为自动化工作流单独创建密钥以便…

作者头像 李华
网站建设 2026/5/4 0:17:29

多模态大语言模型主动行为评测基准ProactiveBench解析

1. 项目背景与核心价值在人工智能领域,多模态大语言模型(Multimodal Large Language Models, MLLMs)正逐步从被动响应式交互向主动行为模式演进。传统评估体系主要关注模型对用户指令的响应质量,却忽视了模型自主发起交互、主动提…

作者头像 李华
网站建设 2026/5/4 0:11:10

跨端编译测试总失败?不是代码问题,是环境隔离缺失!(独家披露金融级Python跨端测试沙箱架构)

更多请点击: https://intelliparadigm.com 第一章:跨端编译测试失败的真相:环境隔离缺失的本质诊断 跨端编译测试失败常被归因为“平台差异”或“工具链版本不一致”,但深层根因往往指向**环境隔离机制的系统性缺失**。当构建环境…

作者头像 李华