news 2026/4/15 10:35:10

人工智能应用- 语言理解:03. 语言模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能应用- 语言理解:03. 语言模型

当句子较短时,直接统计句子的概率还比较简单,但随着句子长度增加,词与词之间的组合方式呈指数级增长。例如,若词汇表中有 5000 个词,句子长度为 10,则可能的句子组合数目达到,这是一个无法实际计算的天文数字。

为解决这一问题,研究者提出了N 元文法(N-gram)语言模型。这种模型只考虑一个词在前面N-1 个词后出现的概率,然后将这些概率连乘起来,得到整个句子的概率。例如,二元文法(Bi-gram)语言模型统计一个词后面接另一个词的概率,如P(吗| 可以) 表示“可以”后面接“吗”的概率。如果一个句子中有M 个词,则将这 M 个词的概率相乘即可得到整个句子的概率。图31.3展示了二元文法语言模型的计算过程。

二元文法语言模型的计算过程

有了这个N 元文法模型,就可以利用它来生成句子。首先随机生成一个词x1,然后根据P(x2|x1) 生成下一个词x2,以此类推,即可生成句子和段落。下面是一段话是利用三元文法生成的一段话:

我喜欢吃苹果味道很甜我是学生的身份工作人员并学习数据科学很愉快听音乐看电影总是给我很多启发一天我去学校上课和同学们讨论各种问题也喜欢动手做实验锻炼思维非常有趣。

可以看到,生成的每句话看起来还是通顺的,但当这些句子放在一起就显得杂乱无章,没有意义。这是因为仅考虑最近几个词的上下文还不足以捕捉到复杂的语言规律。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/13 0:02:55

纯前端网格路径规划:PathFinding.js的使用方法

点赞 关注 收藏 学会了 本文简介 在 Web 应用和游戏中,路径规划是一个核心功能,无论是在地图导航、策略游戏的单位移动,还是虚拟现实中的导航辅助,都离不开高效的路径查找算法。 在一个 Web 项目中,路径规划通常…

作者头像 李华
网站建设 2026/4/10 14:30:29

基于深度学习框架YOLOV8打架暴力行为检测系统 YOLO模型如何训练打架及暴力行为数据集 基于深度学习的暴力行为检测系统 使用 PyQt5 + YOLOv8 + OpenCV

1基于深度学习的暴力行为检测系统 使用 PyQt5 YOLOv8 1 1 以下是您提供的 基于深度学习的暴力行为检测系统 的完整代码实现,该系统使用 PyQt5 YOLOv8 OpenCV 构建,支持: ✅ 图片/视频/摄像头实时检测✅ 暴力行为(打架、推搡…

作者头像 李华
网站建设 2026/4/7 21:25:25

AI赋能网络小说创作:脑洞生成的实操指南与技术技巧

在网络小说创作领域,“脑洞”是作品脱颖而出的核心竞争力——无论是反转迭起的剧情、打破常规的世界观设定,还是极具反差感的人物形象,都离不开新颖且可落地的脑洞支撑。随着大语言模型技术的快速迭代,AI已成为创作者突破灵感瓶颈…

作者头像 李华
网站建设 2026/4/8 19:12:12

SFT对大语言模型的作用

1. SFT的作用 如果没有 SFT(监督微调),你面对的不是一个“助手”,而是一个“复读机”或者“复印机”。 举个例子,假如你给一个仅经过预训练(Base Model)的模型发指令: 你的输入&…

作者头像 李华
网站建设 2026/4/11 23:36:00

iOS签名证书,免费与付费的本质差异

当您踏入iOS开发世界,选择签名证书是第一个分水岭。看似相似,但免费与付费证书的差异,直接决定了您应用的测试效率、分发规模与商业潜力。理解其核心区别,是做出明智决策的第一步。核心差异:分发范围与设备限制苹果提供…

作者头像 李华