news 2026/4/24 15:46:22

华为OD机试真题精讲:新词挖掘(Python/Java/C++多语言实现)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为OD机试真题精讲:新词挖掘(Python/Java/C++多语言实现)

华为OD机试真题精讲:新词挖掘(Python/Java/C++多语言实现)

一、题目描述(2025B卷高频100分题)

在自然语言处理场景中,「新词挖掘」是指从一段文本中识别出未被收录在词典中的连续字符序列,这些序列需满足特定的频率和长度条件。给定一段仅包含中文汉字的文本字符串text、词典集合dict_words、最小长度min_len、最小出现频率min_freq,请完成以下要求:

  1. 提取文本中所有连续子串,过滤掉词典中已存在的子串;
  2. 筛选出长度≥min_len且出现频率≥min_freq的子串作为候选新词;
  3. 最终返回按出现频率降序、长度降序、字典序升序排序后的候选新词列表。

关键约束

  • 文本长度1 ≤ len(text) ≤ 10^4,词典规模1 ≤ len(dict_words) ≤ 10^3
  • 子串长度范围1 ≤ min_len ≤ 5,最小频率1 ≤ min_freq ≤ 100
  • 时间限制1秒,空间限制256MB;
  • 中文文本无标点符号,仅包含单个汉字组成的连
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 10:19:12

降AI工具安全吗?论文会被收录吗?2026年隐私保护指南

降AI工具安全吗?论文会被收录吗?2026年隐私保护指南 用降AI工具处理论文,安全吗?会不会被收录到数据库? 这是很多同学担心的问题。毕竟论文是自己的心血,万一被泄露或收录就麻烦了。 这篇文章帮你搞清楚…

作者头像 李华
网站建设 2026/4/18 16:59:33

下载与快速上手 NVM:Node.js 版本管理工具

一、准备工作:卸载旧版 Node.js 重要提示:在安装 NVM 前,请先彻底删除已安装的 Node.js,避免路径冲突:检查安装路径where node常见路径:C:\Program Files\nodejs\ C:\Users\用户名\AppData\Local\nodejs\卸…

作者头像 李华
网站建设 2026/4/18 17:34:10

2026年最新降AI攻略总结:一站搞定论文AIGC检测

2026年最新降AI攻略总结:一站搞定论文AIGC检测 这篇文章是2026年降AI攻略的终极总结。 如果你只想看结论,直接拉到最后。如果想了解细节,继续往下看。 2026年AIGC检测现状 检测平台:知网、维普、万方 红线标准: 本…

作者头像 李华
网站建设 2026/4/18 19:38:54

DeepSeek+豆包+Kimi降AI指令有用吗?2026年实测告诉你真相

DeepSeek豆包Kimi降AI指令有用吗?2026年实测告诉你真相 网上流传着很多"降AI指令",说用DeepSeek、豆包、Kimi就能把AI率降下来。 我认真测试了一下,结论是:有一定效果,但很有限。 想把AI率从60%降到10%以…

作者头像 李华
网站建设 2026/4/18 7:47:19

MGW-10000微机控制静载锚固试验机

MGW-10000微机控制静载锚固试验机 一、产品主要功能  本机主要用于混凝土结构和构件用预应力钢绞线锚具、夹具和连接器,预应力钢结构钢绞线锚具、夹具和连接器,拉索锚具、夹具和连接器,预应力筋锚具、夹具和连接器的静载锚固性能测试…

作者头像 李华