news 2026/5/16 15:22:37

中文分词模拟器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中文分词模拟器

题目描述

给定一个连续不包含空格字符的字符串,该字符串仅包含英文小写字母及英文标点符号(逗号、句号、分号),同时给定词库,对该字符串进行精确分词。

说明:

  • 精确分词:字符串分词后,不会出现重叠。例如 "ilovechina",不同切分后可得到 "i", "love", "china"。

  • 标点符号不分词,仅用于断句。

  • 词库:根据常识及词库统计出来的常用词汇。例如:dictionary={"i","love","china","ilovechina","lovechina"}。

  • 分词原则:采用分词顺序优先且最长匹配原则。“ilovechina”,假设分词结果[i,ilove,lo,love,ch,china,lovechina] 则输出 [ilove,china]

    • 错误输出:[i, lovechina],原因:"ilove" > 优先于 "lovechina" 成词。

    • 错误输出:[i, love, china],原因:"ilove" > "i",遵循最长匹配原则。

输入描述

  1. 字符串长度限制:0 < length < 256
  2. 词库长度限制:0 < length < 100000
  3. 第一行输入待分词语句 "ilovechina"
  4. 第二行输入中文词库 "i, love, china, ch, na, ve, lo, this, is, the, word"

输出描述

按顺序输出分词结果 "i, love, china"

示例一

输入:
ilovechina
i,love,china,ch,na,ve,lo,this,is,the,word

输出:
i,love,china

说明:
输入的字符串被按最长匹配原则分为 "i", "love", "china"。

示例二

输入:
ilovech
i,love,china,ch,na,ve,lo,this,is,the,word

输出:
i,love,ch

说明:
输入的字符串被按最长匹配原则分为 "i", "love", "ch"。

示例三

输入:

iat
i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful
输出:

i a,t

代码思路

2024华为OD机试真题---中文分词模拟器-CSDN博客

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 14:35:27

关于文章仿写的专业指南与实践要点

关于文章仿写的专业指南与实践要点 【免费下载链接】Hermes-4-14B 项目地址: https://ai.gitcode.com/hf_mirrors/NousResearch/Hermes-4-14B 在信息爆炸的时代&#xff0c;内容创作的需求日益增长&#xff0c;而文章仿写作为一种高效的内容生产方式&#xff0c;正受到…

作者头像 李华
网站建设 2026/5/12 8:42:12

Ascend C Tiling维度切分策略全解 - Block、Core与硬件单元的映射艺术

目录 &#x1f4d6; 摘要 &#x1f3d7;️ Tiling架构设计 1.1 两种开发模式的深度对比 1.2 Tiling基本概念的硬件映射 ⚙️ 核心算法实现 2.1 基础Tiling实现流程 2.2 非对齐shape处理算法 &#x1f680; 实战&#xff1a;企业级Tiling框架 3.1 完整实现示例 3.2 常…

作者头像 李华
网站建设 2026/5/10 19:51:37

Netbank与Thredd合作,助力其在菲律宾全境推出新一代卡片即服务解决方案

菲律宾首个完全受监管的嵌入式银行业务平台旨在通过其全新的卡片即服务&#xff08;CaaS&#xff09;解决方案&#xff0c;助力该国银行和金融科技公司快速推出并扩展现代卡片服务 领先的下一代全球支付处理商Thredd今日宣布&#xff0c;菲律宾首家完全受监管的嵌入式银行业务平…

作者头像 李华