news 2026/6/18 14:58:38

awk:对文本内容去重

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
awk:对文本内容去重

案例一

样本数据

ES11 ES15 ED13 ED15 ES1Z ED11 SZ13 SZ15 ED13 SB15 SB13 BT23 DZ19 IT39 SZ13 IU23 IT23 GZ13 GZ15 IJ13 IU21 JS13 IH13 BT25 ED11 ED13 ED15 EJ15 ES11 IT25 IU25 JS15 SV15

去重命令:

awk'{arr[$1]++;if(arr[$1] == 1){print}}'11.txt

案例二

样本数据

2019-01-13_12:00_index?uid=123 2019-01-13_13:00_index?uid=123 2019-01-13_14:00_index?uid=333 2019-01-13_15:00_index?uid=9710 2019-01-14_12:00_index?uid=123 2019-01-14_13:00_index?uid=123 2019-01-15_14:00_index?uid=333 2019-01-16_15:00_index?uid=9710

去重命令

awk-F"?"'{arr[$2]++;if(arr[$2]==1){print}}'
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 16:58:43

计算机毕业设计springboot内蒙古电子信息职业技术学院图书馆自习室预约管理系统 SpringBoot驱动的内蒙古电子信息学院自习空间在线预订系统 内蒙古电职院图书馆座位智能预约平台

计算机毕业设计springboot内蒙古电子信息职业技术学院图书馆自习室预约管理系统f620g32c (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。在高校图书馆一座难求、空座率又高的矛盾…

作者头像 李华
网站建设 2026/6/13 1:50:36

营销人员必备|用Z-Image-Turbo快速生成广告素材

营销人员必备|用Z-Image-Turbo快速生成广告素材 在数字营销时代,高质量视觉内容已成为吸引用户注意力的核心武器。然而,专业摄影、美工设计和后期制作不仅耗时耗力,还面临成本高、响应慢的痛点。阿里通义推出的 Z-Image-Turbo We…

作者头像 李华
网站建设 2026/6/18 3:29:41

Z-Image-Turbo Notion知识库配图自动化生成方案

Z-Image-Turbo Notion知识库配图自动化生成方案 背景与需求:AI图像如何赋能知识管理 在现代知识工作流中,可视化内容已成为提升信息吸收效率的关键。Notion 作为广受欢迎的协作与知识管理平台,支持丰富的页面结构和数据库功能,但…

作者头像 李华
网站建设 2026/6/17 22:27:48

考古新发现:用MGeo自动对齐历史文献中的古地名

考古新发现:用MGeo自动对齐历史文献中的古地名 在历史文献研究中,古今地名的对应关系一直是困扰学者的难题。MGeo作为一款多模态地理语言预训练模型,原本设计用于现代地址的实体对齐任务,但通过少量样本的迁移学习,我们…

作者头像 李华
网站建设 2026/6/14 0:23:26

cms系统JAVA分块上传功能教程分享

大文件传输系统技术方案 一、技术选型与架构设计 作为项目负责人,我主导设计了基于现有技术栈的混合架构方案: 前端架构:采用Vue2 CLI框架兼容模式,通过Webpack配置同时支持Vue2/Vue3组件,通过条件编译实现React项目…

作者头像 李华
网站建设 2026/6/12 20:42:41

MGeo推理脚本复制技巧:cp /root/推理.py 到 workspace

MGeo推理脚本复制技巧:从/root/推理.py到workspace的高效实践 引言:为什么需要复制MGeo推理脚本? 在实际项目开发中,模型推理脚本的可维护性与可编辑性至关重要。阿里开源的MGeo地址相似度匹配系统,专为中文地址领域…

作者头像 李华