news 2026/6/26 2:20:12

flink统计文本单词数量

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
flink统计文本单词数量

1.flink统计文本单词数量

package com.ycl; import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.ExecutionEnvironment; import org.apache.flink.api.java.operators.AggregateOperator; import org.apache.flink.api.java.operators.DataSource; import org.apache.flink.api.java.operators.FlatMapOperator; import org.apache.flink.api.java.operators.UnsortedGrouping; import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.util.Collector; public class WordCountDemo { public static void main(String[] args) throws Exception { //1.创建执行环境 ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment(); //2.读取数据,从文件中读取 DataSource<String> lineDS = env.readTextFile("input/word.txt"); //3.切分,转换(word,1),匿名类 //Alt+Enter跳出如下方法的全部内容。 FlatMapOperator<String, Tuple2<String, Integer>> wordAndOne = lineDS.flatMap(new FlatMapFunction<String, Tuple2<String, Integer>>() { @Override public void flatMap(String value, Collector<Tuple2<String, Integer>> out) throws Exception { //3.1 按照空格切分单词 String[] words = value.split(" "); //3.2将单词转换为(word,1) ,点击.var 会补全所有的行。 for (String word : words) { Tuple2<String, Integer> wordTuple2 = Tuple2.of(word, 1); //3.3 使用 Collector 向下游发送数据; out.collect(wordTuple2); } } }); //4.按照 word分组 UnsortedGrouping<Tuple2<String, Integer>> wordAndOneGroupBy = wordAndOne.groupBy(0); //5.各分组内聚合 1是位置,表示第二个元素; AggregateOperator<Tuple2<String, Integer>> sum = wordAndOneGroupBy.sum(1); //6.输出 sum.print(); } }

输出结果如下;

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 2:18:34

lark-cli 设计:Raw、资源 API、Shortcut

先看结论 lark-cli 不是简单把飞书 API 包一层命令&#xff0c;而是把复杂 SaaS 平台拆成三种 CLI 能力&#xff1a; 资源 API&#xff1a;把平台 OpenAPI 元数据映射成 service resource method&#xff0c;用于结构化覆盖。Raw API&#xff1a;保留 HTTP method OpenAPI p…

作者头像 李华
网站建设 2026/6/26 2:16:29

2026实测盘点:16款降AI率工具测评,论文安全过关就靠它!

随着AI写作技术的迅猛发展&#xff0c;越来越多的学术创作者开始依赖各类智能工具提升写作效率。然而&#xff0c;2026年各大高校与科研机构对AIGC内容的检测标准愈发严格&#xff0c;论文中哪怕一丝一毫的AI痕迹都可能成为被质疑的隐患。在这样的背景下&#xff0c;如何有效降…

作者头像 李华
网站建设 2026/6/26 2:14:41

你的好,要给对的人

我们总习惯把善意和温柔分给身边的人&#xff0c;以为真心能换来真心&#xff0c;却常常忽略了一个现实&#xff1a;不是所有人都懂得珍惜你的好。有些人会把你的付出当成理所当然&#xff0c;你给得越多&#xff0c;他们越得寸进尺&#xff1b;有些人会把你的温柔当成软弱&…

作者头像 李华
网站建设 2026/6/26 2:13:11

PyTorch 张量计算与自动微分:从底层机制到工程实践

PyTorch 张量计算与自动微分&#xff1a;从底层机制到工程实践 一、当训练循环遇上计算图断裂&#xff1a;张量与梯度的真实痛点 在工业级深度学习项目中&#xff0c;PyTorch 的动态计算图机制既是灵活性的来源&#xff0c;也是工程事故的高发区。一个典型的场景&#xff1a;在…

作者头像 李华
网站建设 2026/6/26 2:11:24

AI 辅助创作:从提示词工程到结构化思维链

AI 辅助创作&#xff1a;从提示词工程到结构化思维链一、AI 生成的"似是而非"陷阱 AI 辅助创作最大的坑&#xff0c;往往不是"生成不了"&#xff0c;而是"生成了却不敢用"。 典型场景是&#xff1a;用大模型生成技术文档初稿&#xff0c;读起来通…

作者头像 李华
网站建设 2026/6/26 2:10:09

XSS攻击深度解析:从原理到防御的Web安全实战指南

1. 项目概述&#xff1a;从“弹窗恶作剧”到数据窃取的深渊几年前&#xff0c;我刚接触Web安全时&#xff0c;第一次听说XSS&#xff08;跨站脚本攻击&#xff09;&#xff0c;觉得它不就是个能弹个警告框的“小把戏”吗&#xff1f;直到后来亲眼看到一个真实的案例&#xff1a…

作者头像 李华