新网创想网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
如何分析Flink中的KeyBy,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
十年的隆回网站建设经验,针对设计、前端、开发、售后、文案、推广等六对一服务,响应快,48小时及时工作处理。营销型网站的优势是能够根据用户设备显示端的尺寸不同,自动调整隆回建站的显示方式,使网站能够适用不同显示终端,在浏览器中调整网站的宽度,无论在任何一种浏览器上浏览网站,都能展现优雅布局与设计,从而大程度地提升浏览体验。创新互联从事“隆回网站设计”,“隆回网站推广”以来,每个客户项目都认真落实执行。
KeyBy算子:将数据流按照指定key进行分区(分组)
示例环境
java.version: 1.8.x flink.version: 1.11.1
示例数据源 (项目码云下载)
Flink 系例 之 搭建开发环境与数据
KeyBy.java
package com.flink.examples.functions; import com.flink.examples.DataSource; import org.apache.flink.api.java.functions.KeySelector; import org.apache.flink.api.java.tuple.Tuple3; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.datastream.KeyedStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import java.util.List; /** * @Description KeyBy算子:将数据流按照指定key进行分区 */ public class KeyBy { /** * 遍历集合,将用户按性别分成两类 * @param args * @throws Exception */ public static void main(String[] args) throws Exception { final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); //如果有多个分区,则设置并行度需大于1,或者在算子上设置setParallelism(2)前行度,否则算子只有一个并行度,则计算结果始终只有一个分区 // env.setParallelism(4); List> tuple3List = DataSource.getTuple3ToList(); DataStream > dataStream = env.fromCollection(tuple3List); //注意:使用Integer进行分区时,会导致分区结果不对,转换成String类型输出key即可正确输出 KeyedStream , String> keyedStream = dataStream.keyBy(new KeySelector , String>() { @Override public String getKey(Tuple3 tuple3) throws Exception { //f1为性别字段,以相同f1值(性别)进行分区 return String.valueOf(tuple3.f1); } }); //lambda // KeyedStream , String> keyedStream = dataStream.keyBy((KeySelector , String>) t3 -> t3.f1); //指定第几个字段做为key进行计算 // KeyedStream , Tuple> keyedStream = dataStream.keyBy(1); keyedStream.print().setParallelism(4); env.execute("flink keyBy job"); } }
打印结果
2> (张三,man,20) 4> (李四,girl,24) 2> (王五,man,29) 4> (刘六,girl,32) 2> (吴八,man,30) 4> (伍七,girl,18)
关于如何分析Flink中的KeyBy问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。