程序员开发实例大全宝库

网站首页 > 编程文章 正文

良鑫科技大数据岗位面试题(大数据面试题以及答案整理(一))

zazugpt 2024-11-07 13:34:35 编程文章 72 ℃ 0 评论

良鑫科技-上海

学长1

1)一面

(1)最近做的项目

(2)Sparkstream如何保证数据的有序性(几个公司都问到实时数据出错怎么处理)

(3)我说开窗口,他说存在数据延迟和oom,不要开窗

(4)Sparkstream如何数据的精准一次消费

(5)Redis如何搭建,如何保证数据在一个slot中

(6)Flink延迟和异常的数据怎么处理

(7)我说放入侧输出流

(8)他说放入之后又是怎么处理的呢,不能只是放入就完了,怎么自动恢复或者报警呢,保证在老板看到数据前处理完

(9)Kibana做了什么需求,给谁看

(10)日用户登陆怎么做的

(11)恶意登陆监控怎么做的

(12)内存调优,JVM了解吗,怎么调优

(13)dws数据怎么填充(他想问的是实时的分层)

(14)Hbase二级索引

(15)我说使用Phoenix

(16)他接着问Phoenix创建二级索引的底层

(17)又问Phoenix存在什么问题,他们使用时遇到了很多坑(Kylin)

(18)Kafka 的rebalance

(19)Zookeeper的leader,follower和observe

(20)Observer和follower的区别

(21)Hbase底层原理,故障如何恢复

(22)数据库的隔离级别

(23)Spark使用了哪些排序,有什么区别

(24)你们有用过哪些线程池,在什么什么场景

2)二面

(1)Hbase架构原理

(2)Hbase和HDFS怎么连接

(3)HDFS有哪些节点,架构

(4)Namenode的内部,datanode里面有哪些东西,讲细一点

(5)hbase有哪些类型,怎么和其他数据库的数据类型进行调节

(6)Hbase自身有二级索引吗

(7)Flink中state有哪几种存储方式

(8)Rocksdb存储在哪里,task,taskmanage,还是哪里

(9)Yarn的调度机制

(10)Flink中数据聚合,不使用窗口怎么实现聚合

(11)Flink的CBO,物理执行计划和逻辑执行计划

学长2

(1)HDFS 的索引?

(2)HBase 中的Hlog 如何区分不同的表以及表、列组与组件中的对应关系?

(3)DataNode 里面有啥? 数据块、数据的校验和 其他的?

(4)Mysql 基于什么实现事务? undo log 、 redo log

(5)jvm 对 : 里面的各个区的大小比例 ?

(6)HBase 的表关联到Phoenix 中会有哪些问题? HBase 的二级索引?

(7)HashMap 的底层实现 ?

(8)HBase 和 HDFS 的架构

(9)Spark 数据倾斜的处理

(10)zookeeper 的 角色 ? 区别 ? Leader 、 Follower 、 Observer

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表