前言
???????? 卷友们,大家好 ~ 我是梦想家 Alex 。最近原创更新频率挺高,主要还是感谢群友们的积极投稿,让我能得到这么多珍贵的素材,才有机会展示给大家~
????????本期内容,我为大家带来的是群友 louwin 在参加 2022年 携程提前批大数据面试 后写下的面经。如果对大家有所启发,希望能在文末来发三连,感谢大家~
2022携程提前批大数据一/二面经(oc)
开篇先说明:本次面试的岗位是大数据底层框架工程师,不是大数据分析,数据仓库,数据开发。
个人:双非本硕
一面
时常
45分钟
问题
因为我有一段大厂实习,所以主要针对我实习问了很久,一切问题都结合实习进行提问,所以要是没接触过没关系,咱们实习的内容不一样。而且因为当时暑期实习也是这个面试官面试的,所以基础的问题也没有怎么问。
- 实习做了什么,有什么收获
- 对于presto的理解,和hive/spark有什么不同
- 对sparksql调优有没有遇到,实际情况是什么
- 对框架apache atlas的理解
然后大概就是我表示很有缘,为啥后面没去(二面,一面时间隔得太久了当时),聊一下他们组正在干的事情,让我回去有空可以了解一下spark3还有一些别的(这段时间大概20分钟,心里已经很稳了)
感受
很棒,没有迟到
二面
时长
1h45min,是的,你没看错,就是这么久,哎。
问题
时间过去有些久了,要是遗忘了请见谅。问题顺序也是乱的,不要在意这些细节。
- 自己平时用哪些编程语言
- ArrayList和LinkedList什么时候该用哪个:自己稍微解释一下就行,有自己的理解就好,不需要背课文
- ArrayList有上限么,如果有,能给出解决方方案么:我给了分布式存储和spark中压缩存储的方法这两个策略
- jvm gc 常见的方法:那几个概念稍微说一下就行,面试官知道你实际中没用过
- 如何判断发生了数据倾斜,有哪些情况会引起倾斜
- 如何找出在哪个部分发生了数据倾斜
- 如何在map/reduce端发生倾斜后,快速定位到出问题的表或者文件
- spark3新特性有哪些
- spark3新特性在实际工作中有关注过么
- presto和hive/spark区别,并且实际编写中有遇到什么困难:再次问到
- apache atlas:我介绍了如何监控元数据并且传递变化信息
- 数据治理一些常见的框架的交流和分析:有一些框架知道你没看过,只是想问你觉得会如何设计,比如如果实现一个对sql单元测试的模块,怎么设计
- mr job 有没有写过,基本流程是什么
- 一道智力题:和位运算有关
感受
????????很棒,没有迟到。而且问的其实大部分都不是之后工作可能接触最多的内容,问的很多还是偏向我实习的这部分,更多的想了解你的潜力,而不是你和我的岗位是不是完全匹配,所以会发现问的问题包含很多数仓的(实习做的数仓),这是我心中面试官的样子,不是拿个套路问问问的类型,看中的是人,而不是人会的技能,技能可以学,人变不了。
???????? 如果你也想要加入我的技术交流群,与更多优秀的小伙伴学习,交流,欢迎大家添加我的 wx:zwj_bigdataer,记得备注【昵称-城市-岗位】,我看到后会第一时间通过。
????????
更多精彩内容请关注 微信公众号 👇「大数据梦想家」🔥: ???????? 一枚喜欢阅读,输出,复盘的大数据爱好者。热衷于分享大数据基础原理,技术实战,架构设计与原型实现之外,还喜欢输出一些有趣实用的编程干货内容,与阅读心得 … ???????? 🚀 关注后回复 【简历】获取大数据精品简历模板 800+ 🚀 关注后回复 【面经】获取互联网一线大厂java校招笔试真题面经汇总 🚀 关注后回复 【Flink知识图谱】获取Flink最新权威知识图谱 🚀关注后回复【大数据高频面试题】获取海量大数据高频面试题+企业级面试真题108套 🚀关注后回复回复【Python学习路线图】获取Python学习完整路线 … ???????? 更多精彩福利干货,期待您的关注 ~
|