小编

原文地址:www.shulanxt.com/doc/mysqldoc/cxyxt

自我介绍

正常先容就好。
报下大名,经历公司与参与项目,卖力事变与古迹产出。

思想和方法论数据仓库理解:架构、分层数据仓库理解:主题域、好处范式建模和维度建模差异,稠浊利用 场景举例两种建模的阐明和理解 差异雪花模型 星型模型 阐明理解实体建模和维度建模差异ER模型图理解阐明模型会随着业务进行迭代优化手段拉链表理解阐明 场景举例,全量拉链vs增量拉链数据质量如何担保的讲一下数据管理如何做元数据管理,实践怎么理解数据中台与OneData思想 Hive hive 行转列,列转行udf函数讲解,然夹帐撕一下mapreduce和spark分别讲解然后,差异讲解hive 数据倾斜调优hive sql 优化办法map数、reduce数、job数怎么确定cube、grouping sets、grouping__id手写SQL 根据实际业务场景,写累计SQL逻辑手写连续登录hql,求连续登录的用户,以及详细哪天登录的日期行转列 列转行 Spark spark算子部分讲解举例spark调优讲解并举例spark数据倾斜讲解,并举例。
spark宽依赖,窄依赖 讲解,并举例。
spark 容错机制实时数仓&Flink做过实时数仓吗,生产举例。
实时数仓vs数据湖,生产实践flink 运用处景flink 水位线,窗口flink 反压机制事理kafka 实时讲解,如何分区kafka 数据丢失怎么办kylin 利用问题,优化策略hbase 利用情形,rowkey设打算法 求两个连续数组的中位数手写单例模式反问环节

一样平常就问问项目架构、组织架构和对自己的定位就好。
不要问太多,很多时候只是口试官在客套。

橙心优选php面试橙心优选数据仓库高等工程师面试 PHP

总结

问的还是比较全的,从离线数仓到实时数仓,从Hive到Spark到Flink,HQL开窗函数利用问的频率也是非常高。
但大部分韶光,还是都在问项目更多一些。
也参加了美团优选的口试,基本问题都差不多,尤其是技能问题大同小异。
问项目细节还是差异挺大的,模型细节,业务细节,模型与业务的结合,一定要理解业务。