rt,携程大数据分析的面经,来攒个rp
一面:坐标上海,8.29上周四在现场一面,大教室好多人,一人一个桌子。
实习方面: 自我介绍,实习项目介绍(个人/team,负责部分) 怎么做的数据清洗,缺失值、脏数据等等 训练集维数大吗,用的集群还是单机,用过什么集群平台;了解Spark吗 如果让你用Python来做你的清洗工作,你能Handle吗 Machine Learning: 你有自己用过别的模型然后调参之类的吗?能说一下基本的调参流程吗?XGB知道吗,以XGB为例子说一下调参流程吧 XGB和GBDT的区别有哪些? 知道SVM吗?核函数是什么,干嘛的 RF每棵树之间有什么关系吗?每棵树是怎么选择特征优先进行分裂的?subfeature的经验值通常是多少? 线性回归,画了一个图,问怎么用回归拟合(对数变换)。然后问怎么确定这个阶是对数还是别的?(蒙了个box-cox好像对了) Python: 用py2还是py3,给一个list怎么去重 给两个list,怎么用一行代码生成一个dict(让你用列表生成式) pandas对DataFrame的每一行调用一个函数怎么做?想要根据index删除行怎么做? Deep Learning问你懂不懂深度学习,我说我知道dnn和cnn,然后就问我cnn有哪些层,卷积和池化的作用分别是什么,没了= =
数理统计这个就问了数理统计里最重要的两个定理是什么(大数定律和CLT),然后让你简述一下。
Hive:因为我实习的时候写HQL比较多,就问我有没有什么优化查询语句的经验(随便扯了几个,count distinct,semi join什么的)。还有partition和bucket的区别
业务场景面试最后问了一个业务场景题:一个用户订了一个酒店,现在要给她推荐旅游景点,从数据的角度你需要获取哪些信息呢?
一面总结:大概就面了30多分钟,总的来说感觉面的都是比较碎的基础知识,没有现场写代码或者写sql之类的,最后面试结束还主动和我握了个手233。希望能进到二面吧。。
二面:一面结束后第二天傍晚就接到电话,约第二轮电话面试时间,定的是今天上午11点。电话接通是个女面试官,一开始让你自我介绍,然后说一下做过的数据分析项目,(听到这里我以为是HR面,后面发现并不是。。)简单的说了一下之后也没太深究,然后开始介绍部门做的是什么,说了一堆名词其实我也没太听懂(我好菜。。大概好像就是酒店定价方面的) 然后她问我会不会Java(不会),学没学过多目标优化算法(没学过..),会不会pyspark(会),会不会scala(不会..),知道Hive吗(用过,会写hql)等等。接着问我有没有想问她的. 然后问我能不能来实习,说实习可以让我看看对工作感不感兴趣什么的,我说可以来但是手头还在实习,不能立马来。接下来大概是问了些简历问题吧:
为什么想做数据分析方向 你的职业规划是什么 概率论学的怎么样,说一下Naive Bayes的原理 Machine Learning学了多久,会推导公式吗,说一下LR的推导到这里没了,最后说可能还会有一轮面试,等电话通知。。感觉有点凉,希望能抬我一手吧555,到现在就进了2次面试,第一次到二面,上岸太困难(菜的真实)
#携程##面经##数据分析师##校招#