03.29 面试 + 03.31 HR面 字节跳动 机器学习实习生(反作弊)面经(04.02 OC)
03.29终面
问题
判别模型和生成模型
- 从属性X预测标记Y
- 判别模型求P(Y|X),即后验概率 SVM、LR
- 生成模型求P(X,Y),即联合概率 NaiveBayes、HMM
团伙识别算法
- 闻所未闻,按自己的理解答了一种思路:
- 记录不同流量信息的相似度,例如不同用户在同一设备(强相似)、同一地点(弱相似)等等;
- 利用该相似度建立不同用户间的带权图G
- 在G中寻找相似度较高的团伙
- 闻所未闻,按自己的理解答了一种思路:
GBDT、XGBoost、Lgb对比
- 老生常谈
项目和比赛相关…
- 伪标签方法
- 数据不均衡的解决方式
- 提阈值、过采样、欠采样、SMOTE
- 工业界哪种更实用(不知道,答了SMOTE或生成式的伪标签)
- …
算法
可用的操作包括加减2、加减3、加减5
输入:A和B 输出:最小步数
- 解题思路:
- 简化到计算abs(B-A)的最小步数——加减对称,只考虑加法和非负数
- dp
- 初始化dp[0:5](因为1和4涉及减法,但简化后只考虑加法,直接初始化构造)
- 最优子结构dp[i] = min(min(dp[i-2], dp[i-3]), dp[i-5]) + 1
03.31 HR面
问题
个人职业生涯发展规划
通过实习想获得/发展xx
对组内工作是否熟悉(一无所知)