0%

字节跳动 机器学习实习生(反作弊)面经

03.29 面试 + 03.31 HR面 字节跳动 机器学习实习生(反作弊)面经(04.02 OC)

03.29终面

问题

  • 判别模型和生成模型

    • 从属性X预测标记Y
    • 判别模型求P(Y|X),即后验概率 SVM、LR
    • 生成模型求P(X,Y),即联合概率 NaiveBayes、HMM
  • 团伙识别算法

    • 闻所未闻,按自己的理解答了一种思路:
      • 记录不同流量信息的相似度,例如不同用户在同一设备(强相似)、同一地点(弱相似)等等;
      • 利用该相似度建立不同用户间的带权图G
      • 在G中寻找相似度较高的团伙
  • GBDT、XGBoost、Lgb对比

    • 老生常谈
  • 项目和比赛相关…

    • 伪标签方法
    • 数据不均衡的解决方式
      • 提阈值、过采样、欠采样、SMOTE
      • 工业界哪种更实用(不知道,答了SMOTE或生成式的伪标签)

算法

可用的操作包括加减2、加减3、加减5
输入:A和B 输出:最小步数

  • 解题思路:
    • 简化到计算abs(B-A)的最小步数——加减对称,只考虑加法和非负数
    • dp
      • 初始化dp[0:5](因为1和4涉及减法,但简化后只考虑加法,直接初始化构造)
      • 最优子结构dp[i] = min(min(dp[i-2], dp[i-3]), dp[i-5]) + 1

03.31 HR面

问题

  • 个人职业生涯发展规划

  • 通过实习想获得/发展xx

  • 对组内工作是否熟悉(一无所知)

你可以打赏我哦!