好猎头网-中高级人才猎头网站!服务热线:400-1801-668 好猎头   |   登录 注册

搜狐2015校招数据挖掘工程师笔试题

添加时间:2018-01-02 10:24:43
浏览次数: 0

职位类型:数据挖掘工程师
招聘公司:搜狐(搜狐官方招聘)
笔试时间:2015校招

以下题目是我能回忆起来的笔试内容。我不记得是不是有 A、B 卷之分,但以下内容都被考察过无疑。笔试题目范围非常广泛,涉及机器学习、网络编程、hadoop、C++、多线程和智力题。

1.小白鼠喝毒水问题。

2.hadoop 在 HDFS 上文件存储的默认冗余参数是3。

3.两个线程同时累加一个全局变量,比如利用 for 循环进行 50 次自增操作,问该该全局变量的最终结果范围。

4.TCP 的三次握手,四次挥手。

5.关于 TCP 双方关闭连接,涉及到 TIME_WAIT 的概念。

6.SVM、条件随机场、隐马尔科夫模型、最大熵模型中,哪个是生成式模型?应该是隐马尔科夫模型1。

7.还是以上四个模型,哪个模型不符合凸模型 有全局最优解的条件?应该还是隐马尔科夫模型。

8.贝叶斯网络是有向无环图。

9.分词中最大正向匹配,最大逆向匹配的概念。

10.linux 平台下有一个三列文件,列之间用逗号分隔,请编程对第二列数字求和。

11.左值不能赋值。

12.hadoop 默认 block 大小是 64M,JobTracker 和 NameNode在同一台机器上。

13.hadoop 采用 Combiner、采用压缩率高的文件格式以及在 map 过程中去掉无效数据都是为了减少数据传输量,与这些优化方法不同的是优化 Partitioner,因为它是为了均衡数据量,而非减少数据量。

14.熵的计算公式和熵最大的条件。

15.复杂链表的复制,所谓复杂是指一个节点除了指向后继,还随机指向链表中的一个节点或 NULL。

16.问如下代码的输出,其实就是统计二进制表示中 1 的个数。

int a = 9999;
int count = 0;
while(a) {
    count  ;
    a = a & (a-1);               
   }
   cout<

没有完整题目和答案,能力有限,只能做到这样了,希望能对大家多少有点帮助。最后对要应聘这个岗位的同学们说声Good Luck!