您所在的位置：首页 > 职场资讯 > 面试

搜狐2015校招数据挖掘工程师笔试题

添加时间：2018-01-02 10:24:43

浏览次数： 0

职位类型：数据挖掘工程师
招聘公司：搜狐（搜狐官方招聘）
笔试时间：2015校招

以下题目是我能回忆起来的笔试内容。我不记得是不是有 A、B 卷之分，但以下内容都被考察过无疑。笔试题目范围非常广泛，涉及机器学习、网络编程、hadoop、C＋＋、多线程和智力题。

1.小白鼠喝毒水问题。

2.hadoop 在 HDFS 上文件存储的默认冗余参数是3。

3.两个线程同时累加一个全局变量，比如利用 for 循环进行 50 次自增操作，问该该全局变量的最终结果范围。

4.TCP 的三次握手，四次挥手。

5.关于 TCP 双方关闭连接，涉及到 TIME_WAIT 的概念。

6.SVM、条件随机场、隐马尔科夫模型、最大熵模型中，哪个是生成式模型？应该是隐马尔科夫模型1。

7.还是以上四个模型，哪个模型不符合凸模型有全局最优解的条件？应该还是隐马尔科夫模型。

8.贝叶斯网络是有向无环图。

9.分词中最大正向匹配，最大逆向匹配的概念。

10.linux 平台下有一个三列文件，列之间用逗号分隔，请编程对第二列数字求和。

11.左值不能赋值。

12.hadoop 默认 block 大小是 64M，JobTracker 和 NameNode在同一台机器上。

13.hadoop 采用 Combiner、采用压缩率高的文件格式以及在 map 过程中去掉无效数据都是为了减少数据传输量，与这些优化方法不同的是优化 Partitioner，因为它是为了均衡数据量，而非减少数据量。

14.熵的计算公式和熵最大的条件。

15.复杂链表的复制，所谓复杂是指一个节点除了指向后继，还随机指向链表中的一个节点或 NULL。

16.问如下代码的输出，其实就是统计二进制表示中 1 的个数。

int a = 9999；
int count = 0；
while(a) {
    count ；
    a = a & (a-1)；
   }
   cout<

没有完整题目和答案，能力有限，只能做到这样了，希望能对大家多少有点帮助。最后对要应聘这个岗位的同学们说声Good Luck！