职位类型:数据挖掘工程师
招聘公司:搜狐(搜狐官方招聘)
笔试时间:2015校招
以下题目是我能回忆起来的笔试内容。我不记得是不是有 A、B 卷之分,但以下内容都被考察过无疑。笔试题目范围非常广泛,涉及机器学习、网络编程、hadoop、C++、多线程和智力题。
1.小白鼠喝毒水问题。
2.hadoop 在 HDFS 上文件存储的默认冗余参数是3。
3.两个线程同时累加一个全局变量,比如利用 for 循环进行 50 次自增操作,问该该全局变量的最终结果范围。
4.TCP 的三次握手,四次挥手。
5.关于 TCP 双方关闭连接,涉及到 TIME_WAIT 的概念。
6.SVM、条件随机场、隐马尔科夫模型、最大熵模型中,哪个是生成式模型?应该是隐马尔科夫模型1。
7.还是以上四个模型,哪个模型不符合凸模型 有全局最优解的条件?应该还是隐马尔科夫模型。
8.贝叶斯网络是有向无环图。
9.分词中最大正向匹配,最大逆向匹配的概念。
10.linux 平台下有一个三列文件,列之间用逗号分隔,请编程对第二列数字求和。
11.左值不能赋值。
12.hadoop 默认 block 大小是 64M,JobTracker 和 NameNode在同一台机器上。
13.hadoop 采用 Combiner、采用压缩率高的文件格式以及在 map 过程中去掉无效数据都是为了减少数据传输量,与这些优化方法不同的是优化 Partitioner,因为它是为了均衡数据量,而非减少数据量。
14.熵的计算公式和熵最大的条件。
15.复杂链表的复制,所谓复杂是指一个节点除了指向后继,还随机指向链表中的一个节点或 NULL。
16.问如下代码的输出,其实就是统计二进制表示中 1 的个数。
int a = 9999;
int count = 0;
while(a) {
count ;
a = a & (a-1);
}
cout<
没有完整题目和答案,能力有限,只能做到这样了,希望能对大家多少有点帮助。最后对要应聘这个岗位的同学们说声Good Luck!