职位描述
工作职责:
1、负责和参与百度大数据基础架构平台的监控、资源管理、数据流管理等自动化运维系平台的建设
2、研究大数据前沿技术,改进现有系统的服务和运维架构,提升系统可靠性和可运维性
3、负责百度大数据平台的设计和开发,数据仓库建模,数据预处理子系统的设计和开发
4、负责海量数据的处理、分析、挖掘
5、负责高并发、大存储的数据系统,实时计算处理系统的研发
职位要求:
1、具有2年以上设计开发经验
2、计算机或相关专业本科以上学历
3、精通Linux/Unix环境,至少熟悉一种编程语言(PHP/Python/Java)
4、熟悉数据仓库的ETL的开发和数据建模,有Map Reduce或其他并行计算的实践经验
5、工作细致、善于思考,有很强的问题分析和推进解决的能力
6、强烈的责任心与上进心、抗压能力强
7、良好的沟通和协调能力
具备如下实际项目经验者优先考虑:
1、具备基于Hadoop集群数据仓库DW系统运维经验
2、具备数据仓库数据流监控自动化运维经验
3、大数据处理,大规模的数据分析和算法实践经验
企业介绍
百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。
百度拥有数千名研发工程师,这是中国乃至全球最为优秀的技术团队,这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
从创立之初,百度便将“让人们最便捷地获取信息,找到所求”作为自己的使命,成立以来,公司秉承“以用户为导向”的理念,不断坚持技术创新,致力于为用户提供“简单,可依赖”的互联网搜索产品及服务,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。