职位描述
职位描述:
l 研究大数据、无人车、图像处理、人工智能前沿技术,改进现有系统的服务和运维架构,提升系统可靠性和可运维性
l 负责和参与百度大数据基础架构平台、百度公司无人车项目的监控、资源管理、核心数据流管理等自动化运维系平台的建设并保证高可靠
l 负责百度大数据平台的设计和开发:数据传输、作业调度、数据仓库、数据处理、在线数据服务
l 负责高并发、大存储的数据系统,实时计算处理系统的运维研发
| 建设和完善百度的大数据生态,服务百度核心业务;优化提速数据平台的ETL过程,保证数据处理时效性,提升用户体验;
职位要求:
| 计算机相关专业本科以上学历,2年及以上互联网从业经验
l 精通Linux/Unix环境,至少熟悉一种编程语言(PHP/Python/Java)
| 熟悉业界主要的分布式海量日志采集、聚合、传输的系统,有 Flume、Scribe、Chukwa、Kafka等实践经验
l 熟悉业界分布式存储系统,熟练掌握file/kv/table/object中的任意一种
| 熟悉业界分布式计算系统,熟练掌握 mapreduce/spark/storm中的任意一种,有Map Reduce、Spark、Hive或其他并行计算的实践经验
l 强烈责任感,对生产环境服务高可用有敬畏之心 ,良好的团队合作意识
| 独立思考,善于主动发现问题,能够系统化的分析问题和解决问题
| 良好的自驱力,持续学习,追求极致,能够承受一定的工作压力
加分项:
| 具备分布式海量日志采集、聚合、传输的运维实践经验
l 具备数据流监控自动化运维经验
l 熟悉数据仓库的ETL的开发和数据建模
l 有大型互联网/IT公司 存储/mapreduce/spark/storm的开发、测试、运维、应用工作经验,熟悉源码尤佳
企业介绍
百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。
百度拥有数千名研发工程师,这是中国乃至全球最为优秀的技术团队,这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
从创立之初,百度便将“让人们最便捷地获取信息,找到所求”作为自己的使命,成立以来,公司秉承“以用户为导向”的理念,不断坚持技术创新,致力于为用户提供“简单,可依赖”的互联网搜索产品及服务,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。