职位描述
工作职责:
-打造面向海量数据,每日传输P级数据量的分布式传输服务
-面向实时计算需求,提供低延时高可用的实时数据流传输引擎
-结合spark生态,打造传输+计算的实时化产品服务,提供秒级延迟的数据实时分析能力
-加入大数据平台,打造业界一流的分布式日志服务
职位要求:
-具有大数据开发经验,了解分布式传输系统的基本原理,了解实时计算,有spark, kafka, scribe, flume, chukwa, datax, sqoop一个或者多个系统经验者优先
-熟练使用C++、Java、Python中至少一门语言;熟练使用基础数据结构和算法;熟悉网络编程、多线程编程技术
-善于学习新知识,动手能力强,良好的沟通能力和推动能力,强烈的进取心
企业介绍
百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。
百度拥有数千名研发工程师,这是中国乃至全球最为优秀的技术团队,这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
从创立之初,百度便将“让人们最便捷地获取信息,找到所求”作为自己的使命,成立以来,公司秉承“以用户为导向”的理念,不断坚持技术创新,致力于为用户提供“简单,可依赖”的互联网搜索产品及服务,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。