职位描述
工作职责:
-负责百度大数据部抓取平台的核心技术研发工作
-负责网页抓取相关在线服务、计算、调度、存储等工程架构开发
-解决负责相关业务团队定向数据获取诉求
-负责抓取相关新技术方向研究、开发和应用
职责要求:
-优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情
-网络爬虫、网页抓取、定向数据获取相关工作经验至少1年
-熟练掌握至少一种编译语言,C/C++或者JAVA,具备较丰富工程经验
-熟悉linux平台,熟悉至少一种脚本语言,熟练应用shell、python进行工作
-大型工程架构相关经验优先
-复杂抓取、爬虫工程经验优先
企业介绍
百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。
百度拥有数千名研发工程师,这是中国乃至全球最为优秀的技术团队,这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。
从创立之初,百度便将“让人们最便捷地获取信息,找到所求”作为自己的使命,成立以来,公司秉承“以用户为导向”的理念,不断坚持技术创新,致力于为用户提供“简单,可依赖”的互联网搜索产品及服务,其中包括:以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。