职位描述
职责描述:
1、基于hadoop生态的大数据存储平台搭建和部署;
2、承担数据抽取、清洗、转化等数据处理程序开发;
3、参与数据模型设计和评审,保障数据平台架构稳定;
4、为日常运营活动提供数据支持,并且在一定程度上给予评估和建议。
任职要求:
1、乐于学习和尝试新技术、新工具,良好的沟通和理解能力;
2、有较强的Linux操作能力,有Shell等脚本编写经验;
3、熟悉数仓体系和大数据处理平台相关子系统功能,如ETL、数据报表、监控、数据质量等;
4、熟悉Java语言,最好有scala、python使用或开发经验;
5、掌握Hadoop/Spark/Storm生态圈的主流技术及产品,深入了解Hadoop/Spark/Storm生态圈产品的工作原理及应用场景;
6、熟悉MySQL处理机制与应用场景限制,熟悉NoSQL如Redis、HBase等,熟悉消息中间件如Kafka等的实现原理。
企业介绍
世纪互联数据中心有限公司(21ViaNet Group, Inc,简称世纪互联)是中国目前规模最大的电信中立互联网基础设施服务提供商。我们为客户提供业界领先的服务器及网络设备托管服务,并通过优质的网络互联服务(interconnectivity),帮助企业全面提升其互联网基础设施的性能、可用性和安全性。此外,我们的服务范围还涵盖管理式网络服务(managed network services),致力于帮助客户通过广泛的数据传输网络和特有的BroadEx?智能路由技术在互联网上更快捷、更可靠地传输数据。
作为一家互联网基础设施服务提供商,世纪互联的基础设施与国内全部电信运营商、大型非运营商企业和地方互联网服务提供商(ISPs)运营的网络均保持互联互通,这使得世纪互联旗下每家数据中心都能够作为客户数据流中的一个网络访问点来发挥作用。与此同时,世纪互联凭借特有的BroadEx?智能路由技术,可帮助客户自动选择出最优化路径进行数据流引导,确保快速、可靠的数据传输。这样,世纪互联以网内、网外高水平的互联性战略设计,满足客户因为网络互联性不足而产生的需求,从而提供完整、有效的全方位解决方案。
目前,世纪互联在国内33个城市运营47家数据中心,这些基础设施均由高质量的数据中心和庞大的数据传输网络组成。世纪互联现已拥有超过1,300个客户,横跨多个领域,涵盖互联网企业、政府机构、大型蓝筹股企业及中小企业等。