职位描述
职责描述:
1、负责公司健康医疗大数据平台相关组件的设计、搭建和维护;
2、负责对远程的医疗信息系统的数据收集、处理、存储进行方案设计和开发
3、利用分布式计算集群对数据进行分析、挖掘、处理、生成报表;
4、负责Hadoop相关业务的性能优化与提升,集群性能优化,不断提高系统运行效率;
5、进行大数据技术培训以及相关项目交付,对客户或团队成员形成知识转移;
任职要求:
1、3年以上hadoop,hive,spark开发经验,精通Hadoop生态系统及相关组件,并拥有实际的实施经验;
2、精通Java、scala编程,精通Spark计算框架的实时采集和流处理;
3、熟悉整个大数据的处理流程,包括数据的管理,数据的分析挖掘,服务器扩展;
4、熟悉Cassandra、HBase、MangoDB等数据库的设计开发;
5、良好的SQL语句功底,熟悉MySQL、PostgreSQL、Oracle数据库中的一种;
6、熟悉sqoop、flume、azkaban等大数据ETL调度工具,主流的消息队列中间(主流MQ、Kafka等);
7、有大数据系统架构设计、OLAP应用开发(如Kylin)、数据分析挖掘经验者优先考虑;
8、学习能力强,工作作风严谨、积极主动,有较强责任感,乐于协作,善于分析和解决问题。
企业介绍
中国健康医疗大数据第一品牌。公司依托云计算、大数据、物联网、人工智能等新技术,卫衣料机构、卫生管理机构、企业、个人等提供包括健康医疗大数据、医疗云服务、医疗卫生信息化在内的全方位健康医疗解决方案,积极推动中国医疗卫生信息化变革与创新进程。