更新于 4月1日

大数据开发工程师

1-1.5万
  • 西安雁塔区
  • 3-5年
  • 本科
  • 全职
  • 招1人

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 人际关系好
  • 团队执行强
  • 氛围活跃
  • 免费班车
  • 管理人性化
  • 准时发工资

职位描述

SparkFlink
1、熟悉主流大数据平台:如 Hadoop(包括 HDFS、YARN)、Spark、Flink 等。要了解它们的架构、原理和组件,能够熟练进行安装、配置和升级。例如,需要知道如何在集群环境中部署 Hadoop,以及如何根据业务需求调整 Hadoop 集群的参数。
掌握数据存储系统:包括 HBase、Cassandra 等分布式数据库。要理解它们的数据模型、存储机制和读写操作,能够进行性能优化。例如,对于 HBase,要能够优化其表结构设计以提高数据读写效率。
2、精通 Linux 系统:因为大数据平台大多运行在 Linux 环境下。需要熟练掌握 Linux 命令行操作,如文件系统管理、用户管理、进程管理等。例如,能够使用命令行工具查找和解决服务器上的高负载进程问题。
3、服务器硬件知识:了解服务器的硬件组成,如 CPU、内存、存储设备等。能够根据大数据系统的负载要求合理配置服务器资源,并且在出现硬件故障时能够进行初步的诊断和处理。
网络知识
4、自动化运维工具:熟练使用 Ansible、Puppet、SaltStack 等工具进行大数据平台的自动化部署和配置管理。例如,使用 Ansible 编写自动化脚本,实现一键部署大数据集群。
脚本语言能力:至少精通一种脚本语言,如 Python、Shell 等。能够编写脚本来实现系统监控、日志分析、故障自动恢复等功能。例如,使用 Python 编写脚本定期收集和分析大数据系统的性能指标。
5、有大数据平台运维经验:一般要求有 1 - 3 年以上大数据运维项目经验,参与过大型大数据平台的建设和维护工作。例如,曾经负责过一个电商企业的大数据分析平台的日常运维工作,包括数据采集、存储和分析系统的维护。
6、具备故障排查能力:能够快速定位和解决大数据系统在运行过程中出现的各种故障,如集群节点故障、数据丢失、服务异常等。例如,在遇到数据仓库查询性能急剧下降的情况时,能够通过分析查询计划、系统资源使用等方面找到原因并解决问题。

工作地点

西安雁塔区环普科技产业园-E座

职位发布者

刘宇洁/人事经理

三日内活跃
立即沟通
公司Logo软通动力信息技术(集团)股份有限公司
软通动力信息技术(集团)股份有限公司(以下简称“软通动力”)是中国领先的全栈智能化产品与服务提供商,是“中国500强”企业(出自“财富FORTUNE”)。公司2005年成立于北京,多年来持续创新,致力于成为一家具有全球影响力的科技企业,提供软件与数字技术服务、计算产品与智能电子、数字能源与智算服务以及国际化服务。目前,公司在10余个重要行业服务超过2600家国内外客户,其中超过230家客户为世界500强或中国500强企业,员工90000人。软通动力拥有软通咨询、软通金科、软通工业互联、机械革命、软通华方、软通国际等业务子品牌,并在全球60余个城市布局业务,构建北美、日韩、亚太、中东四大国际交付中心,在北京通州、江苏无锡建设两大智能制造基地。同时,公司前瞻布局智能制造、ICT软硬基础能力和生产力智能化产品,打造产业链闭环。软通动力设立30个能力中心,拥有1个国家级工程实验室,6个省市政府认定的工程、技术实验室及研发中心,1个博士后科研工作站,50+技术合作伙伴的生态合作体系,不断探索前沿技术的巨大商业应用潜力。公司旗下教育品牌软通教育,拥有一家全日制本科学院——郑州西亚斯学院数字技术产业学院;同时在全国合作院校700多所,设有70多个校企联合人才培养基地,通过校企合作、协同育人,为社会培养高素质应用型人才。软通动力先后获得“2024年中国IT服务市场排名TOP1”、“2024新经济企业500强”、“2024年中国软件和信息技术服务竞争力百强企业”、“2024年信创领军企业”、“2024万得ESG评级(WindESGRating)AA级及信息技术服务行业ESG综合得分排名第一”等荣誉及市场认可,并拥有全球软件工程领域最高级别CMMIV2.0成熟度5级评估认证、国家研发运营一体化(DevOps)三级能力成熟度模型认证、信息技术服务标准(ITSS)运维能力成熟度一级认证等专业资质,支撑公司更优质的服务体系。
公司主页