高级爬虫工程师(社媒项目经验)

1.4-1.8万
  • 天津 东丽区
  • 5-10年
  • 大专
  • 全职

雇员点评标签

  • 工作环境好
  • 同事很nice
  • 人际关系好
  • 团队执行强
  • 氛围活跃
  • 免费班车
  • 管理人性化
  • 准时发工资

职位描述

PythonJava数据采集数据清洗爬虫开发
职责
· 高并发抓取架构: 负责跨平台社交媒体(TikTok, Instagram, YouTube 等)的高并发数据抓取架构设计与开发,具备千万级以上平台并发抓取经验。
· 反爬策略攻坚: 攻克各大平台的反爬策略(代理池调度、逆向分析、验证码及加密参数破解),确保采集通道的高可用与稳定性。
· 数据清洗与标准化: 负责底层抓取数据的精准清洗与标准化。例如:准确提取地域 Country Code 并严格执行自动剔除冗余洲际标签的逻辑,从源头确保数据的高质量与纯净度。
· AI 辅助逆向分析: 深度应用 AI 编程工具,加速复杂网页结构解析、正则表达式生成及逆向分析脚本的编写。
■ 任职要求
· 专业技能: 精通 Python 或 Java,熟练使用主流爬虫框架及自动化工具,精通网络抓包与逆向工程。
· 数据业务嗅觉: 不仅仅负责“抓”,还要理解“抓什么有价值”。能快速理解数据清洗标准对下游分析业务的直接影响,确保采集策略与业务目标高度一致。
· AI 协同开发: 熟练使用 AI 辅助开发工具应对海量、多变的 解析工作,大幅缩短脚本开发周期。

工作地点

工作地点
东丽区天津讯飞
位置图标
完善简历

公司信息

软通动力信息技术(集团)股份有限公司

已上市 · 10000人以上 · 软件/IT服务、软件/IT服务、人工智能 已审核 已审核

6136 个在招职位

公司介绍

软通动力信息技术(集团)股份有限公司(以下简称“软通动力”)是中国领先的全栈智能化产品与服务提供商,2005年成立于北京,始终坚持创新,致力于成为一家具有全球影响力的科技企业。公司提供软件与数字技术服务、计算产品与智能电子、数字能源与智算服务以及国际化服务,员工90000人。目前,公司在10余个重要行业服务超过2600家国内外客户,其中超过230家客户为世界500强或中国500强企业。公司位列2024年中国 IT 服务市场第一,入选2025年财富中国 500 强企业,位列429。软通动力拥有软通咨询、软通金科、软通国际、软通工业互联、软通华方、机械革命、恒悦等业务子品牌,北京、江苏两大智能制造基地,布局北美、日韩、亚太、中东四大区域市场,在全球60余个城市构建完善的全球业务网络。公司锚定AI前沿,以人工智能工程能力为基础,科学智能(AI for Science)为引领,布局智能制造、ICT软硬基础能力和具身智能等领域,打造新产业链闭环,为客户提供场景智能(AIAgent)、终端智能(AI Terminal)、计算智能(AIInfra)的全栈智能服务。软通动力设立30个能力中心,拥有1个国家级工程实验室,6个省市政府认定的工程、技术实验室及研发中心,1个博士后科研工作站,依托全球软硬生态协同创新体系,不断探索前沿技术应用潜力。公司旗下教育品牌软通教育,拥有一家全日制本科学院——郑州西亚斯学院数字技术产业学院;全国合作院校700多所,设有70多个校企联合人才培养基地,通过校企合作、协同育人,为社会培养高素质应用型人才。软通动力先后荣获“2024新经济企业500强”、“2024年中国软件和信息技术服务竞争力百强企业”、“中国软件产业40年贡献企业”、“2024年信创领军企业”、“省级科技进步奖”,入选沪深300、中证A500、创业板50等核心指数,深交所信息披露最高“A”级评价,连续三年获得Wind ESG评级AA级等权威认可;拥有专利380+项、全球软件工程领域最高级别CMMI V2.0成熟度5级评估认证、信息系统建设和服务能力最高等级——杰出级(CS5)、信息技术服务标准(ITSS)运维能力成熟度一级认证等专业资质,支撑公司更优质的服务体系。

工商信息

企业名称 软通动力信息技术(集团)股份有限公司
企业类型 股份有限公司
法人代表 刘天文
经营状态 存续
成立时间 2005-11-04
注册资本 10.35亿元
查看全部信息

认证资质

营业执照信息
最新招聘
热门城市
热门职位
热门公司