该职位已失效,看看其他机会吧

python爬虫/数据采集员

5000-8000元
  • 西安未央区
  • 1-3年
  • 大专
  • 全职
  • 招1人

职位描述

数据采集反爬虫PythonJavaScrapy
【主要职责】:
1、根据公司业务需要,对指定信息源进行数据抓取;
2、研究和应对反爬策略,保证爬取的稳定性;
3、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
4、负责信息抽取、数据清洗等研发和优化工作;
5、负责抓取数据的解析入库,爬虫系统的监控和异常优化。
【任职要求】:
1、大专及以上学历,1年以上相关工作经验;
2、熟悉Python语言;
3、熟练掌握一种开源爬虫框架,如scrapy、webmagic,有研发爬虫框架经验者优先;
4、熟悉火车头软件的使用;
5、熟悉一种数据库;
6、对爬虫有浓厚的兴趣,责任感强,有较好的交流沟通能力和团队合作能力;
7、有自我学习和探索的能力,关注行业动态和技术趋势,不断提升个人技能水平
查看全部

工作地点

西安未央区草滩八路

职位发布者

王女士/HR

三日内活跃
立即沟通
公司Logo中译语通科技(陕西)有限公司
中译语通科技(陕西)有限公司是2017年由中译语通科技股份有限公司与陕西省西咸新区秦汉新城开发建设集团有限责任公司合资成立,是陕西省“一带一路”语言服务及大数据平台建设运营单位。中译语通是中国对外翻译有限公司的控股子公司、国家高新技术企业,直属于中宣部旗下中国出版集团有限公司。公司自主研发了机器翻译、跨语言大数据分析、金融量化与监管科技、全球科技发现与价值评估、数字城市大脑等全球领先的系统平台,为全球企业级用户提供全方位的领先大数据与人工智能场景化应用解决方案,连续多年在国际机器翻译评测比赛中获得冠军。前沿技术研发覆盖机器翻译、自然语言处理、跨语言大数据分析、语音识别、图像识别、语义搜索和知识图谱等。目前,公司在上海、青岛、西安、成都、美国硅谷设有子公司。中国出版集团是中国最大的大众出版和专业出版集团。中译公司前身为“联合国资料小组”,于1973年3月经国务院批准成立,是中国唯一的联合国文件中文翻译提供商,拥有行业领先的语言服务经验。
公司主页