职位描述
1.负责实现对互联网网站、网页内容进行爬取、采集和数据抽取等工作;
2.内容提取、处理、结构化、过滤等数据处理,并设计存储结构;
3.搭建通用爬虫框架,支持各种定制化爬虫需求的快速实现;
4.攻关抓取过程中的关键技术,优化代理,调度,解析,数据处理等核心模块。
5.公司分配的其它工作
岗位要求:
1.计算机相关专业统招本科及以上学历;
2.精通python语言,3年以上python项目开发经验;
3. 熟悉scrapy或其他python爬虫框架;
4.有较多的web站点爬取、开发经验,至少熟悉一种脚本语言(python、lua等);
5.熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理;
6.良好的编程风格;良好的沟通能力和团队合作精神。
工作地点

公司信息
公司介绍
北京阿尔法风控科技有限公司(以下简称“阿尔法公司”)成立于2018年2月,是一家专注于大数据智能分析技术与嵌入式系统软件的研发应用的高新技术企业。公司坐落于北京市经济技术开发区,实缴注册资本1500万元人民币,具备雄厚的技术底蕴与创新能力,目前已拥有6项发明专利和8项软件著作权,有十余项发明专利正在自主申请和授权过程中。公司被评为北京市专精特新中小企业、国家高新技术企业、北京市省级研发中心、中关村高新技术企业、科技部“科技型中小企业”,并计划于近年申报国家级专精特新“小巨人”企业。阿尔法公司自成立以来,始终坚持以技术创新为核心驱动力。创始团队由多位毕业于欧美知名高校的大数据、管理决策等专业的博士和硕士组成,均具备二十年左右的海内外大型企业的专业背景与行业实践经验。公司早期致力于构建面向多行业场景的大数据风险分析模型,并于2019年成功开发出自主知识产权的人力资源风控系统,相关成果凝聚为专著《雇员群体性离职对企业重大信用风险的预警》,于2022年由中国社会科学院下属经济管理出版社出版,展现了阿尔法在数据分析与智能决策领域的领先实力。近年来,阿尔法公司持续深化在嵌入式系统与大数据平台方向的研发投入,承接了多项来自国家部委与知名大中型企业的具有行业影响力的软件开发与系统集成类项目任务,展现出卓越的全栈技术能力与跨场景落地实力。例如公司开发的企画像2.0版本,该平台集成AI语音交互、知识图谱分析、大数据实时决策辅助等前沿技术,其中“电销精灵”模块具备智能语音识别与实时话术推荐功能,旨在为企业客户提供精准的客户洞察与营销赋能。在推动技术产业化的过程中,阿尔法公司也积极参与行业标准建设。作为主要起草单位,阿尔法公司与清华大学、中国电子技术标准化研究院等单位共同制定了人工智能之“知识图谱”方面的国家标准,该国家标准已由全国信息技术标准化委员会于2026年在全国范围发布,标志着阿尔法公司在人工智能与大数据融合领域的技术贡献获得国家层面认可。 展望未来,阿尔法公司将继续聚焦智能系统与数据技术服务的主航道,依托扎实的研发积累、标准化的产品输出与良好的市场口碑,不断拓展企业级软件系统的应用边界,致力于成为中国领先的大数据风控解决方案与嵌入式系统供应商,为推动行业数字化转型与高质量发展持续赋能。

更新于 今天





