数据人自己的学习交流平台,以后如果做商业化,收益扣除20%的运营成本,其他都按照积分进行分配。当然最重要的目的还是为了沉淀一些比较好的内容,希望对大家的学习有所帮助。有任何问题和建议可以直接联系QQ 23683716
推荐关注 一起大数据 微博
0 votes

from 颗颗颗

自然语言(薪资20k-40k)

岗位职责:

1.应用机器学习、自然语言处理、深度学习等技术处理海量非结构化文本数据,进行文本反作弊、用户兴趣标签、用户意图识别、自动问答等开发工作。

岗位要求:

1.计算机、数学、统计学或相关专业,硕士及以上学历;对概率统计和机器学习基本原理有扎实理解;优秀的编程能力,精通Java或Python语言;2年以上自然语言处理和机器学习经验; 

2.在如下专业领域有丰富经验:分词、词性标注、新词发现、词义消歧、情感分析、主题模型、话题分析、命名实体识别、事件发现、舆情分析、知识图谱,作为主力实现过复杂NLP系统; 

3.能够快速理解业务,通过良好的沟通表达能力和自我驱动动力,快速拿结果; 

4.有反作弊、视频图像识别工作经验优先考虑。

推荐系统开发(薪资20k-40k)

岗位职责:

1. 参与不同场景的个性化推荐系统的研发;

2. 分析用户行为数据,针对不同场景设计与搭建个性化推荐算法模型及策略,并优化推荐排序;

3. 通过对用户行为数据的挖掘,对用户进行建模,形成用户特征库。

岗位要求:

1.计算机专业本科或以上学历,2年以上相关工作经验,有直播或短视频推荐经验优先;

2. 熟悉linux操作环境,精通Java、Python编程语言,扎实数据结构和算法基础;

3.具备大数据处理能力,掌握hive、Map Reduce等常规大数据处理方法;

4.熟悉业内常用推荐、机器学习算法,对推荐系统架构设计有深入了解;

5.具备自然语言处理、特征分析等方面的基础知识;

6.责任心强,良好的沟通能力和团队协作精神;

7.有广告、搜索,深度学习相关经验者优先考虑。

数据平台(薪资20k-40k)

岗位职责:

1、负责公司内部大数据存储计算平台等基础设施的搭建、维护、优化、改造,如hadoop/jstorm/hive/flume等;

2、负责各种数据源的收集流程,并提供稳定的基础数据服务;

3、负责数据分析相关系统的设计、开发工作;

4、负责参与构建数据仓库方面工作。

岗位要求:

1、3年以上的互联网公司大数据基础平台开发及优化经验;

2、具有Linux环境开发经验,工程能力强,基础扎实;

3、至少精通hadoop/hive/storm/flume之一,有丰富的开发或调优经验;

4、精通java/python/scala等一种或多种语言,掌握基本数据结构与算法;

5、强悍的编码能力,生产环境快速trouble-shooting能力,对新技术有强烈的学习热情;

6、有过为开源社区提供patch经历者优先考虑;

7、有JVM原理调优经验者优先。

公司官网  http://www.mlxinxi.com/about.html 

以下是公司介绍:

公司简介:杭州明霖信息技术有限公司成立于2011年4月,是一家涵盖海量数据存储、运算、训练、部署能力的大数据服务提供商,同时也是一家以社区应用研发,AI智能服务为主的高科技研发型企业。公司注册资本1900万,目前人员规模在150人左右,其中80%以上为研发技术人员,有来自于211、985和海外留学的高学历人才。公司高管均为原阿里巴巴资深级员工,曾任职支付宝和里金融各核心部门总监,能力涵盖市场销售、企业管理、软硬件部署及运维(DBA)、技术开发、数据挖掘等各个方面。团队能力互补,为公司综合性的长远发展打下良好基础。

公司业务:公司以“科技服务于人”为愿景目标。业务分为两大模块:基于大数据应用服务的社区应用研发与AI智能。

1、大数据社区建站服务

已经成功共部署超过3个万人日活以上的大型社区,为该社区提供:

A、专业成熟的赛事数据:近6年全世界所有足球赛事的对阵、比分、气温、事件(红黄牌进球换人等)、球员等数据记录,通过对该数据的挖掘分析(研究球员状态、阵型、气温等因素对于比赛,结果的影响),并进行专业的大数据解读,从而预测未来的比赛走势。此技术未来可应用于球队俱乐部与赛事管理,切入到线下体育市场,提供数据化服务:通过对球员训练的数据采集(训练时间、出汗量等),可以科学合理的制定球员训练计划,提升球队综合实力,改变足球俱乐部与足球产业的管理模式。

B、高质量的社区内容自动化管理:通过对千万级的UGC内容的深度数据挖掘与相关的业务特性研究,为社区提供大数据应用。比如:UGC优质内容自动排序算法、潜力内容识别系统、社区广告大数据识别拦截系统和违规言论识别屏蔽系统等。

C、强大的服务器支撑:近100台物理服务器,400台虚拟机,硬件资金投入已达1500万。2017年预计再投入2000万,用于服务器扩容与容灾机房建设。目前服务器的线上数据量在3TB左右,每天产生数据库日志600-800GB,支撑约80个线上系统,预计上半年扩容至120个。公司拥有专业的运维团队,负责服务器运维管理。

D、业界领先的合作团队:公司拥有优秀的研发团队,积累了各行业大量的原始数据。外部合作方面,公司与全国数学专业第一名的北大数学学院就大数据研究有着深入的合作(类似谷歌的AlphaGo围棋算法)。为我们进一步发展平添了更多可能性。

2、AI智能:小懂机器人(“懂我”智能聊天)

A、行业领先的对话匹配率:小懂机器人成立于2016年8月,同年10月上线。目前已完全实现文字自动识别并回复,匹配率达75%,处于行业领先梯队(行业顶尖在80%)。小懂可应用于各个服务行业,替代人工客服,减少人力成本,提升经营效率。

B、AI智能与大数据联动:在研发AI智能的基础上,公司将AI智能与大数据相结合,让小懂可以记住每一位用户。在用户初次使用时,小懂便会建立用户档案,通过与用户的聊天互动,不断计算用户数据,由此对用户行为作出预判,可用于私人个性化定制行业。有别于其他云客服机器人,小懂的数据由自有服务器存储,对用户印象“不清零”,真正做到越聊越“懂我”。目前小懂已用于公司对外咨询回复,并持续研发中。

资质认证:公司致力于高科技研发投入,目前已拥有B2-20160794《中华人民共和国增值电信业务经营许可证》、Nemko认证(国际认证)、UL美国权威安全认证、CE欧盟市场安全认证、BSMI台湾市场强制认证、中国节能产品认证、中国环境标志产品认证、ISO9001质量管理体系认证等一系列服务器资质认证。

规划愿景:公司将继续发展AI智能与大数据研究,不断提升研发水平,打造全国一流的涵盖海量数据存储、运算、训练、部署能力的大数据部署及应用提供商。

坐标:杭州滨江(江陵路地铁站附近)

asked in 招聘 by (1.5k points)

Please log in or register to answer this question.

推荐书籍:
...