阿里巴巴全球化技术团队介绍【内含算法干货】

我们在做什么

我们的主战场是Aliexpress、速卖通,中国最大出口B2C电商平台,被称为国际版淘宝;覆盖全球230个国家和地区,App海外装机量超过6亿,入围全球应用榜单TOP10。我们负责Aliexpress搜索、推荐以及包括广告在内的商业智能算法技术。

我们拥有什么

由于买家来自全球各地,不同地区的受众因为地理气候、生活习惯、宗教文化、经济条件的不同,购物的品类、购买力、对图片文案的偏好、物流时效的诉求,都有很大的差异。我们不会给地处非洲的用户推荐羽绒服、北欧各国的用户在购买偏好和风格审美上会有很多相似之处、欧美的买家普遍购买力较强、新加坡人喜欢从周边国家采购生活用品……显然国家、地域差异化的人群背后蕴藏着丰富的个性化信息;此外,还有这些用户在搜索引擎、社交网站上的行为信息;和国内买家大多使用app不同,国外的buyer还会使用PC网站以及手机网页进行购物。复杂的场景构建出了许多复杂而又有趣的算法问题:如何利用其他地区的数据对一个冷启动的小国受众的购买偏好做预估?如何在考虑全球汇率、税率的情况下进行流量采买以维持平台的ROI(投资回报率)?国内的商家在深夜迎来了俄罗斯、美国等地的流量高峰,如何帮助他们解决时差问题、进行自动化的商品投放?

我们拥有丰富的全球化场景和数据、能支撑上亿用户的搜索引擎及计算资源、专业的国际化业务技术团队,以及充满挑战的算法课题。

跨语言检索
传统的检索召回主要依赖字面匹配的程度并利用规则控制来增加召回,并没有利用文本背后的丰富语义信息。而向量表示学习可以表达文本背后丰富的上下文分布式语义,是提高召回丰富性的有效手段,也是目前业界常用的技术。在模型选型上最终采用CDSSM+多任务+Siamese双胞胎网络架构+自注意力机制。结合跨境电商场景,我们自主研发的多任务包括句子匹配任务、叶子类目分类任务、点击意图编码回归任务、一级行业分类任务、二级行业分类任务共5类任务,且彼此促进学习,从而有利于主任务的学习和收敛,增强最终向量表示的通用性。考虑到深度模型属于计算密集型作业,向量召回的整体架构就预留了全部商品和热门查询串的向量预测预先计算和缓存模块,从而为用于中长尾查询串的实时计算的RTP节省了大量计算资源,保证了深度模型的计算延迟性能可控。

然而前文提到的,全球化跨境场景最大的特性是国家场景丰富、涉及到18个主要语种。单语种的向量化检索并不能满足诉求。因此,我们和达摩院翻译团队合作共建跨语言向量化检索引擎及算法,应用于搜索场景,提升检索召回与准确率。

国家差异化建模

上文提到不同用户兴趣差异很大。目前许多业务使用深度模型取得不错提升,我们调研WDL、DFM、xDeepFM、AutoInt、DIN、DIEN等方法,但是直接暴力Copy并不适用于AE场景。基于以上问题,我们网络整体设计成WDL结构,通过Linear部分表达大规模离散化特征保证模型稳定性。而将国家信息放到偏置网络,让Deep部分每个子网络更容易表达和抽象。最后形成了如下模型结构:

运筹学在商业场景中的应用

商业场景中往往需要考虑多目标优化,买卖家平台三方共赢。算法的任务就是从全局维度优化展现、点击、交易、竞卖等环节,帮助实现帕累托最优,即资源已经达到最优的状态、再做任何的改动都会使得参与者利益受损。

第一个典型的场景是在广告资源的分配中,有些广告平台会根据广告主的不同营销诉求推出不同的推广计划。广告主希望针对自己的产品最大化点击,或订单、或曝光。不同的营销诉求都由不同的推广计划来承载和实现,同时受到广告主预算的约束。我们从对整个问题进行建模和求解,设计了一套完整的离线在线解决方案。Optimal Delivery with Budget Constraint in E-Commerce Advertising:https://arxiv.org/abs/1909.13221

第二个经典场景是红包发放。算法参与运营红包决策过程,完成商家圈选、敏感度拟合、面额决策、张数决策。商家之间相互竞争形成了竞争网络,且每个流量下,后一名商家对前一名起到了打桩作用。如图所示,深绿色的为网络中贡献度最大的成员。如果核心商家提价,对大盘效果影响会更显著。
对问题进行定义求解,其中,i为商家编号,卡券为满ai-bi,ci为i的基准消耗,可以发放的卡券总面额为B(运营设置卡券发放量),ROI要求大于2,采用01背包求解。

这两个应用,在实际业务中都取得了非常不错的效果。

我们的团队

来自世界各地的业务、技术小伙伴
国内外高等院校毕业、曾在知名企业就职的专业人士


我们需要什么

欢迎对全球化业务感兴趣有热忱的同学
算法类:机器学习、自然语言处理、运筹学、算法工程等方向
研发类:研发工程师JAVA,研发工程师C++,客户端开发工程师-iOS,客户端开发工程师-Android,前端开发工程师
测试类:测试开发工程师
产品类:产品经理


欢迎加群进一步交流

更多招聘信息见海报内容




#阿里巴巴##内推##算法工程师##春招##校招#
全部评论
即将入职的团队,实习感觉很棒,欢迎大家投递简历啊,有疑问可以加群咨询
2 回复 分享
发布于 2020-03-24 14:36
不明觉厉
1 回复 分享
发布于 2020-03-24 14:37
日常一顶,欢迎加群咨询
点赞 回复 分享
发布于 2020-03-26 18:04
看到的同学不要含羞,大胆加群吧,都是热情的学长学姐
点赞 回复 分享
发布于 2020-03-24 19:15
点赞 回复 分享
发布于 2020-03-24 15:12
欢迎大家进群讨论,交流算法、项目、论文、面试题哈,偷偷拉了好多阿里大牛到群里。
点赞 回复 分享
发布于 2020-03-24 14:54

相关推荐

不愿透露姓名的神秘牛友
11-10 11:42
点赞 评论 收藏
分享
评论
2
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务