阿里的做法确实让我们看到很暖心,为科研人员提供应用场

作者:jcmp      发布时间:2021-01-21      浏览量:0
一次偶然的机会,在中科院自动化所模式

一次偶然的机会,在中科院自动化所模式识别国家重点实验室,工作的副研究员吴书拿到阿里用于竞赛的电商数据集,凭兴趣和专业做了一个类似“商品风格”的算法,并投稿到2016国际信息检索大会上。没想到,这开启了他参与阿里巴巴“访问学者计划”的大门。

原来,吴书开发的“商品风格”算法,正是阿里巴巴访问学者计划所寻找的“将阿里巴巴丰富场景和前端科技相融合,解决实际问题”的落地项目。在获知吴书的“商品风格”算法后,阿里巴巴主动沟通相关领域的学者前来阿里进行访学,在与吴书沟通后双方一拍即合,开始了他们产学研合作之旅。

“相比以前与企业的一些横向合作项目,去企业做访问学者这种模式在国内很新奇。接到邀约后就挺想去试一试。”吴书在接受《中国科学报》记者专访时说,在推动学术研究方面,产业界并不鲜见,但是像阿里巴巴这样能有如此主动的姿态,确实少见。

从应用中来,到应用中去

 

请输入图片描述

在阿里北京总部,记者见到了佩戴着阿里工牌的吴书。短短两个月,他已经习惯了这里的节奏,跟阿里的“同学”打成了一片。“在这里我和阿里的员工没什么区别吴书告诉记者。

真实场景的海量数据之于近年主要从事数据挖掘、推荐系统和网络数据理解等研究的吴书,可谓意义重大。

“我所从事的研究领域属于计算机领域的应用基础研究,它其实是由应用驱动的。在真实的数据场景下我们往往能看得更远,做出来的研究也更有先见性。”吴书说,从数据挖掘的角度来看,产业界的迅猛发展正推动着这个领域的研究“一直往前走”。不仅如此,马云还通过网商银行解决了央行限额规定,将芝麻体系发挥到了极致,更有网银金融的 “益捷通宝”展开合作业务,无论是个别商家都可以使用,与芝麻分体系是同类产品,还能获得隐形奖品,还能获得隐形奖品,红包免费天天领取。

记者了解到,吴书刚刚“跑完”阿里电商数据的两个算法,分别是表达更丰富的“商品推荐”和备货量的预测模型,均属于“新零售”环境下的重磅应用。

“阿里的电商业务多,遇到的问题也多,我们希望拿到一些数据,针对一些重要问题往深处钻。最终的成果可能不仅电商领域能用,也能给其他行业带来一些帮助。”吴书告诉记者,更重要的是,更多真实的数据和应用场景还能帮助发现一些之前“没有的”重要问题的研究:“之前看不到这种数据和需求,所以问题也没有被发现。”

同在今夏赴阿里杭州总部访学的台湾大学教授林智仁对此颇有同感:“企业能够提供在校园接触不到的实际应用场景,这是最关键的。只有接触到实际应用场景,才知道这个领域有哪些应用、怎么应用、应用中存在哪些问题。”

林智仁是阿里巴巴首位访问学者,因发明LIBSVM这款非常流行的机器学习软件奠定了业界“学术大牛”地位的他,也有在谷歌、雅虎、微软等企业做访问学者的经历。“我喜欢来业界,去了解实际应用。数据当然很重要,但对我而言应用场景更重要。”他在接受《中国科学报》记者专访时说道。

林智仁对记者举例说,阿里巴巴要处理的数据量很大,其机器学习部门需要对接用户大规模的机器学习服务——这是在学校、小企业所不具备的——大规模的机器学习有很多、很大的挑战,就像指挥一个人和指挥整个军队的不同,在这种场景下才能发现大规模机器学习在运转、应用中的问题,进而做出一些改进或者触发新的研究。

“可以说,在企业访学,最大的期待在于能否发现问题,然后顺着这些问题开展更深入的研究。”林智仁说。

让做科研的人专心做科研

在去阿里访学之前,吴书坦言也与不同企业有过不少合作,但像这样的访学还是第一次。“企业很多项目,给研究者的手笔不可谓小,但项目做完了就完了,没有互动、没有持续性。”在向记者谈与其他项目的区别时,他提到,阿里的访学计划,是“产业界和学界深度结合的一种探索”。

吴书告诉记者,在阿里访学期间,能明显感受到产与研的完美支持与良好互动。“一方面,阿里工程能力很给力——这样我们可以脱离工程细节,将精力集中于算法和重要的问题;另一方面,阿里的科技人员也特别有科研素养——他们会考虑提出的问题适不适合从学术角度进一步探究,将来会对哪些业务场景、哪些行业有用。”

这也正是青年973科学家、上海市互联网大数据工程中心执行副主任肖仰华的感受。他在阿里访学期间,主要针对电商应用场景,研究相应知识体系(包括知识图谱、行业规则库)的自动化构建方法,搭建一个电商行业的导购图谱系统并落地在MatrixQ平台上——这个平台就是阿里搜索事业部搭建的。

“阿里是全球电商巨头,没有哪个地方比在这里做这项研究更合适的了。”肖仰华对记者表示,阿里巴巴这种支持能力和互动深度,正是吸引他来阿里做访学的原因。

林智仁告诉他们在访问学者项目中非常愿意无偿扮演‘支持者’的角色。”

除了访问学者计划之外,还有更多

让吴书赞赏是阿里巴巴用灵活多样的机制来推进产学研合作,以此获得技术引领能力的做法。在当前市场环境下,即使强如阿里这样的巨头也面临着激烈的竞争和瞬息万变的市场,企业细致布局科技前沿甚至基础科学领域往往成为奢谈。“这种情况下与高校或科研院所形成良好的合作机制就会显得非常有效率,对学者而言,也是在高校院所的实验室之外,另辟了一个新战场。”吴书说。

“这种双赢,想象空间非常大。不过,就像需要‘科研工作者不要完全以论文为导向’一样,企业也要用心梳理出一个好的与学者的配合机制,才能真正成为创新的主体。”吴书话锋一转说道。

而对于此,阿里巴巴技术生态负责人给出的回答是,阿里巴巴希望搭建学术界、工业界的合作平台,推进旨在以产学研深度合作的方式引领重大科技创新的实践应用的技术生态工程建设。联合多方优势共同促进前沿技术的发展。为此,阿里巴巴愿意更大力度地进行投入,愿意寻找更加灵活的合作机制与方式。事实上,阿里巴巴也正在这么做:

5月,阿里巴巴-浙江大学前沿技术联合研究中心(AZFT)成立;7月,阿里巴巴正式对外发布了阿里巴巴创新研究计划,诚邀全球学术机构或非盈利性实验室的学者们,致力于推进计算机科学领域基础性、前瞻性、突破性的研究;9月,之江实验室在杭州举办成立大会。这一全新的“一体、双核、多点”架构组建方式——以省政府、浙大、阿里巴巴出资成立的之江实验室为一体,以浙大、阿里巴巴为双核,以国内外高校院所、央企民企优质创新资源为多点。以国家目标和战略需求为导向,打造一批世界一流的基础学科群,开展重大前沿基础研究和关键技术攻关,对于阿里巴巴而言,这一积极争创网络信息国家实验室的全新机制设计,也正是构建技术开放协同学术生态的全新落地。

9月8日,在阿里巴巴集团有4万名员工参加的18周年庆上,阿里巴巴董事局主席马云,强调阿里作为“理想主义者”要承担责任、创造价值。其中他着重提到了已是世界第21大经济体的阿里巴巴必须担当起“(依靠)市场进步、创新、技术推动社会的力量” ,让“技术不应该成为贫富差距拉开的驱动剂,技术是一种完全的,彻底的,更普惠共享的东西,必须让全人类能够共享这样的技术。”。这样的技术愿景,恰恰也正是科研工者的使命与愿望。