您当前的位置: 首页 > 故事

北大计算机所技术和市场都要顶天立地

2019-03-14 03:14:09

北大计算机所 技术和市场都要“顶天立地”

作者:未知来源:科技

写稿机器人小南是智媒体实验室推出的研究应用成果。智媒体实验室由南方都市报社、凯迪络和北京大学计算机科学技术研究所联合成立,欲在推动媒体智能化技术研发、促进自然语言处理等科学领域的发展、探索媒体智能化产品服务的新运营模式等方面开展深度合作。

里约奥运会让张小明名噪一时,这部写稿机器人6天写出400多篇稿件,它与击退全部国外照排系统的方正电子出版系统师出同门,均诞生于北京大学计算机科学技术研究所(以下简称北大计算机所)。

这个被认为可以让下岗,引领媒体行业进入全新时代的机器人此后分身有术,在体育、财经、春运甚至时政类报道中屡现身影

2017年春运,北大计算机所和南方都市报社合作的小南,在一票难求时通过与12306打通技术连接,秒级播报广州旅客和列车情况;2017年两会,它又化身阿同,快速度解读几十万字的两会六大报告,快敲黑板划重点。

过去35年,我们始终传承王选精神,发展王选事业。5月28日,在接受科技专访时,北大计算机所所长郭宗明介绍,顶天立地是计算机所一直秉持的王选精神之一,顶天指的是的科学技术,立地就是大范围科技成果的应用。研究要面向应用,哪怕是短期没有应用前景,长期有应用前景的,我们也坚持研究。

研究的步子要走在需求前面

黑白的排版印刷系统,用户都是排着队来买的。郭宗明回忆,1989年,激光照排系统获得成功,新华社报道我国印刷技术将开创新纪元。

面对黑白排版红得发紫的市场,当彩色出版系统关键技术的研发课题提出时,企业侧很多人是反对的。一方面,研发部门和市场部门的同事已经疲于应付超饱和的市场需求,另一方面,高企的业绩让人甘于满足。郭宗明回忆,但是,王选老师顶住压力,坚持要搞彩色出版。

1992年6月1日,《科技》在中国大陆首家采用方正彩色出版系统出版彩报。随后彩色出版系统这一科研成果迅速进入东南亚和北美,占领了海外80%的华文报业市场。

研究是对未知的探索,是永远不满足于已经获得和已经达成。新时代的王选接班人们同样走在市场需求之前,力求让科研成果符合要求,顺利落地。

以前文本信息是络信息中的主流类型。北大计算机所多媒体信息处理研究室主任彭宇新教授说,近几年图像、视频等多媒体数据铺天盖地而来,已经占据大数据的80%以上。

然而对于图像、视频数据类型的分析技术,北大计算机研究所早在2005年前后就已经开始布局。

研发要基于市场需求,却不是被市场牵着鼻子走,郭宗明认为,对研究发现的把握要有前瞻性,是要牵着市场的鼻子走。在研发阶段就要对以后的应用市场心里有数,让科研成果转化的工作走在前面。

随着硬件的发展,

北大计算机所技术和市场都要顶天立地

数据类型就会发生巨大变化,智能识别的任务将发生变化。彭宇新就是这样看三步地确定了团队的研究方向为人工智能的数据库中加上图像、视频。

团队创新性地发明了基于注意力模型和深度增量学习的识别方法,并6次参加国际权威评测TRECVID的视频样例搜索比赛均获名,在与卡内基梅隆大学、牛津大学、IBM Watson研究中心等参赛队伍的较量中胜出。

技术的抽丝剥茧,让图像、视频中的信息如文本一般精确透明。我们是瞄着应用去的,准确率、处理速度都经过多年优化,并已落地应用。彭宇新介绍,这项技术不仅帮助媒体等行业进行数据管理和检索,还在助力互联管理部门对大数据进行分析与监测。

联手企业重新定义媒体

2017年春节的假期还没走远,广州的紧急任务就找上了门。

希望让写稿机器人进行全国两会的报道,这是首次尝试敏感的时政话题,北大方正电子有限公司新媒体产品事业部总经理霍为兵回忆,当时,广州领导带领团队亲自上门商讨合作。

这次的挑战是双重的:一方面时政话题容错率几乎为零,这对技术是一个很高的挑战;另一方面,从需求提出到两会召开,只有不到一个月的时间。

我们还是决定接受挑战。霍为兵回忆,北大计算所研究员万小军团队紧急应战,并和方正电子研发团队快速对接。当时已经不是海量算法的训练阶段,而是有针对性地对机器人进行训练,包括对历史数据的文案进行分析、形成适合时政的文风,确定了综述和简讯两类写作类型。霍为兵说,机器人跑两会在各方的共同努力和把关下,在两会期间快速写出了十几篇分析文章。这次实践引起了轰动。

霍为兵表示,越来越多研究成果转化为实际应用的成功案例,帮助方正电子打开了新媒体市场的大门。机器人不再局限于写稿,它出现了更多的应用场景,媒体也跟着被重新定义。此外用机器人进行创作线索的发现、实现的分发都在逐步投入应用。

成长为教学研用的全优生

发论文一度是我们不擅长的。作为研究所的带头人,郭宗明曾有过与其他研究所领导不同的苦恼别人苦于成果转化不出去,而他苦于好成果写不出对应的好论文。

1995年,为了方正电子在港股上市,北大计算机所划入方正集团,倾尽所有科研实力为企业服务,当时约定10年为期。

10年期满,我们觉得还是选择独立的研究之路。郭宗明回忆,不惟市场的研究能恢复研究天马行空的自由,找回自我,也能产出更多前瞻性的科研成果。

从服务别人的B角转变为自主科研的A角,从企业走出来的研究员们一时间还跳不出唯用至上的思路,并不热衷于写论文。但是学校会考核我们,标准变了。郭宗明说,为了推动科研人员在思想上转变,当时所里还出台了论文奖励办法,鼓励科研人员发表论文。

当全国都在讨论科技成果转化率低只发论文没有转化等科技经济两张皮的问题时,北大计算机所却正好相反。好的论文意味着你要有好的成果,好的研究内容,更要有好的写作能力。郭宗明说,进入企业的十多年,让我们和学校老师在学术论文的表达上有很大的差距。

失之东隅,收之桑榆。北大计算机所的人均专利是北京大学这所高等学府专利持有量的5倍之多。2017年,北大计算机所与方正电子签约合同额超过900万元,是前几年的数倍,郭宗明认为,经过几年的刻苦努力,北大计算机所从一个科研能力特别强的特长生,成长为教学、科研、产业应用等全面的全优生,并开始批量产出研究成果。

不只与方正集团,在科技成果转化方面,阿里、优酷、央视、国家部委等都是北大计算机所成果落地的合作伙伴。

我们对市场摸得太熟了。郭宗明此前也在方正集团担任过技术总监的职务,有了十年来锤炼的市场基因,加上探索研究的情怀,对于新时代的王选接班人来说,顶天立地间,有更广阔的施展空间。

随着新成果转化法的落地实施,我们在期待细则的进一步落地,相信未来将有更多的能够产生技术变革和产业颠覆的创新落地。郭宗明说。

推荐阅读
图文聚焦