当前位置:主页 > 生活 >  正文

一个AI博士8年生活实录:没有苦哈哈 倒是乐呵呵

来源: 网络整理  发布时间:2019-04-15 22:10

王赟在网上发布的留学生涯的帖子写得非常有趣,有些意外这是一个理科工学生的手笔。与他交谈也非常愉快和放松。

1

他的眼中只有语音

王赟高中就读于山东龙口一中,昔日的校友在网上直呼高中时代他就是一个学霸。

“像数学物理化学这方面从中学时代就已经有比较浓厚的兴趣了,高中参加过信息学竞赛,编程算法这些学得比较早。”在他看来,当时这些还算挺新的东西。也就是在高中的时期,他对语音方面就萌发了兴趣,他记得,读高一时了解到日本出的一款用电脑合成唱歌的软件,“就觉得这个东西挺好玩,然后就想将来我也可以做一款类似的东西,然后从那个时候开始有了兴趣。”在这背后还有他喜爱唱歌这一推动因,“我比较喜欢唱歌,学了好多首歌,这个东西正好可以合成歌曲。”为此,后来上了大学,他“自主研发”了一套系统。

在清华,他完成了这个深藏已久的心愿。2006年,王赟考入清华大学电子工程系,大一的时候,他就着手完成这个小心愿,“写了一个简陋的合成系统出来,(系统)还凑合,很明显是合成音,不过能听出是唱歌声。(笑)”牛刀小试后,他感到一些成就感,当时想如果以后有这种机会的话,希望往这个方向发展。

语音合成只是他纵身跃入兴趣领域的入口,是语音识别还是语音合成都无所谓,“只要跟语音信号有关系的东西,我都比较有兴趣。”电子工程系中的一门课信号处理,王赟学得比较扎实,“因为语音本身就是一个信号,所以这个可以算是看家本领。”他说,语音本身就是一个信号,它是一个波形样态,你怎么对它处理来提取里面有用的信息,经过电子系的训练之后,这方面的功力会比较扎实一些。

在本科阶段,王赟眼中关注的都是语音,也发表了第一篇署名为第一作者的论文。那时候人工智能还不是如现在这般火,他也阴差阳错成了人工智能领域最早的一批先行者。

2

8年博士生涯

本科毕业以后,王赟在发展语音兴趣路上越走越远,走出了国门去留学。他申请到两所大学的研究生。一般而言,攻读硕士学位比较难拿到奖学金,而其中一所大学的项目很特殊,给了奖学金,于是他选择了这所大学。

一个AI博士8年生活实录:没有苦哈哈 倒是乐呵呵

王赟(右)和朋友一起演出。

王赟前2年读硕士,做的事跟博士几乎没有两样,一半时间上课一半时间做研究。从硕士到博士的中间需要再申请一次,但是因为他已经在那,教授们都见过,评价的依据就比较丰富,“就这样自然而然申请上博士。”

从入学到2012 年春天,王赟跟随老师研究说话人识别(分为说话人辨认和说话人确认)。他说,做说话人识别,一般不管说的是什么内容,哪怕你听不懂,也能听出来是谁在说话。在这将近两年的时间里,王赟用Matlab 语言亲自实现了十几种语音特征的提取。

“那时候博士申请结果已经出来了,所以说不会有特别紧张,但从技术上来看是个遗憾,因为没有在市场上火起来。”后来,王赟转到一位高高胖胖的德国教授名下攻读博士,名字发音和英语的花朵有些相似,于是在中文的语境中,王赟称导师为“花哥”。

3

博士三年仍未发论文

投身花哥门下,王赟做的第一个项目是Babel,其任务是在多种小语种语音里检索关键词,这个项目是由全世界许多大学和公司共同参与,大学或公司合作组队伍,而队伍之间互相PK,最后优胜劣汰,留下好的项目。

这是一个规模很大的系统,前期要完成一个从无到有的过程,有了这个基础之后,才能做研究。王赟形容前期搭建系统“与其说是像科研,不如说是像工作”。2014年,王赟才从工程性工作中脱身出来,开始做有价值的科研工作,比如如何更准确地给检索到的每个关键词的可靠性打分。然而好景不长。2014年6月,正当王赟在韩国游玩的时候,实验室的同学发来噩耗:王赟所在的队伍被淘汰。这犹如晴天霹雳。那个时候他在想下面做什么好。

一个AI博士8年生活实录:没有苦哈哈 倒是乐呵呵

王赟(左2)和朋友一起游玩。

“我一下子不知道将来的路就是怎么走。”而此时是王赟留学的第四年,到此时为止,他只发出了一篇署名为第一作者的论文,另外一篇论文屡投屡不中,最后只能将其尘封。他当时就知道这个博士可能会是一场马拉松,经过前面一两年的热身很正常,但到了第三年还没科研产出,这对于博士来说,是一件很惊悚的事情。“知乎上有一个这样的问题:博士第三年还没有发论文是一种怎样的体验?我想我是最适合回答的,但终究没有勇气回答。”那时起,他做好了读博六年七年八年的准备。

未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任,如有问题请联系我们删除。