第234章 板上钉钉的收购(上)
尽管睡得比较晚,不过林灰起得还是蛮早的,早晨七点多林灰就起床了。 吃过早饭之后,林灰就去找了伊芙·卡莉。 之所以要去找伊芙·卡莉,自然是因为学术上论文撰写工作。 其实仅仅是由伊芙·卡莉自己也足可以胜任一篇以综述为主要内容的论文的撰写工作。 但这毕竟是林灰重生之后搞得第一篇论文。 这论文某种程度上意味着林灰重生之后在学术方面迈出的第一步。 在这种情况下,林灰希望能够尽可能地尽善尽美。 很快林灰就在状元学府见到了临时在这里落脚的伊芙·卡莉。 说也奇怪,同伊芙·卡莉的会面也是私下进行接触。 但和伊芙·卡莉进行会面的话,林灰就不会出现昨晚同黄静会面时所出现的那种促狭感。 仔细思考了一下,林灰觉得之所以会有这样的区别并不是因为颜值之类的外在因素。 当然了,颜值方面肯定是有一定的影响的,毕竟很多时候无论男女,都是视觉动物。 不过即便是有一定的影响,其影响也没那么大。 林灰觉得之所以同伊芙·卡莉的接触不会出现促狭感 究其根本还是因为伊芙·卡莉的纯粹。 至于伊芙·卡莉是不是真的纯粹林灰也不得而知。 但这不重要,至少给林灰的感觉是伊芙·卡莉很纯粹。 相比于其他人经常会在意到俗世的一些东西。 伊芙·卡莉大多数情况下都是醉心于学术而不是耽于学术之外世俗方面的东西。 尽管这种气质在海外的高校中很容易被冠以_nerd之类的标签。 不过林灰喜欢这种气质,林灰喜欢和纯粹的人打交道。 或许纯粹的人有时候会淡漠一些社交上繁琐的礼节。 但和纯粹的人打交道至少不需要时刻提心吊胆去慎防算计。 总之,林灰很喜欢和伊芙·卡莉这种纯粹且和他有共同语言的人打交道。 而且正所谓他山之石,可以攻玉。 虽然伊芙·卡莉在文本摘要方面所掌握的理论的并没有林灰那般得天独厚的优势。 但伊芙·卡莉很多时候看问题的另一视角也会给林灰以很多的启发。 总之,林灰蛮喜欢同伊芙·卡莉进行学术方面的交流的。 和伊芙·卡莉进行学术方面的交流时常会让林灰有些意料之外的收获。 其实伊芙·卡莉对林灰也是差不多的感觉。 伊芙·卡莉也比较喜欢同林灰进行学术方面的接触。 而且接触的越多伊芙·卡莉越能发现林灰思想的广博性。 甚至于,伊芙·卡莉现在越发觉得林灰的思想就像璀璨的星河一般。 越是涉足其中,伊芙·卡莉越能领略到林灰思想的深邃。 前不久伊芙·卡莉将其拟定的论文整理好了发给林灰。 结果却被林灰改了一通之后又发了回来。 原本看到自己信心满满的作品被改了很多之后伊芙·卡莉是不开心的。 毕竟当初只是涉及到文本摘要方面的一篇综述性质的文章而已。 除了一些超级大犇心血来潮想到写综述当作一时的消遣之外。 多数的综述文章就像是小说中的小白文,基本没啥技术含量。 写综述的任务通常都是课题组里最菜的一个的任务。 毕竟这工作没啥技术含量,只是涉及到资料的收集和整合。 偶尔有技术水平还算可以的人写综述性质的文章多数情况下也只是为了一些期刊的约稿而应付了事。 综述而已,能有什么技术含量? 反正最开始伊芙·卡莉是没太把这个任务当回事的。 尽管涉及到生成式文本摘要方面的东西伊芙·卡莉也接触的时间不长。 但正所谓熟读唐诗三百首,不会写诗也会吟。 伊芙·卡莉自诩经过相当长时间对生成式文本摘要的跟踪。 如果这个世界上林灰是对生成式文本摘要理解的最透彻的人。 那伊芙·卡莉觉得她怎么说也应该算是对该技术理解的第二透彻的人。 毕竟在生成式文本摘要这项技术甫一问世,伊芙·卡莉及其先前所在的团队就对这一技术进行了跟进。 而后伊芙·卡莉更是来到华国受到林灰的当面指点。 在这种情况下,伊芙·卡莉对其第二的位置还是很有自信的。 纵然和林灰的差距依然是不小的。 但伊芙·卡莉觉得就算不能理解生成式文本摘要的全部实现方式。 但对生成式文本摘要部分概略性内容应该还是能管窥一二的。 在管窥一二的情况下写篇综述应该是不成问题的。 在撰写完文本摘要这方面的综述之后,伊芙·卡莉将该论文传给林灰之后却被修改了一通之后。 此时伊芙·卡莉的心情可想而知。 不过当看到林灰在其写的论文就生成式文本摘要这方面所做的补充之后。 伊芙·卡莉先前的自得却不见了,此前内心深处还有点小抱怨的情绪更是消失得无影无踪。 看到林灰所修改的内容,伊芙·卡莉才愈发明白她同林灰之间所隔着的距离远比其曾经设想的距离还要大。 甚至一时间伊芙·卡莉有点绝望,原本以为在林灰身边几個月之后她同林灰的距离会逐渐缩短。 但看到林灰补充之后的论文后,伊芙·卡莉却一时之间有种错觉。 即她跟林灰之间的差距甚至有三四年之多。 虽然只是三四年,但在算法方面迭代迅速的情况下,三四年的差距是相当大的。 三四年的差距在某些算法岗位。 差不多就是“前辈盆满钵满后浪没有饭碗”那种区别。 可以说是相当冰冷残酷了。 说实话伊芙·卡莉内心深处是一个极其骄傲的人。 但自从林灰搞得东西问世之后,她内心的那份骄傲破碎了。 在跟林灰日渐的接触中,她残存的骄傲更是荡然无存。 不过这不代表她将要甘于落寞,因为在同林灰接触的过程中。 伊芙·卡莉似乎接触到了另外的一些概念。 林灰搞出的东西是有很多值得骄傲的资本的,但同林灰接触的过程中伊芙·卡莉却极少感受到来自于林灰的那份骄傲。 恰恰相反,在林灰那伊芙·卡莉收获到的通常都是一种类似于平和的感觉…… 这种平和的感觉让伊芙·卡莉在异国他乡也能察觉到一丝温暖。 伊芙·卡莉似乎也更加明白了。 内心深处的宁静和平和似乎远远要比骄傲更重要。 具体到林灰当时对伊芙·卡莉撰写的那篇论文的改动。 客观来说,其实当时那篇论文涉及到生成式文本摘要这方面林灰的改动并不算很多。 林灰只是补充了一些内容。 但林灰补充的内容却几乎都是精髓之所在。 通过林灰的补充内容伊芙·卡莉更进一步了解了林灰是如何搞定南风APP里面文本摘要技术的。 林灰在就构建生成式文本摘要算法采取了很多巧妙的方法。 无论是基于深度学习技术设计合适的模型架构和训练策略。 还是借助迁移学习的思想提出了基于预训练模型的生成式自动文本摘要算法。 抑或是通过无监督来完成内容表示以及权重计算。 这些都是伊芙·卡莉此前所没想到,或者说从来没深刻认识的。 一个相关领域的博士居然还有此前没认识到位的东西? 听起来似乎有些不可思议,但事实如此。 正所谓闻道有先后,术业有专攻。 一时的落后于人也没什么不可承认的。 而且伊芙·卡莉敢肯定她这种情况绝对不会是孤例。 伊芙·卡莉觉得林灰所补充的内容未必只是她本人没想到。 很多其余的研究者或许也是没想到的。 甚至于林灰提出的一些新的见解相对于传统的抽取式文本摘要来说都可以说是全新的思路。 反正伊芙·卡莉是觉得这些思路很奇妙,甚至有可以让人有一种醍醐灌顶之功效。 之所以会有这样的功效,很大程度上是因为在此之前多数文本摘要的研究人员都是研究抽取式文本摘要的。 抽取式文本摘要和生成式文本摘要虽然都是文本摘要。 但从前者到后者的转变涉及到一个思路上转换的过程。 很多时候多数传统文本摘要方面的研究人员亦即研究抽取式文本摘要的研究人员受先入为主的影响对生成式文本摘要认识不到位也是常有的事情。 举个例子,就比如说林灰在搞定生成式文本摘要时所提出的预训练。 按说,这个东西并不算什么高深的概念。 所谓的预训练倒是不难理解,无非就是对训练模型的数据进行粗处理而已。 但这玩意就比较难想到,以前伊芙·卡莉在进行抽取式文本摘要这方面的调校时候就几乎没用到预训练。 多数情况下都是直接进行训练的,很少应用到预训练这一步骤。 至于为什么省却了预训练这一步骤。 是因为textrank算法在应用过程中就很少会进行数据训练。 按照林灰在论文中进行的补充。 预训练的通常做法一般是将大量低成本收集的训练数据放在一起。 而后以某一种或者某一类特定预训方法去学习这些训练数据其中的共性。 然后将其中的共性移植到特定任务的模型中。 再使用相关特定领域的少量标注数据进行更细致的调校。 完成这一过程之后,今后用于实际应用的模型模型只需要从共性出发。 再去学习特定任务的特殊部分即可。 大概类似于对于部分方程先求通解再去找特解的过程。 听起来似乎蛮抽象的。 实际上也没多么高深。 涉及到机器学习这方面,无论多么高深的东西。 其本质上基本都是在模仿人。 因此只要了解人处理问题的方式,就能理解机器学习处理问题的方式。猪熊的穿越:2014