第237章 超级人脉网的价值
《文本判断甄别比较的一种新方法》这个专利是伊芙·卡莉在18岁的时候申请的第一个专利。 这个专利在正式转让给林灰之前一直被伊芙·卡莉持有长达六七年。 不过饶是持有此算法专利数年时间,在此之前伊芙·卡莉也一直没有发现该专利的潜在价值。 在她眼中这個专利除了纪念价值(毕竟是第一个专利)之外几乎毫无价值。 这样一个在伊芙·卡莉眼中几乎没什么价值的专利反倒在LINHUI手上拥有了极大焕发出新生机的可能。 曾经伊芙·卡莉以为自己能够十分平静地接受这一切。 但等到真的得出相应的判断的时候,伊芙·卡莉还是心情还是不由自主地泛起一些涟漪。 毕竟因为《文本判断甄别比较的一种新方法》这个专利的核心内容主要是负责自动文本摘要里面内容表示这样初阶任务。 该专利可是一度被伊芙·卡莉视为低级专利的。 而林灰却向她证明没有低级的专利,只有有低级的眼光。 这简直啪啪啪啪地打脸,换谁都会心里也很难完全无动于衷。 当然了伊芙·卡莉也只是内心深处泛起了一些涟漪以及有些感慨而已,还不至于太在意这事。 再说了所谓地林灰向他证明没有低级的专利只有低级的眼光。 也只是林灰无意中向人证明的,而不是林灰刻意为之。 反正自从接触林灰之后,伊芙·卡莉是觉得林灰这样性格的人 是很少会单纯地为了打脸别人或者是逞一时之快而去专门做一些事情。 林灰做事情总是按照他自己独有的节奏,一步一个脚印。 看似慢吞吞的小动作,只有经过仔细地留神才会发现一切都是极其精密地安排,颇有分进合击层层包围的架势。 作为对手会知道林灰这一切的恐怖,每迈出一步的时候却发现对手给你设置了好几重障碍了,这种感觉怎么能不恐怖呢?爱阅小说app阅读完整内容 伊芙·卡莉有点庆幸没有接着做林灰的敌人,而是成为林灰同一阵营的。 当然了,林灰似乎也从没有什么单纯地与人为敌的想法。 林灰总是在认真地做自己,但林灰所不知道的是,在他努力成为更优秀的人的过程中却不知不觉中悄然改变了世界。 自从抵达中國并且得以和林灰正式见面之后。 最近伊芙·卡莉的电子邮件中几乎充斥着美國学术界同仁向其发来的邮件。 这些人询问最多的问题不是她在接触了LINHUI之后有没有搞到生成式文本摘要算法的奥秘。 这些人最好奇的问题是林灰究竟是一个什么样的人。 林灰是一个什么样的人呢? 对此伊芙·卡莉也很难用具体的语言来形容。 未接触林灰之前,林灰给伊芙·卡莉最深刻的印象是林灰的天才。 初次接触林灰的时候给伊芙·卡莉留下最深刻印象的又是林灰的举止儒雅、待人宽厚。 但接触的时间久了之后,给伊芙·卡莉留下更深刻的印象反而是林灰渊博的学识和灵动的思维。 具体伊芙·卡莉也不知道该怎么回答这一问题。 对于这类的问题伊芙·卡莉干脆统一回复为: ——LINHUI是个令人着迷的人。 事实如此,林灰极其理性的逻辑、沉静的气质、对待事物专注的态度这些都让伊芙·卡莉着迷。 甚至于伊芙·卡莉心底深处似乎还生出了几分沉寂已久的别样情愫。 尽管对一个比自己小几岁的异性生出这种情愫很羞人。 但能怎么办呢?一个能够举手投足间悄无声息影响世界又怎么能不让人着迷呢? 或许林灰自己还没意识到他在改变世界。 但伊芙·卡莉对此却是再清楚不过了。 首先,林灰在文本摘要方面的贡献太大了。 而文本摘要本就是可以影响世界的。 这并不是夸张的说法。 涉及到文本摘要方面的研究其实有很长的历史了。 东方对于文本摘要的研究是什么状况此前伊芙·卡莉不是很清楚。 但来到中國之后,伊芙·卡莉通过一些麻省理工学院同中國友好合作的机构才了解到。 广泛意义上的文本摘要这方面中國虽然似乎没啥项目。 但涉及到纯粹的中文文本处理这个古老的东方国度不但有专门的项目。 甚至于有的还被863计划这样的国家级计划所涵盖。 863计划,顾名思义自然是在86年3月开始执行的。 当时第一次听说不少涉及到文本摘要的项目甚至于早在上世纪末期就开始了。 伊芙·卡莉是震撼的。 甚至细思之下,伊芙·卡莉觉得比较恐怖。 都已经是2014年了,居然还有一个近乎于三十年前开始的计划在按部就班地向前推进。 做计划不难,难的是计划的执行力度。 就这份计划的执行力度,总之这在频繁两挡交替的美國几乎是难以想象的事情。 不过仅仅是文本摘要这方面,伊芙·卡莉还不至于太悲观。 毕竟西方在文本摘要这方面一样是倾注了大量心血。 甚至于要远比华国在这方面开始的研究还早。 伊芙·卡莉记得此前还在学生时代的时候就听闻西方关于文本摘要这方面的研究在冷/战初期就已经开始了。 最早进行这方面工作的是诸如斯坦福大学、麻省理工学院之类的这些学校。 不过当时这些学校背后的雇主是美國的大五楼角。 听起来很奇怪,但并不奇怪。 事实如此,现在人类互联网以及计算机方面各种各样的技术最初都和军方有着千丝万缕的联系。 甚至于不少技术几乎就是纯粹的军转民。 涉及到文本摘要这个方向。 之所以当初当时进行文本摘要这方面的研究是旨在通过在文本摘要上实现技术突破从而能够更加高效地通过一些诸如新闻、报道各种公开的资料进行信息处理,同时进行文本摘要方面的研究也是为了能更好的实现对敌对势力的舆情分析。 至于是什么敌对势力,自然是昔年无比强大的北极熊。 说起来这也是早期文本摘要编码的一个奇葩特征。 对中文这门使用人数相当多的语言基本没啥处理能力。 对俄文处理却几乎拥有和英文同等水平的高效性。 不管最初的目的是什么。 总之,在相当长的一段时间里涉及到文本摘要这方面的研究都相当受重视。 甚至在相当长的一段历史时期该领域的部分研究经费甚至直接是来自M國军费中的拨款。 后来随着间谍卫星等更高效获取情报的手段相继问世,M军方对这方面的研究的热情才逐渐被淡漠。 尽管如此,商业上对文本摘要的热情却几乎自始至终毫无动摇。 文本作为信息的重要载体,再怎么重视也不为过。 新世纪互联网的告诉发展,大量信息的涌现。 人们更是不得不重视。 对信息的研究越深入,我们就越能了解到这个世界。 文本摘要的深度探索,让我们对信息的掌控更强。 就林灰在文本摘要上所作的贡献而言。 说林灰改变了世界也不为过。 涉及到具体领域,林灰所作的贡献在自然语言处理所做的贡献实在是同样很大。 相对于传统的抽取式文本摘要,生成式文本摘要的意义空前。 之所以说生成式文本摘要的意义空前,并不仅仅是因为这项技术在处理文本摘要上效率上更高。 一个转动的更快的轮子相比于一个同样能转但转的较慢的轮子相比有价值,但其实价值也不大。 如果仅仅看到生成式文本摘要在文本摘要效率方面的进步只能说是图样图森破。 事实上伊芙·卡莉觉得生成式文本摘要最不起眼的内容就是其在效率方面的提升。 甚至可以说效率只是生成式文本摘要这项算法的外在表现而不是这一算法的真正内核。 通常意义上所说的自然语言处理(NLP)主要内容无非就是两部分。 一部分是NLU,另一部分是NLG。 前者指的是自然语言理解,后者指的是自然语言生成。 林灰搞定的生成式文本摘要算法在自然语言理解和自然语言生成此二者上都有极为突出的意义。 涉及到生成式文本摘要这项全新的文本摘要算法。 其相比于传统的抽取式摘要只能借助于原有的文本内容抽取而言,能直接“无中生有”的进行摘要生成。 这样的一种算法在自然语言理解方面自然是做到了前所未有的高度。 而且这也启发着在自然语言生成方面有可能实现新的突破。 自然语言生成更是一项极为有价值的方向。 涉及到自然语言生成,更长远的未来可不仅仅是依靠文本生成文本。 理论上讲,当神经网络学习进展到一定地步的时候。 当输入内容不是文本的时候,也可以据此进行自然语言生成。 诚然如此的话,那么今后自然语言处理这方面会获得真正意义上的腾飞。 届时自然语言处理也会彻底摆脱现在一向圈地自萌的局面。猪熊的穿越:2014