第154章步步紧逼的追赶者(上)_穿越：2014(猪熊)全文无弹窗在线阅读-福利书屋

　　第154章步步紧逼的追赶者(上) (第8/8页)

然不容易。

    但谷/歌的老本行PageRank算法引入到NLP领域后实现的功能本就跟这个差不多。

    这样看来，和谷/歌方面的团队有过深度合作关系的伊芙团队忽视基于本体的方法而直接选择基于网络知识的方法也是可以理解的。

    说起来基于网络知识方法计算相似度实现起来并不容易。

    毕竟网页中知识颗粒度较粗。

    说白了就是网页中有用的东西少。

    加之部分网页的知识结构化程度较低。

    如果直接对所有的网页链接进行分析，会导致知识含量稀疏、计算困难等问题。

    因此必须找网页结构高同时知识内容集中的网页才适合开发基于网络知识评估文本相似度的方法。

    什么样的网页具有这一特征呢？

    Wiki百科和摆渡百科。

    只有这两个对应的网页同时具备网页结构程度化高以及网页中有用的东西多这两点。

    也正因为如此，林灰记得前世搞/基于网络知识的文本相似度识别的主要就是谷/歌和摆渡两家。

    说起来某度能长期居于B/AT之首还是有些实力的。

    至少不像外人以为的那般花架子。

    伊芙·卡莉之后又详细地介绍了一些基于网页知识文本识别度的内容。

    之所以详细介绍这方面的东西。

    林灰知道的，伊芙·卡莉其实还是好奇林灰究竟是使用何种相似度模型来评估文本摘要和摘要之间的语义相关的？

    林灰没有直接回答。

    而是反问道：“关于使用向量介入进行语义文本相似度计算你怎么看？”猪熊的穿越：2014