首頁 » 因此我们更愿意保留昵称

因此我们更愿意保留昵称

但是,Google 不会在搜索中将这两个术语映射在一起,,而不仅仅是重定向到“Bab Ruth”。如果我们想确定何时应该保留两个标签或何时应该重定向到彼此,我们需要更深入地研究。作为独立的方法,这种方法也不足以识别用户拼写错误标签或使用不正确语法的情况,因为如果没有“联合”,他们的产品基本上就会被孤立。

贾罗-温克勒距离 方法:

我们在整个过程中使用了多种修改距离和字符串 whatsapp 数据 性指标。编辑距离只是衡量将一个单词更改为另一个单词的难度的指标。例如,“Russ Jones”和“Russell Jones”之间最基本的编辑距离度量(Levenshtein 距离)为 3(要将 Russ 更改为 Russell,您需要添加“E”、“L”和“L”)。

这可以帮助我们找到相似

的单词和短语。在我们的例子中,我们使用了一种特 行动: 通过邮件激发具体的购买兴趣 殊的修改距离度量,称为“Jarrow-Winkler 距离”,它对起始相似的单词和短语给予更高的优先级。例如,“棒球”比“篮球”更接近“棒球”,因为差异出现在术语的最后。

优点:修改距离矩阵帮助我

们找到许多相似类型的标签,特别是当变量不一定拼写错误时。当与 Jaccard 索引度量一起使用时,这一点尤其有价值,因为我们可以在与字符无关的度量之上应用字符级度量(即关心标签中字符的度量和不关心标签中字符的度量)。

限制:修改距离矩阵可能

很愚蠢。根据 Jaro-Winkler 距离,“棒球”和“篮球”之 人工智慧文本  间的关系比“棒球”和“投手”或“捕手”之间的关系更密切。 “Round”和“circle”有一个可怕的修改距离度量,而“round”和“pound”看起来非常相似。

距离编辑不能仅仅为了查

找相似标签而单独使用。 关键词规划师分组 方法:虽然谷歌选择在关键字规划器中组合相似的关键字对于流量预测来说存在问题,但它实际上为我们提供了一种识别高度相关术语的新方法。每当两个标签共享 Google Keyword Planner 中的相同指标(平均每月流量、历史流量、每次点击费用和竞争)时,我们就可以得出结论,这两个标签更有可能相关。

优点:此方法对于缩写

(特别难以检测)非常有用。虽然谷歌将首席运营官和首席运营官放在了一起,但你可以想象,使用上述标准方法可能很难追踪这种关系。 局限性:这种方法的主要缺点是它会产生许多不太流行的误报。有大量关键词的年平均搜索量为 10,每月搜索次数为 10 次,CPC 和竞争度均为 0。

返回頂端