多工具配合—工作效率倍增

2015-07-17
  • 839
  • 0
        最近工作中遇到一个问题,网上已经有一个比较完善的关键词库,直接使用的话可以节省我们很长时间的关键词挖掘分类工作。
        看到这一套现成的词库网页,唯一的决定就是必须拿来直接用啊,火车头采集动起来,不过纠结的事情马上就发生了,对方的防采集做的很完善,我们没办法直接采集到,采集的页面中有百分之七八十是没有任何内容的。怎么办?
        这个时候,就体现出多工具配合的精明之处了。既然采集来的数据成功率那么低,那我们就用SQL将采集来的数据进行筛选,将错误的页面反复进行筛选采集。这样很快我们就采集到了全部的关键词。
        不过事实再次证明,凡事都要付出代价。关键词跟对应的长尾词无法按照预想的在excel中每个关键词与相应的长尾词们在同一行整齐排列,怎么办?使用EditPlus打开文件,使用快捷键:Alt+Shift+L将文件中自带的换行符显示出来,观察之后发现看似杂乱无章的数据中,其实每一组关键词组合之间是有规律的,就是换行符出现的位置与前后的符号是不一样的,使用正则表达式,就可以将这些换行符进行正确的匹配替换,让每一组关键词都可以整齐排列。这份最终得出的数据,就可以直接复制到excel中进行整理了。
        就这样,软件相互配合使用,工作效率可以提升N多倍。如果你也面临这种流程化的工作,请注意挖掘是否有一些工作可以帮你分解工作量。