3.实现流程
def index_main(self, word): print('step1, open page....') #利用selenium,打开页面,获取指数数据所在页面 page_source = self.search_index(word) print('step2, get data....') #解析原网页,获取purchase_index_1688, supply_index, purchase_index_tb purchase_index_1688, supply_index, purchase_index_tb = self.data_parser(page_source) #以本地文件的办法保存结果,分别写入到purchase_index_1688, supply_index, purchase_index_tb三个文件中 self.output_data(word, purchase_index_1688, supply_index, purchase_index_tb) print('step3, %s finished....'% word)
4.实行
def demo(): ali = AliIndex() search_word = '连衣裙' ali.index_main(search_word) demo()
5.效果展示
将得到的数据文件,进行本地可视化,效果如下:
7.总结
1、阿里指数的采集较为大略,1)阿里指数直接将历时数据写在前端页面中,可以直接解析得到。2)无需用户登录。2、阿里指数与百度指数不同,其对应的关键词实体须要对应到详细的行业或商品上,而用户查询的关键词具有多样性,这样会导致可能无法精确获取严格的关键词商品指数,如搜索iphone,会得到电子产品的指数。3、比较遗憾的是,阿里指数只供应以查询当日为结束如日,往前推一年为开始日期的数据,对付历时数据的构建来说,不是太方便。
[项目链接跳转] (https://blog.csdn.net/sinat_39620217/article/details/131975141)

更多优质内容请关注公号:汀丶人工智能;会供应一些干系的资源和优质文章,免费获取阅读。