基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数

基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC指数三个指数

  • 项目介绍

    1. 微指数是基于海量用户行为数据、博文数据,采用科学计算方法统计得出的反映不同事件领域发展状况的指数产品。
    2. 微指数对于收录的关键词,在指数方面提供微博数据层面的指数数据,包括综合指数、移动指数、PC指数三个指数。
  • 项目举例

    以'中兴'这一关键词为例,要求获取中兴的三个指数数据。微指数的数据收录时间有范围,范围表现在:

    1)整体趋势:2013-03-01-至今

    2)移动趋势:2014-01-06-至今

    3)PC趋势:2014-01-06-至今

    本例子设定start_date = '2016-05-29',end_date = '2018-05-29', 原始结果如下:

1.原始综合指数

2. 原始移动/pc指数

  • 实现流程

    复制代码
    '''主函数'''
      def index_main(self, word, start_date, end_date):
          # 打开数据页面
          print('step1, open page....')3
          driver = self.search_index(word)
          # 构造请求,获取指数json数据
          print('step2, get data....')
          data = self.get_data(driver, start_date, end_date)
          # 判断数据返回类型,若微博没有收录改词,则退出,显示退出信息
          if data['zt']:
              print('step3, save data ...')
              self.output_data(word, data)
              print('finished....')
          else:
              print('not be record...')
          #关闭浏览器对象
          driver.close()
  • 执行

    def demo():
    start_date = '2016-05-29'
    end_date = '2018-05-29'
    sina = SinaIndex()
    search_word = '中兴'
    sina.index_main(search_word, start_date, end_date)
    demo()

3.效果展示

将得到的数据文件,进行本地可视化,效果如下:

3.1 综合指数

3.2 移动指数

3.3 PC指数

3.4指数对比

5.总结

1、微指数的采集难度介于百度指数与阿里指数之间,两个特点:1)指数有js动态请求而成,可以通过构造请求,解析获得。2)无需用户登录。

2、微指数收录的日期比阿里指数要广,较百度指数要窄,但基于微博这一层面得到的数据,对于相关研究还是有一定新意的。

项目码源见文章顶部or文末

https://download.csdn.net/download/sinat_39620217/88000970

相关推荐
hef2887 小时前
如何生成特定SQL的AWR报告_@awrsqrpt.sql深度剖析单条语句性能
jvm·数据库·python
m0_488913018 小时前
万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!
人工智能·学习·机器学习·大模型·产品经理·llama·uml
xcjbqd08 小时前
Python API怎么加Token认证_JWT生成与验证拦截器实现
jvm·数据库·python
二月十六8 小时前
SQL Server 2022 新语法:IS [NOT] DISTINCT FROM 彻底解决 NULL 比较难题
数据库·sqlserver
~ rainbow~8 小时前
前端转型全栈(四)——常见的错误及解决方案
数据库·oracle·全栈
数厘8 小时前
2.1SQL 学习:先懂数据库概念再学 SQL
数据库·sql·学习
Cat_Rocky9 小时前
redis哨兵模式
数据库·redis
哥布林学者9 小时前
深度学习进阶(八)Swin Transformer
机器学习·ai
YoseZang9 小时前
【机器学习】【手工】Streaming Machine Learning 流数据学习 – 应对变化的机器学习方法(一)
人工智能·学习·机器学习
广师大-Wzx9 小时前
一篇文章看懂MySQL数据库(下)
java·开发语言·数据结构·数据库·windows·python·mysql