首页
首页 >> 科技咖 >> 正文

分析了 7 万款 App,全是没想到

日期:2019-01-11 11:50:15 来源:互联网 编辑:小狐 阅读人数:149

对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加:tstoutiao,邀请你进入数据爱好者交流群,数据爱好者们都在这儿。

相关历史文章推荐:

绝对值得安装的 24 款 App

有了它,你手机上的很多 App 都可以卸了

摘要:使用 Scrapy 爬取豌豆荚全网 70,000+ App,并进行探索性分析。

写在前面:若对数据抓取部分不感兴趣,可以直接下拉到数据分析部分。

1 分析背景

之前我们使用了 Scrapy 爬取并分析了酷安网 6000+ App,为什么这篇文章又在讲抓 App 呢?

因为我喜欢折腾 App,哈哈。当然,主要是因为下面这几点:

第一、之前抓取的网页很简单

在抓取酷安网时,我们使用 for 循环,遍历了几百页就完成了所有内容的抓取,非常简单,但现实往往不会这么 easy,有时我们要抓的内容会比较庞大,比如抓取整个网站的数据,为了增强爬虫技能,所以本文选择了豌豆荚这个网站。

目标是: ,数量在 左右,比酷安升了一个数量级。

第二、再次练习使用强大的 Scrapy 框架

第三、对比一下酷安和豌豆荚两个网站

话不多说,下面开始抓取流程。

▌分析目标

首先,我们来了解一下要抓取的目标网页是什么样的。

可以看到该网站上的 App 分成了很多类,包括:应用播放、工具等,一共有 14 个大类别,每个大类下又细分了多个小类,例如,影音播放下包括:直播等。

分析了 7 万款 App,全是没想到(图1)

本文相关词条概念解析:

豌豆荚

豌豆荚婴童毛巾,追求于研发织造出更适合婴童群体的毛巾制品。为孩子为国家和民族打造有世界地位的高端婴童毛巾品牌。

相关新闻:

10月VR大数据:Vive Pro占比2.27%创新高,Steam VR应用超5.3万款

hi188| 撰文

Hello大家好,每月期的VR内容/硬件大数据统计又和大家见面了。

想了解VR软硬件行情么?关注这里就对了。

网友评论
  • 吃饭用大碗
    庄家依靠盘口水位的变化来均衡受注额,而玩家则依靠这些来判断比赛的胜负走势
    2019-01-14 04:25 19
  • 花咕朶儿
    App数据分析到底要分析什么?
    2019-01-20 01:28 27
  • xiuyusu
    也需要针对高质量用户进行重点运营,低质量用户通过产品和运营改进手段,使其往高质量用户迁移
    2019-01-16 18:32 27
  • 不知转入此
    有哪些学习竞彩分析的APP?
    2019-01-18 22:08 22
  • 遇见你是灾
    ⽤户规模,⽇活/周活/⽉活⽤户数⽤户类型
    2019-01-16 14:31 18
  • 大王叫我起
    常⻅的问题包括,通过海量⽤户⾏为数据的沉淀,利⽤⼤数据技术,可绘制⽤户的兴趣画像
    2019-01-14 20:26 13
  • 记几说自己
    猫眼为什么要做票房分析app?
    2019-01-15 22:35 34
  • 徒手掰雪亮
    在APP的整个⽣命周期中,需要对产品的留存数据持续的观察和分析
    2019-01-16 12:18 7
  • 东江河下
    移动医疗APP如何做竞品分析?
    2019-01-19 14:32 15
  • 一了了之了
    Retention用户留存与活跃,Revenue用户产生收入,到发起传播Refer
    2019-01-19 15:35 22
  • 单身从不吭
    功能使⽤频次、使⽤时⻓问题诊断APP问题诊断的前提是对业务有⾜够的深度和⼴度的理解,结合产品逻辑和商业价值,能从各个维度进⾏分析
    2019-01-13 04:43 8
  • 灌溉枯萎的
    用其它自带流量的公众号或者小程序的形式是否也可以满足企业诉求,如果满足不了,那好,我们再回到APP上
    2019-01-19 09:27 3