首页
首页 >> 科技咖 >> 正文

分析了 7 万款 App,全是没想到

日期:2019-01-11 11:50:15 来源:互联网 编辑:小狐 阅读人数:152

对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加:tstoutiao,邀请你进入数据爱好者交流群,数据爱好者们都在这儿。

相关历史文章推荐:

绝对值得安装的 24 款 App

有了它,你手机上的很多 App 都可以卸了

摘要:使用 Scrapy 爬取豌豆荚全网 70,000+ App,并进行探索性分析。

写在前面:若对数据抓取部分不感兴趣,可以直接下拉到数据分析部分。

1 分析背景

之前我们使用了 Scrapy 爬取并分析了酷安网 6000+ App,为什么这篇文章又在讲抓 App 呢?

因为我喜欢折腾 App,哈哈。当然,主要是因为下面这几点:

第一、之前抓取的网页很简单

在抓取酷安网时,我们使用 for 循环,遍历了几百页就完成了所有内容的抓取,非常简单,但现实往往不会这么 easy,有时我们要抓的内容会比较庞大,比如抓取整个网站的数据,为了增强爬虫技能,所以本文选择了豌豆荚这个网站。

目标是: ,数量在 左右,比酷安升了一个数量级。

第二、再次练习使用强大的 Scrapy 框架

第三、对比一下酷安和豌豆荚两个网站

话不多说,下面开始抓取流程。

▌分析目标

首先,我们来了解一下要抓取的目标网页是什么样的。

可以看到该网站上的 App 分成了很多类,包括:应用播放、工具等,一共有 14 个大类别,每个大类下又细分了多个小类,例如,影音播放下包括:直播等。

分析了 7 万款 App,全是没想到(图1)

本文相关词条概念解析:

豌豆荚

豌豆荚婴童毛巾,追求于研发织造出更适合婴童群体的毛巾制品。为孩子为国家和民族打造有世界地位的高端婴童毛巾品牌。

网友评论
  • 活该我倒霉
    有哪些学习竞彩分析的APP?
    2019-03-14 05:52 7
  • 阿瑟发嘚瑟
    移动医疗APP如何做竞品分析?
    2019-03-13 18:17 42
  • 大屁股怪兽
    ⽤户增⻓率,留存率,流失率⽤户产品粘度
    2019-03-15 17:02 47
  • 幸福倒映
    App数据分析到底要分析什么?
    2019-03-23 09:07 27
  • 忽忽的爆木
    用其它自带流量的公众号或者小程序的形式是否也可以满足企业诉求,如果满足不了,那好,我们再回到APP上
    2019-03-16 14:22 1
  • 天龙王子
    猫眼为什么要做票房分析app?
    2019-03-18 13:57 26
  • 落雪听梅1
    常⻅的问题包括,通过海量⽤户⾏为数据的沉淀,利⽤⼤数据技术,可绘制⽤户的兴趣画像
    2019-03-22 04:25 31
  • 啊哦又来了
    功能使⽤频次、使⽤时⻓问题诊断APP问题诊断的前提是对业务有⾜够的深度和⼴度的理解,结合产品逻辑和商业价值,能从各个维度进⾏分析
    2019-03-22 13:44 18
  • 小鱼_58
    庄家依靠盘口水位的变化来均衡受注额,而玩家则依靠这些来判断比赛的胜负走势
    2019-03-14 10:51 20
  • 偏爱自由
    电商漏斗模型,功能优化漏斗模型
    2019-03-17 01:42 13
  • 110922106
    也需要针对高质量用户进行重点运营,低质量用户通过产品和运营改进手段,使其往高质量用户迁移
    2019-03-23 00:42 45
  • 幻想偷闲
    在APP的整个⽣命周期中,需要对产品的留存数据持续的观察和分析
    2019-03-14 04:35 2