数据挖掘2:具体项目
接《百万级的数据里找项目》步骤1拓展词库 和 步骤2数据清洗
步骤3:
经过前面两步的拓词和清洗,我们得到了一份干净的关键词数据,它保存在一份TXT中:
有别于上次,这次特意拓展了近500W的词,因为本次使用的方法需要更多的词库做支撑。
上次我们使用了”词向量文本分类“来归类关键词,方便我们分析查看,但是这种方法的问题在于它是没有结构的,一份词库生成之后,你只能从上往下看,看到什么是什么。
因此我采用了”关键词根提取法“的方式来归类,并且使归类好的内容自动按照思维导图的结构展示出来,先来感受一下:
简单说一下技术思路:
1:提取一份词库里词频最高的topN
2:按照上一条的思路在包含上一级词根的前提下陆续提取下一层级的topN词频
3:最后一个节点的子节点输出对应长尾词
4:利用Python的”xmind“模块把词频作为节点输出
肯定是看不懂,我们拿上图说明,这是一份”抖音“的词库(所有长尾词都包含”抖音“):
1:经过统计,我们得到了这份词库中除”抖音“这个词根外,词频最高的4个词根
”视频“、”网红“、”直播“、”歌曲“(这些作为一级节点)
2:单独提取出包含”视频“这个词根的所有长尾词(肯定包含”抖音“),作为一个”子词库“,再按照(1)里的方式统计这个”子词库“里词频最高的词根
”剪辑“、”水印“、”字幕“(这些作为二级节点)
3:如果我们只要两级,那么”剪辑“这个层级之后开始输出长尾词,这些长尾词包含他的父级节点的所有词根:”抖音“-”视频“-”剪辑“
”抖音视频怎么剪辑“-”抖音视频剪辑教程“
4:自动输出一份思维导图文件
以上,就是一次完整的归类方式,上图就是我们得到的最终文档。
这是一个简单的技术思路过程,怎么实现不是关键,先能理解就好,后面会说如何实现。
上面我们仅仅是为了展示说明,而实际上本次我们统计的目标是一份仅500W的词库,所以需要在思维导图里分子页显示,如下:
每一个节点中的数值代表:涵盖总词量/在词库里所占比例,这些数值可以给你一个概念,让你大概知道这个版块在这个领域的比重。
我们来看看占比最大的”视频“这个一级节点:
比例显示0%是因为相对500W太小了,被约等于了(忘记处理这个问题了),我们把最后的节点打开看看,比如右下角的”水印“-”ios“:
据我了解,ios去抖音水印一直是个不太稳定的服务,目前能找到的很多平台很容易挂。
归类做好了,开始寻找合适的项目。
步骤4:
根据我的经验,绝对的热门和冷门都不是好的选择,所以类似“视频”这样的节点下的内容,大多数要嘛没有商业价值,要嘛涉及到的需求早就有人完善了。
我个人习惯去看那些我不能理解的,好奇的,往往这里面隐藏着寻常人不理解的商机,比如我找到了一个“表情”的版块,大家感受一下:
五花八门,长尾词数量有7W+,之所以让我好奇是因为“表情”(即表情包)这个东西,不应该有这么大的需求量(仅指在抖音里),同时多年从事搜索优化的工作让我发现这是一个好的需求,有各种大量长尾需求,能够使内容生产者有源源不断的内容可以产生。
为什么这么说呢:
这是一个可延展性很强的需求,它天然包含着“无限种”类别,“影视”、“人物”、“动物”表情包等等,以”人物“举例,社会每天都在生产各种各样的红人,以这些人做成的表情包,如:”XXX表情包“,永远都有新的搜索。
我们在抖音里搜索一下“表情包”:
(本文仅作为分析讲解,为避免给他方带来麻烦,所以隐私细节全部打码)
不管什么样的表情包资源,总有一堆人求。
注意:这里有一个小细节可以看得出这一定是一个行业,看看图片里那个在别人求图时,回复别人说在这,让别人私他的人,不信大家可以去搜索,然后翻翻评论,几乎求图下面总有这样的人。
为什么这就一定是一个行业?
逛贴吧的都知道,卖东西的人惯用的套路就是总会在同行帖子下面回复那些有“求”的人,让别人去私他,有时候大半夜还在回,说为广大人民服务我是不信的。
所以:找项目、看行业,不要等别人给你推荐一个能赚钱的,能的不会推荐给你,要善用逆向思维去看待一些现象。
然而这只是初步判断,为做进一步验证,我选了一个排序相对靠后很多,粉丝量相对低的号(这也可以赚钱,那数据比他好的也可以),接下来我把分析到的内容展示给大家,用于判断这个业务是不是有钱赚,钱在哪里,怎么赚的,能赚多少。
步骤5:
这是翻了几页后的某一个表情包号,粉丝量和视频数量相对平均,不高不低,图中可以看出:
1:背景图引导粉丝关注公众号取图
2:简介留微信,并明确表示收徒
这就更加验证有利可图了,我们先看看他的公众号:
更新频率并不高,几天更新一次,有时候甚至一个月,之所以这样,是因为这种公众号并不靠持续的优质内容来吸粉,吸粉行为本身就是在抖音进行的,公众号只是承载粉丝。
内容也没什么高质量的,无非是堆砌素材,需要的自取。
查看了几篇文章,大部分的阅读量都在4000左右,这种号的粉丝会比较泛,不够垂直,接广告的话撑死了一个粉丝2毛,也就是接一次广告能理论上能赚近800,另外还有广点通的广告分成。
还算可以,但不足以算一个项目,接下来我们再看看ta的收徒是怎么赚的。
以下是我加了微信后的聊天记录,为保证别人利益,避免给人带来不必要麻烦,涉及隐私的相关内容我就不显示了,只展示关键信息:
加完微信后,看了下朋友圈,挺热闹
除了收徒还有帮引流、卖号等业务,简单沟通下,发了ta的套餐给我:
大概沟通下来的意思是:
1:教徒弟如何找资源、做资源
2:教徒弟如何在抖音发布引流
3:引流后你想跟ta一样做培训或者自己对这些粉丝做转化变现都可以
到此,这个项目已经基本明朗:
1:这是一个互联网项目
2:核心是靠表情包等虚拟资源在抖音引流
3:赚广告费、培训费、粉丝变现
所以,这个项目能赚、钱在哪里、怎么赚,我们已经明确了,那么能赚多少?
首先第一点:公众号
如果他接广告,一篇大概能赚500-800左右,广点通还有额外收益,但不好估计
其次第二点:培训收费
以下计算方式仅根据行业经验,在下不负责任的分析一下,姑且听之:
假设ta只有一个抖音号在运营(事实上肯定是矩阵运营)
30W的抖音粉丝,关注公众号比例在1%以上,因为光阅读已经有1%了,关注肯定更多(不排除还有其他引流渠道)
加微信的比例应该没有这么高,但是0.5%并不过分。也就是有1500个加粉。
咱们保守一点,砍一半吧,750个加微信,这里面能否有10%的人被转化?
我个人认为完全没问题,对方已经明确表示,要拜师才加微信,否则勿扰,加进来的都是目标群体,转化75个人应该不成问题。
看了下朋友圈,差不多是在3月份开始有抖音收徒的相关内容,之前都是只做拿图相关的,也就是到现在大概经营了4个月,75个转化,不过分,要不然朋友圈可以停了。
75 * 600(不要688,假设有人讲价) = 45000
这是4个月的,月超一万应该是没有问题的,而且是我折中保守估计的数据。
可以预估到的还有第三点盈利方式:粉丝变现和卖号
对于不拜师的,那以后朋友圈可以更新点其他内容,粉丝量多,总能有一个合适的变现方式
再不济一个号也可以卖,一个5000人的微信号,只要是正常加进来的,不是僵尸号,产生的价值养一个10几人的团队不成问题,市面上也是很抢手的。
分析到此结束,综上,这大概率是一个可以赚钱的业务。
至于ta教的东西,提供的资源,我个人认为并没有太多技术含量,要找也是有办法的(我不打算分享,请勿针对这点私信),属于信息差性质,你知道了一点都不值钱,你不知道的话又需要,你只能找ta。
以上,我们通过“关键词根提取法”的方式在垂直行业里找到了一个别人正在经营的项目,并且通过初步分析,认为是一个有利可图的项目。
但是我个人不建议你去学习ta做这个项目,更不要去打扰人家,你真去了,也不要以为不花一毛钱想从ta身上得到什么有价值的东西,浪费大家时间而已,当然你要去拜师我不阻止。
我觉得利用这种方式,找到一个适合自己的项目才是最好的,毕竟500W的词库,我也就演示了其中一个版块,还有太多了。
步骤6:
本来准备接着讲“关键词根提取法“的方法具体如何实现,让大家可以自己去执行看看,但是鉴于本篇篇幅已经太多了,还是消化一下。
下一篇,我会更新这两篇文章所提到的”词向量文本分类“和”关键词根提取法“如何去实现,有个好的消息可以先透露:就是”关键词根提取法“这种方式就算不会技术也有很方便的现成工具可以使用,届时我会为大家介绍。
如果觉得内容确实对你有帮助,帮我点个赞哈,算是给我一个继续更新的信号,一直希望自己会的东西能在一个平台上分享出去,沉淀下来,过程中如果还能帮到你,那当然也是好的。
两次文章的项目看上去都比较LOW,但一定不要看不上,它不一定值得你去组建一个团队,搭建一个场地来创业,但是一两个人甚至自己一个人,就可以做了,收入不LOW,我前一篇文章提到的自己在付费投放的业务比这个还LOW。
Reference
1、 https://zhuanlan.zhihu.com/p/159151941
打赏
微信 | 支付宝 |
---|---|
万分感谢 |
- 原文作者:冷眼
- 原文链接:https://cold-eye.github.io/post/data-mining-2/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。