0%

微信朋友圈的时间入口、转化量与注意熵研究

摘要

大量的微信朋友圈充斥着我们的生活,占用着我们大量的时间与注意力。我将朋友圈的发布、点赞、评论与每日时间联系在一起,研究了朋友圈的时间入口;参考选择或然率公式,得出了微信朋友圈转化量公式,并将其应用于点赞、评论转化量期望的研究;根据信息熵的理论提出注意熵,研究并描述了注意力分散在不同纬度下的特征。

关键词

微信朋友圈;时间入口;转化量;转化率;注意熵

介绍

随着互联网的井喷发展,不同平台对用户时间的争夺日益激烈。每一个个体除去睡眠、工作、饮食等必要支出时间以外的时间就是剩余时间,而人群每日平均剩余时间是一个相对恒定的值,平台对时间入口的争夺就是对用户剩余时间的争夺。因此,分析用户使用平台的时间入口颇为关键,这能帮助发布者了解内容发布的最适时间,从而获得更大的内容曝光量。

获得了曝光量后就需要考虑内容的转化能力,把曝光转化至点赞、评论、关注、购买等一系列转化量。这些转化量是内容发布的反馈,组成了互联网上的社交关系、内容运营、商品售卖的闭环连结。

而巨大的信息发布量、曝光量也会带来更显著的注意力分散,在由时间排序的列表、信息流或瀑布流的中,内容可能因此受不到足够的曝光。根据信息熵的相关理论,我用注意熵来描述注意的随机情况也就是注意力,分析内容发布时间与数量对用户注意力的影响,同时探究转化量、转化率与曝光量的熵关系。

方法

微信朋友圈的量化指标

在微信朋友圈中,量化指标有两个:点赞和评论。辅以发布时间、发布内容等信息,可以探究其间的联系。

数据采集

每一位合法用户只能浏览朋友圈数据库中有权限访问的那一部分,因此朋友圈数据不可通过网络爬虫获取。我采用了缓存读取的方法,采集了自己 7418 条朋友圈数据。单条数据中记录了朋友圈的时间、内容、点赞人、评论人、评论内容以及其他的信息。样本包括:

  1. 我朋友圈信息流在 2019.9.14 - 2019.9.22 期间的全部内容;
  2. 我典型微信好友的全部朋友圈。

注:典型好友特征包括但不限于朋友圈无发布时间锁、共同好友较多、朋友圈内容量大;此样本集具有极大的局限性,缺乏多类样本的比对分析,分析结果也仅适用于此类情况,例如样本中的好友几乎现居中国,控制了样本用户时区一致,但好友中学生群体的占比较大,暂未考虑其带来的影响。

时间入口的研究方法

朋友圈的内容发布、点赞量、评论量与时间有很大关系,通过绘制点赞数—时间、评论数—时间等图表,可以研究朋友圈在每天各个时间段的发布情况、被关注情况,探究用户浏览、发布朋友圈的 “时间入口” 与发布朋友圈的 “最佳时间”。

转化量的研究方法

单条微信朋友圈的转化量即为该朋友圈收到点赞、评论的量,参考选择或然率公式(Fraction of Selection Formula): \[\text{选择或然率} \ \left(\text{Fraction of Selection}\right)= \frac{ \text{报偿的保证} \ \left(\text{Expectation of reward}\right) }{ \text{费力的程度} \ \left(\text{Perception of effort}\right)}\]

我得出微信朋友圈的转化量公式为: \[\text{转化量} \ \left(C\right)=\text{转化率} \ \left(R\right) \cdot \text{曝光量} \ \left(E\right)\]

其中单条朋友圈的曝光量 \(\left(E\right)\) 即为用户对该条朋友圈的注意量 \(\left(T\right)\)

对于一个给定的朋友圈样本 \(A\)\(\left| A\right|\) 是样本中朋友圈的数量,有:

\[\begin{aligned} {\rm E}(E) = \frac{\sum _A E}{\left| A\right|} \end{aligned}\]

将转化率与曝光量视为两个独立随机变量,有:

\[\begin{aligned} {\rm E}(C) & = {\rm E}(R \cdot E) \\ & = {\rm E}(R) \cdot {\rm E}(E) \\ & = {\rm E}(R) \cdot \frac{\sum _A E}{\left| A\right|} \\ & = {\rm E}(R) \cdot \frac{\sum _A T}{\left| A\right|} \end{aligned}\]

即:

\[\begin{aligned} \text{转化量的期望} = \text{转化率的期望} \cdot \frac{\text{总注意量}}{\text{样本数}} \end{aligned}\]

注意熵的研究方法

微信不会显示朋友圈内容的曝光量和点击量,不会提供用户观察朋友圈内容的停留时间,同时微信朋友圈不可转发,不存在内容的网络鸣放。因此一条朋友圈的点赞数可以大致的反应其引起好友的关注量。微信朋友圈采用信息流的设计,不同的内容在信息流中会取得不同程度的关注。基于香农的信息熵理论,用户朋友圈的注意熵可以反应用户的注意的不确定性。

熵被用来衡量一个随机变量出现的期望值,计算方法是:

\[{\rm H} \left(X\right)={\rm E}\left[{\rm I}\left(X\right)\right]={\rm E}\left[\log \frac{1}{ P\left(X\right)}\right]=-\sum _{i=1}^n P\left(x_i\right) \log P\left(x_i\right)\]

我将点赞数据作为计算注意熵的来源,探究用户注意力的分散度。对于一份点赞样本 \(C\)\(P\left(c_i\right)=c_i/\sum _{i=1}^n c_i\),即某条朋友圈的点赞数可反应用户注意停留在该内容上的概率。将转化率与曝光量视为两个独立随机变量,有:

\[{\rm I}\left(C\right)={\rm I}\left(R \cdot E\right)={\rm I}(R) + {\rm I}(E)\]

有:

\[\begin{aligned} {\rm H}(C) & = {\rm E}[{\rm I}(C)] \\ & = {\rm E}[{\rm I}(R) + {\rm I}(E)] \\ & = {\rm E}[{\rm I}(R)] + {\rm E}[{\rm I}(E)] \\ & = {\rm H}(R) + {\rm H}(E) \end{aligned}\]

结果

朋友圈的时间入口

发布时间

我的第一个研究是关于朋友圈内容的发布时间的,我将每条朋友圈的发表时间抽出,统计样本中每分钟发布朋友圈的总数,绘制了图 1 ;为了研究工作日与周末的发布情况差别,我绘制了图 2。

图 1 中的朋友圈数量时间直方图以及平滑核曲线向我们展示了朋友圈发布在一天中的分布。横坐标是时间(从 0:00 到 23:59,精确到分),纵坐标是发布发布次数。由图可知,我的朋友圈夜间发布内容较少,随着天亮内容逐渐增多,在正午达到第一个高峰,在日落时达到第二个高峰,9 点左右达到全日发布量的顶峰,此时朋友圈的发布最密集。

图 2 中我通过精确到小时的直方图对比了工作日与周末朋友圈在各个时间段的平均发布量。由图可知,周末与工作日朋友圈在夜间与早晨的发布量相近且均偏低,而周末朋友圈在正午、日落、晚间的发布量峰值均超过了工作日。

点赞与评论

在这个研究中我绘制了图 2、3 两幅记录单条朋友圈点赞数、评论数与朋友圈发布时间的散点图。

图中每个数据点的横坐标是朋友圈发布时间,纵坐标是其收到的点赞数或评论数。可以看出每天有两个点赞、评论密集区:中午和晚间。数据点密集可说明此时朋友圈的转化量大。

朋友圈的转化量

点赞、评论是两个重要的转化量,研究其与发布内容的联系,可以了解内容收到的反馈情况。我将全天分为 48 个时段,图 5 中的每个数据点横坐标是各时段的朋友圈发布量,纵坐标是该时段收到的总点赞量(黑)、总评论量(灰)。

可以发现,各个时段的转化量与发布量之间近乎是正比例分布的,也就是说,各时段朋友圈的点赞率、评论率的期望是恒定的。拟合直线如下:

\[y=4.11x,y=2.69x\]

因为 \(\sum _A C = {\rm E}(C) \cdot \left| A\right|\),所以 \({\rm E}(C) = \sum _A C / \left| A\right| = k\),其中 \(k\) 为拟合直线的斜率。因为 \({\rm E}(C) = {\rm E}(R) \cdot \sum _A T / \left| A\right|\),所以 \({\rm E}(R) \cdot \sum _A T / \left| A\right| = k\)。而在朋友圈中转化率的期望 \({\rm E}(R)\) 也是一个恒定的值,所以朋友圈中总注意量正比于样本数,说明朋友圈中用户发布内容的速率与浏览(注意)内容的速率保持一致。

朋友圈的注意熵

为了研究各时段用户注意力的规律,我用 48 个时段的点赞数、评论数近似地描述注意力,绘制了图 6、7 两幅注意熵的时间分布图。

图 6 中,我将每个时段内的所有样本求熵;图 7 中,我随机选取了每个时间段中确定数量的样本求熵。由图可知,在一个确定时间段内,用户的注意的随机性会因内容的增多而变强,而在一个确定数量的样本中,用户注意的随机性几乎恒定。

这就说明,用户浏览内容时,注意力出现的概率是恒定的,即用户出现对某条朋友圈关注度提升的概率是恒定的,但是用户的注意力总量会被有限时间的内容数量所稀释,信息量越大,用户随时间分配注意力的随机性越强。

如果拓展朋友圈转化量公式,使得点赞、评论之间也存在某种假设的关系,那么此时公式应为:

\[C_\text{评论} = R_\text{点赞—评论} \cdot C_\text{点赞}\]

由图可知,无论是各时段总注意熵还是确定样本数注意熵,

\[{\rm H} \left(R_\text{点赞—评论}\right)={\rm H} \left(C_\text{评论}\right) - {\rm H} \left(C_\text{点赞}\right)\]

几乎恒定,故点赞—评论转化率的随机性几乎恒定。

结论

从社会互动的角度看,微信朋友圈的发布、浏览、点赞、评论都是符号互动的重要组成,它形成了比以往更多的人与人之间的强弱互惠性服务关系。这些互动拓展了个体维持关系的能力,同时也挤压了用户的时间,占用了用户的注意力。

在时间入口的研究中,我发现朋友圈发布量、点赞量、评论量与时间之间有着密切联系。从分布上看,每一个峰值点都对应了一个人群基本剩余时间点(如常规的午休时间、下班时间、晚间活动时间),说明微信朋友圈的时间入口与用户剩余时间有着密切关系。而时间入口、空间入口恰是影响总曝光量或是总注意量的重要因素。

在转化量的研究中,我发现朋友圈的点赞量与发布量是呈正比例关系的,且与发布的时间无关,故单条朋友圈转化量的期望是恒定的。经过公式推导,可以发现用户发布朋友圈的时间与使用朋友圈的时间是接近一致的。

在注意熵的研究中,我通过点赞数、评论数体现的关注度计算了两类注意熵,一类是以确定时间段的所有样本计算的注意熵,另一类是确定样本数的注意熵。经过观察发现,确定时间的注意熵仍随时间变化而变化,当发布量升高时,该注意熵同时升高;而确定样本数的注意熵不受时间或发布量影响,始终保持一致,用户注意的随机性也就是注意力几乎恒定。

综上所述,我将微信朋友圈的发布、注意、曝光、转化总结为以下的内容机制。

其中,微信朋友圈的转化量以及转化量的期望可以通过如下方式计算:

\[\text{转化量}=\text{转化率} \cdot \text{曝光量}\]

\[\begin{aligned} \text{转化量的期望} = \text{转化率的期望} \cdot \frac{\text{总注意量}}{\text{样本数}} \end{aligned}\]