中国广视索福瑞媒介研究(CSM)

用户画像时代的收视率

作者：郑维东

　　从捕捉用户特征的角度，画像并不等同于照相。照相可以客观真实地映射用户特征，而画像则带有作画人的主观色彩。所以既是"像"与"相"的不同，也有"画"与"照"的差异。
　　传统的收视率调查，以真实的人群抽样来记录收视行为数据，每一个样本人员都是实名的、确定的，对每一个样本观众特征的信息采集是真实客观的，这好比是用户照相。由此记录和计算的收视率数据对这一样本组而言是客观事实，误差则反映于以这个抽样样本群去推断总体电视观众的过程。推断的过程则带有画像的意思。
　　如果不是以一个实名的、确知的样本人群作为记录收视行为的基础，而是以一个匿名的、模糊的样本人群的某些行为特征作为对他们用户特征的推断，并与之收视行为数据相匹配，再计算和推断出总体收视率数据，那么这就是基于用户画像的收视率了。所以简言之，大数据时代的收视率多半就是用户画像的收视率。
　　当然也可以把基于用户照相的收视率与基于用户画像的收视率结合起来，通过数据融合及数据整合的算法技术，让两种数据的优点得到相互支撑，这是目前国际收视率调查业界的一项前沿实践。
　　电视观众或者更广义地说视频用户，其用户特征通常以标签化的方式加以识别和采集。比如性别，以用户照相的方式，对个体性别的判断和标识不会出现差错；如果是用户画像的方式，基于这个用户的一系列相关行为特征来推断和标识其性别，则存在容错概率，这个概率的大小取决于数据质量、指标相关性程度和算法。所以在用户画像的语境中，一般不直接进行用户标签化，而代之以用户信息标签化，也即是说通过一组信息来完成对某一用户特征的标签化过程。信息多了但结论精度低了。
　　对用户收视行为数据的采集，用户照相主要是基于样本个体的，以用户视角识别和记录其有关视频使用行为；用户画像情形下，由于样本用户个体是模糊的，则往往代之以终端视角的用户行为追踪记录，而后以用户与终端之间的连接信息进行数据再归集。
　　无论用户照相还是用户画像，对收视率数据的计算都必须涉及这样几组信息：一是用户特征标识，无论是确知的还是推断的；二是用户使用视频的时间数据，包括时间戳和时间长度，无论是以用户个体视角的记录还是以终端数据记录；三是视频内容标识数据，无论是通过即时声音或图像匹配方法还是通过数据库编码提取；四是接触点数据，或者说场景数据，是室内还是户外?是看电视还是上网?是静止还是移动？等等。
　　基于这样四组数据，一个标准的几近完美的收视率模型就等同于：用户标识+时间+内容+接触点。传统收视率调查的接触点，因为仅限定于家庭电视，所以只需要有前三组信息就足够，即我们通常说的3W：谁（Who）、什么时间（when）和什么内容（What）。用户画像时代的收视率调查，是一个对所有场景的跨屏收视行为的调查，所以需要增加另外一个W，即接触点(Where)。
　　接触点数据让收视率有了场景化的概念，场景是节目与用户连接与互动的情景。这和场景化营销相结合，使收视率数据价值得到进一步提升。营销界的需求是推断收视率调查发展的源动力，场景化营销的发展让场景化收视率调查时不我待。基于用户画像的收视率与基于用户照相的收视率相结合，一个混合、融合加整合的新收视率调查时代显然已经到来。
　　

返回列表

研究洞察

您的需求将被转发到CSM的邮箱