登录 注册

研究洞察

发力供给侧:实时数据与多屏测量
作者:肖建兵 吴盛刚 蔡芳

  最近一年,CSM媒介研究在供给侧方面进行了一些改革和尝试,在新媒体方面的工作也处于提速状态。提速的原因来自于两方面,一是市场的需求,另外一个是市场的竞争和用户的压力。2015年我们提出了多屏拓展与跨界融合的概念,其中,多屏拓展包括收视实时化、穷尽电视端收视和实现跨屏总收视,在穷尽电视端收视方面,我们在5月份正式推出时移收视率的标准化服务。实际上在2016年5月份之前,从去年1月份开始到今年5月份之间我们一直在十二城市做时移收视,现在已经能够提供标准化测量服务。今年过去的大半年中,我们在实时数据和跨屏测量这两个领域取得了一定的进展,本文主要围绕这两个方面与大家进行分享。
  一、收视测量实时化:智能电视实时收视
  2015年12月,CSM与欢网开启战略合作,2016年2月CSM与欢网、微博、一点、奥维合作推出猴年春晚实时收视平台,在该领域进行了成功的尝试。在此过程中,我们与欢网合作的实时收视测量,也一直在推进。2016年6月,我们推出了实时数据系统全国版,在此基础上7月推出实时数据系统52城市平台,可以看到节目的实时收视曲线、历史数据、频道的对比以及节目的画面。很多卫视的同事都有这样的经历,看完市面上其他实时数据后,把它乘以4才约是第二天的数据。而我们给出的实时数据的绝对值会和第二天CSM公布的数据非常贴近。52城市实时数据平台已经运行一段时间,总体来说,数据绝对值与正式数据的差距是可以接受范围内的。
  智能电视终端CSM-huan的实时数据系统涵盖了四项技术:直播识别和触发式实时回传技术;基于4200万智能电视海量终端数据;分钟级实时呈现云计算和大数据技术流式处理;海量数据与抽样数据融合技术。大致有如下几个特点:第一,在整个识别中,我们运用了直播识别和触发式实时回传技术,这是目前智能电视机在行业当中的一个高精尖技术;第二,我们是基于4200万智能电视海量终端数据,但不是全部的。为什么呢?这个系统我们提供N多的实施路线,可通过云计算和大数据流式处理进行分钟实时呈现,大家看到的曲线跟我们跑出来的曲线是非常类似的。第三,海量数据与抽样数据的融合,利用抽样调查的优势结合海量数据,我们回避了一些大数据的缺点。
  在设计系统的时候,我们将实时数据进行了一个合理的定位。鉴于我们本身有一套CSM自己的数据,我们把实时数据定位为现有收视率体系的延伸。换句话说我们这套系统是实时预测CSM第二天的数据。预测效果如何?与第二天数据的差异如何?以CCTV1为例,蓝线是4月19日当天我们24小时的智能电视实时收视数据,红线是第二天CSM发布的数据,可以发现整体的趋势是一致的(图1)。


 
  观察智能电视实时收视数据与次日发布的收视数据之间的差异,可以发现当天看到的智能电视实时收视数据和第二天发布的数据基本在一个数量级上。尽管作为预测系统存在一定的误差,但从目前中央台的主要频道和省卫视来看,对主频道来说基本上是一致的。
  二、CSM-huan智能电视实时收视系统
  2014年底,在全球市场上,智能电视(1.2亿)第一次超过了不带上网功能的传统电视(1.0亿)。在中国,智能电视发展速度更快,2013年底,中国智能电视的普及率已经超过了50%。根据现有的合理推测,2016年全年的智能电视销售将超过了4千万台,而非智能电视同期销售缩减到8百万台。
  目前,智能电视在中国较之全球发展更快。去年是2倍,今年达到5倍,预计明年会是10倍。今时今日智能电视发展会是什么状态,两个数字可供参考,根据工信部的统计,目前中国市场上的智能电视的保有量是1.1亿,智能电视出货量、内部渗透率达到84%,也就是说无论是城市、农村市场,销售100台电视中大概有84台是智能电视。
  那么,智能电视是否城市卖的多,农村卖的少?根据目前统计数据,差异不明显。相反,农村比城市卖的更多、更贵。农村智能电视销售占比52%。而在城市的销售占比48%。同样100台电视在城市的内部渗透率是72.6%,在农村是73.7%,城乡差异在智能电视这个领域已基本消除。
  按照这样的预期,智能电视在电视的存量市场会扮演什么样的角色呢?据预估,今年智能电视占整个存量市场22%,2017年是26%,到2018年是30%。此外,智能电视的出现极大地缩短了电视的生命周期,传统电视的生命周期是10年-15年不等,今时今日电视的生命周期已经缩短到6年。智能电视的盒子,例如小米盒子等生命周期是6年半,科技越发展,电视生命周期越短。
  欢网成立于2010年。与小米、乐视等不同,小米、乐视等更多服务于自己的品牌。欢网的市场在哪里?第一个是智能电视。目前在智能市场包括东芝、长虹、TCL、康佳等品牌,欢网平台级合作已连接智能终端超过4200 万台。智能电视这个行业,如果规模达不到一定的程度,很快会被资本市场洗牌。还有一部分市场,即为核心的智能导视系统,我们在江苏、北京、河南、河北、新疆等差不多将近10个省市上线。作为欢网的核心主体,智能电视的操作体系,或者说后期广电运营商的智能导视服务,可以作为欢网主体。
  欢网是如何做数据业务的?我们经历了自信到迷茫,再到清晰的过程。在最初的起步阶段,我们拥有用户实时收视信息,可以知道观众什么时候、在看什么、从什么台换到什么台,这些大数据建立了我们的信心。但很快我们就从自信转入迷茫,因为我们发现市场上有很多所谓数据的榜单,彼此差异较大。最关键的是我们的数据与CSM基于统计抽样方法的数据也不一致。欢网的初衷是想做实用的、靠谱的数据,所以进入这个迷茫期之后,我们就展开了一系列分析,为什么存在这个差异。在这个过程中我们发现了智能电视用户与全网电视用户的差距。欢网既做智能电视的平台服务,又为10个省的广电网运营商做智能导视。我们把数据产生的差异进行对比,发现了如下三点差异:首先,一旦买了智能电视之后,观众可看的内容空前的增加。智能电视对直播的依赖程度并不像传统依电视那么高。例如,某城市广电机顶盒直播收视的用户在70%,甚至80%,只有20%会进入游戏、教育等。但是智能电视由于更多与互联网接轨,把一部分互联网用户群拉回来。其次,因为智能电视在整个行业的份额没有达到30%,就像海水,有些地方偏咸,有些地方偏淡,所以区域分布就有差异。2013年最关键的是智能电视的用户群与全网用户在收视行为上存在一些差异。基于点播之后,用户群对直播的收视有所差异。我们需要科学的方法赋予智能电视收视恰当的权重,通过一系列算法,一系列抽样方法把收视的区别、差异消除,再通过一系列方法,也许就能做到通过智能电视收视更好地反映全网用户收视情况。我们希望做到实时动态收视信息的预测,不仅仅基于单纯智能电视用户的相对片面的信息,而是基于全网用户的真实的信息的预测。
  欢网有4200万的终端数据激活量,现在每年的全国电视机出货量当中,超过80%是智能电视。我们如何利用这个大数据的优势和CSM测量的优势做出来这个系统呢?目前我们使用了海量数据与全网数据的融合技术,可以说我们的系统是是融合技术的产物。
  我们当前的设计系统中,大体用了四套方法,一是抽样并固化终端,二是地域加权调整,三是“历史数据+实时预测”,是我们对重大节目历史收视数据库的建立,来提高系统的预测精准率(图2)。  


 
  我们首先在4200万智能电视终端中进行抽样,抽取50万的固定终端作为样本。为什么选择抽样?我们在研究欢网数据的过程中,发现第一批购买智能电视的用户,他们很大程度上是对收看直播电视不太感兴趣的人。因此,我们要参照全国电视观众的收视时长分布,以智能电视终端的直播收视时长为变量进行抽样。未来随着智能电视机市场的快速发展,智能电视机的保有量会越来越大,存量会越来越大,我们再做固定终端样本的时候,就拥有更大的样本量,这就是为什么我们要进行抽样并固化终端的原因。
  第二,我们要做的是地域加权调整。观察截止到4月份我们全国网电视和欢网智能电视终端的数据差异,应该说有一些城市数据差异比较大。例如在山东,欢网智能电视终端数据是5.29%,全国电视观众数据是7.41%;广州的欢网智能电视终端9.47%,全国电视观众7.76%。
  智能电视具有机天然的收视地域偏差。所谓天然,它跟品牌完全相当的,比如说西南地区长虹占比较高的,珠三角TCL占比较高,华北、东北地区海尔、海信占比较高。目前包括欢网等公司,都是一个厂商一个厂商来签合同。所以就造成了智能电视的数据有天然的偏差性,因而这个过程中我们必须做一个地域加权。
  第三,我们用“历史数据+实时数据”的预测。我们不能完全用历史的收视数据,用各种的历史数据来预测未来的数据,抹杀了电视节目它作为文化产品本身特殊性。那我们采取历史数据+欢网目前50万户的实时数据进行预测。根据CSM和欢网智能电视终端的历史数据,系统会在每一分钟对欢网智能电视终端实时数据进行加权,并利用模型自动计算出前一分钟的电视收视率结果。历史数据区分工作日、周五、周六和周日,采用5天/5周天的历史数据均值,进行收视率预测。
最后,我们通过对包括春晚在内的重大节目的CSM和欢网智能电视终端历史收视数据的积累,建立并逐渐完善重大节目的历史收视数据库,提供收视预测的精度。
  我们在这里面做了几点创新。一是对智能电视终端按收视时长分布进行抽样和固化,解决智能电视的代表性偏差;二是对海量智能电视实时收视数据按照全国电视观众的地域分布进行了加权;三是利用CSM历史数据与欢网海量智能电视实时收视数据进行数据融合。在海量数据的基础上采用抽样方法,进行加权计算。海量数据和抽样数据融合,进一步提升海量数据的价值和精度。
  在实时数据的应用上,CSM完全没有经验。但是全世界有一个地方有经验,那就是南美。大约10年之前,在巴西,他们的电视台、广告公司就都开始使用实时数据。所以在2014年底的时候,我们外方全资收购了其在南美做收视调查的公司。南美通过实时测量仪来实现实时收视。我们现在已经订购了100个实时测量芯片。今年第四季度我们会选一个城市,来做实际的测试。不仅在南美实时收视测量有十几年的经验,最关键是南美的业界有十多年实时数据的应用经验。实时测量仪也在引进过程中。发达国家对实时数据并不是很看中,为什么中国市场那么喜欢实时数据呢?我认为是我们的工作节奏比欧美快,所以大家都想知道数据怎么样。
  应该说这个引进的技术改造并不困难,但是复杂处在于后期的数据处理流程。下图中蓝线是我们现有的收视率调查和后期收视数据的流程。下面这个红线是实时测量仪的流程,应该说改动还是很大的(图3)。


三、跨屏总收视的实现
  跨屏收视测量是CSM探索已久的一个领域,实际上我们从四年前就开始做,在欧洲做了很多的尝试,有很多示范的经验,这半年我们找到合作伙伴,整体工作有很大的提速。从去年底到现在,我们与美国comScore合作,已经实现了一部分。下面图中,红色部分表示的是电视端收视测量;蓝色部分表示电视端的延展收视行为,我们目前跨屏合作就是为实现这个目标;绿色部分表示全视频测量;橘色部分是全内容测量,不仅仅是指电视台的,还有视频网站,还有自己的延伸视频(图4)。


  那么,在电视端和在PC端的观众规模如何呢?以19部热播电视剧集为例,《亲爱的翻译官》在电视端的观众规模最高,达2.71亿。该剧自5月24日开播后前10集,电视端的观众规模波动不大,第10集的观众规模最高,为6432.6万。在PC端,观众规模则波动较大,第五集的观众规模最高,为459万,第二集最低,仅为123.7万。从其观众构成来看,女性观众比例高于男性,为65.57%;从年龄分布上看,14岁及以下的观众比例最高,为24.13%。在PC端,该剧在乐视视频和芒果TV两个平台的女性观众比例均高于男性;从年龄分布上看,PC端两个平台之间年龄结构出现差异,该剧在乐视视频平台的25-34岁观众比例最高,而在芒果TV平台的15-24岁观众比例最高(图5-7)。




  comScore在跨屏测量行业取得一定的进展,是一家全球领先的数字媒体测量企业。公司1999年在美国成立,2007年在纳斯达克上市,目前在全球拥有44个市场的数据,服务3200个客户。客户主要包括代理公司和广告主,comScore所提供的产品能帮助客户做媒介计划,以及其他的媒体、受众分析、广告效果的测量等。2009年comScore进入中国市场,目前在中国已经拥有60万PC端的样本,其安装在用户的电脑上,可以实时的跟踪用户的上网行为。不同的网站流量、用户特征,以及流量的来源等信息,为客户提供互联网用户分析的依据。此外,comScore在国内主流的视频网站上,已经加入代码,以便可以实时的了解每一个网站完整的流量、以及视频播放的情况。
  现在公司已经发展为全屏、跨屏精准受众分析的企业。2014年comScore在美国推出了数字测试的跨屏产品,涵盖了PC、移动端等终端上的视频播放情况。2015下半年,comScore推出了与数字视频、电视视频趋同和跨屏的分析。2016年1月,comScore与美国从事电视收视调查的公司合并,使用有线运营商的数据,进行实时的数据分析,目前拥有全美4千万家庭户机顶盒实时的数据。在完成合并之后,两家公司会进一步把机顶盒的数据跟comScore加码的数据、以及comScore样本的数据,包括现在发展家庭路由器的样本结合在一起,进行全新的跨屏测量。
  目前,受众对于媒体消费已经呈现碎片化、多屏化、多场景化的趋势。从数据上也验证了这一点,在过去三年间,中国PC端用户所花的时长增长了44%,视频消费时长增长了75%。移动端的数据更加的惊人,从数据来看,目前视频播放量是PC端的2-3倍。这是非常巨大的转变,平台的多样化,在一定的程度上会消减用户对直播的依赖。从美国的数据来看,在过去一年间,直播所花的时长下降了2%。而与此同时,在点播上的时间有了很大的提升,仅综艺节目点播的时长,在6年增长了3倍。
  回到中国市场来看,第三方视频网站在中国数字视频市场占据主流的地位。虽然有芒果TV这样依附于湖南TV的网站,综艺节目的数字视频收视取得很好的份额。但从总量来讲,其他一些依附于电视台的网站跟第三方视频网站有非常大的差距。那么这些第三方视频网站,不仅在PC、移动端占据很主导的地位,他们还播放一些电视频道主流的热点的节目,所以我们非常有必要进行跨屏分析,帮助电视台找到观众增量在什么地方,完整展示电视应该有的收视率。
  2015年1月,Kantar Media集团战略投资了comScore,在Kantar完成投资之后,我们工作重心放在跨屏测量的领域。我们两家第一个试点的区域在西班牙。2015年8月,comScore开始探讨与CSM进行跨屏的合作。希望基于中国市场特殊的国情,例如电视台很少有自己很大的官方网站这一现实情况,探索有中国特色的跨屏测量的方法。从目前的进展来看,第一阶段先利用comScore在PC上的样本,以及PC端加码的方法进行第一期的非排重的到达的计算;第二期会加入移动端的数据,目前我们也在跟视频网站洽谈移动端加码;第三阶段,还可以加入视频网站OTT端一些容量,进一步获取视频的播放时长的指标之后,获得总收视的数据。在我们实现了非排重跨屏之后,下一个目标是加入CTR的合作,把移动端收视也加进来,然后实现跨屏总收视。
  过去几年CSM一直努力致力于三个方面的探索,一是收视实时化,二个是穷尽电视端的收视,三是实现跨屏总收视。穷尽电视端的收视方面,我们已经在15个城市推出了电视时移收视率产品。收视实时化方面,6月全国平台上线,7月52城市平台上线,今后还会有35城市和重点城市的实时收视平台上线,数据和功能不断优化。跨屏总收视领域,我们最终的目标是要实现非排重的到达评估,正式向市场推出跨屏报告。
  跨界融合方面,我们一直致力于打通消费数据、完善社交媒体数据和机顶盒数据个人化三个领域。今年我们在打通消费数据领域有一个比较大的举措,我们将20省的和4个直辖市的收视数据与KWP消费数据进行融合,应该说在跨界融合方面,我们的目标就是以电视收视率为核心,融合消费数据、其他的能融合的数据,例如互联的数据,形成以电视为中心的涵盖其他各个领域的数据。机顶盒的数据,我们和歌华在合作,把广电机顶盒数据和IPTV机顶盒数据融合,如何把机顶盒的数据个人化,这里有一套复杂的方法,我们仍在紧密的合作过程当中。所有的这些工作应该说与CSM的目标都是一致的,是为电视传播做加法、做增量,谢谢大家!
 

您的需求将被转发到CSM的邮箱

  • 我是CSM的客户
  • 姓名:
  • 公司:
  • 职务:
  • 领域:
  • 所在城市:
  • 电子信箱:
  • 手机:
  • 需求信息:
  • 预计项目额度(人民币)