新媒体、新技术的发展改变了受众的收听习惯和和对媒介介质的使用习惯,传统的广播听众也逐渐演变成了生产和消费音频产品的用户,相应地,对传统受众的收听行为的测量也应该升级为对音频用户的使用行为的测量。CSM媒介研究顺应市场的需求,适时推出了基于智能手机的虚拟测量仪技术。
基于智能手机的虚拟测量仪技术原理是,通过在手机上安装程序软件,自动接收音频信息,实时转换为不可解读、不可还原的数字音频码,传送到远程后台,再与广播节目数字音频码资源库进行匹配,最终准确识别出收听的频率(图1)。
图1 虚拟测量仪技术实现全流程
与传统的日记卡测量方式得到的数据相比,用虚拟测量仪测量方式得到的数据具有更准确、更精细、更灵敏、更及时和更高投入的特点。因为是自动采集收听的音频信息,所以避免了以往日记卡回忆式填涂带来的人为误差,数据更为准确;测量仪数据精度可以到秒级,收听率数据最小时间单位为1分钟,相比于日记卡的15分钟为间隔单位要精细很多;时间精度的提高使得数据对重大事件、节目调整和广告投放变化的反应更清晰和敏感;同时测量仪数据可以实现隔日提供数据,相比于日记卡的隔周提供,大大缩短了数据提供周期,提高了数据的时效性,自然,这也意味着抽样和维护样本需要更高的投入。
目前,该技术已成功在北京、上海、深圳、南京、广州和无锡六地实现了商用。北京人民广播电台广播发展研究中心主任助理兼受众研究部主任王浩洁女士从技术问答和数据特点两方面对收听测量仪数据进行了正确的解读,此文一经发出,在微信朋友圈广为流传,今转载于此,供广大读者借鉴。
上篇:技术问答篇
2017年1月1日起,北京电台将正式停用以日记卡方式采集的收听率数据,全面启用测量仪收听数据。尽管从2016年7月起,电台就已经开始对内提供测量仪数据作为日常参考,以便完成数据过渡,但对于很多小伙伴来说,只有数据正式开始关系到绩效考核时,才会有切肤之感。时值两套数据更迭之际,我们诚意奉上此篇。
面对测量仪数据,何以解忧?唯有Q&A……
• Q:日记卡用的好好的,为什么非要换测量仪?
A:北京电台从2004年开始正式使用日记卡收听率数据,到目前为止已经使用了整整12年。在这12年间,日记卡为我们的日常工作提供了一个客观的参考工具,但也饱受质疑。主要质疑集中在"人为主观填写"和"样本量不足"两点。新的测量仪方法实现了样本收听行为"被测量",而不是主观填写,很大程度上避免了由于记忆不准造成的"客观误差"。同时,样本量也提高到了1200人。
• Q:为什么还要买索福瑞的数据?不能换一家用?
A:索福瑞和北京电台日记卡数据的合同在2015年年底就已经到期。该公司当时已计划于2016年在北京等地将日记卡数据升级为测量仪数据,因此电台必须更换数据。通过多轮调研,我们发现目前市场上仅有三家公司能够相对稳定地提供收听率测量数据,这三家公司是:索福瑞、尼尔森网联和赛立信。电台在2016年5月,根据政府采购的要求向社会公开招标收听率数据服务项目,也只有这三家公司应标,最终索福瑞中标。
• Q:新的测量仪收集数据的原理是什么?
A:新的测量仪是虚拟测量仪,以用户的智能手机为数据采集终端。在当前社会,只有手机是大多数人不会离身的物品,因此手机被作为虚拟测量仪的载体能保证记录较为完整的听众行为。调查公司会在样本人员的手机上安装一个手机应用。根据调查公司和样本人员的协议,该应用开机自动开启,并保持后台运行。在运行过程中,这个应用会调用手机的麦克风,通过麦克风收集环境当中的声音,并转化成数字音频特征码。这些数字音频特征码实时传回调查公司的服务器。与此同时,公司的音频采集系统会全天24小时不间断同步录下各个开路广播的音频,并将其转化为数字音频特征码。当样本的数字码传回服务器后,专业系统程序会进行后台比对和匹配,如果两个数字码能够匹配,则说明这个样本人员收听了某个频率。
• Q:耳机收听是否能被监测到?
A:调查公司会提供一个小的接口装置,类似于我们常用的耳机大三头换小三头的装置,只要通过这个装置把耳机和手机相连,则通过耳机收听也能够被测量仪监测到。需要注意的是,蓝牙耳机的收听目前尚未纳入监测范围。
• Q:类似于喜马拉雅和蜻蜓那种移动终端上的音频平台的收听能否被监测?
A:如果听众是通过喜马拉雅那样的手机客户端收听广播,只要收听的是直播节目,就可以被监测到。回放形式的收听也能被监测到,但是不能与直播匹配,因为数据传回时有附带有听众收听的时间点信息,该时间点的直播内容和回放内容无法吻合,数据会混乱。回放或者时移收听数据将根据市场需要另行处理及提供。
• Q:车上收听能被监测到吗?如果我在车上打电话或者说微信,占用了麦克风怎么办?
A:车上收听一般都是外放,只要手机在身边就能够被监测到。如果在打电话或者说微信语音,占了手机麦克风,那么数据中会显示样本的收听行为中断。因为即便你边打电话边开着广播,实际上多半的注意力都在打电话而不是收听上,从这个角度来讲,收听行为确实中断了。也正因为如此,测量仪的数据才会比回忆式的日记卡数据更加精确。毕竟回忆式填写中,多半会直接忽略自己打电话或者说语音的细节。
• Q:听说这套测量仪只能安装在安卓手机上,苹果的手机不能装?因为你看苹果商店里都没有这个应用!不通过苹果商店是不可能装软件的,除非越狱!
A:安卓商城里也没有这个应用(手动擦汗)……调查样本的取样遵循严格的统计学要求,采取PPS分层抽样法抽取,是不可能把应用开放在应用商城里让人随便下载的。如果能随便下载,大家关注的样本代表性如何保证?测量仪的应用由调查公司派调查员进入到被选取的样本家中现场安装。关于苹果手机,之所以能装,是因为调查公司购买了苹果的企业账号资质,样本的苹果手机是按照企业内部员工装内部小范围应用软件的形式来实现的,既不用越狱,又能够保证后台对麦克风的调用。
• Q:你们把样本户的环境声音都录下来了,是否会侵犯对方隐私?
A:样本的环境声音是通过麦克风录在手机里,然后通过软件转换成数字特征码回传。这一转换过程是不可逆的,也就是说不能把数字特征码再还原成音频。原因很简单,为了不占用样本手机空间并能快速实时回传并且节省流量,音频信息在转换成数字特征码时会被压缩和删减。这个过程中损失的信息无法找回。
• Q:这个测量收听的APP装在手机上得耗多大的流量啊!得多耗电啊!万一断网了或者手机没电了不就监测不到了吗?
A:关于流量,正如我们之前问题中提到的,测量仪收集到的数据是转换成数字特征码的,这种信息体量上比音频要小得多得多,传输流量损耗降到了最低。此外,调查公司会额外向样本户支付一定的流量补贴。关于断网,如果网络中断,但手机还有电,应用就可以仍然在后台收集数据,一旦再次联网,就会把积累的数据再传输过去。因此,虽然是实时回传,但我们并不能实时看到数据变动,仍然会有大概一天半的数据延迟。关于耗电,从目前的耗电测算看,属于正常手机应用的耗电水平。如果手机没电关机了,那么确实不能继续监测。但作为最常用的随身物品,相信各位小伙伴能够体会手机忽然没电的焦虑和随身携带充电宝的重要性,并推己及人。
• Q:如果样本收听行为是"被监测",那么样本在哪儿听的信息怎么被记录?比如车上听、在家听怎么区分?
A:当前智能手机都有GPS定位功能。样本在回传数据时,会附带回传收听过程中的位置、移动速度等信息。调查公司会基于这些信息,结合样本的家庭地址、单位地址等信息,用一套算法来推算样本是在路上收听还是在家中收听。随着GPS定位精准度的提高和算法的不断改进,对收听状态的推断将越来越精准。
• Q:测量仪能区分收听终端吗?比如是通过车载开路广播收听,还是通过音频聚合平台收听?
A:不能。除非被测样本自己记录,否则目前市面上任何一套数据都不能通过技术解决样本到底在用什么终端听的这个问题。收听终端的使用,是听众长期收听行为的一项,如果没有特别的个性化要求,可以通过截面式的单项问卷调查结果来回答这个问题。
• Q:未来测量仪数据功能能扩展吗?比如监测离线收听等。
A:从技术的角度来讲,对回放收听的监测是有数据基础的。因为当前虚拟测量仪收集了样本收听音频的全部信息,包括实时直播和离线回放。未能匹配实时直播的数据仍然沉淀在数据库中,并未删除。未来如果有实际需要,可再次提取数据进行离线回放匹配。不仅如此,对于聚合音频平台上的其他非广播内容,例如单独为网络电台制作的、不在开路频率播出的音频内容,只要在服务器短采集这些内容的音频特征码,然后与样本收听特征码定向匹配,就能够知道这些内容的收听情况。
下篇:数据特点篇
2017年1月1日起,北京电台将正式停用以日记卡方式采集的收听率数据,全面启用测量仪收听数据。从2016年7月起,电台就已经开始对内提供测量仪数据作为日常参考,以便完成数据过渡。在数据过渡期,我们对测量仪数据进行了观察。上篇旨在解决小伙伴们对测量仪技术方面的疑问,下篇将尝试总结测量仪数据的基本特性。
测量仪收听数据是传统的日记卡收听数据的升级换代产品。二者在很多地方是一脉相承的,两套数据有这样一些相同点:首先,不管是测量仪还是日记卡,基本的调查方式仍然是抽样调查,而不是普查。其次,两套数据均是连续性调查数据,是对听众365天24小时收听行为的调查。第三,样本替换均为规律性、渐进式替换,日记卡每周换户2%,一年内换完,测量仪年更新率为15%-25%。根据样本填写质量、参与调查历史等进行渐进式的样本替换,可避免造成因为样本大面积替换而产生的数据异常波动。第四,数据的指标体系完全一致,我们日常使用的收听率、市场份额、平均到达率等指标方面没有任何变化。
既然测量仪数据和日记卡数据都是听众收听行为的数据反馈,对同一个对象进行测量,又为什么会出现不同的数据?这主要是因为数据收集的方法不同、样本量不同、数据精度不同等因素造成。
1、终端:智能手机作为数据收集终端提高样本进入门槛
测量仪是通过安装在智能手机上的应用来完成数据收集的。这一收集方式事实上为样本的选取带来了一定的进入门槛。与日记卡相比,虚拟测量仪数据的样本框也确实出现了一些变化。首先是样本年龄的下限从10岁提升到了15岁,上不封顶。调查公司认为,通过智能手机"自主"选择收听的行为需要有一定的年龄底线,因此把样本的最低年龄提升到了15岁。15岁以下的儿童则被视为对智能手机没有完全的使用掌控权。其次,由于数据是通过智能手机采集的,不可否认的是,老年人对于智能手机的接触相对较少,且年龄越大,接触程度越低。因此,不排除部分老年听众样本,尤其是年龄在80岁以上的样本,在学习如何操作智能手机方面有难度,这对调查公司的具体执行能力提出了考验。作为数据使用方,我们也需要密切观察老年听众收听数据的变化来判断数据质量。
2、样本:不仅仅是样本量增加
与日记卡相比,测量仪数据在样本量上有了明显的提升。日记卡时代,索福瑞收听数据在北京地区的样本量是"300户",被抽取的家庭户中10岁以上符合条件的所有家庭成员均为样本。按照平均每户2-4人的规模,实际样本人数在700-900人之间浮动。按户抽取样本是因为,按固定的户籍门牌抽样能很好地完成"随机"抽取这一要求,且能够保证样本在各个城区按照人口密度等特点进行合理分布,从而提高样本代表性。新的测量仪数据仍然按户抽取样本。但抽取的是900-1200户,每户不再抽取所有人,而是仅抽取符合样本框条件的一个样本,所以样本量可以表述成"900-1200户"或"900-1200人"。
日记卡时代,当一户所有人口都被抽取时,尽管不同年龄、性别的家庭成员会有不同的生活场景,但仍然有很多全家共同出现的生活场景。换句话说,一个家庭就类似于簇生的蘑菇,样本之间会有部分行为相似。例如在早上,可能丈夫、妻子和孩子都在车上收听同一个频率。客观上会放大一些收听数据。测量仪则一户仅抽取一人。同样三个样本,日记卡时代可能因为这三个样本是同一个家庭的,于是监测到的情况是在同一个场景下收听了同一个内容。测量仪时代,三个样本就是三个家庭户,三个家庭户出现收听行为差异的可能性大大提高。这样的改变会让收听行为的多元化在数据方面表现的更为清晰,但同时也意味着数据的复杂性提高了。
3、行为:突破刻板印象,多维划分人群,呈现多元收听行为
在谈到收听行为的多元化趋势时,首先需要强调的是,并非收听测量技术改变了听众的收听行为,而是以前数据收集方式无法清晰展现这种客观存在的变化,决不能倒因为果。
日记卡时代,8分钟的填涂原则和回忆式填写的疏漏让收听数据上的马太效应有所放大。部分频率、节目的知名度通过"误填",在数据上转化成了实际收听,有夸大的成分。而部分听众对非知名频率、节目和"低谷"时段的漏填和多远化选择也被掩盖在了回忆式填写的误差当中。测量仪还原了这种多元化的选择。比较明显的是高峰时段收听率的回落和低谷时段收听率上涨。如果更细致的观察数据,我们会发现,以往对细分人群关于生活状态的假设能够更好地在测量仪数据中得到佐证。例如,如同样是18-22岁年龄段的听众,学生和非学生在测量仪中收听的高峰和低谷就会出现区别。日记卡数据,这一区别则并不稳定和显著。这种数据上的区别可以进一步佐证我们对于不同人群划分的准确性,并为有针对性地制作内容产品提供有力的数据参考。另一个发现是,传统概念上的早晚高峰正在发生变化。测量仪数据显示,部分频率晚上8点以后的收听率甚至高于晚高峰。进一步拆解数据发现,晚高峰以后的收听人群在人群细分、内容选择等方面有显著差异。测量仪数据比日记卡数据更清晰地显示出细分人群的多元化收听行为,数据对收听行为的描述犹如从人像绘画提升到了人像照片。这为我们重新思考频率、节目、时段、人群价值带来了契机,也提示我们需要摆脱对广播市场的刻板印象,按照真实的市场变化趋势进行自我调整。
4、精度:更快数据反馈、更细数据颗粒、更个性化的参考
测量仪数据比日记卡数据的一个重要提升在于数据精度。日记卡数据的最小时间间隔是15分钟,测量仪数据最小间隔是1分钟。日记卡时代,一些时长低于15分钟的节目无法获取精确的数据,只能无奈地被包含在大时段数据当中。数据颗粒度精确到以1分钟为单位后,关于听众流动的数据将会逐渐成为新的分析领域。以往日记卡数据很难做听众流动分析,因为在15分钟这个尺度内,听众的行为是处于"黑箱"状态的,数据无法准确展现听众开关机或流出流入的确切时点和方向。测量仪数据则能够精确地展现听众流动的状态,这将为我们研究节目编排提供有力的数据支持。
从数据提供的频次来讲,除周末外,测量仪数据能够做到昨日数据今日下午拿到。这样的数据提供频次为我们的很多工作带来了便利条件。例如,突发事件的报道在隔天就能看到报道在数据方面的效果反馈。如果一个阶段性的策划报道,可以在报道执行过程中以收听数据为参考对报道方向、呈现形式等进行过程中的修正。总之,当数据颗粒度越小,精度越高时,我们可观察到的变化会越细微。这种类似于"像素"提升似的变化一方面会为我们的工作带来更多可靠的参考数据,另一方面,我们也需要对这种频繁的、各个尺度上的波动有心理准备。毕竟,精细化数据这个"放大镜"对于优点和缺点的放大是一视同仁的。
5、未来:大数据应用,道阻且长,行则将至
测量仪数据实际上也是借助大数据的处理方式来实现的,例如利用位置信息、移动速度信息等建立算法模型推断样本收听状态就是典型的大数据应用。对于广播从业者而言,复合传播模式逐渐形成传播常态时,对于大数据,尤其是对于听众多渠道收听行为的统和性数据需求越来越强烈。然而当前这方面的大数据存在着各种各样的问题。例如不同音频聚合平台之间的数据壁垒如何打破、单个音频聚合平台后台数据真实性的如何保证、听众通过不同渠道收听的行为数据如何实现排重和同源……
问题很多,现实障碍很多,但这不能成为阻止前行的借口。最近人民网研究院发布了《中国媒体融合传播指数报告》。报告中的广播部分的指数体系除收听率外,还引入了微博、微信、入驻聚合新闻客户端、入驻音频客户端和媒体自有APP等项。在这一报告的电台榜单中,北上广深电台无一能进入前十。尽管这个指标体系的构建尚有诸多未向公众公开的细节,例如权重如何确定,数据如何收集等。但这样的分析视野和实践值得学习。同时,也应该看到,其他地方电台在微信、微博等新的传播领域上确实领先于我们,这样的差距不容忽视。
收听数据的应用伴随着广播行业的发展不断进步,这条路溯洄从之,道阻且长。然荀子《修身》有云,路虽弥,不行不至;事虽小,不做不成。数据应用同理,客观看待,细致考究,积极实践,行则将至。
All rights reserved © 2011-2023 CSM Media Research 京ICP备05047992号-5
京公网安备 11010502035133号 法律声明诚聘英才联系我们隐私保护