转自:大数据梦想家?
这篇文章就是被洗过的,洗的方式简单粗暴,直接将几篇相关文章进行混剪!这还应该算是洗的质量比较好的,只是打乱了文章段落,没有打乱文章的整体脉络。来,大家围观下这篇被洗后的文章!
01什么是用户画像用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。
在产品早期和发展期,会较多地借助用户画像,帮助产品人员理解用户的需求,想象用户使用的场景,产品设计从为所有人做产品变成为三四个人做产品,间接的降低复杂度。用户画像使用的标签是网络标签的一种深化应用方式,是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,用户标签是基于用户的特征数据、行为数据和消费数据进行统计计算得到的,包含了用户的各个维度。而所谓的用户画像就是可以用用户标签的集合来表示的,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。
02用户标签的分类
5、按照数据提取和处理的维度,可以将标签分为事实标签,模型标签,预测标签。这种用户标签的分类方式更多是面向技术人员使用,帮助他们设计合理的数据处理单元。事实标签。既定事实,直接从原始数据中提取,描述用户的自然属性、产品属性、消费属性等,事实标签其本身不需要模型与算法,实现简单,但规模需要不断基于业务补充与丰富,比如:姓名、购买的产品品类、所在小区等。模型标签。对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。预测标签。参考已有事实数据,基于用户的属性、行为、位置和特征,通过机器学习、深度学习以及神经网络等算法进行用户行为预测,针对这些行为预测配合营销策略、规则进行打标签,实现营销适时、适机、适景推送给用户。例如试用了某产品A后预测可能还想买产品B并推送购买链接给该用户。
03用户画像标签体系的建立
1、什么是标签体系用户画像是对现实用户做的一个数学模型,在整个数学模型中,核心是怎么描述业务知识体系,而这个业务知识体系就是本体论,本体论很复杂,我们找到一个特别朴素的实现,就是标签。标签是某一种用户特征的符号表示。是一种内容组织方式,是一种关联性很强的关键字,能方便的帮助我们找到合适的内容及内容分类。(注:简单说,就是你把用户分到多少个类别里面去,这些类是什么,彼此之间有什么关系,就构成了标签体系)标签解决的是描述(或命名)问题,但在实际应用中,还需要解决数据之间的关联,所以通常将标签作为一个体系来设计,以解决数据之间的关联问题。一般来说,将能关联到具体用户数据的标签,称为叶子标签。对叶子标签进行分类汇总的标签,称为父标签。父标签和叶子标签共同构成标签体系,但两者是相对概念。例如:下表中,地市、型号在标签体系中相对于省份、品牌,是叶子标签。
用户画像标签体系创建后一般要包含以下几个方面的内容
(1)标签分类用户画像标签可以分为基础属性标签和行为属性标签。
(3)标签命名&赋值我们用一张图来说明一下命名和赋值的差别,只要在构建用户标签的过程种,有意识的区别标签命名和赋值足矣,不再赘述。
值得注意的是,一种标签的属性可以是多重的,比如:个人星座这个标签,既是固有属性,也是推导属性,它首先不以个人的意志为转移,同时可以通过身份证号推导而来。即便你成功了建立用户画像的标签体系,也不意味着你就开启了用户画像的成功之路,因为有很大的可能是这些标签根本无法获得,或者说无法赋值。标签无法赋值的原因有:数据无法采集(没有有效的渠道和方法采集到准确的数据,比如用户身份证号)、数据库不能打通、建模失败(预测指标无法获得赋值)等等。2、标签体系结构标签体系可以归纳出如下的层级结构。
(1)原始输入层主要指用户的历史数据信息,如会员信息、消费信息、网络行为信息。经过数据的清洗,从而达到用户标签体系的事实层。(2)事实层事实层是用户信息的准确描述层,其最重要的特点是,可以从用户身上得到确定与肯定的验证。如用户的人口属性、性别、年龄、籍贯、会员信息等。(3)模型预测层通过利用统计建模,数据挖掘、机器学习的思想,对事实层的数据进行分析利用,从而得到描述用户更为深刻的信息。如通过建模分析,可以对用户的性别偏好进行预测,从而能对没有收集到性别数据的新用户进行预测。还可以通过建模与数据挖掘,使用聚类、关联思想,发现人群的聚集特征。(4)营销模型预测利用模型预测层结果,对不同用户群体,相同需求的客户,通过打标签,建立营销模型,从而分析用户的活跃度、忠诚度、流失度、影响力等可以用来进行营销的数据。(5)业务层业务层可以是展现层。它是业务逻辑的直接体现,如图中所表示的,有车一族、有房一族等。3、标签体系结构分类一般来说,设计一个标签体系有3种思路,分别是:(1)结构化标签体系;(2)半结构化标签体系;(3)非结构化标签体系。(1)结构化标签体系简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告井喷时比较好用。性别、年龄这类人口属性标签,是最典型的结构化体系。下图就是Yahoo!受众定向广告平台采用的结构化标签体系。
(2)半结构化标签体系在用于效果广告时,标签设计的灵活性大大提高了。标签体系是不是规整,就不那么重要了,只要有效果就行。在这种思路下,用户标签往往是在行业上呈现出一定的并列体系,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。下图是Bluekai聚合多家数据形成的半结构化标签体系。
(3)非结构化标签体系非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。还有Facebook用的用户兴趣词。4、用户画像标签层级的建模方法用户画像的核心是标签的建立,用户画像标签建立的各个阶段使用的模型和算法如下图所示。
原始数据层。对原始数据,我们主要使用文本挖掘的算法进行分析如常见的TF-IDF、TopicModel主题模型、LDA 等算法,主要是对原始数据的预处理和清洗,对用户数据的匹配和标识。事实标签层。通过文本挖掘的方法,我们从数据中尽可能多的提取事实数据信息,如人口属性信息,用户行为信息,消费信息等。其主要使用的算法是分类和聚类。分类主要用于预测新用户,信息不全的用户的信息,对用户进行预测分类。聚类主要用于分析挖掘出具有相同特征的群体信息,进行受众细分,市场细分。对于文本的特征数据,其主要使用相似度计算,如余弦夹角,欧式距离等。模型标签层。使用机器学习的方法,结合推荐算法。模型标签层完成对用户的标签建模与用户标识。其主要可以采用的算法有回归,决策树,支持向量机等。通过建模分析,我们可以进一步挖掘出用户的群体特征和个性权重特征,从而完善用户的价值衡量,服务满意度衡量等。预测层。也是标签体系中的营销模型预测层。这一层级利用预测算法,如机器学习中的监督学习,计量经济学中的回归预测,数学中的线性规划等方法。实习对用户的流失预测,忠实度预测,兴趣程度预测等等,从而实现精准营销,个性化和定制化服务。不同的标签层级会考虑使用对其适用的建模方法,对一些具体的问题,有专门的文章对其进行研究。05用户画像的应用场景用户画像,即用户信息标签化,是企业通过收集与分析消费者基本属性、社会属性、生活习惯、行为特征等主要信息的数据之后,抽象出用户的商业全貌。大数据的发展让各行各业都日益聚焦于怎样利用大数据了解用户需求,实现精准营销,进而深入挖掘潜在的商业价值。不同的企业做用户画像有不同的战略目的,广告公司做用户画像是为精准广告服务,电商做用户画像是为用户购买更多商品,内容平台做用户画像是推荐用户更感兴趣的内容提升流量再变现。企业对用户的了解越多,就越容易为用户提供所需产品和服务,从而提升用户的粘性,提升企业盈利能力。
1、了解用户不得不承认大数据正在改变着各行各业,以前了解用户主要是通过用户调研和访谈的形式,形式单一、数据收集不全、真假难辨。尤其是在产品用户量扩大后,调研的效用降低,以不能满足企业发展的要求。利用大数据技术,基于标签体系构建用户的360°画像,从用户的各个维度进行分析,了解用户是谁,他们有什么特征,他们的兴趣偏好,而这些信息的研究是企业制定营销策略、服务策略,提升用户满意度的重要依据。2、精准营销要做到精准营销,数据是最不可缺的存在。以数据为基础,建立用户画像,利用标签,让系统进行智能分组,获得不同类型的目标用户群,针对每一个群体策划并推送针对性的营销。精准化营销具有极强的针对性,是企业和用户之间点对点的交互。它不但可以让营销变得更加高效,也能为企业节约成本。3、产品创新在用户需求为导向的产品研发中,企业通过获取到的大量目标用户数据,进行分析、处理、组合,初步搭建用户画像,做出用户喜好、功能需求统计,从而设计制造更加符合用户核心需求的新产品,为用户提供更加良好的体验和服务。4、渠道优化当前的零售企业的销售渠道有多种,比如:自营门店、经销商代理、电商平台、电商APP等,每个渠道的用户群体的消费能力、兴趣偏好可能是不一样的,通过用户画像可以让合适的产品投放在合适的渠道投放,从而增加销售量,这是目前零售行业惯用的方法。5、个性推荐众所周知,今日头条是个个性化的新闻推荐引擎,在今日头条CEO张一鸣看来,算法是《今日头条》这款兴趣推荐搜索引擎应用的核心,这也是与传统媒体最本质的区别,今日头条之所以能够非常懂用户,精准推荐出用户所喜好的新闻,完全得益于算法,而正是精准推荐,使得今日头条在短短两年多的时间内拥有了2.2亿用户,每天有超过2000万用户在今日头条上阅读自己感兴趣的文章。06用户画像的分类从画像方法来说,可以分为定性画像、定性 定量画像、定量画像
从应用角度来看,可以分为行为画像、健康画像、企业信用画像、个人信用画像、静态产品画像、旋转设备画像、社会画像和经济画像等。07用户画像需要用到哪些数据一般来说,根据具体的业务内容,会有不同的数据,不同的业务目标,也会使用不同的数据。在互联网领域,用户画像数据可以包括以下内容:(1)人口属性:包括性别、年龄等人的基本信息(2)兴趣特征:浏览内容、收藏内容、阅读咨询、购买物品偏好等(3)消费特征:与消费相关的特征(4)位置特征:用户所处城市、所处居住区域、用户移动轨迹等(5)设备属性:使用的终端特征等(6)行为数据:访问时间、浏览路径等用户在网站的行为日志数据(7)社交数据:用户社交相关数据
Qunar的画像数据仓库构建都是基于Qunar基础数据仓库构建,然后按照维度进行划分。
08用户画像的作用在互联网、电商领域用户画像常用来作为精准营销、推荐系统的基础性工作,其作用总体包括:(1)精准营销:根据历史用户特征,分析产品的潜在用户和用户的潜在需求,针对特定群体,利用短信、邮件等方式进行营销。(2)用户统计:根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用户数量、分布;分析不同用户画像群体的分布特征。(3)数据挖掘:以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,提升服务精准度。(4)服务产品:对产品进行用户画像,对产品进行受众分析,更透彻地理解用户使用产品的心理动机和行为习惯,完善产品运营,提升服务质量。(5)行业报告&用户研究:通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析根据用户画像的作用可以看出,用户画像的使用场景较多,用户画像可以用来挖掘用户兴趣、偏好、人口统计学特征,主要目的是提升营销精准度、推荐匹配度,终极目的是提升产品服务,起到提升企业利润。用户画像适合于各个产品周期:从新用户的引流到潜在用户的挖掘、从老用户的培养到流失用户的回流等。
总结来说,用户画像必须从实际业务场景出发,解决实际的业务问题,之所以进行用户画像,要么是获取新用户,要么是提升用户体验、或者挽回流失用户等具有明确的业务目标。
另外关于用户画像数据维度的问题,并不是说数据维度越丰富越好,总之,画像维度的设计同样需要紧跟业务实际情况进行开展。09用户画像的体系架构按照应用系统分层设计的原则,基于标签体系的用户画像的体系结构可以分为:数据源层、数据采集层、数据建模层、数据应用层,行业应用层等。
行为类型权重:用户浏览、搜索、收藏、下单、购买等不同行为对用户而言有着不同的重要性(偏序关系),该权重值一般由运营人员或业务来决定;时间衰减:用户某些行为受时间影响不断减弱,行为时间距现在越远,该行为对用户当前来说的意义越小,采用牛顿冷却定律;行为次数:用户标签权重按天统计,用户某天与该标签产生的行为次数越多,该标签对用户的影响越大。公式:t=初始温度×exp(-冷却系数×间隔的时间),实际应用中,初始温度为1就行,间隔的时间为今天与产生行为那天的天数,或者小时数都行,根据业务进行调整,冷却系数的业务来决定,或者通过数据分析而来。TF-IDF计算标签权重:tf为某标签在该用户出现频率,idf为某标签在全部标签中的稀缺程度。5、标签挖掘标签挖掘,即对用户标签体系中的用户数据进行挖掘,形成用户标签,这个过程也叫标签生产。标签的生产方式主要有以下两种:①基于规则定义的标签生产方式,即根据固定的规则,通过数据查询的结果生产标签,重点在于如何制定规则。②基于主题模型的标签生产方式,主题模型最开始运用于内容领域,目的是找到用户的偏好,在用户标签中我们可以参照分类算法将用户进行分类、聚类,使用关键词的算法挖掘用户的偏好,从而生产标签。6、数据可视化数据可视化是基于标签体系的用户画像的重要应用, 通过详实、准确对用户的各类标签数据进行汇集和分析,并以图片、表格等可视化手段帮助企业全面了解用户的基础信息,用户关系情况,用户经济情况、用户偏好情况、健康情况、饮食情况等信息。同时,利用数据标签体系的用户画像可视化技术,通过对用户关系数据、用户内容数据、用户行为等数据进行可视化展示,能够帮助企业管理人员、业务人员全面了解用户,了解用户是谁,他们有什么特征,他们的兴趣偏好等,从而为智能推荐、精准营销、产品和服务创新、渠道优化等业务提供支撑。
<END>
??
相关文章(必读推荐):数据中台:基于标签体系的360°用户画像9张图,把“标签体系”讲得明明白白的!聊聊领域分析,谈谈业务建模!数据中台为什么要建标签体系,分类它不香吗?数据中台即服务——数据中台的四大支柱