社交网络|IP数据挖掘在社交网络领域应用!( 二 )


个体用户画像研究
做个体用户画像研究遇到的挑战主要有如下三方面:其一 , 如何充分利用腾讯各种丰富的数据资源及之间的联系?其二 , 如何使用户画像适应各种不同的应用场景?其三 , 如何高效的处理海量的用户数据(超过10亿的QQ用户超过千亿级别的各类日志数据) ?面对这些挑战 , 相应的解决方案如下:
针对不同的底层数据类型设计特定的挖掘算法挖掘用户的行为特征形成底 层标签 。 综合考虑不同数据来源的形成更上层的抽象用户标签
建立完善的用户画像标签体系结构从不同维度、粒度对用户进行描述 。
搭建用户画像挖掘系统基于大规模存储和机器学习计算平台定期对全 量用户数据进行计算和挖掘并提供用户标签的使用和查询服务 。
用户画像挖掘结果
个人用户画像研究的结果就是把结构化数据 , 文本分类 , LBS数据 , 社交网络传播扩散这些挖掘之后形成一个比较完整的画像 , 比如说人口的一些基础属性如年龄、家乡、兴趣等 。 同时也会对用户婚姻状况来做一个判断 。 有了这些数据之后 , 就可以基于这些用户数据去做很多社交征信工作 。
社交网络拓扑的应用
【社交网络|IP数据挖掘在社交网络领域应用!】社交网络拓扑的应用无外乎有两种 , 其一是是判断拓扑的类型 , 其二是研究这些类型在这个关系链里的影响力 。 比较有标志性的拓扑类型有三角形和心型两种结构 。