一种基于微博社交的人物关系可视化方法与流程

发布时间:2025-11-26 19:51

本发明涉及一种利用计算机技术的微博社交人物关系分析方法,能够分析多个用户的微博数据以解析用户间的社交关系,并通过可视化的方式展示社交关系网络。

背景技术:

随着社交网络服务的盛行,数以万计的用户每天活跃在社交网络服务中,在网络上创造着丰富的信息,由此构建了一个庞大而复杂多样的虚拟社交网络。在社交网络中,发现社交关系是一个至关重要的问题,涉及到每一个人在社交网络中的自我定位和价值发现。因此,通过分析人们在社交网络服务中的社交行为(发布博文、转发、关注),挖掘社交关系引起了许多学者的关注,其中基于社交网络好友推荐拓展社交关系颇受人们关注。

目前针对社交网络好友推荐有两个主要研究方向:基于用户兴趣的主题推荐,以及基于社交网络拓扑结构的推荐。第一个方向通过分析用户在社交平台上的行为提取用户兴趣爱好,获得高相似度的用户群,在此基础上推荐好友给目标用户,而用户的社交网络拓扑结构很大程度上反映了用户交友倾向,彼此信任度越高的用户越有可能成为朋友,但现有方法未充分利用这些因素。因此,亟需一种结合用户相似度和信任度的好友推荐方法,进一步提高好友推荐的准确度,使社交关系的发现更加精准、更具说服力,并通过可视化的方式展示,使结果更加直观。

技术实现要素:

本发明要克服现有技术中微博社交关系分析方法的准确性及直观性不高的缺点,提供了一种利用计算机技术的微博社交人物关系分析方法,能够分析多个用户的微博数据以解析用户间的社交关系,并通过可视化的方式展示社交关系网络。

一种基于微博社交的人物关系可视化方法,具体步骤如下:

步骤1、根据用户的微博id爬取多名用户的用户信息、关注数据及微博文本。

步骤2、对微博文本数据进行预处理,然后进行中文分词,再运用隐含狄利克雷分布(latentdirichletallocation,以下简称lda)主题模型提取文本主题,并分析微博文本相似性。

步骤3、通过解析用户关注数据、微博文本数据以及微博文本相似度,构建社交关系网络。

步骤4、通过力导引布局、打包布局等可视化方式展示社交关系网络。

本发明的技术构思是:利用爬虫技术,获取用户的微博数据;以jieba分词和lda主题模型对微博文本数据进行处理;根据微博文本、关注数据、用户相似度构建社交关系网络;利用力导引布局、打包布局等可视化方式展示社交关系网络,提高社交关系提取的准确性、客观性。

本发明的优点在于:通过计算用户微博文本相似性,分析用户间是否存在相似的价值取向,以获得高相似度的用户群,通过解析用户在社交平台上的交互行为(@、转发、关注),分析用户间的拓扑关系,以获得高信任度的用户群,并利用有向图构建社交关系网络并通过可视化的方式展示,使社交关系的发现更加准确、客观,具有说服力。

附图说明

图1为本发明的总的流程图。

图2为本发明的力引导布局可视化效果图。

图3为本发明的打包布局的共同关注可视化效果图。

图4为本发明的打包布局的用户a关注可视化效果图。

图5为本发明的打包布局的用户a与用户b共同关注可视化效果图。

具体实施方式

参照附图,进一步说明本发明:

基于微博社交的人物关系可视化方法,包括以下步骤:

步骤1、根据用户的微博id爬取多名用户的用户信息、关注数据及微博文本。

步骤2、对微博文本数据进行预处理,然后进行中文分词,再运用隐含狄利克雷分布(latentdirichletallocation,lda)主题模型提取文本主题,并分析微博文本相似性。

步骤3、通过解析用户关注数据、微博文本数据以及微博文本相似度,构建社交关系网络。

步骤4、通过力导引布局、打包布局等可视化方式展示社交关系网络。

所述步骤2中,首先对获取的微博文本数据进行清洗,删除错误或重复的数据,再使用基于textrank方法的“结巴”(jieba)中文分词对微博文本进行分词,textrank方法主要用于抽取关键词;然后将分词后的微博文本数据通过lda挖掘出文本主题,再通过增量gibbs采样(gibbssampling)算法计算微博文本主题在主题词上的概率分布,gibbs采样是马尔可夫链蒙特卡尔理论(mcmc)中用来获取一系列近似等于指定多维概率分布(比如2个或者多个随机变量的联合概率分布)观察样本的算法;最后,使用jensen-shannon散数的倒数来衡量文本与文本之间的主题相似度:

其中,vi,vj表示微博文本的主题概率分布,sim(vi,vj)表示,js(vi,vj)表示vi,vj的jensen-shannon散度,dkl(vi,vk)表示vi,vj的kullback-leibler散度,zk表示,p(zk|vj)表示。

所述步骤3中,首先,根据用户关注数据,对一个用户u,假设其关注了n个用户,表示为一个用户集合f=(u1,u2,…,un),由u和f组成的社交网络g可表示为有向图g=(f,e),其中e={eij|ui∈f,uj∈f,ui关注uj},表示用户间关注关系的集合;再根据微博文本,如果ui转发了uj的一条微博或者微博中@(提及)他(她),则可以认为两者之间有一条边,为边设定权值,权值大小为两者间的交互次数,此时e就可以表示为e′={eij|ui∈f,uj∈f,ui与uj产生了交互};最后,根据微博文本相似度,若ui与uj之间的文本相似度高于阈值,则可以认为两者存在相似的爱好或价值取向,两者之间有一条边,边的权值为两者的文本相似度,这样e就可以表示为e″={eij|ui∈f,uj∈f,ui与uj存在相似爱好}。

所述步骤4中,通过节点链的力导引方式展示,以节点表示用户,边表示节点间的联系。在节点链视图中,以节点的颜色表示用户的价值取向,若节点的颜色越接近则表示用户的相似度越高;以边的粗细表示用户间交往的次数多少,越粗代表了用户间的交往越频繁。通过打包图可视化方法展示对象间共同关注信息。用大圆包含识别对象的所有共同关注,用中圆包含该对象与其他任一对象的共同关注,用小圆包括不同类别的共同关注。

目前,发现社交关系是社交网络中不可缺少的一个环节。社交网络好友推荐是发现社交关系的重要途径。社交网络好友推荐目前有两个方向,一是基于用户兴趣的主题推荐,二为基于社交网络拓扑结构的推荐。第一个方向通过分析用户在社交平台上的行为提取用户兴趣爱好,获得高相似度的用户群,在此基础上推荐好友给目标用户,而用户的社交网络拓扑结构很大程度上反映了用户交友倾向,彼此信任度越高的用户越有可能成为朋友,但现有方法未充分利用这些因素。本发明提出了一种结合用户相似度和信任度的好友推荐方法,进一步提高好友推荐的准确度,使社交关系的发现更加精准、更具说服力,并通过可视化的方式展示,使结果更加直观。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

网址:一种基于微博社交的人物关系可视化方法与流程 https://m.mxgxt.com/news/view/1904989

相关内容

基于微博社交的人物关系可视化方法.pdf
基于照片的社交关系可视化方法
一种基于社交网络分析用户社交关系的轻量级方法与流程
一种微博中人物关联关系分析方法
一种基于聚合矩阵的多层社交网络可视化方法及系统
一种基于社交媒体平台数据的用户年龄标注方法与流程
基于微博的社交网络用户关系分析.docx
基于人脸匹配的名人励志推荐和社交网络建立方法与系统与流程
基于微博用户行为的兴趣模型构建和可视化方法研究
一种人物关系图谱构建方法与流程

随便看看