回声效应度量网络

数据挖掘 r 图表 社会网络分析 绘图
2022-02-20 03:05:41

我一直在从事数据科学项目,我正在尝试建立一个指标来衡量一个源在网络中的近交程度。我们希望将此应用于情报报告,其中文件倾向于引用其他来源而不知道固有的偏见。想想 WBD 伊拉克,一份情报报告中的一个小脚注导致了二阶和三阶效应,使该信息获得了比它应得的更多的基础——它创造了一个回声室。

在将其应用于情报报告之前,我们决定使用引文网络来展示能力。我们使用关键字“网络科学”获取了前 200 个资源,按相关性排序。然后我们构建了两个边列表:首先,我们构建了一个源边列表,其中包含一个“ID”列和一个带有源名称的列。其次,我们构建了一个引文边缘列表,其中包含一个“ID”列和一个包含每个来源引文的列。因此,我们有 200 个来源和大约 5,000 个引用的列表。

我们的代码合并了数据集,以便每个来源的每个引用都具有正确的 ID,然后我们绘制它。但是,我们正试图将其绘制为 DAG。在我们的伪代码中,我们尝试了两次都不成功。我们计划在我们可以制作一个 DAG 以达到我们对回声效果的度量点之后进行传递缩减。

两个问题: 1)我们是否正确合并了数据,还是应该在前端做更多的事情?
2) 我们需要研究如何绘制 DAG 以及如何执行传递归约。

# Reading the Data into R
cit.citations <- read.csv(file.choose())
cit.sources <- read.csv(file.choose())

# Merge the Data Frames
cit.total <- merge(cit.sources, cit.citations, by="ID")

# List all the sources
sources.vertices <- cit.total$Sources
sources <- (as.character(sources.vertices))

citation.edges <- cit.total$Citations
citations <- (as.character(citation.edges))

total <- rbind(sources,citations)

# Redefining the Data Frame into a Network Object
net.cit.obj <- graph_from_data_frame(d = cit.total, directed=TRUE)

# Network - using dplyr package
cit.test <- dplyr::inner_join(cit.sources,cit.citations, by = "ID")[,-2]
cit.test.network <- as.network(cit.test, directed = TRUE, loops = FALSE)
as.sociomatrix(cit.test.network)
as.edgelist(cit.test.network)
plot(cit.test.network)

具有合并数据的网络 具有合并数据的网络

这是我们合并时的样子

0个回答
没有发现任何回复~