交通事故数据挖掘模型是什么，论文 arxiv

时间：2022-10-05 04:54:08来源：法律常识

网络社区检测20年;
复杂预测的拓扑结构;
使用图神经网络预测和缓解非局部级联故障;
有向符号网络中符号beta模型的有效估计和推理;
基于节点邻度频率的局部图嵌入;
具有不同储蓄倾向的经济市场的动力学模型;
具有异构互易性的随机网络;
群体形成中的分歧和两极分化;
应用于俄亥俄州 COVID-19 流行病的无似然动态生存分析;
Twitter 对竞选伙伴选择的政治影响：社会网络分析和语义分析——回顾;
伦敦疫情后更安全的交通恢复——车祸时空数据挖掘;
在 Twitter 上检测反疫苗用户;
从社会网络结构中识别社交媒体上有影响力的经纪人;

网络社区检测20年

原文标题： 20 years of network community detection

地址： http://arxiv.org/abs/2208.00111

作者： Santo Fortunato, Mark E. J. Newman

摘要：网络数据分析中的一个基本技术挑战是自动发现社区 - 紧密连接或共享相似特征或角色的节点组。在这篇评论中，我们回顾了过去 20 年来该领域的进展。

复杂预测的拓扑结构

原文标题： Topological structure of complex predictions

地址： http://arxiv.org/abs/2207.14358

作者： Meng Liu, Tamal K. Dey, David F. Gleich

摘要：复杂的预测模型（例如深度学习）是将机器学习、神经网络或 AI 模型拟合到一组训练数据的输出。这些现在是科学中的标准工具。当前一代模型的一个关键挑战是它们是高度参数化的，这使得描述和解释预测策略变得困难。我们使用拓扑数据分析将这些复杂的预测模型转换为代表拓扑视图的图片。结果是可以进行检查的预测图。这些方法扩展到跨不同领域的大型数据集，使我们能够检测训练数据中的标记错误，理解图像分类的泛化，并检查 BRCA1 基因中可能致病突变的预测。

使用图神经网络预测和缓解非局部级联故障

原文标题： Prediction and mitigation of nonlocal cascading failures using graph neural networks

地址： http://arxiv.org/abs/2208.00133

作者： Bukyoung Jhun, Hoyun Choi, Yongsun Lee, Jongshin Lee, Cook Hyun Kim, B. Kahng

摘要：电网中的级联故障 (CF) 在非本地传播；在局部扰动之后，第二次故障可能很遥远。研究非局部CF的雪崩动力学和缓解策略，需要进行数值模拟；但是，计算复杂度很高。在这里，我们首先基于 Motter 和 Lai 模型提出每个节点的雪崩中心性 (AC)，这是与雪崩大小相关的度量。其次，我们在小型网络中使用 AC 训练图神经网络 (GNN)。接下来，经过训练的 GNN 预测更大网络和现实世界电网中的 AC 排名。这个结果可以有效地用于雪崩缓解。我们开发的框架可以在其他复杂的过程中实现，这些过程在大型网络中模拟的计算成本很高。

有向符号网络中符号beta模型的有效估计和推理

原文标题： Efficient estimation and inference for the signed $\beta$-model in directed signed networks

地址： http://arxiv.org/abs/2208.00137

作者： Haoran Zhang, Junhui Wang

摘要：本文提出了一种新的有向符号网络的符号beta-model，该模型在应用领域中经常遇到，但在文献中大部分被忽视。所提出的有符号beta-模型将有向符号网络分解为两个无符号网络的差，并在每个节点中嵌入两个潜在因子，用于状态和输出。负边的存在导致非凹对数似然，并且开发了一步估计算法以促进参数估计，该算法在理论上和计算上都是有效的。我们还开发了一个推理程序，用于在有符号的 beta 模型下进行成对和多节点比较，这填补了节点排名缺乏不确定性量化的空白。建立了置信区间覆盖概率的理论结果，以及多节点比较的错误发现率（FDR）控制。还通过在合成网络和真实网络上进行的大量数值实验来检查符号 beta 模型的有限样本性能。

基于节点邻度频率的局部图嵌入

原文标题： Local Graph Embeddings Based on Neighbors Degree Frequency of Nodes

地址： http://arxiv.org/abs/2208.00152

作者： Vahid Shirbisheh

摘要：我们通过定义节点的某些局部特征和向量表示，然后使用它们通过深度神经网络学习节点的全局定义的度量和属性，提出了一种用于图机器学习和网络分析的局部到全局策略。通过 Breath-First Search 扩展节点度的概念，定义了能够揭示节点重要性的 bf 参数中心性函数的一般族。我们引入了 bf 邻居度数频率 (NDF)，作为将无向图节点局部定义的嵌入欧几里得空间。这产生了节点的矢量化标签，该标签对节点的局部邻域结构进行编码，并可用于图同构测试。我们为我们的构造增加了灵活性，以便它也可以处理动态图。之后，使用广度优先搜索将 NDF 向量表示扩展为两个不同的节点矩阵表示，其中包含有关节点邻域的高阶信息。我们的节点矩阵表示为我们提供了一种可视化节点邻域形状的新方法。此外，我们使用这些矩阵表示来获得适用于典型深度学习算法的特征向量。为了证明这些节点嵌入实际上包含有关节点的一些信息，在一系列示例中，我们表明可以通过对这些局部特征应用深度学习来学习 PageRank 和接近中心性。我们的结构足够灵活，可以处理不断变化的图。最后，我们解释了如何使我们的结构适应有向图。

具有不同储蓄倾向的经济市场的动力学模型

原文标题： Kinetic modeling of economic markets with various saving propensities

地址： http://arxiv.org/abs/2208.00263

作者： Lijie Cui, Chuandong Lin

摘要：在本文中，针对具有同质或非同质储蓄利益的主体人的封闭经济市场提出了两种动力学模型。对于模型 I，交易量取决于交易中任意一对主体人的平均储蓄倾向。对于模型 II，交易由两个交易者的储蓄倾向之间的随机参数控制。此外，在迭代过程中，引入了两种抽样方法来随机选择两个智能体。具体来说，技术 I 是带替换采样，并且更易于编程。技术二是无替换抽样，计算效率更高。使用经济物理学模型和计算方法模拟的固定财富分布之间存在细微差异。通过典型的数值试验验证了模型和方法的准确性和鲁棒性。此外，研究了两组主体人的储蓄倾向对财富分配的影响，并研究了主体人比例的影响。为了定量测量财富不平等，对所有主体人和两组的基尼系数、加尔各答指数和偏差度进行了模拟和详细分析。

具有异构互易性的随机网络

原文标题： Random Networks with Heterogeneous Reciprocity

地址： http://arxiv.org/abs/2208.00348

作者： Tiandong Wang, Sidney Resnick

摘要：社会网络用户表现出多样化的行为和上网习惯。例如，用户回复帖子的倾向可能取决于用户和发帖人。为方便起见，我们将用户分组为聚合的行为模式，重点关注回复或回馈消息的倾向。社会网络中的互惠特征反映了用户之间的信息交换。我们研究了具有异质互惠水平的优先依附模型的属性，给出了模型边数的增长率，并证明了经验度数频率收敛到一个极限分布。这种极限分布不仅是多元规律变化的，而且具有隐规律变化的特性。

群体形成中的分歧和两极分化

原文标题： Disagreement and polarization in group formation

地址： http://arxiv.org/abs/2208.00379

作者： Jiadong Zhu, Yuheng Yao, Yubo Xie, Run-Ran Liu, Jianlin Zhang, Fanyuan Meng

摘要：一致是罕见的例外，而分歧是普遍的。为了研究意见分歧甚至两极分化是如何出现的，我们提出了一个基于主体的模型，通过招募对不同问题持有二元相反意见的新成员来模拟嘈杂的群体形成过程。我们研究了对持有不同意见的群体成员比例的长期影响，以理解分歧有多大。我们发现，无论噪音水平如何，总会出现分歧。此外，随着群体规模的扩大，意见往往会出现两极分化。更重要的是，我们发现有不同意见的群体成员的比例与转移概率矩阵的特征值和特征向量密切相关。通过构建社会网络，我们的工作可以扩展到未来研究社会碎片化和社区结构。

应用于俄亥俄州 COVID-19 流行病的无似然动态生存分析

原文标题： Likelihood-Free Dynamical Survival Analysis Applied to the COVID-19 Epidemic in Ohio

地址： http://arxiv.org/abs/2208.00417

作者： Colin Klaus, Matthew Wascher, Wasiur R. KhudaBukhsh, Grzegorz A. Rempala

摘要：动态生存分析 (DSA) 是一个基于平均场动力学对流行病进行建模的框架，该平均场动力学应用于个体（主体）水平的感染和恢复历史。最近，DSA 已被证明是分析复杂的非马尔可夫流行过程的有效工具，而这些过程很难使用标准方法处理。 DSA 的优点之一是它以简单但不明确的形式表示典型的流行病数据，其中涉及某些微分方程的解。在这项工作中，我们描述了如何借助适当的数值和统计方案将复杂的非马尔可夫 DSA 模型应用于特定数据集。这些想法通过俄亥俄州 COVID-19 流行病的数据示例进行了说明。

Twitter 对竞选伙伴选择的政治影响：社会网络分析和语义分析——回顾

原文标题： The impact of Twitter on political influence on the choice of a running mate: Social Network Analysis and Semantic Analysis — A Review

地址： http://arxiv.org/abs/2208.00479

作者： Immaculate Wanza, Irad Kamuti, David Gichohi, Kinyua Gikunda

摘要：在这个社交媒体的新时代，社会网络正成为互联网上用户生成内容的越来越重要的来源。这些信息资源，包括很多人的感受、意见、反馈和评论，对于大企业、市场、政治、新闻和许多其他领域都非常有用。政治是目前社交媒体网络上最受关注和最受欢迎的话题之一。许多政客使用 Twitter 等微博服务，因为他们在这些网络上有大量的追随者和支持者。政客、政党、政治组织和基金会使用社交媒体网络提前与公民沟通。今天，成千上万的政治团体和政治家使用社交媒体。在这些社交媒体网络上，每个政客和政党都有数百万的追随者，政客们找到了新的和创新的方式来敦促个人参与政治。此外，社交媒体通过提供建议来协助政治家进行各种决策过程，例如根据以往经验制定政策和战略，为特定选区推荐和选择合适的候选人，为党内的特定职位推荐合适的人选，以及除其他外，根据公民对各种问题和争议的情绪发起政治运动。这项研究是对 Twitter 平台上使用社会网络分析 (SNA) 和语义分析 (SA) 来研究政治领导人的支持者网络的回顾，因为它可以在预测他们的政治未来时帮助决策。

伦敦疫情后更安全的交通恢复——车祸时空数据挖掘

原文标题： Safer Traffic Recovery from the Pandemic in London — Spatiotemporal Data Mining of Car Crashes

地址： http://arxiv.org/abs/2208.00548

作者： Kejiang Qian, Yijing Li

摘要：为了通过智能地改善道路安全来支持伦敦从大流行中更安全地恢复，本研究在回答两个主要研究问题的基础上，调查了涉及年龄的车祸和影响因素的时空模式：（1）“什么是空间和时间2019 年和 2020 年两个典型年份伦敦的车祸模式及其变化，以及影响因素如何发挥作用？”；（2）“按年龄组划分的伤亡时空模式是什么，人们的日常活动如何影响大流行前后的模式”？已经实施了三种方法，即空间分析（网络核密度估计，NetKDE）、因子分析和时空数据挖掘（张量分解），分别用于识别每周和每天的车祸的时间模式，检测车祸’热点，并更好地理解公民日常活动对大流行前后碰撞模式的影响。从研究中发现，车祸主要集中在伦敦市中心，尤其是密集的兴趣点（POI）中心附近的繁忙地区； POI 作为市民日常活动和旅行行为的反映器，在通过地理探测器对相互作用进行进一步评估后，有助于更好地理解事故模式；撞车事故的伤亡模式因年龄组而异，POI 与相应年龄组的撞车事故模式之间存在独特的关系。总之，该论文对伦敦的车祸及其伤亡模式进行了深入的探索性分析，以促进在 COVID-19 后实现大流行后更安全恢复的部署政策。

在 Twitter 上检测反疫苗用户

原文标题： Detecing Anti-Vaccine Users on Twitter

地址： http://arxiv.org/abs/2110.11333

作者： Matheus Schmitz, Goran Murić, Keith Burghardt

摘要：最近由在线叙述驱动的疫苗犹豫不决大大降低了疫苗接种策略的功效，例如针对 COVID-19 的疫苗接种策略。尽管医学界对可用疫苗的安全性和有效性达成了广泛共识，但大量社交媒体用户继续被有关疫苗的虚假信息所淹没，犹豫不决或不愿接种疫苗。本研究的目的是通过开发一个能够自动识别负责传播反疫苗叙述的用户的系统来更好地理解反疫苗情绪。我们引入了一个公开可用的 Python 包，该包能够分析 Twitter 个人资料，以评估该个人资料在未来分享反疫苗情绪的可能性有多大。该软件包使用文本嵌入方法、神经网络和自动数据集生成构建，并在数百万条推文上进行了训练。我们发现该模型可以在反疫苗用户发布反疫苗标签或关键字之前长达一年准确地检测到他们。我们还展示了文本分析如何通过检测 Twitter 上的反疫苗传播者与普通用户之间的道德和情感差异来帮助我们理解反疫苗讨论的示例。我们的研究结果将帮助研究人员和政策制定者理解用户如何成为反疫苗者以及他们在 Twitter 上讨论的内容。政策制定者可以利用这些信息进行更有针对性的运动，以揭穿有害的反疫苗接种神话。

从社会网络结构中识别社交媒体上有影响力的经纪人

原文标题： Identifying Influential Brokers on Social Media from Social Network Structure

地址： http://arxiv.org/abs/2208.00630

作者： Sho Tsugawa, Kohei Watabe

摘要：识别给定社会网络中的影响者已成为各种应用的重要研究问题，包括加速病毒式营销中的信息传播以及防止虚假新闻和谣言的传播。文献中包含大量关于识别有影响力的源传播者的研究，这些传播者可以将自己的消息传播到许多其他节点。相比之下，可以将其他节点的消息传播到许多节点的有影响力的经纪人的识别尚未得到充分探索。理论和实证研究表明，有影响力的来源传播者和经纪人的参与是促进大规模信息传播级联的关键。因此，本文探讨了从给定社会网络中识别有影响力的经纪人的方法。通过使用三个社交媒体数据集，我们通过与有影响力的来源传播者和从中心性度量获得的中心节点进行比较来研究有影响力的经纪人的特征。我们的结果表明（i）大多数有影响力的来源传播者不是有影响力的经纪人（反之亦然），并且（ii）在 Twitter 数据集中，中心节点和有影响力的经纪人之间的重叠很小（小于 15%）。我们还解决了从中心性度量和节点嵌入中识别有影响力的经纪人的问题，并检查了社会网络特征在经纪人识别任务中的有效性。我们的结果表明（iii）虽然单一的中心性度量不能很好地表征有影响力的经纪人，但使用节点嵌入特征的预测模型的 F_1 得分为 0.35—0.68，这表明社会网络特征对于识别有影响力的经纪人的有效性。