办事指南

维基百科搜索和病态推文预测流感病例

点击量:   时间:2017-10-01 15:01:08

作者Aviva Rutkin(图片来源:Picceralla / Getty)互联网现在就会见到你一种新算法可以通过从维基百科挖掘数据来跟踪美国各地的流感病例该计划监控一些病人或他们的亲人可以想象的条目,如“流感季节”,“发烧”和“流行病”它每小时都会下载有关全国有多少人访问这些页面的公开信息当研究人员将他们的数据与美国疾病控制中心的数据进行比较时,他们发现他们可以准确预测两周前该国的病例数,相差仅为0.27%近年来,公共卫生官员越来越关注利用社交媒体或搜索查询等互联网数据来追踪疾病哈佛医学院的共同作者约翰布朗斯坦说,使用维基百科的一个优点是它的数据不受单一机构的控制 “维基百科的数据不需要访问,”他说 “这对任何人都是真正可用的”现在该算法已经证实了流感,研究人员希望在棘手的主题上进行尝试,并了解人们如何对与健康相关的政府政策作出反应他们还希望找到一种按州或县分开数据的方法,使估算对医学界更有用但维基百科不会发布更细粒度的信息,因为它涉及查看网络用户的IP地址由于隐私和免费数据的问题,大多数互联网跟踪项目倾向于关注大范围的广泛疾病趋势但宾夕法尼亚州立大学的一项新算法希望将这种方法推上去(arxiv.org/abs/1404.3026)该团队分析了104名学生的推特信息,其中一些人在一年的时间里被医生诊断为流感他们还查看了他们所遵循的人的饲料,然后是他们该计划搜索关于疾病的关键词 - 例如“流感”,“发烧”,“咳嗽”,“药物” - 以及提及可能需要健康的活动,如参加聚会,以及Twitter的变化使用使用这些数据,如果学生在某个月内感染了流感,就能确定99%的准确率宾夕法尼亚州立大学大学公园传染病动力学中心的研究生Todd Bodnar说,这种方法对那些想要监测特定人群的人有用 “如果你想知道我是否应该关闭这所学校,实时获取流感数字可能非常有用,”他说谷歌流感趋势最着名的追踪项目之一,最近受到了负面关注,因为一项研究得出结论,该网站一直高估病例数(Science,doi.org / rwx)波士顿东北大学的David Lazer撰写了这项研究,认为维基百科或WebMD上的主题页面可能会让官员更好地处理人口的实时问题 “也许比看到人们有什么问题(通过谷歌搜索)更好的信号是找出他们选择的答案,”他说期刊参考:PLoS Computational Biology,DOI:10.1371 / journal.pcbi.1003581关于这些主题的更多信息: