华体会体育HTH-百度的野心:疾病数据谱

2024-09-06 作者:华体会体育HTH

举世医药网 > 医药资讯 > 行业新闻 > 正文 百度的野心:疾病数据谱2014/8/6 浏览数:

6月末,借助最新年夜数据手艺,继城市猜测、景点猜测、高考猜测和世界杯猜测以后,百度推出疾病猜测,将年夜数据的“触角”向医疗范畴延长。对此,记者采访了百度的相干负责人,并取得百度的独家答复。

百度猜测的新功能“疾病猜测”,基在年夜数据堆集和智能阐发,可以或许为用户供给流感、肝炎、肺结核和性病这四种流行症的趋向猜测,帮忙用户提早进行预防。

据领会,中国疾病预防节制中间也为该产物供给了相干疾病监测数据。

另外,百度疾病猜测的猜测规模也不但仅局限在年夜城市,而是笼盖到了区县和商圈。在数据模子方面,其针对每一个城市别离建模,扩年夜数据根本和精准性来包管猜测的正确性。

今朝,很多业内助士对如许的年夜数据猜测疾病心里也没有底,“我感觉这个可托度大要可以打70分吧”东软望海科技有限公司总裁焦桐如是对记者说。在他看来,今朝年夜数据监测和阐发还没有完全成熟,在阐发建模上还必然的成长空间。可是他也绝不粉饰年夜数据猜测疾病的前景,“这应当是一个必定的趋向”。

卫生经济学家陈茁对媒体说,他对年夜数据猜测疾病持乐不雅立场,“假如方式适当,年夜数据对疾病猜测照旧有庞大的潜能,还可以在疾病监测防控以外阐扬难以对比的感化。”

而年夜数据时期下的今天,年夜数据对疾病监测的正确性到底若何,今朝谁也不清晰。仍是需要百度“疾病猜测”的切身查验。

甚么是百度疾病猜测?

“风行病的产生和传布有必然的纪律性,与气温转变、情况指数、生齿活动等身分紧密亲密相干。天天网平易近在百度搜刮年夜量风行病相干信息,会聚起来就有了统计纪律,颠末一段时候的堆集,可以构成一个个猜测模子,猜测将来疾病的活跃指数。”对猜测道理,百度相干负责人如斯阐释道。

今朝,百度疾病猜测可供给流感、肝炎、肺结核和性病四种疾病的猜测,并可对曩昔30天和将来七天的疾病转变作出预判。“活跃度”用来反应所选地区该疾病的活跃水平,同时也可经由过程1~99999的活跃指数反应。用户可以看到全国或省某疾病指数排名前十的城市、区县,和该疾病相干病院的搜刮排行。

“对百度疾病猜测如许针对全国规模的产物来讲,靠得住性、正确性是我们很是正视的。是以,我们会从统计的角度来验证数据的准确性,以机械供给的数据为根本,插手对异常数据的监控和阐发,以确保数据的靠得住性。”

按照北京年夜学市场与前言研究中间发布的2014年4月《搜刮市场研究陈述》中的数据,百度以市场份额82.7%在桌面端连结强势领先地位。

Google流感猜测的“进级版”?

由于功能附近,百度疾病猜测一经推出,便使人联想到早在2008年推出的Google流感趋向猜测(GoogleFlu Trends,简称“GFT”)。

昔时在H1N1爆发几周前,Google的工程师们在《Nature》上颁发论文介绍GFT,并成功猜测了H1N1在全美规模的传布,令世界为之一振。但是,在此以后,有研究发现,GFT会高估与流感相干的就诊量,在这类数据最有效的流感季候岑岭期特别猜测禁绝确,被《Scientists》杂志认为被年夜数据夸张(Big Data Hubris)的算法所误导。也就是说,Google的流感疾病猜测不再那末精准。

相较在GFT,百度疾病猜测已笼盖供给全国331个地级市,2870个区县,某些城市乃至已细化到具体的商圈,“将来乃至可以加倍细化到小我粒度”,百度相干负责人暗示。另外,GFT今朝供给了流感和登革热的猜测,而百度的疾病猜测系统涵盖流感、肝炎、肺结核和性病四种疾病。而据其网站申明,将来还会增添更多的常见流行症和慢性病。

谈和百度疾病猜测的产物形态和Google的差别。百度相干负责人弥补,Google首要利用query数据,在此根本上,百度增添了微博、气候、人群迁移等数据一并插手猜测身分。“另外,Google用的query数据依靠在Google Correlation产物,而百度则是直接从原始日记中进行清洗、消岐、扩大和阐发,在数据上做得更注意些,也由此可以供给加倍有用的判定。”

不只是“一堆数据”

在百度疾病猜测的介绍版块中,特殊向中国疾病预防节制中间(以下简称CDC)暗示了感激。“在构建流感猜测模子的进程中,中国疾病预防节制中间的流感监测成果供给了必然的参考感化。”

现实上,百度疾病猜测参考了CDC2006年1月至2014年6月的流感监测周报数据,而且会按照CDC发布的数据按期来更新。

“百度的成果算法在模子搭建上是综合参考多维度数据布局,此中我们在与CD���������HTHC数据合作上,不但是数据互通,同时也会与他们的专家进行产物交换,终究的猜测成果首要仍是依托我们所成立的疾病猜测模子来完成。”百度相干负责人暗示,疾病猜测的模子数据搭建在疾病人数本身的统计纪律性和疾病人数与其它相干数据的相干性。

一方面,经由过程汗青数据发掘纪律来猜测将来的趋向,比方流感或手足口等疾病具有季候性周期纪律,或最近几年来艾滋病整体上具有一个上升趋向等;另外一方面,数据之间存在相干关系,这也会对将来疾病趋向有所影响。“好比搜‘伤风药’、‘三九伤风灵’词的次数与伤风人数之间就具有较强的相干性,在微博上提得手足口病的次数与手足口病舒展水平有必然的相干性,异常的气候转变与伤风人数也有必然的相干性等。”百度相干负责人注释,“我们会经由过程阐发百度的搜刮query、微博内容、气候转变、人群迁移等数据与疾病人数的相干性,成立机械进修模子,操纵这些数据来猜测疾病的人数。

年夜数据若何落地?

事实上,百度的“野心”远不止简单的疾病猜测,让“年夜数据落地”是现在互联网公司不能不做出的改良,而百度也将在医疗范畴深化定制化的健康信息办事。

为了让疾病猜测不只是一堆数据的聚积,而成为“中国人的健康图谱,老苍生适用的糊口助手”,百度正在对此产物进行优化,但愿继续增添病种,以笼盖常见流行症和慢性病。

另外,“除时空数据,我们还会增添气候、情况污染、用户属性数据,但愿可以或许针对分歧用户,供给个性化的防病、健康信息推送。”百度相干负责人透漏,百度疾病猜测还将供给逐日疾病指数等细化数据,往后有望增添小我健康参谋、预防医治办法、求医用药指点等功能。

编纂:小惠


上一篇:华体会体育HTH-广州日报:取消限价为何仍扶不起低价药 下一篇:华体会体育HTH-药企新药pipeline中的重磅炸弹Top20