大数据:数学的三大挑战19

作者:辛喂

计算机。数据科学家必须设计新算法来控制数字数据的数量,速度和可变性,并提取相关信息。作者:David Larousserie发布于2014年1月27日15:53 - 更新于2014年1月28日08:11播放时间9分钟。仅订阅者项目这是一个洪流。一个新词正在侵入世界:“大数据”。根据谷歌搜索引擎,在法国上查询这个词已经增加了十倍以上2011年12月至2013年第四季的定义并不是那么folichonne:这个词是指大型的收集,挖掘和分析大量数据。数字,文字或图像,还有基因,星星,颗粒或道路交通的痕迹......通过“大”,每个人都能听到他想要的东西。例如,从Google或Facebook Web巨头的数百万GB(GB)到地理定位文件的数千GB。对于那些撼动“大”实际上“小”的聪明小家伙来说更是如此。事实上,这个词的流行程度与大数字的魅力相关,而不是与概念的承诺和现实相关。现实的一面,美国国家安全局(NSA)的间谍规模揭示了2013年6月,其前雇员之一,斯诺登显示大数据和大哥之间的接近程度。方的约定,顾问说服了许多经济玩家,他们的数据,有时会处于休眠状态,是潜在的财富:更好的诊断和制药业的治疗目标,广告活动的网页上提高效率,估计保险费,伴随网上商户购买的建议,对警察犯罪的预期......简而言之,许多地区已经或将会受到影响。 200万美元的美国美国,在2012年3月宣布SHELL,他们的节目“大数据研究和发展”,以200万美金(146万欧元)预算,并伴有这个运动。与法国一样,2030年创新委员会将其作为未来的七大挑战之一。但是为了履行承诺,它将采取除蛮力和更强大的机器之外的其他东西。放置计算机科学家和数学家的灰质和微妙的大脑。因为,很快,这些巨大的列表或数字,字母或图像表之前,分析师落在三块骨头,至少包括:音量,速度和各种数据,如在2001年出Meta Group研究公司(当时没有使用大数据这个术语)。 “卷”很容易理解。 “速度”此外,如果我们想使数据的频繁更新,如从网页的关键字,从网页甚至咨询商家网站的产品点击。 “多样性”不太自然。这个词指的是收获,其中,例如关于用户的异质性,包含姓名,年龄,地址,而且他访问的网站列表,评论,它留在这些网站,照片或视频......比销售代表或银行家管理的传统客户表更“脏”。....