科学技术/NEWS CENTER

大数据时代,我们应该具有怎样的思维方式?

发布时间:2017-12-29

  大数据时代,我们应该有什么样的想法?

  “飘”,“汤姆叔叔的小屋”之类的故事是一个强烈的情感共鸣,与故事相比,数据没有情节,只代表客观事实,数据激发,理性思考作为一个理性的人,我们不仅仅满足于情绪的宣泄,而是希望通过数据掌握更多的事实,理性思考,在当今世界,最重要的是缺乏信息。什么信息被消费是显而易见的:它消耗信息接收者的注意力。信息越丰富,我们越注意。卡内基梅隆大学的赫伯特·西蒙(Herbert Simon)指出,人的理性是有限的,所有的决定都是基于他还指出,如果计算机和数据中存储的信息被用来辅助决策,那么人类推理的范围就会扩大,决策的质量也会提高;在大时代数据,人类社会所面临的问题之一就是如何更好地利用数据来辅助决策,对于小数据来说,最基本也是最重要的要求就是减少错误,保证质量,由于收集的信息量小,我们必须尽可能保证记录的数据无论是确定一个物体的位置还是在显微镜下观察物体的大小,许多科学家都致力于优化工具他们的测量,以使结果更准确。抽样时,需求程度要求更高。因为收集有限的信息意味着细微的错误可以被放大,甚至会影响整体结果的准确性。但在新出现的新情况下,允许非性吸引力成为新的亮点,而不是缺陷。由于宽松的容错标准,有更多的人需要掌握,你可以使用这些数据做更多的新事物。这并不像大量数据超过少量数据那么简单,但是大量数据创造了更好的结果。谷歌的翻译并不是更好,因为它具有更好的算法机制,因为谷歌翻译增加了各种各样的数据。2006年,谷歌发布的万亿字的语料库是来自互联网的一些过时的内容。 ,你可以正确地计算出英文单词的可能性,这个谷歌语料库是一个质的突破,使用庞大的数据库使得自然语言处理在这个方向上取得了飞跃,同时,我们需要对付各种混沌,混乱,简单地说就是随着数据量的增加,错误率也会相应增加,所以如果收集到的数据量增加了1000倍,收集到的部分数据可能是错误的,随着数据量的增加错误率也可能会继续增加,在巩固来自不同来源的不同类型的信息的同时,也会由于通常不完全相同而增加混淆的程度。如果我们能够投入足够的时间,那么这些错误是可以避免的,在许多情况下,我们更容忍错误,而不是承诺避免错误。如果将传统的思维方式应用到21世纪的数据化和网络化,重要的信息将被忽略,而强迫性是信息稀缺的产物。当我们有很多新的数据时,性不是那么重要,不是因为依赖关系,我们也可以把握事物的发展趋势。大数据不仅使我们不再期待性,也使我们无法实现。但是,除了从一开始就与我们的直觉相矛盾之外,接受这些数据并不完美。相反,我们可以做出更好的预测,更好地了解世界。与依赖小数据和性的时代相比,大数据通过强调数据完整性和滥交来帮助我们更接近事实。部分和确切的吸引力是可以理解的。但是,由于我们的视野仅限于我们可以分析和能够确定的数据,因此我们对世界的整体了解可能是错误的和有偏见的。他不仅失去了尽力收集所有数据的动力,也失去了从各个角度观察事物的权利。所以,局限于狭隘的小数据,我们可以为追求性而自豪,但即使我们可以分析细节的细节,仍然会怀念整个画面。就像印象派的风格一样,画面中的每一支笔都会感到困惑,但退后一步,你会发现它是一个伟大的工作,因为你可以看到这幅画,当你退后一步的整体思路。这是一个大数据时代的一种思维方式,不是专注于追求性,抱抱混乱。另一种思维方式是改变,多关注关系,而不偏执地在假设的基础上追求因果关系。在小数据的世界中,相关性也是有用的,但是在大数据的背景下,这种关系是闪耀的。通过应用相关性,我们可以比以往更容易,更容易,更清楚地分析事情。相关性的核心是量化两个数据值之间的数学关系。强关联意味着当一个数据增加时,另一个数据可能增加。例如,谷歌的流感趋势:在特定的地理位置,越多的人使用谷歌搜索特定术语,该地区的流感患者就越多,相反,弱相关性意味着当一个数据价值增加,其他数据价值几乎没有变化,例如,我们可以找到个人的鞋子大小和幸福感之间的相关性,但发现它们几乎是不相关的,相关性帮助我们通过识别有用的关联来分析一个现象,而不是通过揭示它内在运作当然,即使是强大的相关性也不一定能解释每一种情况,因为两件事似乎是相似的,但很可能只是一个巧合而已,没有关系,只有可能性,也就是说,并非亚马逊推荐的每本书都是一本书,但是如果相关性强,相关链接成功的可能性很高,我们知道世界不再需要建立在假设之上即解决现象对其生产机制及其基本机制的假设。因此,我们也不需要确定哪些条目可以指示何时何地传播流感;我们不需要知道航空公司如何收取机票;我们不需要知道沃尔玛客户的烹饪偏好,而是可以关联点击数据,看看哪些搜索条件最有可能显示流感传播,无论是机票价格飙升,还是什么食物是飓风期间家庭最需要的,我们用大数据的数据驱动关联分析来代替假设的容易出错的方法,大数据相关分析更准确,更快,更不容易受到偏见的影响。相关性分析是大数据的核心,这种预测的频率很高,我们往往忽视了它的创新,当然,它的应用也越来越多,在社会背景下寻找伙伴只是大数据分析的一种方式。一种同样有用的方法是通过识别新类型数据之间的相互关系来解决日常需求,例如,一种称为预测分析的方法被广泛用于商业世界中以预测发生练习。例如,汽车故障。因为一件事情要失败,不是一瞬间,而是慢慢的问题。通过收集所有的数据,我们可以预先捕捉到某些事情将会失败的信号,例如嗡嗡的引擎和过热的引擎,所有这些都可能表示出现故障。系统比较这些异常情况与正常情况,我们会知道哪里出了问题。通过尽快检测异常情况,系统可以提醒我们更换零件或在故障发生前解决问题。通过识别相关性并对其进行监控,我们可以预测未来。在小数据时代,相关分析和因果分析并不容易,代价高昂,都是从建立假设出发的。那么我们要实验的假设要么被证实,要么被推翻。但是,由于两者都以假设开始,所以这些分析容易出现偏差,很容易导致错误。同时,用于相关性分析的数据很难得到,收集数据成本很高。今天有这么多的数据,没有这个问题。通过识别可能相关的事情,我们可以在此基础上进行进一步的因果分析,如果存在因果关系,我们可以进一步找出原因。这种便利的机制通过严格的实验降低了因果分析的成本。我们也可以在相互关系中找到一些重要的变量,用于验证因果关系的实验。这种关联是有用的,不仅因为它给了我们一个新的视角,而且提供了一个清晰的视角。在小数据时代,我们假设世界是如何工作的,然后通过收集和分析数据来验证这个假设。在不久的将来,我们将在大数据的指引下探索世界,不再受各种假设的限制。我们的研究从数据开始,由于数据我们发现了以前从未见过的连接。总之,我们应该容忍一些超出数据准确性,正确性和严谨性的废话。数据不能完全正确或完全错误,当数据量增加一个数量级时,混淆并不重要。事实上,这可能是有益的,因为它可能提供一些我们无法想到的细节。而且因为我们发现数据依赖性更快,更便宜,而且往往效果更好,所以我们不需要努力寻找因果关系。当然,在某些情况下,我们还是要打坐才能进行因果研究和实验。然而,在许多日常情况下,我们足够了解我们所需要的,而不必弄清楚为什么。

博狗bodog88

2017-12-29

更多内容,敬请关注:

博狗bodog88官网:/

博狗bodog88新浪官方微博:@博狗bodog88

博狗bodog88发布微信号: