什么是大数据和数据科学?
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):
-
Volume(大量)
-
Velocity(高速)
-
Variety(多样)
-
Value(低价值密度)
-
Veracity(真实性)
维基百科版本
heading.anchorLabel大数据是一个术语,用于指传统数据处理应用软件过于庞大或复杂的数据集,以便充分处理。具有许多情况(行)的数据提供更大的统计功率,而具有更高复杂度(更多属性或列)的数据可能导致更高的错误发现率。
大数据挑战包括捕获数据,数据存储,数据分析,搜索,共享,传输,可视化,查询,更新,信息隐私 和数据源。
大数据最初与三个关键概念相关联:大量,多样和及时。后来归因于大数据的其他概念是准确性(即 数据中有多少噪声)和价值。
相关书籍(3) 《大数据时代》
《决战大数据》
《智能时代》
入门类文章(3) 五分钟解读“大数据”
实践类文章(3) 33种经典图表类型总结,轻松玩转数据可视化
开拓视野类文章(2) 不让「数据孤岛」成为 AI 发展的绊脚石,「联邦学习」将成突破口?(2019-2-27)
2019年1月17日 by [打不死的小强](https://easyai.tech/author/xiaoqiang/) Updated: 2022年8月15日
- ** [基础科普](https://easyai.tech/ai-definition-category/popular-science/)
- ** [Big data](https://easyai.tech/ai-definition-tag/big-data/), [大数据](https://easyai.tech/ai-definition-tag/%e5%a4%a7%e6%95%b0%e6%8d%ae/)
Thanks for your rating!
You have already rated this article
An error occured, please try again later
Was This Article Helpful?
** 1