大数据管理课件.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《大数据管理课件.pptx》由会员分享,可在线阅读,更多相关《大数据管理课件.pptx(34页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、数据库系统概论 An Introduction to Database System第第1414章章 大数据管理大数据管理xxxxx1精品课件目目录 大数据概述大数据概述 大大数据的数据的应用用 大数据管理系大数据管理系统 小小结精品课件大数据概述大数据概述什么是大数据?什么是大数据?精品课件什么是大数据什么是大数据精品课件什么是大数据什么是大数据分分类:按大数据的应用类型将大数据分为海量交易数据(企业OLTP应用)、海量交互数据(社交网、传感器、全球定位系统、Web信息)和海量处理数据(企业OLAP应用)。精品课件大大数据的特征数据的特征u巨量(巨量(Volume)u多多样(Variety)
2、u快快变(Velocity)u价价值(Value)精品课件大数据的特征大数据的特征巨量巨量大数据的首要特征是数据量巨大,而且在持续、急剧地膨胀。大规模数据的几个主要来源有:科学研究、互联网应用和电子商务领域、传感器数据、网站点击流数据、移动设备数据、无线射频识别数据等。精品课件大数据的特征大数据的特征巨量巨量观点:大是相对的,是和当时的计算机处理能力相关的,超过了现有技术的能力。但是,“大规模”又是大数据的基本要求。n80年代,百万条记录就是VERY LARGE DATAn00年代,TB级别就是DATA INTENSIVEn10年代,100T以上,甚至PB级才能够算得上是大数据从现在起,每18
3、个月,新增的存储量等于有史以来存储量之和!1998年图灵奖获得者Jim Gray精品课件大数据的特征大数据的特征多多样数据的多样性通常是指异构的数据类型、不同的数据表示和语义解释。现在,越来越多的应用所产生的数据类型不再是纯粹的关系数据,更多的是非结构化、半结构化的数据,如文本、图形、图像、音频、视频、网页、推特、和博客等。精品课件大数据的特征大数据的特征快快变大数据的快变性也称为实时性,一方面指数据到达的速度很快,另一方面指能够进行处理的时间很短,或者要求响应速度很快,即实时响应。u数据到达或者产生的速度太快,对系统处理造成巨大的压力。u例如,入库速度要求:100GB/S。精品课件大数据的特
4、征大数据的特征快快变时间交易交易额描述描述0时0分52秒超过10亿一分钟超10亿的交易额0时14分16秒超19亿超过2012年双十一全天交易额1时突破353亿超过2013年双十一全天交易额6时54分53秒超571亿超过2014年双十一全天交易额15时19分13秒912亿超过2015年双十一全天交易额24时超1207亿交易额翻了一番无线交易额占比81.87%,覆盖235个国家和地区l“现象级”应用:在某一个时期,对系统的压力突然暴增,极易导致系统的崩溃。精品课件大数据的特征大数据的特征价价值u大数据的价值是潜在的、巨大的。大数据不仅具有经济价值和产业价值,还具有科学价值。这是大数据最重要的特点,
5、也是大数据的魅力所在。精品课件大数据的大数据的应用用大数据的应用特征:u大数据作为一种新的战略资源,要重视对数据对象的管理、重视数据治理。u大数据作为一种新的研究方法,已经在许多学科领域取得成效在:第四研究范型u大数据作为一种新的信息化的思维,强调跨界应用,数据整合基础上的创新。精品课件大数据的大数据的应用用应用案例:u感知感知现在在 预测未来未来 互互联网文本大数据管理与网文本大数据管理与挖掘挖掘u数据服数据服务 实时推荐推荐 基于大数据分析的用基于大数据分析的用户建模建模精品课件互互联网文本大数据管理与挖掘网文本大数据管理与挖掘u互联网媒体文本大数据应用:时事探针高速发展的互联网媒体在给人
6、们获取信息带来便利的同时,也带来了新的挑战,其中之一便是“信息过载”问题。当一个重要新闻事件发生后,各种互联网媒体会有大量相关报道。时事探针系统可以实时监控、收集互联网媒体数据,并对数据进行深入的挖掘和分析。其主要功能包括动态数据抓取、历史数据保留、数据深度智能分析、数据可视化展示、敏感信息实时捕捉、预定阈值报警等。精品课件互互联网文本大数据管理与挖掘网文本大数据管理与挖掘u互联网媒体文本大数据应用:时事探针该系统可以有效地帮助用户、企业以及政府机构对所关注的新闻话题在互联网媒体中的报道进行感知、获取、跟踪、预警和深入分析,具有极大应用价值。精品课件互互联网文本大数据管理与挖掘网文本大数据管理
7、与挖掘u互联网文本大数据管理的挑战n无法事先预定义关系模式和值域n无法直接用关系型数据进行存储和查询n可扩展性和实时性要求高对于文本大数据处理,目前广泛使用的互联网搜索引擎只是对文本数据的简单索引和查找,不能满足用户对所关注的话题进行实时监测、深入分析以及决策支持等需求。精品课件互互联网文本大数据管理与挖掘网文本大数据管理与挖掘u互联网文本大数据管理系统n时事探针系统时事探针系统是一个面向互联网文本大数据的通用的管理和分析平台。整个系统分为离线处理和在线处理两个部分。其中离线部分是设计的重点,主要功能有:1.多源异构网络大数据的感知和获取2.文档理解及结构化数据抽取和集成3.数据存储和索引4.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据管理 课件
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内