大数据技术架构解析-课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据技术架构解析-课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 架构 解析 课件
- 资源描述:
-
1、第一課:大數據技術架構解析1PPT课件目錄 一、大數據建設思路二、大數據基本架構三、大數據的目標效果四、課程總結2PPT课件一、大數據建設思路 大大數據數據數量龐大,格式多樣化數量龐大,格式多樣化。大量數據由家庭、製造工廠和辦公場所的各種設備、互聯網事務交易、社交網路的活動、自動化感測器、移動設備以及科研儀器等生成。它的爆炸式增長已它的爆炸式增長已超出了傳統超出了傳統ITIT基礎架構的處理能力,給企業和社基礎架構的處理能力,給企業和社會帶來嚴峻的資料管理問題會帶來嚴峻的資料管理問題。因此必須開發新的資料架構,圍繞“數據數據收集、收集、數據數據管理、管理、數據數據分分析、知識形成、智慧行動析、知
2、識形成、智慧行動”的全過程,開發使用這些資料,釋放出更多釋放出更多數據數據的隱藏價值的隱藏價值。3PPT课件1.數據的獲得4PPT课件1.數據的獲得 大大數據數據產生的根本原因在於感知式系統的廣產生的根本原因在於感知式系統的廣泛使用泛使用。隨著技術的發展,人們已經有能力製造極其微小的帶有處理功能的感測器,並開始將這些設備廣泛的佈置於社會的各個角落,通過這些設備來對整個社會的運轉進行監控。這些設備會源源不斷的產生新資料,這種數據的產生方式是自動的。因此在數據收集方面,要對來自網路包要對來自網路包括物聯網、社交網路和機構資訊系統的資料附上括物聯網、社交網路和機構資訊系統的資料附上時空標誌,去偽存真
3、,盡可能收集異源甚至是異時空標誌,去偽存真,盡可能收集異源甚至是異構的構的數據數據,必要時還可與歷史,必要時還可與歷史數據數據對照,多角度對照,多角度驗證驗證數據數據的全面性和可信性。的全面性和可信性。5PPT课件2.數據的匯集和存儲 數據只有不斷流動和充分共用,才有生命力。應在各專用數據庫建設的基礎上,通過數據集成,實現各級各類資訊系統的數據交換和數據共用。數據存儲要達到低成本、低能耗、高可靠性目標,通常要用到冗餘配置、分佈化和雲計算技術,在存儲時要按照一定規則對數據進行分類,通過過濾和去重,減少存儲量,同時加入便於日後檢索的標籤。6PPT课件3.數據的管理 大數據管理的技術也層出不窮。在眾
4、多技術中,有6種數據管理技術普遍被關注,即分散式存儲與計算、記憶體數據庫技術、列式數據庫技術、雲數據庫、非關聯式的數據庫、移動數據庫技術。其中分散式存儲與計算受關注度最高。左圖是一個圖書數據管理系統。7PPT课件4.數據的分析 數據分析處理:有些行業的數據涉及上百個參數,其複雜性不僅體現在數據樣本本身,更體現在多源異構、多實體和多空間之間的交互動態性,難以用傳統的方法描述與度量,處理的複雜度很大,需要將高維圖像等多媒體資料降維後度量與處理,利用上下文關聯進行語義分析,從大量動態而且可能是模棱兩可的數據中綜合資訊,並匯出可理解的內容。大大數據數據的處理類型:的處理類型:批次處理批次處理-先存儲後
5、處理先存儲後處理 流處理流處理-直接處理直接處理數據數據數據挖掘的任務:數據挖掘的任務:關聯分析關聯分析聚類分析聚類分析分類分類預測預測時序模式時序模式偏差分析偏差分析8PPT课件5.大數據的價值:決策支持系統DDS 大數據的神奇之處就是通過對過去和現在的數據進行分析,它能夠精確預測未來;通過對組織內部的和外部的數據整合,它能夠洞察事物之間的相關關係;通過對海量數據的挖掘,它能夠代替人腦,承擔起企業和社會管理的職責。9PPT课件6.數據的使用大數據有三層內涵:n數據量巨大、來源多樣和類型 多樣的數據集;n新型的數據處理和分析技術;n運用數據分析形成價值。大數據對科學研究、經濟建設、社會發展和文
6、化生活等各個領域正在產生革命性的影響。大數據應用的關鍵,也是其必要條件,就在於IT與經營的融合,當然,這裡的經營的內涵可以非常廣泛,小至一個零售門店的經營,大至一個城市的經營。10PPT课件二.大數據基本架構 基於上述大數據的特徵,通過傳統IT技術存儲和處理大數據成本高昂。一個企業要大力發展大數據應用首先需要解決兩個問題需要解決兩個問題:一一是是低成本、快速地對海量、多類別的低成本、快速地對海量、多類別的數據進行抽取和存進行抽取和存儲儲;二二是是使用新的技術對使用新的技術對數據進行分析和挖掘,為企業創進行分析和挖掘,為企業創造價值造價值。因此,大數據的存儲和處理與雲計算技術密不可分,在當前的技
7、術條件下,基於廉價硬體的分散式系統(如Hadoop等)被認為是最適合處理大數據的技術平臺。Hadoop是一個分散式的基礎架構,能夠讓用戶方便高效地利用運算資源和處理海量數據,目前已在很多大型互聯網企業得到了廣泛應用,如亞馬遜、Facebook和Yahoo等。其是一個開放式的架構,架構成員也在不斷擴充完善中。11PPT课件1.Hadoop體系架構 ThriftThrift是一個軟體框架,用來進行可擴展且跨語言的服務的開發,最初由Facebook開發,是構建在各種程式設計語言間無縫結合的、高效的服務。ZookeeperZookeeper在Hadoop架構中負責應用程式的協調工作,以保持Hadoop
展开阅读全文