智慧城市大数据全业务链应用人工智能运营平台解决方课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《智慧城市大数据全业务链应用人工智能运营平台解决方课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智慧 城市 数据 业务 应用 人工智能 运营 平台 解决 课件
- 资源描述:
-
1、智慧城市大数据全业务链应用人工智能运营平台解决方案议题 智慧城市大数据全业务链应用人工智能运营平台建设背景 智慧城市大数据全业务链应用人工智能运营平台建设实施 智慧城市大数据全业务链应用人工智能运营平台顶层设计议题 智慧城市大数据全业务链应用人工智能运营平台建设实施 智慧城市大数据全业务链应用人工智能运营平台顶层设计当前运维和业务团队面临的困境不是没有数据,而是数据太多不是不想分析,而是无从下手智慧城市大数据全业务链应用人工智能运营平台建设背景挖掘海量数据的业务价值统一大数据分布式处理技术智能算法与机器学习业务系统将要发生什么?主动响应的预防预测性管理降低系统低效对业务的影响多种分散独立监控工
2、具专业化专家型人才业务系统已经发生了什么?被动响应的故障恢复性管理人工运维人工智能运维什么是人工智能运维人工智能运维,即基于人工智能的IT运维(Artificial Intelligence for IT Operations) ,是由Gartner定义的IT运维管理新类别。人工智能运维将服务管理、性能监测、自动化结合在一起,以实现持续洞察和改进的目标,并由大数据和机器学习技术进行支撑。机器学习大数据平台人工智能运维商业价值监测(观察)服务管理(交互)自动化(行动)持续察洞持续洞察持续洞察如何使用机器学习的方法明确问题:处理数据:我们要解决什么样的问题解决问题可能需要哪些数据我们可以获取哪些数
3、据流量预测/异常检测历史时刻对应的流量数据清洗特征工程数据标记清洗接口异常数据统计判别结合无监督学习标记数据训练模型:选择模型训练模型验证模型离线训练模型交叉验证模型表现使用模型:线上加载定期修正BadCase分析修正模型流量预测及异常检测的技术框架原始数据有标记样本库分类模型输出模型实时数据特征工程加载分类模型输出标记离线模块在线模块特征工程回归模型预测流量训练集样本的标记原始数据有监督分类模型统计方法及无监督算法有标记样本库分类模型实时判断异常人工修正确认告警和异常3-sigemaTukeys testIsolation ForestOne Class SVM投票 2负样本投票 =0正样本
4、训练样本库分类器有标记样本库标记Top N无监督分类模型流量预测整体规律性较强 历史同期流量统计特征 历史同期流量变化趋势 移动平均特征历史特征:流量数据特点:短期小幅波动较多移动平均吸收短期波动工作日,周末,假期影响较大设计对应的历史特征提取规则流量趋势可预测异常检测构建合适的对比样本库,提取特征用于对比 当日前n分钟流量数据 昨日同时刻前后n分钟流量数据 上周同时刻前后n分钟流量数据对比样本库对比样本库统计特征:均值中位数标准差最大值最小值偏度峰度样本对比特征:差值比值同比环比异常时流量一定有反常的波动异常发生频率较低统计判别结合无监督算法解决样本初始无标记问题智能告警合并维度选择集群=?
5、异常信息=?ganji合并条数=16合并条数=14合并条数=16合并条数=258tongchenganjuke页面连接错误页面连接错误页面状态码非200异常信息=?服务器ip=?合并条数=2页面关键字异常192.168.40.821.遍历全部备选维度,确认当前合并维度;2.基于合并维度划分数据集,继续选择合并维度;3.到达停止条件后停止;智能故障根因分析基于告警信息提取基于告警信息提取监控分层系统层:资源使用率(CPU、内存)监控应用层:端口、进程监控业务层(页面、接口)网络层、服务器层:网络设备硬件监控告警信息按层合并,异常发生时由上至下逐层获取告警信息,提取根因;优点:解释性好,结果可靠缺
6、点:非常依赖监控的完备性 智能故障根因分析调用链信息不完备智能故障自愈故障自愈的策略出现故障先不告警,自动执行预定义的一系列处理步骤,尝试自动处理故障如果故障自愈成功,那么无需发送告警如果故障自愈失败,按照预定义的方式发告警在合适的时间,将近期故障自愈的执行结果汇总后通知用户人工智能运维的四个核心能力对海量数据进行存储通过智能算法在数据提取时和存储后进行分析从不同的数据源中获取数据对海量数据进行高效访问人工智能运维的技术栈可视化机器学习算法分析计算大数据数据源事件日志监控工单任务 全量,海量,多样性,复杂性IT数据 集中统一管理,历史数据存储,实时数据存储 数据建模,模式识别,趋势识别,故障隔
7、离 智能化选择,异常检测,异常定位,根因分析 算法自我修改演进,新算法创建 多维度,个性化,角色化,场景化展示 数据清洗,去重,过滤,关联,生成新数据人工智能运维的核心价值故障发现故障规避故障止损故障修复异常定位异常定位异常预测异常预测人工智能运维将在5-10年内成为ITOM的主流技术From Gartners Report议题 智慧城市大数据全业务链应用人工智能运营平台建设背景 智慧城市大数据全业务链应用人工智能运营平台建设实施人工智能智能运维平台解决方案服务器数据存储数据网络数据应用数据用户体验数据流量数据日志数据交易数据任意IT数据人工智能人工智能运维运维大数据实时多维分析机器学习大规模
8、事务处理海量数据实时接入服务分析深度挖掘场景可视化多维指标告警数据建模人工智能智能运维平台的五个能力层次发现接入存储整合梳理关联智能分析多维展示从哪里来到哪里去IT数据全栈IT数据的采集范围监控对象监控对象采集数据采集数据IT系统系统客户端 数据库虚拟化 中间件SaaS传统架构业务层应用软件层基础设施层业务系统云架构硬件设备PaaSIaaS交易业务流程浏览器移动APP应用/微服务应用代码数据库服务中间件服务网络流量包日志虚拟化网络主机机房环境交易量交易金额交易成功率页面加载时间浏览器类型用户IP页面加载错误率CDN质量应用响应时间应用吞吐量应用错误率单个服务响应时间单个服务吞吐量单个服务错误率
9、交易错误率交易处理时间APP页面响应时间APP崩溃率APP网络请求时间APP H5页面性能JVM内存利用率服务器时延SQL语句执行时间连接池数量缓冲区命中率告警虚拟机数量主机数量CPU利用率内存利用率丢包率平均建链时间网络流量磁盘可用容量电源处理器配置项业务逻辑IT资产库CMDB全栈IT数据的采集方式IT数据SNMP、IPMI、WMI、SMI-S、JMX、GlassFish、JDBC、SSH、Telnet等Java、.Net、PHP、Python、Ruby、Node.js、Andriod、iOS等Rsyslog、NXlog、Kafka、SDK、Restful API等SFLOW、NETFLOW
10、、IPFIX、SPAN、RSPAN、ERSPAN等StatsD、 Web Service、 JSON等URL、Host、Port、 HTTP 、RTSP、RTMP等IT数据采集方式的选择采集方式适用场景基础监控协议IaaS、PaaS层,服务器、网络、存储、操作系统、中间件、数据库、应用进程,物联网传感器等网络及协议可达的IT资源状态和可用性指标数据采集网络流量采集提取网络包中携带的网络性能、用户体验、应用性能、交易等数据日志采集收集系统、应用、业务等日志,进行事件、告警、交易等任意可标识信息的采集分析字节码探针浏览器、移动APP用户体验数据采集,探针兼容的(Java、.Net、PHP等解释型语
展开阅读全文