火眼®数据科学建模平台



聚焦大数据+算法模型:语义理解,图谱关系,机器学习,时序预测

让业务流程变得更加个性化,并最大化数据价值
迪奥大数据


    迪奥火眼大数据一体机产品组合为企业提供数据管理可视化服务,主要用例包括:针对企业的行情监测、针对企业内部的管理经营分析可视化、针对企业顾客的行为分析等。它主要有三大功能,一是强大的企业内外部数据整合能力,二是丰富的分析模型库,三是丰富的可视化控件。

    作为大数据一体机的产品厂商,迪奥公司在大数据应用领域被评为领先者。该平台集成了多种大数据管理应用模型,企业可以根据需要调用模型组件库的组件进行相应数据挖掘分析,其中包括个性化推荐引擎、场景营销引擎和大数据分析引擎。该平台可以部署于各种业务模式中,为各种设备提供多屏访问,从而满足当今企业的通信和协作需求。它提供了一个基于标准的可扩展开发平台,并以较低的总体拥有成本(TCO) 保证其卓越的性能、高可靠性和高伸缩性。


  • 我们正在迎来一个数据爆炸的时代
  • 各类设备和互动产生的数据量正以年均大于50%的速度增长,预计在2020年可能会到44ZB(44万亿GB)。全球企业越来越关注大数据给自己带来的机会或冲击。据调查显示,拥有优秀大数据能力的企业,它的财务表现在行业前25分位的可能性是竞争对手的2倍、做出正确决策的可能性高出竞争对手3倍、决策速度比竞争对手快5倍。可见,大数据对于企业乃至社会的重要性不言而喻。

    一体机是指通过标准化的架构集成了服务器、存储、网络、软件等配置,减化了数据中心基础设施部署和运维管理的复杂性的一体化设备。大数据一体机即通过一体机的产品形态,解决了大数据时代基础设施的持续扩展问题、数据处理的个性化和一体化需求问题、海量数据的存储成本问题。

  • 迪奥火眼大数据一体机概述
  • 迪奥大数据一体机是一种专为大量数据的分析处理而设计的软、硬件结合的产品,由一组集成的服务器、存储设备、操作系统、数据库管理系统以及一些为数据查询、处理、分析用途而特别预先安装及优化的软件组成,为中等至大型的数据仓库市场(通常数据量在TB至PB级别)提供解决方案

    迪奥大数据一体机如同企业数据门户,为企业全面整合数据资产,通过状态指标监控企业状态,在此基础上进行多角度、全方位的可视化分析,全面、综合地掌握和利用在经营过程中得到的信息,更加精准的掌握企业当前运行状况与经营能力,达到提高企业管理和决策水平的目的。

    通过迪奥大数据一体机,集团产业可以对自身产品、服务、顾客管理等情况进行分析和挖掘,反馈当前存在问题,辅助决策者找到解决问题的途径,促进集团产业信息化链条的建设、完善,建设集团产业运行全息图。



  • 丰富的可视化呈现
  • 报表展现工具集成了30余种统计图表,将为领导、部门和个人提供个性化展现。系统管理员预先制作各类主题的主页模板,并根据工作需要,选择相应模板,更换报表页面形式和信息内容。部门管理员可通过下载不同的模板,配置模板上动态信息区对应的栏目,修改模板样式文件,即可获得不同风格和多样化栏目的分析报表,满足部门信息使用的需求。


  • 应用场景
  • 迪奥大数据一体机是一体化的数据分析处理平台,可应对多种数据类型和多种数据处理需求,包括但不限于以下四种应用场景:

    海量数据存储:大数据一体机具备高性能的分布式文件系统,支持大吞吐量高并发访问,具有自我修复,动态扩展等特性,硬件配备了高密度大容量的硬盘和高速的数据交换网络,对外提供丰富的数据访问接口,非常适合监控视频,医疗影像,科研数据等大数据集的存储。

    批量数据处理:通过分布式计算框架ElasticSearch,大数据一体机可调用所有节点的计算资源执行诸如数据格式整理,数据类型转换,文本特征值提取,模式识别等数据数据处理任务,在处理过程中减少了数据在不同节点间的交换,降低了传输带宽的压力,极大的提升了处理效率。

    海量结构化数据在线查询:大数据一体机内置了列存数据库HBase,它具有高效的查询性能和良好的横向扩展能力,支持高并发访问,百亿条的数据规模下进行查询可达到毫秒级响应,非常适合金融,电信等行业的历史交易查询以及公安,交通等行业的道路卡口数据查询,快速身份信息查询等需。

    数据仓库:大数据一体机配备了数据仓库工具和ETL工具,可实现将数据从多种数据库,多个数据源抽取,转换最终加载到数据仓库中。数据仓库对外提供标准SQL接口,适合各种面向分析应用的数据仓库场景。


  • 技术指标

  • 根据不同的应用场景需求,迪奥大数据一体机有三个通用系列供用户选择,并可为用户进行定制化配置满足客户要求:


    大数据一体机型号
    EyeDMP1000
    EyeDMP2000
    EyeDMP3000
    *扩展性
    只支持单机柜,最多14个数据节点
    主柜最多14个节点支持1-2个机柜,最多30个数据节点
    主柜最多12个节点,支持多个机柜,最大支持60节点
    应用场景
    小规模数据处理,扩展性要求不高
    高性价比配置,适合大多数数据处理场景
    适合数据量大,增长速度快,数据处理性能要求高的应用场景
    管理网络
    千兆以太网
    千兆以太网
    千兆以太网
    数据网络
    千兆以太网
    万兆以太网
    万兆以太网
    整机最大计算CPU
    168
    360
    720
    整机最大计算内存
    5096GB
    10920GB
    21840GB
    *整机最大存储空间
    504TB
    1080TB
    2160TB
    交流输入电压
    220V380V可选
    220V380V可选
    220V380V可选
    整柜最大功率
    11200w
    12600w
    10800w
    整柜最大重量
    690kg
    760kg
    630kg
    机柜尺寸
    1050*600*2050
    1050*600*2050
    1050*600*2050
    工作温度
    5-35摄氏度
    5-35摄氏度
    5-35摄氏度
    管理节点配置
    双路E5-2620V2CPU
    96G内存
    42.5600G硬盘
    2个千兆网口
    四路E7-4820 V28核) CPU
    256G内存
    82.5300G硬盘
    4个千兆网口
    1个单口万兆网卡
    八路E7-8837 8核)CPU
    256G内存
    42.5600G硬盘
    2个千兆网口
    1个单口万兆网卡
    数据节点配置
    双路E5-2420v2 CPU
    192G内存
    22.5500G硬盘
    123.53T硬盘
    2个千兆网口
    双路E5-2420v2 CPU
    192G内存
    22.5500G硬盘
    123.53T硬盘
    2个千兆网口
    1个单口万兆网卡
    双路E5-2420v2 CPU
    192G内存
    22.5500G硬盘
    123.53T硬盘
    2个千兆网口
    1个单口万兆网卡


    *扩展性:指大数据一体机标准配置的扩展能力,采用特殊硬件和设计理论上可扩展到4000节点

    *主柜数据存储空间:如采用HDFS 3副本机制实际存储容量需要除以3


  • 数据产生层

  • 内部业务系统产生的结构化数据

    客户身份信息,包括客户名称、客户类别、国籍地区、身份证明文件信息、客户头像等信息;

    客户联系信息,包括联系地址、联系电话等信息;

    客户自然属性或社会属性信息,包括自然人客户的职业性质、教育程度等信息,机构客户的机构类型、资本属性等信息;

    客户其他基本信息;

    业务申请单据、合同协议、业务回单、信用记录、研发记录等内容。

    企业内部非结构化数据

    日常业务处理过程中产生的非结构化数据,存储形式多样,主要包括用户访问日志、用户行为、用户点评等。

    企业外部数据

    企业外部数据以非结构化为主,主要包括国家政策法规、论坛等互联网信息、地理位置等移动信息、微博等社交媒体信息。

    迪奥大数据一体机总体架构图

  • 数据交换层
  • 数据交换层是根据数据源存储的不同分类而设计的,将结构化数据,文本、图像、声音等非结构化信息整合,通过统一命名规则的URL访问。这样可以达到初步的数据整合的目的(集中管理,统一目录,联合搜索)。本质是通过分析数据存储结构和数据存储库的特点来针对性的设计工具,以追求卓越的性能。

  • 数据应用层
  • 管理分类应用

    管理分析类应用主要实现了集团客户管理、研发管理、研发投入管理、风险管理、科技信息披露五大分析体系功能

    管理分析类应用通常采用套装软件和BI工具实现

    数据增值类服务应用

    数据科学家根据自己对业务需求的理解或者对市场的判断,设计并运行模型,发掘数据价值,并封装成商业产品

    数据增值产品通常采用R语言和BI工具实现,面向企业内外部用户

    沙盘演练类应用

    业务人员根据业务需求或自己对业务的理解,设计计算模型,准备各类明细或汇总数据,导入模型运算,验证业务结果

    沙盘演练类应用通常使用R语言在Hadoop分布式体系下实现

    历史查询类应用

    针对公检法查询需求、内外部审计需求和最终用户的历史交易查询需求,以贴源存储的归档数据为基础,实现的查询类应用

    历史查询类应用通常使用BI 工具或自主开发实现

    高时效类分析应用

    客户经理等最终业务人员针对当前业务的发生(如:用户交易、用户访问日志),进行实时查询、分析的应用

    实时分析类应用通常使用CEP、ESB等技术实现

  • 数据访问层
  • 多种展现形式满足各层级用户及应用系统使用需求

  • 迪奥大数据一体机为企业带来的独特价值
  • 1. 促进业务创新

    业务人员可以基于明细、可信的数据,进行多维分析和数据挖掘,为业务创新(客户服务创新、产品创新等)创造了有利条件。

    2.加强业务协作

    实现分散在各个业务系统中的数据在数据平台中的集中和整合,建立单一的产品、客户等数据的企业级视图,有效促进业务的集成和协作,并为企业级分析、交叉销售提供基础。

    3. 实现数据共享

    通过数据平台实现数据集中,确保各级部门均可在保证数据隐私和安全的前提下使用数据,充分发挥数据作为企业重要资产的业务价值。

    4. 改善数据质量

    从中长期看,数据仓库对分散在各个业务系统中的数据整合、清洗,有助于企业整体数据质量的改善,提高的数据的实用性。

    5. 提升建设效率

    通过数据平台对数据进行集中,为管理分析、挖掘预测类等系统提供一致的数据基础,改变现有系统数据来源多、数据处理复杂的现状,实现应用系统建设模式的转变,提升相关IT系统的建设和运行效率。


    特别声明

    迪奥,DEEAO,Deelio和所有其它迪奥科技公司的产品或服务名称,是广州迪奥信息科技有限公司在中国和其他国家的注册商标。数据雷达®表示中国注册商标。其他品牌和产品名称均为相关公司的注册商标。

    版权所有,2016年,迪奥科技保留所有权利。

会员登录
登录
我的资料
留言
回到顶部