登录 | 注册 | English

资讯中心

yzc88网页版登录  >  资讯中心  >  产品动态

车联网大数据平台架构设计-系统总体架构

        车联网海量数据存储与分析是典型的大数据应用场景:车载终端连接车辆内部CAN控制总线,实时收集车辆数据。一部分数据通过无线通讯方式及时传给后台以满足对车辆状态及故障状态实时监控的需求;其余大部分数据将先进行本地存储(如SD卡),再通过离线导入存储在大数据框架中,以便后续进行深度挖掘。

        亚洲城ca88唯一官网针对车联网大数据平台(后称‘大数据平台’)的架构规划请见下图。

 

 数据源

        大数据平台的数据源包括两类数据:

•  车载终端数据

        系统规模由车载终端并发接入量与消息并发处理需求决定,其特点为增长迅速,数据类型繁多且数据格式多变。大数据平台必须可能保证车载终端高并发远程接入并传输数据。同时还应兼顾历史数据的导入,传统数据存储及分析方式往往以两种形式处理这些车载终端数据:一是用传统型关系型数据库,二是用文件系统。

•  应用数据

应用系统相关数据,数据相对较小,增长较慢。数据结构与应用强相关且较为稳定。

数据传输

        针对上述数据源,大数据平台应提供相应的数据传输接入工具:

•  车载终端数据

    ♦  实时数据

        大数据平台应支撑多设备同时接入并进行数据传输。高并发的规模应考虑在十万级别。

    ♦  历史数据

        大数据平台应提供面向关系型数据库与文件系统的数据导入接口。

    ♦  通讯协议

        如果车载终端由不同供应商提供且使用不同的私有自定义通讯协议,大数据平台应提供私有协议解析适配功能。

•  应用数据

        大数据平台不应对建设在其上的应用系统附加限制,如开发语言,通讯协议等。大数据平台应遵循‘面向服务架构’(Service-Oriented Architecture)的设计模式,即各种异构的应用系统可通过独立的消息中间件进行通信,且通信的数据路由、消息传输协议、传输质量与安全都可管理。大数据平台应提供面向消息中间件的数据接入与导出接口。

数据预处理

        车载终端数据的一个显著特点是数据源源不断,且具有周期性。因此此类数据随车载终端数量增多,系统部署规模的扩大会迅速积累增长,对数据存储与分析带来较大压力。对此,大数据平台需在数据存储之前进行一些必要的预处理:

•  解析

        每种车载终端数据均有固定的schema,大数据平台应提供一种统一的schema定义工具,所有车载终端供应商可便捷的通过此工具将数据schema导入或直接编辑。大数据平台还应提供‘通用信号’功能,在应用与数据间提供了一个适配层,使应用无需关注某一信号在每个异构车载终端中的名称。即将类似‘车速’、‘车门故障’这样的通用描述与各种异构车载终端中的信号名(例如不同列车总线对车速信号的定义可能是Spd/speed/carspeed等)进行绑定。

•  过滤

        针对解析后的数据值,大数据平台应提供去重、降噪、筛选、清洗等工具将无效数据进行过滤,以达到节省存储空间的目的。这些操作应该是在数据接入时实时处理的。

•  预处理

        此外,大数据平台为数据分析提供预处理功能,以便提高后续数据分析的效率。预处理包括合并、分类、转换与增强等。

数据存储

        传统的集中式的数据存储方案在存储车载终端数据时均存在一些性能瓶颈。关系型数据库的规模扩展是其性能瓶颈,纵向扩展意味着花费高昂的成本采购硬件设备,横向扩展则对数据库管理App、数据库管理员乃至网络带宽与环境等均提出非常高的要求。这主要是因为在其核心设计理念提出的上世纪70年代,分布式的概念尚未出现。而文件系统则在数据分析时面临数据索引、文件切分等问题,影响分析效率。

        大数据平台应针对车载终端数据与应用数据提供分布式与集中式的混合型存储建构。其中对车载终端数据的存储是对客观事实的记录,即一旦存入便不会变更,应采用分布式方案来存储车载终端数据,以便于灵活扩展系统存储规模。应用相关数据则可采用传统关系型数据库进行存储。此外,系统应提供数据导出功能以便用户使用专业工具进行数据处理。

数据分析

        大数据平台的核心功能是将原始数据通过各种数据分析的手段转换成对用户有意义的信息。大数据平台的数据分析包括:

•  基础数据运算

        针对各种数据类型,提供相应基础数据分析功能,例如求平均数、最值、变化率、数值积分等。

•  机器学习

        大数据平台应内置各种机器学习的算法,并为用户提供友好的客户端接口。

•  自定义数据分析工作流

        用户可结合应用需求将基础数据运算功能、机器学习以及其他分析手段结合在一起组合成自定义工作流,由大数据平台提供任务的调度与结果的展示。

•  实时分析

        有些数据时效性较强,即需要被实时处理才能将原始数据转化为对用户有意义的信息或被用于支撑一些即时决策。一旦处理不及时,这些数据所包含的信息量将大幅下降。大数据平台可在数据预处理时提供实时数据处理.

关于恒润
企业概况
企业理念
企业资质
资讯中心
恒润在全球
诚聘英才
校园招聘
实习生招聘
社会招聘
走进恒润
常见问题
市场活动
在线研讨会
线下活动
微信课堂
用户社区
资料下载
恒润月刊
用户留言
个人中心
相关链接
达索企业
IBM-中国
联系大家
电话:010-64840808
邮箱:market_dept@hirain.com
版权所有 ? yzc88网页版登录 京ICP备18000642号-1 京公网安备11010802017344号 网站地图 | 招聘信息 | 法律声明 | 隐私保护
XML 地图 | Sitemap 地图