龙源期刊网 http://www.qikan.com.cn
移动可视化架构与关键技术综述
作者:赵建保 冯开颜
来源:《软件导刊》2016年第12期
摘 要:互联网应用终端正从PC端转向移动端,移动优先成为互联网产品设计与开发的准则。现有可视化系统应用终端多依赖于计算机操作系统以及插件,难以实现大数据跨平台、跨终端的移动可视化应用。分析了大数据处理、可视化算法及库、浏览器、触摸交互和响应式设计5大移动可视化关键技术及挑战,基于大数据处理技术和HTML5标准提出了移动可视化系统架构,实现了大数据挖掘和交互式可视化应用,可为可视化、数据分析、数据挖掘、数字媒体生产提供借鉴参考。
关键词:数据可视化;大数据;移动终端;HTML5 DOIDOI:10.11907/rjdk.162602 中图分类号:TP319
文献标识码:A文章编号:1672-7800(2016)012-0172-03 0 引言
第37次《中国互联网络发展状况统计报告》指出,电脑端向手机端迁移趋势明显,手机已经成为主要上网终端[1]。随着移动互联网生态系统的不断完善,移动智能终端硬件、操作系统、浏览器及移动网络发展提速,移动终端具备了一定的数据生成与存储、数据挖掘与分析、数据应用客户端等功能,使整合Web技术创建跨平台、跨终端的移动可视化成为可能。另一方面,由物联网、Web数据、社交网络、信息化系统源源不断生成的大数据,其数据挖掘结果和数据分析依赖于可视化技术来实现辅助数据分析和知识提取。可视化将输入数据映射为一定的视觉表达形式,用户通过视觉通道从可视化结果中发现和提取符合需求的特征和模式,以生成针对问题的假设,帮助用户理解数据、发现数据特征,进而辅助推理决策并进行趋势预测[2],可视化已经成为大数据应用的关键技术。IBM和牛津大学在大数据研究报告中指出,数据挖掘、数据可视化、预测、建模与数据优化组织是组织的5大数据能力[3]。
目前,主流数据可视化平台大致可分为基于客户端和基于浏览器及插件两类,两者都依赖于操作系统及其客户端运行环境或浏览器插件,因而其实现跨平台和移动访问需要的软件移植成本过于庞大[4],以往采用VRML、Flash、Silverlight、Java Applet、ActiveX、X3D等技术的可视化应用也面临同样问题。移动可视化已成为计算机图形和可视化领域新的机遇和挑战,并面临着处理能力、并行可视化算法、实时处理、异构数据(如文本、视频、传感器数据)和人机交互等技术挑战。本文基于大数据处理技术和HTML5标准构建了面向移动终端的可视化系统,利用大数据处理技术的查询与数据挖掘功能生成可视化数据集,利用HTML5 Canvas实现
龙源期刊网 http://www.qikan.com.cn
2D/3D图形的实时绘制,利用触控交互实现用户对数据的操控,利用响应式设计实现移动终端的适配,从而构建适应大数据、开放、跨平台、硬件加速、触控交互的移动可视化应用,进而推动大数据、数据可视化的实践应用。 1 移动可视化系统架构
移动可视化处理流程可概述为:执行大数据检索或数据挖掘,将处理结果按照数据模型输入到可视化模块,通过映射与变换、绘制与渲染生成可视化界面。移动可视化系统架构如图1所示[5-6]。
系统基于大数据处理技术和HTML5规范并参照传统的B/S模式进行设计,主要划分为3个子系统:大数据处理子系统、Web服务子系统和移动端子系统。大数据处理子系统运行在云端环境,由分布式文件系统、分布式计算框架和数据库构成,可实现大数据的采集、存储、预处理、数据挖掘和挖掘结果处理等功能;Web服务子系统主要提供Web服务,选用HTTP协议进行通信,使用Ajax异步操作和Web Worker技术最大限度地降低用户延迟,提高响应时间和绘制效果,Web服务器软件可选用Apache、Nginx和Microsoft IIS技术搭建Web服务器;移动端子系统由移动终端及符合HTML5规范的浏览器构成,浏览器获得Web服务器响应的数据后,渲染引擎调用HTML5 Canvas API在线绘制2D/3D影像,再利用HTML5、CSS3、JavaScript 分别实现Web页面的结构、外观及交互控制功能。 2 关键技术
移动可视化生态系统由可视化用户、可视化应用开发者、Web设计开发者、浏览器厂商、第三方可视化库及工具提供者共同构成。移动可视化综合运用了云计算与大数据、数据分析、Web技术、计算机图形学、图像处理、人机交互、通信等技术,其关键技术有大数据处理、可视化算法及库、浏览器、触控交互与响应式设计。 2.1 大数据处理
大数据具有体量大(Volume)、速度快(Velocity)、模态多(Variety)、真实性(Veracity)和价值大(Value) 5大特征。体量大可通过扩展计算机系统来缓解,而快速及时响应、数据类型多样和数据的不确定性是大数据处理的真正难题,直接制约着大数据查询及挖掘的实用性和实效性。互联网巨头推出了各种不同类型的大数据处理系统:批量数据处理系统主要采用Apache基金会的分布式系统基础架构Hadoop;流式数据处理系统有Twitter的Storm、Facebook的Scribe、Linkedin的Samza、Cloudera的Flume、Apache的Nutch;交互式数据处理系统有Berkeley的Spark系统与Google的Dremel系统;图数据处理系统有Google的Pregel系统,Neo的Neo4j系统和Microsoft的Trinity系统。这些基于开源系统Hadoop的专用化系统主要解决了数据处理引擎专用化、数据处理平台多样化和数据计算实时化的问题,一定程度上促进了深度学习、知识计算、可视化等大数据分析技术的发展。未来大数据处理系统仍将面临数据复杂性、计算复杂性和系统复杂性的挑战[7]。
龙源期刊网 http://www.qikan.com.cn
2.2 可视化算法及库
可视化开发工具可分为应用程序开发工具和Web应用开发工具。应用程序开发工具有VTK、ITK、ParaView、Prefuse、Flare、Processing和Tulip等,多数基于OpenGL封装和支持,采用C++开发,可跨平台运行;Web应用开发工具主要有HTML5 Canvas、SVG和Flash三种。HTML5 Canvas元素利用2D绘图环境,调用JavaScript API在线绘制点、线、矩形、多边形、渐变、文本等2D图形,常用的Canvas 2D标准绘图API有Processing.js、Paper.js、VVVV.js。WebGL是基于OpenGL ES2.0制定的Canvas 3D绘图环境,内部实现利用 GLSL shader 语言对顶点和片段进行控制,以实现3D图形的硬件加速,降低绘制及渲染延时。常用的WebGL标准绘图API有GLGE、CopperLicht、SceneJS、SpiderGL、Three.js、C3DL和Google O3D[8]。Google Chrome、Safari、Mozilla Firefox等浏览器支持WebGL 1.0规范。HTML5 Canvas具有开放性、免插件、跨平台、硬件加速等优势。SVG (Scalable Vector Graphics)是HTML5 Canvas的替代技术,使用 XML定义矢量图形,SVG比JPEG和GIF图像尺寸更小,可任意缩放和高质量打印,文本可选与可搜索等优势。基于SVG技术的常用标准绘图API有D3.js、Raphal、Google Charts。而基于Flash技术的可视化算法及库开发的可视化应用由于依赖于Adobe Flash Player插件且得不到苹果公司的官方支持,应用前景远不及HTML5。 2.3 浏览器
移动可视化应用需实现跨平台和跨终端访问,支持各种品牌的移动终端设备,摆脱对底层软硬件的依赖。移动Web浏览器无疑是移动可视化应用的最佳运行环境,主要分为内置浏览器、可下载浏览器和WebView三种类型。支持移动数据可视化的浏览器需具备支持W3C定义的HTML5规范,并支持Canvas 2D图形、图像导出、WebGL 3D图形、SVG解析、动画、音视频解码与控制、表单、JSON、AJAX通信等关键功能[9]。由于苹果iOS操作系统和Android操作系统的绝对领先垄断地位,使Safari和Chrome成为主流的移动浏览器。 2.4 触控交互
可视化交互设计与用户体验密切相关,设计者必须确保触控交互操作的直观性、易理解性和易记忆性,引导分析者把关注点聚焦于分析任务,而不必过多关注实现任务的具体操作方式和流程。可视化系统有选择、导航、重配、编码、抽象/具象、过滤和关联7大类交互任务,以实现缩放、平移、旋转滚动、数据筛选、可视化映射变量(点、线、面、形状、位置、大小、颜色、纹理、方向等)控制、数据映射方式控制、细节控制等任务,系统根据反馈生成新的可视化结果。以键盘、鼠标作为主要手段的交互技术无法满足用户与移动终端设备之间的交互需求,多点触控(MultiTouch)成为移动终端环境下最主要的交互技术。它能够同时辨识多个接触点的数量和位置,允许用户同时通过多个接触点与系统进行全屏交互,减少了对交互控件的依赖,简化了界面设计工作量。触控交互方式主要有触摸、手势、键盘3种。触摸事件有拍击(Tap)、滑动(Swipe)、捏合(Pinch)、拖曳(Drag)、旋转(Rotate)、摇动(Shake)。手势事件被定义为两个或多个触摸事件同时发生,也可以通过定位、陀螺仪、光