时空大数据研究中心

一、成员简介

中心主任:李军

中心成员:


序号

姓名

性别

出生年月

职称

所属学院

学科方向

1

李军

1962.03

研究员

武汉大学

计算机

2

李英冰

1972.12

副教授

武汉大学

大地测量

3

虞晖

1969.04

副教授

武汉大学

计算机

4

吴云

1975

副教授

武汉大学

大地测量

5

方兴

1981.11

副教授

武汉大学

大地测量


二、建设平台的目的和意义

1、科学目标(拟解决的主要科学问题)

         时空大数据是指对规模巨大的时间和空间数据进行关联分析。研究中心作为开放式研究平台,开展时空大数据产业发展的理论与实践研究,培养时空大数据领域专业化人才,打造国内一流的时空大数据研究机构。

         研究中心依托武汉大学测绘学科的传统优势,通过多学科交叉融合,开展时空大数据挖掘、可视化分析、预测性分析和大数据管理的关键问题研究;多源时空大数据的编码、存储、查询与建模;时空数据处理中的最优估计与故障检测方法;时空数据的模糊性和不确定性理论;高性能时空数据解析与大数据挖掘算法。

2、对学校学科建设、人才培养、科学研究等方面的贡献

学科建设研究中心的建设和发展,将形成国内以空间信息和GIS为基础、现代时空大数据的智能获取和分析为核心的研究新力量,培养与造就时空大数据领域的高水平研究人才,促进空间信息和GIS领域向更广泛的空间信息科学拓展。

人才培养以硕士和博士研究型人才培养为主,每年培养2~5名博士研究生,10~15名硕士研究生,形成约30人左右的研究生团队,为社会输出高水平的时空大数据研究人才。

科学研究结合我国大数据方面的“十三五”规划,重点开展时空大数据的智能获取与网络感知;多源时空大数据的编码、存储、查询与建模;时空数据处理中的最优估计与故障检测方法。积极参与国家重大专项,取得具有国际水平的时空大数据研究科研成果。

三、国际国内该领域的研究现状、最新进展以及发展趋势

         2008年末,大数据得到部分美国知名计算机科学研究人员的认可,随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。

    目前时空大数据的主要研究方向可概括为四个方面,具体包括:

    1.时空大数据的智能获取与网络感知。随着地理空间信息技术和位置服务技术、互联网技术的快速发展, 以空间位置为核心, 组织、描述和理解现实世界和虚拟世界中人、事、物之间的关系,实现泛在信息关联正逐渐成为一种趋势。 由于位置本身在表示方法、 时空基准、精度、时效、覆盖范围以及语义等方面存在差异性,需要研究如何在不同的参考系统之间的位置转换和语义描述方法, 以及各种位置相关信息基于语义的多尺度动态关联和聚合方法。从基于互联网+的民众参与使得含有大量噪声或粗差的定位数据中,利用知识库和数据挖掘算法自动获取有用信息是未来的研究重点方向。

    2.多源时空大数据的编码、存储、查询与建模。时空数据是描述事物和现象空间特征及其属性特征的信息集合,具有多时态、多格式、多语义、多尺度等特征,需要采用科学的分类与表达和编码方法,实现多源、多分辨率、多时相、异构的时空数据高效获取、规范化处理和无缝管理,从而满足实际应用的需求。多源时空信息的深度时空关联和语义关联技术是进行快速查询与建模的关键,它包括时空关联规则的制定,时空特征化/概化模型的建立。其中时空关联规则是研究重点,国内外已有不少学者对其进行了研究或应用。FlorianVerheinSanjayChawla提出一种在交通高峰区域进行属性约减的时空关联规则算法STAR,其将关联规则扩展到时空领域。SheKhar等利用时空关联规则实现交通流量监测。分布式并行时空索引是以分布式协同、高性能计算、时空数据流处理为核心的新一代空间信息系统,也是亟需突破解决的关键问题之一,大部分时空索引是以B-treeKD-treeR-tree等为基础。

    3. 面向海量信息的高性能时空数据解析与大数据挖掘算法。地理时空大数据从数量规模性、类型多样性和产生的高速性等各方面对数据的分析计算带来巨大的挑战。而并行机体系结构和计算资源扩展的能力为地理时空大数据的并行计算分析提供了新的发展机遇。现有的大数据计算环境主要分为两种:一种是以Storm为代表分布式的、容错的实时计算系统,可以以级处理大数据;另外一种是以MapReduce为代表的批处理计算环境。MapReduce具有很好的扩展性、可用性和容错性,已经成为处理大数据最流行的并行计算环境。考虑到大数据的大数量规模,相关的研究从抽样方法、主成分分析方法、低秩矩阵分解方法等展开,能有效地划分高维和大数据集。数据挖掘技术与智能算法相结合,如基于多目标进化的模糊关联分类方法 MOEA-FACM、基于混合进化算法的模糊分类器学习算法、基于动态遗传算法的聚类新方法,以及结合数据挖掘中PAM算法和并行粒子群算法进行数据划分等。

       4.时空大数据分析在不同领域中的应用。空间环境是人类生存的基本依赖,时空大数据是空间环境系统的感知或地理现象的表达,研究时空大数据挖掘理论框架与算法,深入分析时空变化趋势并预测未来时空状态,对规划建设、指挥调度、应急管理和信息服务等领域具有重要的应用价值。

    越来越多的应用领域在问题的分析过程中需要同时考虑时间和空间因素,将时间纳入空间系统中,研究空间位置信息随时间变化的规律,重现历史、跟踪变化和预测未来。因此,响应当前位置信息聚合和地理时空大数据挖掘的需要,研制大数据相关的位置信息汇聚和分析挖掘算法,可以有力地促进我国空间信息产业和位置信息服务的发展。


四、平台现有工作基础、水平

    1、在本领域所处的地位与发展潜力

      时空大数据属于较新的空间科学研究领域,国内的研究基础整体较为薄弱,水平也较为落后。武汉大学测绘学院在空间信息、数据处理理论等方面的研究基础和实力雄厚,具有开展时空大数据研究的坚实基础。

      姚宜斌教授利用气象数据和GNSS数据进行空间环境变化的研究,并发表了多篇相关的高水平论文,李军主持了智慧房管主数据设计与一期建库,将房屋的不同阶段、不同形态、不同环境下的各类信息,按时空关系进行有序组织,构建了跨部门的时空协同房管体系,实现了房屋动态变化管理,并正在采集全国范围内的新房及二手房数据。中心成员主持了多项相关的863项目或自然基金项目,具备较强的时空大数据的研究实力。

      时空大数据研究中心的成立,可以更好地利用测量学科和人才优势,构建人才培养和科研合作平台,成为时空大数据的重要研究基地。

2、    5年承担的国家及省部级重大科研任务

(1) 国家863项目:GNSS 环境与灾害监测技术(2009AA12Z320),2009.1-2010.12, 李英冰主持.

(2) 国家自然科学基金:带有先验信息的总体最小二乘全局优化算法研究及在测绘中的应用(41404005),  2015-2017,方兴主持.

(3) 国家自然科学基金:GNSS接收机自主完备性监测的高级算法与性能研究(41304005), 2014-2016, 吴云主持.    

(4) 湖北省武汉市住房保障与房屋管理局项目: 智慧房管主数据设计与一期建库, 2014.11-2017.12, 李军主持.

3、    代表性科研成果如奖励、发明专利、代表性论文或学术专著

1) 奖励

(1) 武汉市房屋全生命周期管理信息系统建设与实现,地理信息科技进步奖,  2015.

2)         发明专利及软件著作权

(1) 基于六十进制的GNSS 观测值压缩与解压缩方法(发明专利),专利号:201010227700.6.

(2)   一种整周模糊度搜索装置.专利号(实用新型专利):201020592934.6.

(3) 基于互联网运行的GPS 卫星预报软件[简称:GSky] V1.0 2011.3, 软件著作权登记号: 2011SR03154

(4) 基于互联网运行的GPS 质量检查图形绘制软件[简称:GChart] V1.0,软件著作权登记号:2011SR2583

(5) GNSS 自动化实时监测软件[简称:GEye]V1.0,软件著作权登记号:2011SR016268.

(6) 直接解算形变量的 GNSS 监测软件[简称:GMonitor]V1.0 ,软件著作权登记号:2011SR03154.

(7) 基于互联网的房屋信息智能感知软件[简称:HouseSense] V1.0, 软件著作权登记号:2015SR165287.

(8) 房屋信息自动化入库软件[简称:DbRobot]V1.0,软件著作权登记号:2015SR178296.

3) 代表性论文

[1]  方兴、曾文宪、刘经南、姚宜斌、王勇. 基于非线性Gauss-Helmert模型的LS-TLS混合最小二乘估计,《测绘学报》,2015In PressEI

[2] Fang Xing, Wang Jin, Li Bofeng, Zeng Wenxian and Yao Yibin, On total least squares for quadratic form estimation, Studia Geophysica et Geodaetica, 2015, Vol59, No.3, P366-379, doi:10.1007/s11200-014-0267-x SCI-26

[3] 方兴、曾文宪、刘经南、姚宜斌.三维坐标转换的通用整体最小二乘算法,《测绘学报》,2014Vol.43No.11P1139-1143EI

[4] Yun Wu, Jinling Wang etc., Advanced receiver autonomous integrity monitoring (ARAIM) schemes with GNSS time offsets, Advances in Space Research, 2013, http://dx.doi.org/10.1016/j.asr.2013.03.002. (SCI)

[5] Fang X (2015) Weighted total least-squares with constraints: a universal formula for geodetic symmetrical transformations. Journal of Geodesy, 89 (5): 459-469 (SCI)

[6] Wang J, Kutterer H, Fang X* (2015) External error modeling with combined model in terrestrial laser scanning, Survey Review, DOI: 10.1179/1752270614Y.0000000154 (SCI).

[7] Huang X, Xie C, Fang X, Zhang L (2015) Combining Pixel-and Object-Based Machine Learning for Identification of Water-Body Types From Urban High-Resolution Remote-Sensing Imagery. Journal of selected topics in applied earth observations and remote sensing. DOI:1109/JSTARS.2015.2420713 (SCI)

[8] Zhou Y, Fang X* (2015) A mixed weighted least squares and weighted total least squares adjustment method and its geodetic applications. Survey review. DOI: 10.1179/1752270615Y.0000000040 (SCI)

[9] Fang X, Wu Y (2015) On the errors-in-variables model with equality and inequality constraints for selected numerical examples. Acta Geodaetica et Geophysica, DOI: 10.1007/s40328-015-0141-5 (SCI)

[10] Fang X (2014) On non-combinatorial weighted Total Least Squares with inequality constraints. Journal of Geodesy, 88 (8): 805-816(SCI)

[11]Fang X (2014) A structured and constrained Total Least-Squares solution with cross-covariances, Studia Geophysica et Geodaetica, 58 (1): 1-16 (SCI)

[12] Fang X (2014) A total least squares solution for geodetic datum transformations. Acta Geodaetica et Geophysica, 49 (2): 189-207(SCI)

[13] Lu J,  Chen Y,  Li BF, Fang X (2014) Robust Total Least Squares with Reweighting Iteration for Three-Dimensional Similarity Transformation, Survey Review, 46(334):28-36(SCI)

[14] Fang X (2013) Weighted Total Least Squares: necessary and sufficient conditions, fixed and random parameters. Journal of Geodesy, 87 (8): 733-749(SCI)

[15] 胡长江, 李英冰. 全球导航卫星反射信号的镜面反射点算法. 测绘科学, 2014, 39(12): 33-35.

[16] Guo J.Y., Li Y.B., Dai C.L., and C.K. Shum. A technique to improve the accuracy of Earth orientation prediction algorithms based on least squares extrapolation. Journal of Geodynamics, 2013, 70: 36-48. (SCI)

[17] 周雨, 李英冰. GPS观测数据的仿真. 全球定位系统, 2013, 38(2): 50- 52.

[18] 李英冰, 闫景仙, 熊程波, 陈中新. GNSS观测值的压缩方法研究. 武汉大学学报·信息科学版,2012, 37(5): 818-822. (EI)

[19] 李英冰, 夏敬潮. GPS广播星历的时间序列分析. 海洋测绘,2011, 31(1): 20-22, 27.

[20] 李英冰, 熊程波, 闫景仙. GNSS质量检查的图形绘制. 测绘工程,2011,20(2): 11-14.

[21] 李英冰. 基于ARIMA模型的地球自转变化预报. 全球定位系统,2010, 35(1): 1-5.

4)学术专著

[1] 吴云, 最优估计与假设检验理论及其在GNSS中的应用,2015,科学出版社.

[2] 李军, 面向对象和组件的C#编程, 2013,科学出版社.

五、研究方向和主要研究内容,及各研究方向之间的联系性

向我国空间信息产业和位置信息服务的需求,时空大数据研究中心进行时空大数据的获取、管理、处理等方面的理论与应用研究,主要研究方向有如下:

1.时空大数据存储中心建设。开发从互联网上自动下载数据的软件,采集地理空间、气象、兴趣点、房产、以及测绘等相关数据,建立测绘数据存储中心,服务学院教学科研,实现科研数据在全院范围内的共享。

2. 时空大数据挖掘算法研究与数据分析平台建设。从具有海量、 高维、 高噪声等特性的时空数据中提感兴趣的时空模式与特征、时空与非时空数据的普遍关系及其他一些隐含在互联网或数据库中的、人们事先不知道的、 但又潜在有用的信息及知识的过程特征。开发和应用新兴的计算技术来分析海量、高维的时空数据,揭示时空数据中的有价值知识。开发划分、相关性分析、异常分析、预测、可视化分析等程序模块,利用知识库和数据挖掘算法自动获取有用信息,构建大数据分析实验平台建设。

3. GNSS空间环境学研究。利用气象和GNSS等时空数据,分析对流层和电离层等空间环境变化,研究电离层三维精细建模及电离层异常扰动的时空分布规律和触发机制,以此研究和构建高时空分辨率全球对流层延迟精化模型。

4.房屋大数据分析与房价评估研究。用空间数据挖掘方法对房价进行分析,并对全国各城市、各区域、各板块实施动态监测,结合交通、教育、医疗、经融、商业等各项影响因素,通过时间、空间特征因素的动态运算,建立房价关联性分析模型,实现房价的自动评估、预测与预警。

以上的研究方向中,时空大数据存储中心建设和数据分析平台建设是研究基础设施,时空大数据挖掘算法研究是理论基础,GNSS空间环境学研究和房屋大数据分析与房价评估研究是应用研究。



武汉大学测绘学院空间信息工程研究所版权所有 地址:武汉市洪山区珞瑜路129号 邮编:430079