• KTV娱乐
  • 家庭娱乐
  • K米网

非结构化数据管理:大数据时代的基石

发布时间:2013-06-25

      非结构化数据是指没有显式数据结构的数据,包括文本、网页、邮件、格式文档、图形图像、音视频等。专家预计,随着大数据(Big Data)时代的来临,围绕新型数据应用,未来五年数据管理与系统将有新的突破。为抓住非结构化数据等新型数据管理领域发展的机遇,国家“核心电子器件,高端通用芯片,基础软件产品(简称核高基)”科技重大专项提前部署,在“十一五”期间设立了“非结构化数据管理系统”课题。课题经过两年攻关,取得了丰硕成果,形成了四面体数据模型、分布式柔性事务模型以及跨媒体计算理论和方法等一批非结构化数据管理的核心技术,研制成功了三款自主的非结构化管理系统产品,应用于盘古搜索、新华微博、科技基础条件平台资源管理、CADAL数字图书馆、天宇舆情分析等典型海量数据管理领域,并在多媒体数据管理、智能交通信息服务、航空制造生产服务、医学影像数据处理等系统中形成了应用创新。课题成果不仅推动了非结构化数据产业发展,而且彰显了中国非结构化数据管理技术的核心竞争力与广阔市场前景。

      为凝练、固化“非结构化数据管理系统”课题的研究成果,推动非结构化数据管理技术与产业的发展,在工业和信息化部软件服务业司及全国信息技术标准化技术委员会和的指导下,北京航空航天大学、清华大学、浙江大学、中国人民大学、北京大学、中国科学院软件研究所等高校及研究机构,星网视易、百度、用友、阿里云、拓尔思、中软等业界厂商发起成立了非结构化数据管理标准工作组,负责制定和完善我国非结构化数据管理领域的标准体系、制定我国非结构化数据管理相关国家标准并对口ISO/IEC JTC1 SC32/WG4,参与非结构化数据管理的国际标准化工作,秘书处设中国电子技术标准化研究院。

      作为非结构化数据管理标准工作组成员之一,星网视易深耕数字娱乐数字标牌数字家居三大产业,在产业中处于领导地位,年销售十多万台终端设备,每天为百万人提供视讯服务。取得这样的规模,视易必然拥有海量多媒体资源,包括图片、文本、音频、视频、网页、文档等相互组合和关联的非结构化数据,也积累了非结构化数据管理经验。随着视易云平台的建立,非结构化数据将出现井喷,其中蕴含了巨大的商业价值,也对非结构化数据管理技术提出了更高的要求。加入标准工作组将为各方搭建了一个分享、交流、学习的平台,也提供了将视易的技术积累贡献到将来产生的标准中的机会。

      目前国际产业界对非结构化数据管理系统表现出了极高的热情,Google、Yahoo、Facebook、Twitter、百度、腾讯等互联网企业,以及IBM、微软、Oracle、EMC、SAP等传统IT企业,都有相应的产品或内部支撑平台在研发。

      工信部软件服务业司副司长陈英在工作组成立大会上表示,工作组应积极关注国际动向,并加强对关键技术的攻关,切实为中国非结构化数据管理产业的发展服务。同时,应建立产学研用互动的工作机制,吸纳更多学术界、教育界和产业界的单位加入,提升中国在非结构化数据管理领域的整体竞争力。

 

相关信息