压片机厂家
免费服务热线

Free service

hotline

010-00000000
压片机厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

大数据延续吸金非结构数据亟待开发

发布时间:2020-03-10 11:11:56 阅读: 来源:压片机厂家

A5交易A5任务 SEO诊断淘宝客 站长团购

大数据对资本市场的吸引力方兴未艾。

日前,位于美国硅谷的大数据智能关系管理公司RelateIQ再获4000万美元融资(新估值2.45亿美元)。而在最近一年的时间里,全球大数据行业已有20多起千万美元范围以上的融资案例,累计触及投融资金额超过20亿美元。

与以往融资的大数据公司主要处理结构数据不同,RelateIQ主要是通过实时分析公司业务中的电话、短信、邮件等非结构数据,为公司管理客户、保护员工提供建议。

现阶段全球对大数据比较成熟的开发运用主要在于个人信息、交易纪录等结构数据,这部份的价值不言而喻。RelatelQ的成功融资表明,文本、视频、图片和音乐等非结构数据的开发正在成为大数据的新蓝海。专注于企业级非结构大数据处理公司慧思拓CEO包启挺表示。

占比八成以上

根据包启挺介绍,对企业CRM数据库、网络阅读轨迹等结构化、半结构化数据,由于相干的处理方法和计算模型比较成熟,已成功实现商用,例如运用比较普遍的电商网站推荐系统。

与之相比,躺在办公室、互联网各个角落的非结构化数据,像员工日常工作中产生的会议记录、录音或电子邮件,和潜伏网络客户阅读的文本、发表的评论、晒出的图片等等,却因散布零散、分析困难,很少有大数据公司前往问津。

但这其实不意味着这些非结构数据就没有价值,或比结构数据的价值要小。

相反,国外一家类似RelatelQ的非结构数据公司慧锐(VERINT)的一项调查显示,有42%的企业管理者认为非结构化数据处理起来是一个很大的困难,同时93%的管理者认为这些非结构化数据对企业来讲非常重要。

非结构数据散布广泛,获得方便,这为价值发掘提供了条件。比如,虽然淘宝的用户数据是封闭的,用户的评论和评价都是公然的,抓取以后,通过各种维度的重构和计算,一样能提炼出对企业的产品设计、定价、营销和售后等各环节有用的信息。包启挺说。

国际市场研究机构IDC的一份报告还显示,结构化数据只是大数据的很小一部分,当前数字领域约1.8 万亿 GB 容量中,非结构数据占比在80%~90%之间,并且直到2020年都将以44倍的发展速度增长。

为大数据提供云计算服务的浪潮团体高级副总裁王恩东也指出,现在正处于行业内异构数据同享和价值释放的阶段,并在未来相当长的时间都会处在这个阶段。这个阶段,会有大量的新技术和新产品出现,无论是硬件还是软件。对产业链上下游的系统厂商、行业ISV来讲,这都是难得的历史新机遇。

大佬陆续抢滩

鉴于非结构化数据在商业价值上的广阔空间,目前,全球范围内传统企业服务领域的大佬都在抢滩占位。

在国际市场上,代表性企业是以IBM为代表的国际咨询公司和SAP等国际数据巨头,它们致力帮助企业利用内部系统的非结构数据来改良内外部管理。国内市场方面,百度、阿里巴巴等为平型台IT企业也在利用本身的数据资源,开始了对非结构化数据的初步开发,主要用于监测和改进本身的产品服务。

非结构数据的一块重要领域,互联网上的非结构化数据在企业中的运用,也吸引了部份本土公司的注意,慧聪研究(HCR)和拓尔思(TRS)就是其中的两家。

公然资料显示,HCR是范围最大的本土市场研究公司,近几年频繁传出大动作;拓尔思则是中国最早的、最大的企业级搜索服务平台,在政企舆情监测、中文非结构化数据分析技术开发等方面有多年的积累,2011年已在创业板上市。

2013年年底,两家公司合资,成立了中国第一家专门针对非结构数据的企业级大数据处理公司,即是前面提到的慧思拓,由HCR副总裁包启挺出任合资公司CEO。

拓尔思是中国最早的企业搜索公司,在中国政府舆情监测市场处于领先地位,在企业级非结构化数据抓取分析方面具有丰富的积累。HCR的优势在于,多年的企业服务经验,可以将海量非结构数据分析结果融入到企业的具体需求中去。包启挺说。

掌控需求是王道

慧思拓成立以来,我们一直在思考,怎样才能利用互联网大量的非结构数据创造商业价值。这里需要斟酌两个问题,企业对非结构数据的需求是什么,非结构化数据如何重构成产品。直到现在,总算有了大致的思路包启挺说。

在包启挺看来,这是一个全新的市场,国外算是刚刚起步,国内基本上是空白,而且不能完全鉴戒国外唯一经验。由于国内外在文本、音频及图片等非结构化数据形态上存在天然区分,直接影响到后续的分解、重构进程,这恰恰是非结构大数据运用的最核心环节。

以文字为例,英语的语言结构相对简单,无外乎主谓宾定状补等六大部份,相对而言比较容易依照一定规则进行拆解和分析;而汉语就复杂的多,一个字多种词性、多种语音、多种意思的比比皆是,必须通过复杂的组合和计算才能准确进行解析。

某知名大数据营销公司高层表示,大数据的开发就是分析和重构,非结构化数据分解困难还在其次,最为重要的是,如何将分解以后的数据结合企业的市场需求,重构成为满足企业各种需求的信息产品,这也是目前最为困扰各大数据公司的地方。

目前,慧思拓在非结构化数据的相干产品已展开试点,比如常见的客户回访,传统打电话方式的费时费力,转而通过抓取和分析网络上大量有关该产品的评论、晒图等非结构数据,将会对传统调研结果构成非常有效的补充和印证。

固然,非结构化数据在企业层面的运用,绝对不局限于对客户回访、舆情监测等传统业务的改造,慧思拓还在尝试围绕海量非结构化数据为企业产品的生产、定价、售后等提供一整套全新的参考信息产品。包启挺说,具体产品还在研发阶段,暂不方便泄漏。

中国振华进出口总公司

重庆沙鼠科技有限公司

租得嗨成都公寓管理有限公司

重庆腾建汽车销售服务有限公司