数据如何分析预测数据分析预测详解?

营销圈公众号引导关注

发现大数据的价值已成为学术界和工业界的热门话题。本文截取了CCCF中《大数据的价值挖掘与联想的探索实践》一文中关于数据提取与处理方面探讨如何挖掘大数据的价值,并介绍联想集团在这些领域的实践。

数据如何分析预测数据分析预测详解?

引言

近年来,“大数据”一词被广泛提及,人们用它来描述和定义信息爆炸时代产生的海量数据。根据研究机构高德纳(Gartner)的定义[1],“大数据”是海量、高速、多样化的信息资产,它需要有效创新的信息处理模式才能产生对事物的洞察分析、帮助制定决策和促进流程优化。这个定义揭示出大数据是一种资产,但这个资产的价值不在于庞大的数据量本身,而在于对这些数据进行分析处理,发现数据中潜在的规律,从而创造价值。

数据的提取与加工

数据已经成为当今的“新石油”。各行各业每时每刻都有数据产生,数据的激增为基于数据的智能应用创造了前所未有的施展空间。“新石油”需要“提炼”才有用,而这项技术对应着大数据的提取与加工,当下基于知识图谱(knowledge graph)的大数据提取和加工技术最具代表性,近年来也最为活跃。

知识图谱的概念由谷歌在2012年正式提出[2],旨在利用知识构建更智能的搜索引擎。基于知识图谱的大数据提取与加工的过程如图3所示,包括提取、融合、关联三个关键步骤。提取就是从数据源中识别出需要的实体和关系,数据源可以是海量的文本、网页、表格或图片,从数据源中提取出来的知识最初是一些碎片,需要融合技术将众多碎片知识通过关系连接起来。随着碎片知识越聚越多,最终形成一个知识网络,即构成了知识图谱。内部的知识图谱还可以与外部公开的知识图谱关联,从而使知识图谱继续增长,构建为一个既包含自有知识又兼具公开知识的内容丰富的知识资源。用这样的数据提炼技术,我们可以从海量甚至泛滥的大数据中萃取出知识,并且使计算机更容易使用,具有更高的价值。

数据如何分析预测数据分析预测详解?

图3 基于知识图谱的大数据提取与加工

我们以联想客服知识图谱为例,介绍将数据加工为知识图谱的过程。联想客服知识图谱中储备了售前、售后、手机使用、故障排除和常识5大类知识,总的实体数量超过30万条。这些知识是从大数据中抽取、融合、关联得到的。

联想有关于产品信息、客户服务、运维、故障修理等各种数据资源,互联网上也有大量关于联想公司、联想产品的介绍和评论。这些信息构成了联想客服知识图谱的原材料。这些原材料来自不同的业务应用和不同的区域,因此格式复杂、数据异构,同时语言种类也比较多,知识融合成为难点。知识互联的自动学习也是一个很大的挑战。

联想客服知识的抽取就是按照知识图谱的总体本体定义,从数据原材料中抽取出需要的实体和关系。比如,针对公司产品的调查问卷、公开的产品评论,可以利用产品名识别技术(named entity recognition)和情感分析技术(sentiment analytics),自动构建产品评论知识,并和联想产品知识图谱自动关联。构建完成后,在联想客服知识图谱中,每款产品分别对应必备型、期望型、魅力型、无差异、反向型等多级评价。这些细粒度的知识不仅可以更好地引导客服流程,而且还可以应用于指导业务的质量改进和产品迭代。

另外一类比较重要的知识是对话策略相关的知识,这类知识可以帮助客服机器人理解用户的行为,进而跟踪和管理对话的状态,更好地指导机器人自然、友好地与人对话。这些知识是从大量的人工客服与用户的对话中加工出来的。获取了客服代表和用户在服务中的对话日志,借助流程策略识别、抽取、加工和合并,最终形成相关的策略、流程等知识图谱。联想的客服机器人已在更大范围内投入使用,也逐渐融入线下服务,因此可以从过去维修记录中提取问题根源相关的知识,这些知识可以用来辅助人工更快地诊断问题,进而提高其生产率,最终提升用户体验。

除了基于知识图谱技术进行知识的提取与加工,基于众包(crowdsourcing)和基于人计算(human computing)等大数据加工技术也值得关注。众包的模式把数据加工拆分成众多微型任务,然后在网络平台上批量发布,通过广泛招募志愿者或付费工作者来完成数据加工;人计算的模式,侧重人能轻易完成而机器难以完成的任务。这些方法都是通过调动大众的力量,试图用相对便宜的价格获得大规模的加工数据,它们随着智能网络的兴盛和AI技术的进步应运而生,并逐渐被业界认可和使用。

未来大数据加工的广度和深度以及影响,可能会超越我们的想象,不过我们相信不论使用何种数据加工方法,大数据提取与加工必将向“知识共享,知识融合,数据自由”[3]的方向努力。然而,随着大数据提取与加工技术的进步,从大量关联的普通数据中还原出用户的敏感、隐私信息已不再困难。如何在数据加工、共享及使用中保证数据安全、可信、受控,成为大数据抽取与加工的新课题。

未来展望

联想正在进行智能化转型,明确以智能物联网、智能基础设施、智能垂直行业为发展方向。作为全球电脑市场的领导企业,联想拥有终端设备存储的丰富数据、全球领先的超算构建能力以及客服运维物流仓储等海量资源,这些都为联想的智能化变革打下了基础。目前联想通过自主构建的大数据平台、工业物联网平台、企业级人工智能平台,在提升自身效能的同时,将智能技术提供给其他企业,帮助他们实现各环节数据的采集、分析和融合,更容易地使用智能化技术提升企业效能。

从数据提取价值,可以优化流程、节约成本、产生收益。这个过程也在反向促进数据处理与分析技术的进步。当前,智能化变革已经成为时代趋势。人工智能正在各行各业落地,旨在提升行业效率,催生新的业态、产品和服务。要想人工智能进一步与行业结合,发挥更大的作用,包括联想在内的企业应该携起手来,共同促进人工智能技术的进一步突破,推动人工智能进一步落地行业,助力产业发展,造福人类生活。

好了,这篇文章的内容营销圈就和大家分享到这里,如果大家对网络推广引流和网络创业项目感兴趣,可以添加微信:Sum8338 备注:营销圈引流学习,我拉你进直播课程学习群,每周135晚上都是有实战的推广引流技术和网络创业项目课程分享,当然是免费学!

版权声明:本站部分文章来源互联网用户自发投稿,主要目的在于分享信息,版权归原作者所有,不承担相关法律责任。如有侵权请联系我们反馈邮箱yingxiaoo@foxmail.com,我们将在7个工作日内进行处理,如若转载,请注明本文地址:https://www.yingxiaoo.com/130412.html