当前位置 > 首页 > 专家访谈 > “爬虫”引围观 联想大数据应用专家访谈

“爬虫”引围观 联想大数据应用专家访谈

来源:中国数据分析行业网 | 时间:2015-08-28 | 作者:数据委

在今年的中国国际大数据大会上,联想集团展示的大数据挖掘“爬虫”技术吸引了很多参观者的目光,联想利用爬虫技术来对数据的质量源进行收集和分析,PB级的数据量处理能力使得联想近些年在大数据领域逐渐占据了自己的一席之地,同时利用大数据等一系列技术来服务不同行业的用户,作为一个国内IT领头厂商上述特点和优势都给笔者留下了很深的印象。

  在本次大会之后,记者也有幸与联想集团副总裁、联想研究院云计算与智能计算实验室主任黄莹先生和联想集团研究院大数据总监郭炜先生就当前大数据领域的发展以及联想在大数据技术领域的一些应用和创新进行了深入的沟通和交流。

  在谈到联想利用大数据分析技术来对产品进行改进方面的问题和措施时,黄莹博士表示,联想近些年一直在利用大数据技术来对产品规划进行着背后的支撑,通过对大量数据的分析以及用户信息的反馈收集来更好的把握住用户需求,从而让联想的产品更好的打入市场,服务用户,这些成功案例当中,联想的大数据平台功不可没。

在谈到传统BI与大数据技术之间的关系和区别时,黄总指出,当前的大数据技术、BI以及传统分析等方面还是有着区别的,拿联想的大数据团队来说,大致可以分为2个小组,一组是针对大数据和大数据技术平台进行研究和开发;另一组主要在海外市场,来专门做数据分析、预测以及BI等方面的工作。

  在联想看来,这两个是相辅相成的过程。传统的BI工作对业务决策者还是很有价值的,可以人业务决策者进行数据驱动的决策,而不是拍脑袋。可以通过优化、统计学的工作,把数据分析做好。

  对于现在的国内市场来说,做大数据的人才大部分是工程师出身,这些人才的技术水平都是非常不错的,但大数据如何进行经济转换,如何让大数据更懂企业更懂商务。对于这部分技术人员来说就变得有些困难了。不过,上述这些难点与需求,联想目前已经把二者进行了很好的结合,在两方面内容当中通过两个团队的协作做到了相辅相成。

  企业对于大数据的需求基本具有两个特点,一是大数据底层收集数据和处理数据的服务能力,二是上层分析利用大数据平台的能力,对于当前企业中间件来说需要的是改变和创新,传统的数据库对于数据处理能力相对薄弱,基本都是基于结构化处理的设计理念来做的,对于非结构化数据或者大量的数据处理来说依然存在瓶颈。

   近些年我们都知道,联想集团一直都在谈转型,然而转型的最终目的就是要以客户为中心。黄博士强调,大数据技术在联想体系内进行了很广泛的应用,公司内部的很多产品线都利用大数据平台和技术来聆听和分析用户的需求,从而更好的服务客户,这也是让大数据更好的替公司经营、赚钱。当前联想的很多项目在价值层面上也在利用大数据平台进行数据收集和分析,并且充分得到了大数据带来的价值。

  郭总补充道,大数据以前都是在喊口号,谈概念,现在的大数据技术已经在最前沿与业务进行了很紧密的结合,大数据已经可以让企业新技术快速的融入到具体业务体系当中,这也是用户所希望看到大数据最直观的价值。

  对于联想在大数据领域的合作形式和情况方面黄博士指出,联想作为全球性的企业在大数据领域的合作形式还是非常广泛的,在国外会进行成熟的解决方案合作,在不同的专注领域联想会提供特殊的技术来加强合作力度,同时,开放合作也是联想合作模式当中一个非常重要的环节,只要客户需要,联想就会进行多种内容、多种形式的合作,比如云计算、大数据等领域。

  现在越来越多的企业都在谈大数据,也都在做大数据,作为在大数据领域摸爬滚打多年的郭炜来说,他认为从企业角度来讲,做大数据一定是先想到自己的业务。大数据和过去做BI不一样,它要融入到整个业务流程当中。对于每个企业来讲,它的业务是怎样定义的,怎么把大数据融进去,这是非常重要的。从技术架构来讲,现在有很多开源的软件,是不是要进行更大的优化,互联网企业可能会自己做,中型的企业就需要外部厂商的帮助,有些小型的企业可能就会使用大数据服务的方式将数据存在云端。根据不同企业的规模和情况,可以选择适合自己的发展路线。这是企业建大数据平台时更加关注的。

  在对于大量数据的展现形式层面黄博士表示,通过实际的客户应用需求和案例,联想利用自然的交互方式来对数据进行呈现,比如语音交流等形式,这样一来就能够非常准确的将数据结果展现在用户面前,同时也方便并且简化了用户日常的繁琐工作步骤,以最快的方式找到自己需要的信息。

  当被记者问到联想在大数据技术领域所体现的商业价值时黄博士表示,像爬虫技术、自然语言处理、底层大数据处理工具、Hadoop、Spark、数据清洗等方面联想已进行了平台化管理和应用,在定价、营销和供应链分析等环节当中,中国区以及联想海外市场的很多部门也已经进行了非常广泛的应用。这样一来带来的最大价值就是拉近了设备厂商与用户之间的距离,同时联想能够更加精准的了解用户想要什么,进而体现联想大数据技术的分析价值,这对于整个联想来说,不单单是在产品层面能够大大获利,在集团的整体运营、管理和发展等方面都能够进入一个非常良好的循环当中。

来源:pconline