当前位置 > 首页 > 技术热点 > 数据产品设计原则和架构实现(2)(上)

数据产品设计原则和架构实现(2)(上)

来源:中国数据分析行业网 | 时间:2016-09-08 | 作者:数据委

商业模式以及数据的重要性(Data)

3

这是2B端的一些产品。基于这样的业务模式,数据对我们是很重要的。

首先是有很多的用户和业务增长,伴随着很多用户和业务增长,它们产生了很多数据,现在由于大数据收集比较便宜,无数数据都被收集起来。最重要的是紫色和红色这块,如何通过大量数据的收集和积累,创造更多相关的产品和服务,让更多的用户愿意到你这个平台上面来。这是一个闭环的正向积累。很多公司,尤其创业型公司,或者偏小发展型的公司,基本上环在这里闭不上,从蓝色到紫色这里怎么做?买流量,补贴,烧钱,但这个环闭不上,导致很多公司做不下去了。从原始数据的收集到从数据中提取产品价值,这块没有做的很好。

三种主要的数据类型

4

第一个是有用户身份数据,和微信不一样的地方是,你一上LinkedIn就会有很多信息,里面有学校、职位、技能等等各个方面的信息,我们把信息做 深度挖掘,能够提炼出很多有价值东西,一会儿给大家展示。第二个是用户行为展示,用户在我们的平台上点击浏览等等,我们可以把这些数据结合起来开发产品。 最后一个是社交数据的概念。

LinkedIn的数据产品

社交关系图谱

5

这是LinkedIn的社交关系图谱。这张图有很多不同的方法,假如这个数据放进来,看到我跟张三有一个连接,就会把我跟张三的距离拉近一些,看到我跟李四有连接,就会把我跟李四的距离拉近一些,假如看到张三和李四有连接,也会把他们的距离拉近一些,然后投射到二维空间里就会看到这个图。

我们看到这样一个有意思的图,当时非常惊讶,没有用任何的身份数据,只是通过社交数据就可以把很多信息表达出来。数据科学家这个词最早是从LinkedIn走出来的,这张图也是从那个时候开始功不可没的一个成果。

很多公司大量用户提供的数据,但是他不会用,就扔在那里不用了。我们也一样,简历给我们了,很多的信息。拿公司举例,假如我在微软公司,有多种写法,写他的总部,也可以写微软中文,甚至拼错了我的公司写法。但后台处理的时候我们希望把这个人的数据在后面做标准化,这个时候这种社交图谱背后的数据就变得非常有意思了。假如一个人拼错公司名字,通过社交图背后的数据看到,这个人其实被包围在这样一群员工里面,他是这个公司的员工,这是一个正向的用法。

聪明的同学就会想到,如果这样用的话,反向也可以用,很多网络公司遇到的一个问题是,很多用户是假的用户,比如今天在LinkedIn说我在京东工 作,但实际没有在京东工作过,在类似的图谱里面,我们通过这样的方式找到非常多的假的用户,这样的话也能对公司做一个很好的帮助。

Industry Trend

6

我们怎么通过用户简历挖掘数据呢?当我们正确知道很多用户信息,首先结合招聘解决方案,我们会看到一个例子,Industry Trend。

这是讲的美国某一个行业,过去一年在美国的发展情况,这个行业总体增长是5.5%,细分到每一个地区,西雅图增长27%,纽约、德州等等,我们都会做一个排列。这对很多公司做战略性决定是非常有帮助的,而且我们不仅仅做这样一个Industry Trend,我们会做出很多,供我们的客户使用。

来源:网络大数据