vlambda博客
学习文章列表

数据产品经理与回归分析修养

观点分享


Author:熊大

From:狗熊会



有人说现在是一个大数据时代,也有人说这是一个DT(Data Technology)时代。无论怎么说,大家都会同意这是一个同数据紧密相关的时代,这是一个数据创造价值的时代。在这样一个时代,什么样的人才是最奇缺的??是工程师?分析师?还是,模型专家?我认为都不是。

因为,无论是工程师也好,分析师也好,还是模型专家也好,都是现有的(或者正在建设中)的,高等院校标准学科体系,可以大批量培养的。例如,各个大学都有计算机学院可以培养优秀的工程师,各个大学都有统计学院、应用数学专业、管理科学等专业可以培养出色的分析师或者模型专家。而且现在各个大学正在建设的大数据(数据科学)学院(研究院)更是恰逢其时,必将培养出很多优秀的,偏工程技术类型的专业人才。

所以,从中长期看,这种类型的人才一定非常受欢迎,但是可能并不是最奇缺的。那么什么样的人才将是非常难以培养的,但是又很重要,因此现在以及未来都会非常奇缺的呢?我认为一定是:数据产品经理

那么,什么是数据产品经理呢?简单地说,数据产品经理就是关于“数据产品”的“产品经理”。但是,这似乎扯的更加复杂了。要说“产品经理”,大家还耳熟能详,大概都知道乔布斯是一个伟大的产品经理,他领导的团队设计了iPhone。但是,什么是“数据产品”呢?

我相信没有人能够给出一个唯一正确的答案。所以,这里只能同大家分享一下,熊大脑袋里的“数据产品”是个什么东东?

之前我们讨论过,什么是“数据”?凡是可以记录的都是数据。那么,什么又是“产品”呢?这个更不好定义,鬼才知道什么叫做“产品”。一百个人估计会产生一千个不同的答案。但是,我相信,无论如何定义“产品”,都必须强调一点:“产品”必须是有“价值”的东东。这个同意吗?一个没有价值的东东,那是垃圾,那是废物,怎能被称为“产品”。

所以,无论任何东东,如何它可以被称为“数据产品”,辣么它是一个:让数据产生价值的东东。这个东东可以是某种实体(例如:电子产品),也可以是一个平台(例如:BI系统),甚至可以是某种服务。这个大家同意吗?如果我们都同意:数据产品是让数据产生价值的某种存在,那么如何让数据产生价值呢?得有人为此加班加点,日夜操劳。这个人就是:数据产品经理。所以,至少在王老师的脑袋里,什么是“数据产品经理”?数据产品经理就是让数据产生价值的那个角色。

为了给大家一点更加直观具体的感觉,到底什么是“数据产品经理”,熊大从百度文库上找到某公司招聘“数据产品经理”是写出来的工作岗位要求,如下:

当然,我们不敢保证这家公司对“数据产品经理”的定位就是绝对的金标准。因为不同行业,不同企业,不同管理者对“数据产品经理”都可以有自己的定义。但是,熊大认为上面这个截图所描述出来的,对数据产品经理的理解,是基本靠谱的。简单地说,根据这家公司的岗位设定,数据产品经理干的事情很“杂”。

但是,无论怎么杂,都有两个基本点。一个是对接各种数据,一个是支持各种业务(价值)。但是,这个岗位自己不承担业务,不直接建设数据库,不直接开发分析算法。所以,这样看来,这个岗位的要承担的工作无论如何“杂”,都万变不离其宗。那就是:要搭建“数据”到“业务价值”的通道

这就如同武侠小说。一个人要成为高手(一个优秀的数据产品经理),必须打通任督二脉。这两脉分别对应着“数据”和“价值”。因此,一个优秀的数据产品经理必须:

(1)非常懂数据。怎么叫懂数据?还是那句老话,凡是能记录的就是数据。那么,数据产品经理必须非常熟悉:咱家都有哪些技术手段,在哪些产品上,哪些场景下,可以获得哪些记录。一个更好的产品经理,可以根据对后期业务开展的预期,反推相应的数据存储框架。但是,无论怎样,数据产品经理自己不需要去写爬虫码代码采数据,也不需要去开发数据库,这些都是非常专业的计算机工程师的职责。

懂了数据,就等同于找到了自己的“任脉”。懂了价值,就等同于找到了自己的“督脉”。但是,这还不够。因为,要成为绝世高手,您需要打通“任督二脉”!如何打通?需要提高关于回归分析的自我修养,简称回归修养

数据产品经理与回归分析修养

有朋友可能不屑:“现在都什么时代了,是AlphaGo的时代,是深度学习时代,怎么王老师一天到晚都说回归啊,太low了!”有木有朋友这样想?这是非常可以理解的想法,因为,咱俩关于回归的定义不一样。

熊大认为,凡是可以定义因变量(Y),解释性变量(X)的模型分析方法都是回归分析。区别只是:线性或者非线性,参数或者非参数,高维或者低维等等。因变量可以是看得见的(有监督的学习方法),可以看不见但是假设存在的(基于模型的无监督学习方法),甚至可以是部分看到的(半监督的学习方法)。所以,在熊大的脑袋里,回归(Regression)是一个非常广义的概念。在熊大的数据世界里,几乎看不到回归分析罩不住的问题。

那么,在数据与价值的世界里,为什么回归分析如此重要?因为,回归分析不仅仅是一个数据分析的技术方法,不仅仅是一个模型,更重要的是一种理念,是打通任督二脉的不二法门!如何打通? 

咱们再回顾一下,数据产品经理的主要职责是:实现数据的商业价值。因此,数据产品经理必须懂数据(各种记录),懂价值(企业核心业务)。请问:在咱们的所有数据记录中,哪一个或者多个字段,可以充分体现企业的业务诉求?

例如,我要设计一个CRM产品,为每一个客户流失的可能性打分,帮助企业CRM部门提前,而且准确地干预。这是我的业务问题。那么,数据产品经理在整个产品设计的过程中,有可能要操心前端,有可能要操心后端,有可能要操心线上,有可能要操心线下——要操心很多事。但是,无论做任何事情,心里要门儿清:“客户流失与否”是你最最重要的字段,这个字段阐明了业务实践过程中,“流失”是如何定义的,这个定义会直接影响到后面的分析、建模、以及实施。所以,作为数据产品经理,一定要对这个字段,认真研究,小心定义,了如指掌。这是什么?这就是回归分析中的因变量Y,这就是业务价值的核心体现。

一旦Y(客户流失与否)被清晰定义了,接下来想知道,有哪些前瞻性的知识X,可以帮助我们预估一个客户的流失概率。如果,我们认为花费金额高的客户流失的可能性小,那么花费金额就是我的第一个X变量,记作X1;如果,我们认为年龄高的客户流失的可能性小,那么年龄就是我的第二个X变量,记作X2;如果,我们认为收入高的客户流失的可能性小,那么收入就是我的第三个X变量,记作X3。等等。所以,X是什么?是我们用来预测Y的重要的业务知识,或者feature。这些特征设计得越丰富,越准确,最后的模型效果就会越好。很遗憾的是,很多时候,这个寻找X的工作(甚至定义Y的工作),被100%的丢给了工程师。

这不是一个最好的解决方案,因为术业有专攻,工程师不可能花太多的时间去了解业务,而业务知识之于X变量的设计,帮助巨大。所以,更好的方法是:产品经理主导,结合业务,结合开发一起研究,一起改进。

有很多朋友说,现在都机器学习了,哪需要设计X,乱七八糟往模型里放,越多越好,让机器自己学习。对于这样的观点,熊大表示呵呵。这是一个美好的梦想,不知道哪一天会实现。但是,当前现在眼下,面对一个实际数据分析项目,熊大想都不想的第一步:学习业务。这也是为什么熊大坚持认为,数据分析的第一步不是分析数据,而是学习业务,学习业务,学习业务!


简单总结一下:

什么是数据产品经理?

数据产品经理就是让数据产生价值的角色。

数据产品经理的主要职责?

打通任(数据)督(价值)二脉。

如何打通?

从数据中解读出Y(业务核心诉求)和X(脑洞大开的业务知识)。

这是什么?

这是回归分析的修养,简称:回归修养!



识别下方二维码成为狗熊会会员!

友情提示:

个人会员不提供数据、代码

视频only!

个人会员网址:http://teach.xiong99.com.cn