「大数据的关键思考」20:阿里运营数据的外三板斧之存、管、用1

数据与智能 出版了专著「构建企业级推荐系统:算法、工程实现与案例分析」。每周输出7篇推荐系统、数据分析、大数据、AI原创文章。「数据与智能」(同名视频号、知乎、头条、B站、快手、抖音、小红书等自媒体平台号) 社区,聚焦数据、智能领域的知识分享与传播。

作者 | 橙子

审核 | gongyouliu

编辑 | auroral-L


阿里巴巴运营数据的外三板斧之‘存、管、用’

在之前的内容中,我们讲到了数据化运营的内三板斧,分别为“混、通、晒”,那么今天我们来看一下运营数据的外三板斧“存、管、用”


运营数据的第一件事情就是存数据,把数据收回来,集中起来,存起来。为什么要收集数据呢?因为在以往的数据化运营里产生了一些问题,虽然我们解决了一些,但还有一些问题并没有得到解决。当谈到如何更好地解决这些问题时,我们想到了运用数据可能是有效的。所以在这个场景里面,我们开始收集数据、管理数据和使用数据。


以电子商务的数据收集为例,比如母婴类目,我们可以通过填写宝宝的年龄或者购买的特定品类来推算出宝宝最新的一个年龄阶段。在汽车类目上,我们可以通过客户购买的机油、滤清器等型号来推算出客户是否有汽车以及车型。甚至是衣服,也可以用来作为数据收集使用的场景。比如从一个用户购买衣服的历史尺码来观察用户是否有身材上的变化。所以,就数据的收集而言,最重要的不是看我们收集了什么数据,而是要思考这些数据如何使用,以及收集这些数据到底能够起到什么样的作用。用一句话来说就是,收集数据不是目的,收集起来的数据如何产生价值才是最终目标。


数据存储下来之后,数量和广度都很大,就需要对之进行完善的管理。数据管理的内容包括很多方面,比如数据的来源,如何让数据不丢失,如何保护数据的安全,如何让数据准确和稳定,以及如何更好地运用数据,这些都是数据运营中的“管”,但是“管”并没有一个标准可循。


其实对于数据的管理,整个大数据行业和其他行业一样,都经历过很多起起落落。比如IT技术刚兴起时,各公司对IT系统和OA系统的追随十分盲目,最后却没有产生期望内的回报。到后来,信息化管理开始兴起,管理信息系统开始被很多企业推崇,不管规模大小,企业都开始使用ERP和MRP系统,结果仍然没有达到预期。就数据而言,在互联网公司,2004年左右,美国的一些数据管理经验在国内造成了很大的轰动,很多公司纷纷建立了BI团队。但是到了2022年左右,各公司又开始不完全认同BI数据部门,这也是事实。


许多大公司正在数据管理这条路上学习,而当前我们面临着很多以往不曾遇见的问题,比如我们是应该在各个部门里运作还是集中管理数据?我们是应该在数据安全的前提下更开放,让更多人找到数据的价值,还是应该更封闭,让泄露数据的可能性更小?另外,个人隐私怎么去保护?我们怎么才能成为一家负责任的数据管理公司?这些都是代表性的难题。


现在大型的互联网公司通常都同时拥有成百上千种在开发的项目,他们都在直接或间接地改变着数据,在这种情况下,又如何保证数据的安全?实际上,数据的源头已经“脏”了,而下游使用数据的人还不知道,同时源头的数据使用者也没有责任告诉下游这些数据已经“脏”了。


所以,如果数据使用的不好,这对你本来的发展影响也不会很大;但是如果数据使用的好,而且将它作为公司的核心竞争力,那么你的麻烦就大了。因为你的数据源本来就是来自各个地方的,而每一个来源没有责任告诉你,今天从它那儿来的数据是正常的、可靠的。特别是大数据出现后,数据的精准与否更加重要,因为大数据在很多情况下是利用外部数据来帮助内部数据进行调整的。如果你的内部数据都难以保证干净的话,那么外部数据同样无法保证干净。数据管理是大数据行业的“脏活苦活累活”,是最难解决的事情。


本期的内容到这里就结束了,下频会和大家探讨“阿里巴巴运营数据的外三板斧之“用”。欢迎大家关注数据与智能获取更多好内容。