業(yè)務(wù)重點(diǎn),數(shù)據(jù)優(yōu)先。
在我從事互聯(lián)網(wǎng)行業(yè)十多年的工作生涯中,我的大部分時(shí)間都是數(shù)據(jù)操作。從QQ秀到Y(jié)Y語(yǔ)音到迅雷,我經(jīng)歷了產(chǎn)品數(shù)據(jù)操作的流程優(yōu)化,平臺(tái)構(gòu)建,分析和應(yīng)用。 ,經(jīng)歷了產(chǎn)品中數(shù)據(jù)的重要地位。
許多人對(duì)數(shù)據(jù)操作的理解僅限于數(shù)字統(tǒng)計(jì),原因分析等。事實(shí)上,這些只是數(shù)據(jù)操作的一小部分。數(shù)據(jù)最終用于產(chǎn)品服務(wù),數(shù)據(jù)操作和專(zhuān)注于運(yùn)營(yíng)。數(shù)據(jù)只是一種工具。
這篇文章是8200字。
很多人一直在問(wèn),數(shù)據(jù)運(yùn)營(yíng)是做什么的?
個(gè)人理解是:制定產(chǎn)品目標(biāo),創(chuàng)建數(shù)據(jù)報(bào)告渠道和規(guī)則流程,觀察產(chǎn)品數(shù)據(jù),制作數(shù)據(jù)早期預(yù)警,分析數(shù)據(jù)變更原因,根據(jù)分析結(jié)果優(yōu)化產(chǎn)品和操作,并對(duì)未來(lái)數(shù)據(jù)趨勢(shì)進(jìn)行預(yù)測(cè)。決策為將數(shù)據(jù)應(yīng)用程序集成到產(chǎn)品規(guī)劃和操作中提供了基礎(chǔ)。
從廣義上講,數(shù)據(jù)操作了解以下五個(gè)問(wèn)題:
我們要做什么?——目標(biāo)數(shù)據(jù)制訂;
現(xiàn)狀是什么?——行業(yè)分析,產(chǎn)品數(shù)據(jù)報(bào)表輸出;
數(shù)據(jù)變化的原因?——數(shù)據(jù)預(yù)警,數(shù)據(jù)變化的原因分析;
未來(lái)會(huì)怎樣?——數(shù)據(jù)預(yù)測(cè);
我們應(yīng)該做什么?——決策與數(shù)據(jù)的產(chǎn)品應(yīng)用。
我們?nèi)绾谓⑼暾漠a(chǎn)品數(shù)據(jù)操作系統(tǒng)?我根據(jù)我在YY工作中的經(jīng)驗(yàn)進(jìn)行了分類(lèi)和總結(jié)。整個(gè)過(guò)程可分為以下11個(gè)步驟供您參考。
第1步、制訂產(chǎn)品目標(biāo)
這是數(shù)據(jù)操作的起點(diǎn),也是產(chǎn)品上線后評(píng)估產(chǎn)品的標(biāo)準(zhǔn),從而形成一個(gè)閉環(huán)。不應(yīng)該制定目標(biāo),可以根據(jù)業(yè)務(wù)發(fā)展,行業(yè)發(fā)展,競(jìng)爭(zhēng)產(chǎn)品分析,前幾年的產(chǎn)品開(kāi)發(fā)趨勢(shì)和產(chǎn)品轉(zhuǎn)換規(guī)則來(lái)計(jì)算。目標(biāo)是衡量常用的SMART原則。
?。?)S代表具體(Specific)
指工作指標(biāo)具體而不能一般。例如,如果我們開(kāi)發(fā)YY基于語(yǔ)音的體驗(yàn)的產(chǎn)品目標(biāo),如果它是為了增強(qiáng)產(chǎn)品體驗(yàn),那么它就不夠具體,并且每個(gè)人的理解都是不一致的。那時(shí),我們的基本產(chǎn)品目標(biāo)是第二天加強(qiáng)新用戶(hù)的保留,這是非常具體的。
?。?)M代表可度量(Measurable)
指績(jī)效指標(biāo)是定量的還是行為的,驗(yàn)證這些績(jī)效指標(biāo)的數(shù)據(jù)或信息是否可用;為了提高第二天新用戶(hù)的保留率,您需要提供具體的值。
(3)A代表可實(shí)現(xiàn)(Attainable)
指在可以實(shí)現(xiàn)績(jī)效指標(biāo)的情況下努力,避免設(shè)定過(guò)高或過(guò)低的目標(biāo);當(dāng)我們基于YY新用戶(hù)的第二天保留率時(shí),新注冊(cè)用戶(hù)的第二天保留率不是由頭部制作的。歷史數(shù)據(jù)和行業(yè)參考值對(duì)游戲用戶(hù)的新注冊(cè)用戶(hù)保留率設(shè)置相對(duì)較低具有挑戰(zhàn)性的目標(biāo)是將新注冊(cè)用戶(hù)的保留率從25%提高到35%。
(4)R代表相關(guān)性(Relevant)
它與工作的其他目標(biāo)有關(guān);績(jī)效指標(biāo)與工作有關(guān);新用戶(hù)的保留率與用戶(hù)行為密切相關(guān),例如用戶(hù)對(duì)語(yǔ)音工具的識(shí)別以及用戶(hù)對(duì)YY平臺(tái)的偏好。學(xué)位等等,使新用戶(hù)的第二天保留和產(chǎn)品性能,內(nèi)容流行度有很強(qiáng)的相關(guān)性。
(5)T代表有時(shí)限(Time-bound)
專(zhuān)注于完成目標(biāo)的具體截止日期。
產(chǎn)品目標(biāo)可按如下方式制定:截至2013年12月31日,新YY語(yǔ)音用戶(hù)的第二天保留率將從25%提高到35%。
新用戶(hù)次日留存率的提升,意味著更多用戶(hù)的活躍轉(zhuǎn)化,帶動(dòng)整個(gè)用戶(hù)活躍數(shù)量的增長(zhǎng)。
第2步、定義產(chǎn)品數(shù)據(jù)指標(biāo)
產(chǎn)品數(shù)據(jù)指標(biāo)是反映產(chǎn)品健康發(fā)展的具體的數(shù)值,我們需要明確定義數(shù)據(jù)指標(biāo),例如數(shù)據(jù)報(bào)告方法,計(jì)算公式等。
例如,第二天的保留率可以定義為:第二天的保留率是一個(gè)比率,分母是在同一天新注冊(cè)的YY賬戶(hù)的數(shù)量,并在同一天登錄到Y(jié)Y客戶(hù)端日,分子是第二天再次登錄YY客戶(hù)端的分母。 YY賬戶(hù)的數(shù)量。
請(qǐng)注意這里的細(xì)節(jié)。在第一天和第二天,您需要有一個(gè)明確的時(shí)間點(diǎn),例如0到24,計(jì)算為一天。問(wèn)題是,新用戶(hù)在第一天23點(diǎn)注冊(cè)并登錄YY客戶(hù)端。結(jié)束,到第二天凌晨1點(diǎn)下線;根據(jù)上面的定義,這個(gè)用戶(hù)可能不會(huì)被記錄為第二天留住用戶(hù),因?yàn)闆](méi)有明確的數(shù)據(jù)報(bào)告詳細(xì)定義。
定義是第二天再次登錄YY客戶(hù)端。上述案例的用戶(hù)第二天沒(méi)有登錄行為,但他確實(shí)是連續(xù)兩天登錄的用戶(hù)。
因此,針對(duì)這個(gè)定義,需要補(bǔ)充細(xì)節(jié):用戶(hù)登錄狀態(tài)。如果在5分鐘內(nèi)報(bào)告心跳包,則可以將新用戶(hù)報(bào)告為第二天的登錄狀態(tài)用戶(hù)。如果它在0:5之前離線,它將繼續(xù)。直到第二天24點(diǎn),仍然沒(méi)有登錄狀態(tài),那么它將不會(huì)被記錄為保留用戶(hù)。
我們根據(jù)產(chǎn)品目標(biāo)選擇數(shù)據(jù)指標(biāo),例如網(wǎng)絡(luò)產(chǎn)品,并且通常使用PV,UV,崩潰率,人均PV和停留時(shí)間來(lái)測(cè)量數(shù)據(jù)。要定義產(chǎn)品指標(biāo)體系,每個(gè)團(tuán)隊(duì)(如產(chǎn)品和開(kāi)發(fā))都需要達(dá)成共識(shí)。數(shù)據(jù)指標(biāo)的定義清晰且文檔齊全,不會(huì)對(duì)數(shù)據(jù)解釋的理解產(chǎn)生差異。
第3步、構(gòu)建產(chǎn)品數(shù)據(jù)指標(biāo)體系
在數(shù)據(jù)指標(biāo)的基礎(chǔ)上,我們根據(jù)產(chǎn)品邏輯組織指標(biāo),使其組織起來(lái)。
新用戶(hù)的第二天保留率是我們訂閱的核心目標(biāo)。但事實(shí)上,僅查看第二天??的保留率是不夠的。為了更準(zhǔn)確地了解產(chǎn)品,還需要全面檢查影響用戶(hù)保留率的各種因素。健康成長(zhǎng)。如圖所示,它是一種常用的指標(biāo)系統(tǒng),包含:用戶(hù)新增、用戶(hù)活躍、付費(fèi)、其他數(shù)據(jù)。
互聯(lián)網(wǎng)產(chǎn)品通用數(shù)據(jù)指標(biāo)系統(tǒng)
當(dāng)我們?cè)谧鯵Y語(yǔ)音客戶(hù)端產(chǎn)品時(shí),我們將使用以下指示系統(tǒng),包括:賬號(hào)體系、關(guān)系鏈數(shù)據(jù)、狀態(tài)感知數(shù)據(jù)、溝通能力等四大方面。具體指標(biāo)有:好友的個(gè)數(shù)分布、觀看頻道節(jié)目的時(shí)長(zhǎng)、IM聊天時(shí)長(zhǎng)、個(gè)人狀態(tài)的切換與時(shí)長(zhǎng)等,如下所示:
IM即時(shí)通訊產(chǎn)品數(shù)據(jù)指標(biāo)系統(tǒng)
第4步、提出產(chǎn)品數(shù)據(jù)需求
產(chǎn)品索引系統(tǒng)的建立不是一步到位的過(guò)程。根據(jù)產(chǎn)品開(kāi)發(fā)的不同階段,產(chǎn)品經(jīng)理專(zhuān)注于數(shù)據(jù)需求。一般公司將有一個(gè)產(chǎn)品需求文檔模板,方便產(chǎn)品和數(shù)據(jù)報(bào)告開(kāi)發(fā),數(shù)據(jù)平臺(tái)和其他部門(mén)。同事溝通并進(jìn)行數(shù)據(jù)建設(shè)。創(chuàng)業(yè)型中小企業(yè),對(duì)產(chǎn)品數(shù)據(jù)的需求據(jù)報(bào)道是1-2人,但也建議建立數(shù)據(jù)文件,如數(shù)據(jù)指標(biāo)的定義,數(shù)據(jù)計(jì)算邏輯。
下圖顯示了我在YY語(yǔ)音客戶(hù)端團(tuán)隊(duì)中建立的基本產(chǎn)品數(shù)據(jù)要求實(shí)施過(guò)程。
YY業(yè)務(wù)部門(mén)基本產(chǎn)品數(shù)據(jù)要求實(shí)施流程圖(試用)
第5步、上報(bào)數(shù)據(jù)
此步驟是根據(jù)產(chǎn)品經(jīng)理的數(shù)據(jù)要求開(kāi)發(fā),根據(jù)數(shù)據(jù)報(bào)告規(guī)范,完成報(bào)表開(kāi)發(fā),并將數(shù)據(jù)報(bào)告給數(shù)據(jù)服務(wù)器。報(bào)告數(shù)據(jù)的關(guān)鍵是構(gòu)建數(shù)據(jù)報(bào)告渠道。原來(lái),在騰訊工作時(shí),我沒(méi)有意識(shí)到這個(gè)環(huán)節(jié)的困難,因?yàn)閿?shù)據(jù)平臺(tái)部門(mén)已經(jīng)完成了完整的數(shù)據(jù)通道構(gòu)建,并且數(shù)據(jù)是根據(jù)一定的規(guī)則使用統(tǒng)一的數(shù)據(jù)SDK開(kāi)發(fā)的??梢詧?bào)??告它。
后來(lái),在YY,它是一家開(kāi)發(fā)公司,它是從報(bào)告渠道開(kāi)始的,這也為我提供了更多的改進(jìn)機(jī)會(huì)。最關(guān)鍵的一個(gè)方面是數(shù)據(jù)報(bào)告測(cè)試,這導(dǎo)致了不必要的麻煩,因?yàn)榇随溄拥臏y(cè)試資源不到位。
很多創(chuàng)業(yè)公司都沒(méi)有自己的數(shù)據(jù)平臺(tái),他們可以使用第三方數(shù)據(jù)平臺(tái):網(wǎng)絡(luò)產(chǎn)品,可以使用百度統(tǒng)計(jì)(#baidu.com);移動(dòng)產(chǎn)品,你可以使用Youmeng(www.umeng.com),TalkingData(平臺(tái)如www.talkingdata.com)。
第6-8步、數(shù)據(jù)采集與接入、存儲(chǔ)、調(diào)度與運(yùn)算
每一步都是學(xué)習(xí)。例如,收集數(shù)據(jù)涉及界面創(chuàng)建,考慮數(shù)據(jù)字段的可擴(kuò)展性,數(shù)據(jù)收集過(guò)程中的ETL數(shù)據(jù)清理過(guò)程,客戶(hù)數(shù)據(jù)報(bào)告的正確性檢查等;數(shù)據(jù)存儲(chǔ)和調(diào)度,操作在大數(shù)據(jù)時(shí)代,它是一項(xiàng)非常具有挑戰(zhàn)性的技術(shù)。
1. 數(shù)據(jù)的采集與接入
ETL是Extract-Transform-Load的縮寫(xiě),用于描述從源到目標(biāo)的數(shù)據(jù)提取,轉(zhuǎn)換和加載過(guò)程。術(shù)語(yǔ)ETL更常用于數(shù)據(jù)倉(cāng)庫(kù),但其對(duì)象不僅限于數(shù)據(jù)倉(cāng)庫(kù)。 ETL是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的重要部分。用戶(hù)從數(shù)據(jù)源中提取所需數(shù)據(jù),通過(guò)數(shù)據(jù)清理數(shù)據(jù),最后根據(jù)預(yù)定義的數(shù)據(jù)倉(cāng)庫(kù)模型將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中。
下圖是產(chǎn)品數(shù)據(jù)系統(tǒng)的常見(jiàn)流程圖。數(shù)據(jù)采集??,存儲(chǔ)和計(jì)算通常在圖的數(shù)據(jù)中心完成。
數(shù)據(jù)系統(tǒng)流程
確認(rèn)數(shù)據(jù)報(bào)告后,接下來(lái)的幾件事情更具技術(shù)性。報(bào)告數(shù)據(jù)的第一種方法是收集并存儲(chǔ)在我們的數(shù)據(jù)中心。
數(shù)據(jù)收集分為兩個(gè)步驟。第一步是從業(yè)務(wù)系統(tǒng)向服務(wù)器報(bào)告。這部分主要是通過(guò)cgi或后臺(tái)服務(wù)器。調(diào)用統(tǒng)一logAPI后,原始管道數(shù)據(jù)將存儲(chǔ)在logServer中。當(dāng)這部分?jǐn)?shù)據(jù)很大時(shí),您需要考慮使用分布式文件存儲(chǔ)。外部分布式文件存儲(chǔ)主要是HDFS。它不會(huì)在這里擴(kuò)展。
原始數(shù)據(jù)將報(bào)告給存儲(chǔ)在文件
中的文件的架構(gòu)數(shù)據(jù)存儲(chǔ)在文件中后,第二步是進(jìn)入ETL。 ETL是指根據(jù)分析要求和數(shù)據(jù)范圍從文本中提取,轉(zhuǎn)換和加載日志。然后將其存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中。
以騰訊為例:騰訊的大數(shù)據(jù)平臺(tái)現(xiàn)在支持離線和實(shí)時(shí)的海量數(shù)據(jù)訪問(wèn)和處理。核心系統(tǒng)包括TDW,TRC和TDbank。
騰訊數(shù)據(jù)平臺(tái)系統(tǒng)
在騰訊內(nèi)部,數(shù)據(jù)收集,分發(fā),預(yù)處理和管理都通過(guò)TDBank平臺(tái)實(shí)施。整個(gè)平臺(tái)主要解決大數(shù)據(jù)量下大量,實(shí)時(shí),多樣化的數(shù)據(jù)采集和處理問(wèn)題。統(tǒng)一訪問(wèn)和存儲(chǔ)問(wèn)題通過(guò)三層體系結(jié)構(gòu)解決,例如數(shù)據(jù)訪問(wèn)層,處理層和存儲(chǔ)層。
(1)接入層
訪問(wèn)層可以支持各種格式的業(yè)務(wù)數(shù)據(jù)和數(shù)據(jù)源,包括不同的DB,文件格式,消息數(shù)據(jù)等。數(shù)據(jù)訪問(wèn)層將收集的數(shù)據(jù)統(tǒng)一為內(nèi)部數(shù)據(jù)協(xié)議,便于后續(xù)數(shù)據(jù)處理系統(tǒng)。
?。?)處理層
然后,處理層以插件形式支持各種形式的數(shù)據(jù)預(yù)處理。對(duì)于離線系統(tǒng),一個(gè)重要的功能是對(duì)實(shí)時(shí)收集的數(shù)據(jù)進(jìn)行分類(lèi)和存儲(chǔ)。需要根據(jù)特定維度(如鍵值+時(shí)間維度)進(jìn)行分類(lèi);同時(shí),存儲(chǔ)文件大?。ù笮?時(shí)間)。 )還需要進(jìn)行自定義,以使脫機(jī)系統(tǒng)能夠以指定的粒度執(zhí)行脫機(jī)計(jì)算。對(duì)于在線系統(tǒng),常見(jiàn)的預(yù)處理過(guò)程,如數(shù)據(jù)過(guò)濾,數(shù)據(jù)采樣和數(shù)據(jù)轉(zhuǎn)換。
(3)數(shù)據(jù)存儲(chǔ)層
處理后的數(shù)據(jù)使用HDFS作為脫機(jī)文件的存儲(chǔ)載體。確保數(shù)據(jù)存儲(chǔ)整體可靠,然后最終將處理后的數(shù)據(jù)放入騰訊內(nèi)部的分布式數(shù)據(jù)倉(cāng)庫(kù)TDW中。
TDW架構(gòu)圖
TDBank實(shí)時(shí)從業(yè)務(wù)數(shù)據(jù)源收集數(shù)據(jù),執(zhí)行預(yù)處理和分布式消息緩存,并根據(jù)消息訂閱的方式將其分發(fā)到后端離線和在線處理系統(tǒng)。
TDBank數(shù)據(jù)采集和訪問(wèn)系統(tǒng)
TDBank在數(shù)據(jù)源和數(shù)據(jù)處理系統(tǒng)之間架起了一座橋梁,將數(shù)據(jù)處理系統(tǒng)與數(shù)據(jù)源分離,并為離線計(jì)算TDW和在線計(jì)算TRC平臺(tái)提供數(shù)據(jù)支持。通過(guò)持續(xù)改進(jìn),以前的Linux + HDFS模式更改為群集+分布式消息隊(duì)列模式,并且前一天可處理的消息量縮短為2秒!
從實(shí)際的角度來(lái)看,在考慮產(chǎn)品數(shù)據(jù)的收集和訪問(wèn)時(shí),產(chǎn)品應(yīng)該主要關(guān)注幾個(gè)緯度問(wèn)題:
多個(gè)數(shù)據(jù)源的統(tǒng)一,在實(shí)際應(yīng)用過(guò)程中,存在不同的數(shù)據(jù)格式來(lái)源。此時(shí),此部分的收集和訪問(wèn)需要對(duì)這些數(shù)據(jù)源進(jìn)行統(tǒng)一轉(zhuǎn)換。
該系列實(shí)時(shí)高效。由于大多數(shù)系統(tǒng)都是在線系統(tǒng),因此數(shù)據(jù)收集的及時(shí)性會(huì)更高。
對(duì)于一些將影響整個(gè)分析統(tǒng)計(jì)數(shù)據(jù)的臟數(shù)據(jù),需要在訪問(wèn)層進(jìn)行邏輯屏蔽,以避免隨后的統(tǒng)計(jì)分析和應(yīng)用,因?yàn)檫@部分?jǐn)?shù)據(jù)會(huì)導(dǎo)致許多不可預(yù)測(cè)的問(wèn)題。
2. 數(shù)據(jù)的存儲(chǔ)與計(jì)算
報(bào)告并收集和訪問(wèn)數(shù)據(jù)后,數(shù)據(jù)進(jìn)入存儲(chǔ)鏈接并繼續(xù)使用騰訊作為示例。
在騰訊內(nèi)部,有一個(gè)用于存儲(chǔ)數(shù)據(jù)的分布式數(shù)據(jù)倉(cāng)庫(kù)。內(nèi)部代碼名稱(chēng)為T(mén)DW。它支持離線存儲(chǔ)和100-PB數(shù)據(jù)計(jì)算,為業(yè)務(wù)提供大規(guī)模,高效,穩(wěn)定的大數(shù)據(jù)平臺(tái)支持和決策支持。基于Hadoop和Hive的開(kāi)源軟件,并基于公司的大量數(shù)據(jù),計(jì)算復(fù)雜性等具體情況,進(jìn)行了大量的優(yōu)化和轉(zhuǎn)換。
根據(jù)已發(fā)布的數(shù)據(jù),TDW基于開(kāi)源軟件hadoop和hive進(jìn)行了大量的優(yōu)化和轉(zhuǎn)換。它已成為騰訊最大的離線數(shù)據(jù)處理平臺(tái)。集群機(jī)總數(shù)為5,000臺(tái),總存儲(chǔ)量超過(guò)20PB,日均計(jì)算量超過(guò)500TB,占騰訊商業(yè)產(chǎn)品的90%以上,包括廣角推薦,用戶(hù)肖像,數(shù)據(jù)挖掘和各種業(yè)務(wù)報(bào)告,全部通過(guò)該平臺(tái)提供基本功能。
騰訊TDW分布式數(shù)據(jù)倉(cāng)庫(kù)
TDW業(yè)務(wù)圖
從實(shí)際的角度來(lái)看,這部分?jǐn)?shù)據(jù)存儲(chǔ)主要考慮幾個(gè)問(wèn)題:
數(shù)據(jù)安全性,很多數(shù)據(jù)是不可恢復(fù)的,因此數(shù)據(jù)存儲(chǔ)的安全性和可靠性始終是最重要的。一定要投入最多的精力去關(guān)注。
作為存儲(chǔ)源的數(shù)據(jù)計(jì)算和提取的效率將在以后面臨許多數(shù)據(jù)查詢(xún)和提取分析工作,并且需要確保該部分的效率。
數(shù)據(jù)一致性,存儲(chǔ)數(shù)據(jù)主和備份以確保一致性。
第9步、獲取數(shù)據(jù)
它是產(chǎn)品經(jīng)理,數(shù)據(jù)分析師從數(shù)據(jù)系統(tǒng)獲取數(shù)據(jù)的過(guò)程,常見(jiàn)的方式是數(shù)據(jù)報(bào)告和數(shù)據(jù)提取。
報(bào)告的格式在數(shù)據(jù)需求階段通常是明確的,特別是對(duì)于已經(jīng)積累的公司,通常會(huì)有報(bào)告模板,只需填寫(xiě)指標(biāo)??梢愿鶕?jù)分析需求和自助服務(wù)選擇字段(標(biāo)題)配置和計(jì)算功能強(qiáng)大的數(shù)據(jù)平臺(tái)。
以下是設(shè)計(jì)數(shù)據(jù)報(bào)告的一些指導(dǎo)原則:
1. 提供連續(xù)周期的查詢(xún)功能
(1)報(bào)告應(yīng)提供查詢(xún)的開(kāi)始時(shí)間,您可以在指定的時(shí)間范圍內(nèi)查看數(shù)據(jù)。禁忌中只有一個(gè)時(shí)間點(diǎn),無(wú)法看到數(shù)據(jù)趨勢(shì)。
(2)可以對(duì)特定時(shí)間段內(nèi)的數(shù)據(jù)進(jìn)行分段或聚合,并可以比較不同的階段。
2. 查詢(xún)條件與維度相匹配
(1)提供了多少維度,以及提供了多少對(duì)應(yīng)的查詢(xún)條件。盡量滿(mǎn)足每個(gè)維度進(jìn)行分析。
(2)查詢(xún)條件應(yīng)提供特定值的打開(kāi),關(guān)閉和過(guò)濾。你可以看一下整體,你可以看到細(xì)節(jié),你可以看到單曲。
(3)查詢(xún)條件的順序應(yīng)盡可能接近維度的順序,最好是從最大到最小。
3. 圖表與數(shù)據(jù)要一致
(1)圖表顯示的趨勢(shì)應(yīng)與相應(yīng)的數(shù)據(jù)一致,以避免反對(duì)數(shù)據(jù); (2)有圖表時(shí)必須有數(shù)據(jù),但數(shù)據(jù)沒(méi)有圖表; (3)圖中的指標(biāo)不宜過(guò)多,指標(biāo)之間的差距不宜過(guò)大。
4. 報(bào)表要單一
(1)報(bào)告只有一個(gè)分析功能,多個(gè)功能應(yīng)盡可能分成不同的報(bào)告; (2)盡量不要跳進(jìn)報(bào)告;
(3)報(bào)告僅提供查詢(xún)功能。
看幾個(gè)常用報(bào)告,WEB產(chǎn)品流量報(bào)告,來(lái)自百度,關(guān)注PV,UV,新訪問(wèn)者比例,跳出率,平均訪問(wèn)持續(xù)時(shí)間等。
具體來(lái)說(shuō),跳出率,這個(gè)數(shù)據(jù)反映了用戶(hù)登陸頁(yè)面的價(jià)值(不一定是主頁(yè)),是否可以吸引用戶(hù)點(diǎn)擊,如果用戶(hù)到達(dá)登陸頁(yè)面,沒(méi)有點(diǎn)擊,跳出率就會(huì)增加。
百度統(tǒng)計(jì)網(wǎng)絡(luò)數(shù)據(jù)報(bào)告
查看友盟數(shù)據(jù)平臺(tái)提供的產(chǎn)品保留數(shù)據(jù)報(bào)告,保留率通常要注意:1天后保留,7天后保留和30天后保留。
Union的保留數(shù)據(jù)報(bào)告
在產(chǎn)品操作中,數(shù)據(jù)提取是一種非常常見(jiàn)的要求,例如提取具有良好銷(xiāo)售和相關(guān)領(lǐng)域的某批貨物,并提取具有指定條件的一批用戶(hù)。同樣,一個(gè)更完整的數(shù)據(jù)平臺(tái),會(huì)有一個(gè)數(shù)據(jù)自提取系統(tǒng),無(wú)法滿(mǎn)足自助服務(wù)的需求,需要數(shù)據(jù)開(kāi)發(fā)和編寫(xiě)腳本進(jìn)行數(shù)據(jù)提取。
如上圖所示,騰訊的內(nèi)部數(shù)據(jù)門(mén)戶(hù)承擔(dān)了許多產(chǎn)品的數(shù)據(jù)報(bào)告,數(shù)據(jù)提取和數(shù)據(jù)報(bào)告功能。
騰訊數(shù)據(jù)門(mén)戶(hù)網(wǎng)站
第10步、觀測(cè)和分析數(shù)據(jù)
這主要是對(duì)數(shù)據(jù)變化的監(jiān)測(cè)和統(tǒng)計(jì)分析。通常,我們會(huì)自動(dòng)化數(shù)據(jù)的每日?qǐng)?bào)告輸出并識(shí)別交易數(shù)據(jù)。數(shù)據(jù)的視覺(jué)輸出非常重要。
常用的軟件是EXCEL和SPSS??梢哉f(shuō)它是數(shù)據(jù)分析的基本技能。稍后,我將分享在實(shí)際工作中使用這兩個(gè)軟件的方法和技巧。應(yīng)該注意的是,在數(shù)據(jù)分析之前,檢查數(shù)據(jù)的準(zhǔn)確性以確定數(shù)據(jù)是否是您想要的,例如,從數(shù)據(jù)定義到報(bào)告邏輯,是否嚴(yán)格按照需求文檔,以及數(shù)據(jù)是否報(bào)告通道是可能存在數(shù)據(jù)丟失,建議執(zhí)行原始數(shù)據(jù)提取和采樣分析以確定數(shù)據(jù)的準(zhǔn)確性。
數(shù)據(jù)解釋在此鏈接中非常重要。同樣的數(shù)據(jù),由于產(chǎn)品熟悉度和分析經(jīng)驗(yàn)的差異,解釋結(jié)果也大不相同,因此產(chǎn)品分析師必須對(duì)產(chǎn)品和用戶(hù)有很好的了解。
絕對(duì)值通常難以解釋?zhuān)ǔMㄟ^(guò)比較表達(dá)數(shù)據(jù)的含義通常更好。
例如,在產(chǎn)品上線后的第一周,每日注冊(cè)人數(shù)為100,000人。似乎數(shù)據(jù)很好,但如果這個(gè)產(chǎn)品是由YY語(yǔ)音推出的新產(chǎn)品,并且用戶(hù)通過(guò)YY彈出消息觸摸它,每天數(shù)千次。一萬(wàn)個(gè)用戶(hù)曝光,只有100,000個(gè)新添加,不是好的產(chǎn)品數(shù)據(jù)。
通過(guò)比較數(shù)據(jù)的含義更清楚
縱向比較,如分析YY語(yǔ)音新注冊(cè)用戶(hù)的數(shù)據(jù)變化,可以與上周同期,上個(gè)月同期,去年同期相比,是否有類(lèi)似的數(shù)據(jù)變化法。
水平比較,也是YY語(yǔ)音新用戶(hù)注冊(cè)數(shù)據(jù)的變化,可以從漏斗模型,用戶(hù)來(lái)源的不同渠道進(jìn)行分析,看看每個(gè)渠道的轉(zhuǎn)換率是否有任何變化,如頂部漏斗,用戶(hù)訪問(wèn)通道哪些數(shù)據(jù)有很大的變化,以及通道的哪個(gè)部分的轉(zhuǎn)換率發(fā)生了變化。還可以執(zhí)行不同服務(wù)的水平比較,例如YY語(yǔ)音新注冊(cè)數(shù)據(jù),多重播放網(wǎng)絡(luò)流量數(shù)據(jù),YY游戲新注冊(cè)用戶(hù)數(shù)據(jù)以進(jìn)行比較,并找到數(shù)據(jù)變化的原因。
垂直和水平組合比較是將同一時(shí)間段的曲線與多個(gè)數(shù)據(jù)變化進(jìn)行比較,例如YY新注冊(cè)用戶(hù),多重播放網(wǎng)絡(luò)流量數(shù)據(jù)和YY游戲新注冊(cè)用戶(hù)的半年度數(shù)據(jù)變化,以及同時(shí)比較三條曲線。找出某個(gè)數(shù)據(jù)異常的關(guān)鍵節(jié)點(diǎn),然后查找操作日志,查看是否有任何組織有運(yùn)營(yíng)活動(dòng),是否有外部事件,以及是否有特殊日期。
第11步、產(chǎn)品評(píng)估與數(shù)據(jù)應(yīng)用
這是數(shù)據(jù)操作閉環(huán)的終點(diǎn),也是一個(gè)新的起點(diǎn)。數(shù)據(jù)報(bào)告不是顯示,也不是領(lǐng)導(dǎo)層的問(wèn)題,而是產(chǎn)品優(yōu)化和操作的服務(wù),就像產(chǎn)品人員的表現(xiàn)一樣,不僅僅是觀察產(chǎn)品項(xiàng)目是否按時(shí)完成并按時(shí)發(fā)布,有必要不斷觀察和分析產(chǎn)品數(shù)據(jù),評(píng)估產(chǎn)品健康狀況,并將累積的數(shù)據(jù)應(yīng)用到產(chǎn)品設(shè)計(jì)和操作中。
例如,亞馬遜的個(gè)性化推薦產(chǎn)品,如QQ音樂(lè)猜你喜歡的,比如淘寶的時(shí)間機(jī)器,如今天的標(biāo)題推薦閱讀等等。數(shù)據(jù)產(chǎn)品應(yīng)用程序大致可分為以下幾類(lèi):
(1)以效果廣告為代表的精準(zhǔn)營(yíng)銷(xiāo)
推薦期短,實(shí)時(shí)性要求高;用戶(hù)的短期利益和直接行為有很大影響;場(chǎng)景上下文和訪問(wèn)群體特征。
產(chǎn)品案例:谷歌,F(xiàn)acebook,微信朋友圈。
(2)以視頻推薦為代表的內(nèi)容推薦
長(zhǎng)期利益的累積影響很大;時(shí)間段和熱點(diǎn)事件;多維內(nèi)容的相關(guān)性很重要。
產(chǎn)品案例:Youtube
(3)以電商推薦為代表的購(gòu)物推薦
長(zhǎng)期+短期利益+綜合行為;最接近現(xiàn)實(shí),季節(jié)性和用戶(hù)生活信息是至關(guān)重要的;追求訂單和交易,支付相關(guān)。
產(chǎn)品案例:亞馬遜,淘寶,京東
總結(jié)
最后,圖表匯總數(shù)據(jù)操作11步驟:
11個(gè)數(shù)據(jù)操作步驟
從產(chǎn)品開(kāi)發(fā)目標(biāo)到最終產(chǎn)品評(píng)估和基于目標(biāo)的操作優(yōu)化,形成了閉環(huán)數(shù)據(jù)操作。此流程和規(guī)范要求所有部門(mén)都具有統(tǒng)一的意識(shí)。每個(gè)產(chǎn)品終端可以根據(jù)標(biāo)準(zhǔn)流程統(tǒng)一報(bào)告數(shù)據(jù),建立公司級(jí)統(tǒng)一數(shù)據(jù)中心,建立數(shù)據(jù)倉(cāng)庫(kù),最大化數(shù)據(jù)價(jià)值。數(shù)據(jù)成為生產(chǎn)力。
如何構(gòu)建產(chǎn)品數(shù)據(jù)操作系統(tǒng)?可以從以下五個(gè)要素中考慮:
?。?)人:專(zhuān)職的數(shù)據(jù)運(yùn)營(yíng)同事
專(zhuān)職的產(chǎn)品同事,負(fù)責(zé)建立產(chǎn)品數(shù)據(jù)系統(tǒng)的流程和標(biāo)準(zhǔn)化,促成經(jīng)驗(yàn),促進(jìn)系統(tǒng)的不斷優(yōu)化和發(fā)展;專(zhuān)職專(zhuān)業(yè)開(kāi)發(fā)同事,負(fù)責(zé)數(shù)據(jù)報(bào)告,報(bào)表開(kāi)發(fā),數(shù)據(jù)庫(kù)開(kāi)發(fā)和維護(hù)等,確保產(chǎn)品開(kāi)發(fā)和實(shí)施數(shù)據(jù)系統(tǒng)。
(2)數(shù)據(jù)后臺(tái):全面系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)
有一個(gè)特殊的統(tǒng)一數(shù)據(jù)倉(cāng)庫(kù)來(lái)記錄自己產(chǎn)品的特殊個(gè)性數(shù)據(jù)。通用數(shù)據(jù)充分利用數(shù)據(jù)平臺(tái)部門(mén)的通用接口來(lái)獲取和共享數(shù)據(jù)源,充分降低了成本。
?。?)數(shù)據(jù)前臺(tái):固化數(shù)據(jù)體系展現(xiàn)平臺(tái)
需要專(zhuān)業(yè)的報(bào)告開(kāi)發(fā)同事,系統(tǒng)的思維報(bào)告系統(tǒng),靈活的迭代執(zhí)行,而不是簡(jiǎn)單地接受報(bào)告要求,導(dǎo)致大量的報(bào)告。
(4)工作規(guī)范:需求實(shí)現(xiàn)流程化
它是在上述11個(gè)步驟中構(gòu)建產(chǎn)品數(shù)據(jù)系統(tǒng)的過(guò)程和方法。很好地掌握了數(shù)據(jù)要求。兩個(gè)是鞏固需求開(kāi)發(fā)的過(guò)程,另一個(gè)是臨時(shí)需求工具化。
(5)工作產(chǎn)出:數(shù)據(jù)應(yīng)用
常規(guī)數(shù)據(jù)工作是各種數(shù)據(jù)分析,輸出每日,每周,每月報(bào)告;基于決策依據(jù)的數(shù)據(jù)分析。進(jìn)行數(shù)據(jù)產(chǎn)品開(kāi)發(fā),例如準(zhǔn)確推薦,用戶(hù)生命周期管理和其他產(chǎn)品規(guī)劃。
作者:藍(lán)軍,BLUES,高級(jí)產(chǎn)品專(zhuān)家和運(yùn)營(yíng)專(zhuān)家,前騰訊YY語(yǔ)音,高級(jí)產(chǎn)品經(jīng)理,雷霆產(chǎn)品前任總監(jiān),現(xiàn)為梅沙科技創(chuàng)始人。
資料來(lái)源:汕頭商學(xué)院(ID:mantousxy)