在線問卷樣本庫的三代進化,誰能代表未來?_風聞
王新喜专栏-自由撰稿人-2019-11-13 10:56
文/王新喜
沉寂已久的在線問卷行業,今年的資本動向頗為明顯,今年8月,問卷星完成8.27億人民幣的戰略投資,投資方為有才天下獵聘,持股 66.6%,從投資方持股比例來看,相當於戰略收購了。問卷網也完成1.4億元C輪融資。
如果我們梳理國內在線問卷的歷史脈絡,會發現這個行業經歷了三代樣本庫的進化。
第一代問卷帶動行業起步:但樣本採集、結果分析難有質的突破
在線問卷於2000年前後在國外萌芽,SurveyMonkey是典型的成長性巨頭:該公司成立於1999年Dot.com泡沫期間,逐漸建立了616,000付費用户的基礎,去年估值達20億美元。今天SurveyMonkey、wufoo,google form已橫掃海外調研市場。
在國內,在線問卷市場主流企業有問卷網、問卷星、騰訊問卷、樂調查、金數據、麥客、番茄表單等,基本都做到了豐富的題型,海量模板,強大的擴展性功能,能滿足普通受眾的需求。
長沙冉星信息科技有限公司旗下問卷星創立於2007年,是國內最早的在線問卷調查、考試和投票平台,它更傾向於學生市場,問卷星也提供付費模式的樣本服務,為高校教師、科研團隊的課題和企業的市場調查提供數據支持。
在第一代企業問卷星身上,其樣本庫有多個特徵:
其一,更聚焦學生考試市場調研,不像後來者(騰訊問卷、金數據等)擴充到企業級市場等更多行業市場。
其二,樣本庫範圍侷限於自身的平台——針對平均每天超過100萬人在問卷星平台上填寫的問卷,260萬樣本庫成員,問卷星將隨機邀請其中部分人羣加入樣本庫。
其三:企業需要付費才可以使用到平台的樣本服務。其官網顯示,它可以通過性別、年齡、用户地域、身份這幾個樣本屬性,去定位目標人羣。
雖然針對百萬級別的用户樣本進行問卷調研,依然也具備一定的精準投放和效果跟蹤能力,但受樣本規模所限,取樣範圍狹窄,對不同行業沒有明顯區分,不同企業需求也無法得到針對性體現,服務質量不可控。當然,問卷星依然採取了樣本質量控制的手段來防禦虛假用户與樣本質量。
問卷星控制樣本質量的做法是四個步驟:
1. 針對符合要求的人羣發放問卷;
2. 在填寫的過程中控制設定各種規則——A. 自動篩選規則:支持多種無效答卷篩選;B. 選項配額規則:對任意單選題的選項都可以設置配額;C.答題時間控制:設置最短答題時間或最長答題時間;D:隨機調整順序:支持隨機調整題目或選項的順序;E.同一個IP地址、同一台電腦、同一用户名都只能填寫一次。
3. 系統篩選;
4. 人工篩選,最終形成有效樣本。
但在樣本規模偏少的情況下,針對不同行業的問卷調研難以做到更高精準度。在樣本質量的控制流程上,也難以看到精準的抽樣條件。
總體來看,以問卷星為代表的第一代企業是國內在線問卷的先行者,它帶動了國內數據調研的起步,但基於用户體量與模式、技術的限制,它在調研過程中的樣本採集、結果分析難以帶來質的提升,這背後也面臨着模型建立和技術積累的問題。
第二代的突破與進化:但樣本庫的質量短板猶存
隨着時間的推移,在線問卷行業迎來了第二代選手:問卷網、樂調查、金數據、麥客等。
問卷網、樂調查是第二代的典型企業。樂調查於2014年3月正式上線,是市場調查和數據採集的一站式平台。而問卷網成立於2013年,用户超600萬,今年完成1.4億元C輪融資,由方廣資本、元禾控股、中億明源聯合投資。
相對於第一代樣本庫受平台規模所限,樣本面狹窄,第二代問卷平台開始通過自建樣本庫與第三方合作的模式來擴充數據樣本庫。
問卷網的樣本庫是自建+第三方合作的模式,它與今日頭條、華為合作,樣本來源比第一代更為廣泛,樣本收集的目標羣體包括地區、性別、家庭、年齡、職業、學歷、收入、地區等,用户維度上得到了擴充。隨着樣本來源與規模擴大,能覆蓋到更多領域的問卷用户。
樂調查的是通過線上定向邀請問卷,實現精準抽樣,也是自建+第三方合作的樣本庫模式。當前樂調查與京東達成合作,實現消費行為分析+調研訪問數據的結合,樣本收集主要針對消費者的瀏覽偏好、網購人羣行為特徵、搜索偏好來定位目標用户。
其用户屬性標籤大致是:年輕辣媽、忠實果粉或者口紅收割機、戴森真愛粉等類型。樂調查的優勢是針對電商網購消費者的樣本頗為豐富,但針對其他領域的樣本偏少。
樂調查也通過招募資源引入更多的渠道來源,確保樣本的真實性與廣泛性。其官網數據顯示,網易等主流門户合作佔總量10%,百度搜索引擎佔比10%、各應用商店渠道佔比10%、以及支付寶旗下站點,中國電信渠道佔總量30%。其每年執行的樣本總量達到300萬+。
此外,第二代問卷平台開始引入獎勵機制:比如説樂調查是物質與非物質激勵並存。問卷網曾經於2014年針對學生開展贈送調查券活動,為學生免費提供樣本服務,但問卷填寫者僅獲贈2個積分,也造成大量亂填現象,暴露了當時樣本庫在成員篩選和質量控制上的短板。
在當時填寫問卷獎勵的激勵下,主動參與問卷的用户往往有意識去成為"演員",成為問卷需要的人。第二代問卷平台由於篩選機制不足,依然難以獲得接近更加真實的數據。
第二代在線問卷平台也在發力解決樣本庫的質量短板與侷限。
問卷網主要從數據品控(篩選答題時間過短的問卷)、數據追蹤(問卷鏈接增加追蹤參數、轉發、充填無效,每個IP只能回答一次)、數據來源(數據主要來自於樣本庫愛調研)三個層面去嚴控質量。
在樣本質量控制方面,樂調查是通過四個步驟來嚴控樣本質量與品質:1、訪問控制(電腦去重、IP檢查、答題時長檢測等)——2、數據清理(題型邏輯檢查)——3、panel維護(定期更新個人信息與誠信管理體系)——4、panel募集(IP與地址匹配、移除多次註冊、機器註冊自動檢測)。本質上,它通過技術手段排除重複作答、獨有的陷阱題庫體系甄選出不認真受訪者。
此外,無論是問卷網還是樂調查,用户都需要通過填寫付費樣本需求進行在線估價,或進行人工報價。
第二代問卷平台相對第一代,進化頗為明顯:其一,引入第三方平台擴充樣本庫規模,打破了第一代問卷取樣範圍狹窄的短板;引入更多渠道來源,確保樣本的真實性與廣泛性。其二:在目標用户維度上更為細分;其三是,引入了獎勵機制來帶動用户參與問卷的積極性。
但問題依然存在,其一是問卷獎勵刺激用户主動性頗為合理,但缺失了對用户答題的前置審核;其二,投放者成本居高不下,投放者即要根據付費樣本需求在線估價,又要對答題用户進行獎金刺激,需要雙重付費。
其三,在樣本的質量控制上,無論是電腦去重,還是題型的邏輯檢查、記錄答題時間,雖然有效,但這種傳統手段難以保證問卷"演員或羊毛黨"的刷量的行為,這是影響問卷真實性的重要環節。其四:樣本源侷限問題依然存在,比如樂調查更聚焦於電商網購領域的樣本收集,對於不同行業企業、學校的問卷調研需求,可能會有點有心無力。
第三代在線問卷:從付費到免費,從傳統識別到AI+傳統雙重甄別
作為問卷調研市場的後來者,騰訊問卷是在騰訊內部專業用户研究工具UR問卷系統的基礎上誕生的,2014年面世,形成了完善的問卷模板,囊括客户滿意度,產品測試,市場調查,互聯網、生活商業、娛樂等領域,目前已有2.8億用户。
之所以將騰訊問卷劃歸為第三代問卷平台,一方面是相對老牌廠商來説,它沒有商業盈利訴求,問卷調查是B端剛需,騰訊的To B戰略又是做各行業的’數字化助手’。騰訊問卷可以説是騰訊開放戰略與To B戰略下的一環,對騰訊而言,它更在意的是如何做大用户價值與問卷調研的大數據服務價值,更好的服務並贏得企業級市場。
但其他廠商短期內不能盈利是比較嚴重的問題,問卷是服務型較強的行業,盈利模式與用户體驗會產生直接的衝突,正因如此,騰訊在其他玩家的收費業務上做到了免費。
另一方面,它在某種程度上解決了第一代與第二代的樣本庫的侷限。
騰訊問卷的樣本庫是基於"騰訊問卷回答小組"為核心運轉:問卷創建者通過用户提供的基礎屬性和興趣標籤實現問卷的精準投放,通過紅包或甜圈發起調研,回答者獲得紅包或甜圈獎勵。問卷的創建者可以在騰訊問卷的投放頁選擇希望投放的人羣屬性以及興趣標籤,以實現問卷的精準投放。
騰訊問卷與第二代按樣本需求付費不同的是,它是0服務費,平台充當免佣金的橋樑,對接投放者與回答者,投放者的獎勵全部投入給答題用户,支持最低2元、最高8元的紅包和甜圈。
相對來説,騰訊問卷在成本投入上要更低——前兩代樣本庫使用是付費,而騰訊問卷做到了免費,節省了投放者高額的樣本服務費。
其次是,騰訊問卷在用户甄選維度上要比前二代更為細分與精細化。它有四大屬性分類(人口、興趣、設備、行為),20多個細分維度篩選。第一代與第二代是聚焦於用户地域、年齡、性別、職業、學歷等維度,主要以人口屬性的標籤為主。
而騰訊問卷在前代的基礎上,對興趣標籤進行了擴充(汽車、數碼、遊戲、旅遊、理財、美食等)、並擴展了設備、行為屬性等細分維度。
一個特點是,騰訊的數據標籤是由用户主動標記提供的,也有通過數據挖掘的。比如用户可以自己選擇汽車、旅遊、數碼等相關標籤,平台再通過數據挖掘等操作對熱門標籤進行補充——用户標記+數據挖掘的結合,整體的用户標籤更為全面與豐富。
從特點來看,騰訊回答小組都是用户主動申請,它也明顯更注重樣本庫成員的運營,而不是隻有答題的時候才關注樣本,精細化的重樣本運營有兩大好處:
其一,基礎屬性外,它能夠獲取更多維度的其他樣本標籤數據;
其二,可以更精準的去投放問卷,服務價值更明顯。而一二代老牌的樣本庫目前還處於擴充樣本庫來源、確保標籤的真實性階段,還看不到在樣本庫成員運營層面的發力。但從趨勢來看,問卷調查的服務屬性凸顯,將越來越注重樣本庫成員的精細化運營。
騰訊問卷背靠微信、QQ的海量用户數據庫與畫像,它有着其他問卷平台所沒有覆蓋到的細分維度的用户樣本,相對比前二代百萬量級的用户,騰訊問卷用户是億級別的,可以實現更細化、多維度的用户定位與覆蓋與更精準的目標用户鎖定。
也因此,騰訊問卷的回收速度更快,採用了全程自主選擇屬性、標籤投放,全自動化處理,1天內能達到約90%的目標回收量,縮短了調研項目的週期。
前面提到,第二代新增了獎勵手段去激勵用户答題的主動性,但難免會引來羊毛黨,為求省事胡亂答題導致問卷質量堪憂,而第二代在樣本質量控制上採取的是傳統的剔除、甄別手段——即聚焦於答題邏輯、時長與IP地址去重等手段去甄別。
與第二代相比,騰訊問卷也採用了獎勵手段,但騰訊採用了兩種手段來嚴控質量,剔除羊毛黨等無效樣本。
其一是傳統識別與AI技術識別相結合:傳統識別針對有效時長、邏輯篩選、IP分析、渠道做有效甄別,並研發自動識別標記無效問卷(胡亂、偽裝作答)程序,通過跟蹤用户全程的答題行為時間分佈,結合AI技術依靠用户行為序列進行篩選,確保回收問卷的有效性以及填填圈樣本的質量。而AI技術可以識別用户、問卷特徵、答題行為,兩方面數據實現交叉驗證。
相對於前代,它增設AI識別流程,對問卷樣本的質量把控更高。
其二:它通過回答問卷審核機制來嚴控質量,問卷默認開啓了審核回答後發放紅包。對於不符合答題要求或者隨意亂填的答卷可以標記無效,相應的答題者也將無法獲得紅包或甜圈。由此避免了問卷獎勵機制下"演員"的出沒。
相對來看,無論是目標用户細分維度擴充,還是從付費到免費的過度,以及通過AI+傳統識別雙重手段對樣本質量的控制、對有效樣本的甄別,都在前一代基礎上更進一步。發展到今天,問卷調研在樣本獲取的便利性與樣本質量方面都在快速提升。
結語:
從在線問卷樣本庫的發展進程看,每一代都在解決上一代的短板、痛點與侷限。過去樣本付費屬性提高了企業問卷的成本投入,這會逼迫企業去篩選更具性價比的問卷調查平台與工具。
而當前騰訊問卷將平台的服務佣金免費,其實是增加了試用產品用户轉化率,這很容易讓人們想到PC時代的殺毒軟件市場,當年360將同行的收費業務免費而快速崛起。
以騰訊問卷來看,當一家企業建立起一定規模的在線調查樣本庫的時候,如何識別這些樣本,對樣本實行有效的管理,讓調查都反映真實客觀的信息,是爭奪客户羣、形成更穩健的盈利模式以及超過同行的服務體驗的關鍵。
作者:王新喜 TMT資深評論人 本文未經許可謝絕轉載 我的微信公眾號:熱點微評(redianweiping)