聚類分析在用戶分類中的應用
什麼是聚類分析?
聚類分析屬於探索性的數據分析方法。通常,我們利用聚類分析將看似無序的對象進行分組、歸類,以達到更好地理解研究對象的目的。聚類結果要求組內對象相似性較高,組間對象相似性較低。在用戶研究中,很多問題可以藉助聚類分析來解決,比如,網站的信息分類問題、網頁的點擊行爲關聯性問題以及用戶分類問題等等。其中,用戶分類是最常見的情況。
聚類分析的基本過程是怎樣的?
選擇聚類變量
聚類分析
找出各類用戶的重要特徵
聚類解釋&命名選擇聚類變量
在設計問卷的時候,我們會根據一定的.假設,儘可能選取對產品使用行爲有影響的變量,這些變量一般包含與產品密切相關的用戶態度、觀點、行爲。但是,聚類分析過程對用於聚類的變量還有一定的要求:
這些變量在不同研究對象上的值具有明顯差異;
這些變量之間不能存在高度相關。因爲,首先,用於聚類的變量數目不是越多越好,沒有明顯差異的變量對聚類沒有起到實質意義,而且可能使結果產生偏差;其次,高度相關的變量相當於給這些變量進行了加權,等於放大了某方面因素對用戶分類的作用。
識別合適的聚類變量的方法:
對變量做聚類分析,從聚得的各類中挑選出一個有代表性的變量;
做主成份分析或因子分析,產生新的變量作爲聚類變量。聚類分析
相對於聚類前的準備工作,真正的執行過程顯得異常簡單。數據準備好後,丟到統計軟件(通常是spss)裏面跑一下,結果就出來了。
這裏面遇到的一個問題是,把用戶分成多少類合適?通常,可以結合幾個標準綜合判斷:
看拐點(層次聚類會出來聚合係數圖,如右圖,一般選擇拐點附近的幾個類別)
憑經驗或產品特性判斷(不同產品的用戶差異性也不同)
在邏輯上能夠清楚地解釋找出各類用戶的重要特徵
確定一種分類方案之後,接下來,我們需要返回觀察各類別用戶在各個變量上的表現。根據差異檢驗的結果,我們以顏色區分出不同類用戶在這項指標上的水平高低。如下圖,紅色代表“遠遠高於平均水平”,黃色代表“平均水平”,藍色代表“遠遠低於平均水平”。其他變量以此類推。最後,我們會發現不同類別用戶有別於其他類別用戶的重要特徵。
聚類解釋&命名
在理解和解釋用戶分類時,最好可以結合更多的數據,例如,人口統計學數據、功能偏好數據等等(如下圖)……最後,選取每一類別最明顯的幾個特徵爲其命名,就大功告成啦!
-
實用的西遊記作文(集錦4篇)
在日常生活或是工作學習中,大家都不可避免地會接觸到作文吧,藉助作文可以宣泄心中的情感,調節自己的心情。那麼你知道一篇好的作文該怎麼寫嗎?以下是小編爲大家整理的西遊記作文4篇,希望對大家有所幫助。西遊記作文篇1“妖怪,你往那裏逃!吃俺老孫一棒!”同學們,你們...
-
[精選]西遊記作文5篇
無論在學習、工作或是生活中,大家都不可避免地會接觸到作文吧,作文要求篇章結構完整,一定要避免無結尾作文的出現。你知道作文怎樣才能寫的好嗎?以下是小編精心整理的西遊記作文5篇,希望能夠幫助到大家。西遊記作文篇1自從西天取回真經後,唐僧師徒名聲大振,許多高校都...
-
[精]讀西遊記作文9篇
無論在學習、工作或是生活中,大家都不可避免地要接觸到作文吧,作文是由文字組成,經過人的思想考慮,通過語言組織來表達一個主題意義的文體。爲了讓您在寫作文時更加簡單方便,以下是小編幫大家整理的讀西遊記作文9篇,歡迎大家借鑑與參考,希望對大家有所幫助。讀西遊記...
-
西遊記作文精品(8篇)
在現實生活或工作學習中,說到作文,大家肯定都不陌生吧,通過作文可以把我們那些零零散散的思想,聚集在一塊。那麼你有了解過作文嗎?以下是小編爲大家整理的西遊記作文8篇,歡迎閱讀與收藏。西遊記作文篇1“書是人類進步的階梯,書是人類知識的總統。”一本好書能讓我們增...