CRM系統(tǒng):數(shù)據(jù)倉庫在酒店CRM 系統(tǒng)中的應(yīng)用研究
[摘要]在酒店客戶關(guān)系管理系統(tǒng)中,要實(shí)現(xiàn)對大量客戶數(shù)據(jù)的有效分析和利用,需要建立一個面向分析的多維數(shù)據(jù)倉庫模型,實(shí)
現(xiàn)從多個角度顯示和分析客戶數(shù)據(jù),為進(jìn)行數(shù)據(jù)挖掘提供基礎(chǔ)。本文中根據(jù)酒店CRM 系統(tǒng)的需求,設(shè)計(jì)了數(shù)據(jù)倉庫的事實(shí)表和各
維度表,并采用星型和雪花型相結(jié)合的多維數(shù)據(jù)模式構(gòu)建了酒店CRM 系統(tǒng)的數(shù)據(jù)倉庫模型。
[關(guān)鍵詞]CRM 數(shù)據(jù)倉庫星型模式雪花型模式
引言
近幾年,隨著我國國民經(jīng)濟(jì)的迅速增長,酒店數(shù)量不斷增加、客源
更加豐富多樣化、市場更加廣闊多渠道,酒店業(yè)面臨著日趨激烈的競爭
環(huán)境和不斷攀升的客戶期望。要想在競爭中取得優(yōu)勢,必須積極尋求擴(kuò)
大酒店銷售、改進(jìn)服務(wù)質(zhì)量、降低管理成本、改善客戶關(guān)系和提升客戶
滿意度的有效的信息化手段來增強(qiáng)酒店的核心競爭力。
酒店的管理者已經(jīng)逐漸認(rèn)識到酒店的所有活動都應(yīng)該以客戶為中
心,需要依靠現(xiàn)代化的輔助手段隨時對客戶進(jìn)行分析,掌握客戶的動態(tài)
變化趨勢。傳統(tǒng)的酒店管理信息系統(tǒng)往往是以財(cái)務(wù)管理為設(shè)計(jì)主線,僅
能夠?qū)频暌欢螘r間的盈利狀況或客房占用情況做出分析,而忽略了
對決定酒店盈利高低的關(guān)鍵因素———客戶的注意,因此將CRM系統(tǒng)應(yīng)
用到酒店行業(yè)中對于酒店的管理者而言是一個很好的解決方案。
1. 酒店CRM 系統(tǒng)
客戶關(guān)系管理(Customer Relationship Management,CRM)的基本思
想是“以客戶為中心”,其定義可以簡單概括為:利用軟件、硬件和網(wǎng)絡(luò)
技術(shù),為企業(yè)建立一個客戶信息收集、管理、分析和利用的信息系統(tǒng)。
適合于酒店的CRM系統(tǒng)可以有效地幫助酒店正確識別客戶價值、
改善客戶關(guān)系、提高客戶滿意度、降低管理成本,從而使酒店在競爭中
取得優(yōu)勢。目前,國內(nèi)多數(shù)酒店已經(jīng)建立了簡單的信息管理系統(tǒng),員工
利用該系統(tǒng)可以處理一些簡單、瑣碎、重復(fù)性的工作,如在前臺接待部
門,可執(zhí)行入住登記、收銀、查詢、結(jié)帳、報表生成等多種功能。CRM系
統(tǒng)可以建立在酒店原有的管理信息系統(tǒng)的基礎(chǔ)上,使客戶信息在酒店
前臺、客房服務(wù)、餐飲、娛樂、會議、財(cái)務(wù)等各個部門充分共享,并提取客
戶信息,重點(diǎn)實(shí)現(xiàn)對客戶信息的整理和分析,并用于支持酒店決策,將
酒店的客戶資源轉(zhuǎn)化成酒店收益。
酒店CRM系統(tǒng)最主要的任務(wù)是實(shí)現(xiàn)對大量客戶數(shù)據(jù)的收集、整
理、分析和有效利用。作為一個面向客戶的信息管理系統(tǒng),對數(shù)據(jù)有特
殊的需求。如果直接以酒店的管理信息系統(tǒng)數(shù)據(jù)庫為基礎(chǔ),在大量無用
數(shù)據(jù)的干擾下,將使得客戶數(shù)據(jù)的提取與操作異常困難;另一方面,操
作型環(huán)境數(shù)據(jù)表是根據(jù)操作的實(shí)際需要決定,表之間的關(guān)聯(lián)錯綜復(fù)雜,
在分析時需要建立與大量數(shù)據(jù)表之間的連接,降低了分析的時間性能,
不適應(yīng)數(shù)據(jù)分析的需要。所以建立一個為CRM系統(tǒng)提供服務(wù)的數(shù)據(jù)倉
庫是必需的,數(shù)據(jù)倉庫中完備的、經(jīng)過組織的大量數(shù)據(jù)為進(jìn)行客戶分析
提供了良好的基礎(chǔ)。
2. 數(shù)據(jù)倉庫
2.1 數(shù)據(jù)倉庫簡介
數(shù)據(jù)倉庫(DataWarehouse)是計(jì)算機(jī)和數(shù)據(jù)庫技術(shù)應(yīng)用到一定階段
的必然產(chǎn)物。隨著計(jì)算機(jī)應(yīng)用的不斷深入,企業(yè)的運(yùn)營環(huán)境逐漸轉(zhuǎn)化為
以數(shù)據(jù)庫為中心,在企業(yè)的數(shù)據(jù)庫中往往存儲著大量信息數(shù)據(jù),企業(yè)的
業(yè)務(wù)人員希望能夠快速地、交互地、方便有效地從大量雜亂無章的數(shù)據(jù)
中獲取有意義的信息,而決策者則希望能夠利用現(xiàn)有數(shù)據(jù)來指導(dǎo)決策
和發(fā)掘競爭優(yōu)勢。但是,傳統(tǒng)數(shù)據(jù)庫不能實(shí)現(xiàn)上述要求,于是必須將用
于事務(wù)處理的數(shù)據(jù)環(huán)境和用于數(shù)據(jù)分析的數(shù)據(jù)環(huán)境分開,也就是使原
來由單一數(shù)據(jù)庫為中心的數(shù)據(jù)環(huán)境發(fā)展為以操作型關(guān)系數(shù)據(jù)庫為中心
的數(shù)據(jù)處理系統(tǒng)和以數(shù)據(jù)倉庫為中心的數(shù)據(jù)分析系統(tǒng)。
數(shù)據(jù)倉庫的概念是在1991 年由美國著名信息工程學(xué)家WilliamH.I.
博士提出的,將其定義為:“數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題
的、集成的、與時間無關(guān)的、不可修改的數(shù)據(jù)集合”。數(shù)據(jù)倉庫也是一個
數(shù)據(jù)庫,大部分都是基于關(guān)系型數(shù)據(jù)庫管理系統(tǒng)的設(shè)計(jì),它精簡并整合
了來自于異地、異構(gòu)的數(shù)據(jù)源或數(shù)據(jù)庫(如CRM數(shù)據(jù)庫、ERP 數(shù)據(jù)庫等)
的原始數(shù)據(jù),為有關(guān)部門或企業(yè)進(jìn)行全局范圍的戰(zhàn)略決策和長期趨勢
分析提供了有效的支持。
數(shù)據(jù)倉庫系統(tǒng)由數(shù)據(jù)處理、數(shù)據(jù)倉庫管理和分析工具三部分組成,
其結(jié)構(gòu)如圖1 所示:
圖1 數(shù)據(jù)倉庫結(jié)構(gòu)示圖
⑴數(shù)據(jù)處理
數(shù)據(jù)倉庫有多個數(shù)據(jù)源,包括企業(yè)內(nèi)部數(shù)據(jù)(生產(chǎn)、技術(shù)、財(cái)務(wù)、設(shè)
備、銷售等)、市場調(diào)查與分析及各種文檔之類的外部數(shù)據(jù)。這些原始的
“粗?jǐn)?shù)據(jù)”有很多信息是并不需要的,因此要對它們進(jìn)行抽取、加載、轉(zhuǎn)
換和清洗等必要的處理。其中數(shù)據(jù)抽取是指從數(shù)據(jù)源中提取出對數(shù)據(jù)
分析有用的數(shù)據(jù);數(shù)據(jù)轉(zhuǎn)換是指當(dāng)數(shù)據(jù)來源不同而造成數(shù)據(jù)格式不統(tǒng)
一時要將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)格式;數(shù)據(jù)清洗是指消除加載到數(shù)據(jù)
倉庫中的原始數(shù)據(jù)中錯誤的、無效的、不一致的地方。
⑵數(shù)據(jù)倉庫管理
數(shù)據(jù)倉庫本身的內(nèi)容包括數(shù)據(jù)、元數(shù)據(jù)及自身日志等。其中元數(shù)據(jù)
是描述數(shù)據(jù)倉庫特性的數(shù)據(jù),主要用它創(chuàng)建、維護(hù)、管理和使用數(shù)據(jù)倉
庫。
數(shù)據(jù)倉庫管理的主要任務(wù)包括批處理作業(yè)管理,數(shù)據(jù)安全管理,數(shù)
據(jù)沖突解決,數(shù)據(jù)質(zhì)量核查,管理數(shù)據(jù)倉庫元數(shù)據(jù)的更新,數(shù)據(jù)刪除與
復(fù)制,備份與恢復(fù)等,從而為保證數(shù)據(jù)倉庫的正常運(yùn)轉(zhuǎn)提供基本的管理
環(huán)境。
⑶分析工具
數(shù)據(jù)倉庫的分析工具包括用于完成實(shí)際決策問題所需要的各種查
詢檢索工具、基于多維數(shù)據(jù)庫的OLAP 分析工具、數(shù)據(jù)挖掘工具等。
數(shù)據(jù)倉庫應(yīng)用是一個典型的C/S 結(jié)構(gòu),其客戶端的工作包括客戶
交互、格式化查詢及結(jié)果和報表生成等。服務(wù)器端完成各種輔助的SQL
查詢、復(fù)雜的計(jì)算和各種綜合功能等。目前普遍采用的形式是三層結(jié)
構(gòu),即在客戶與服務(wù)之間增加一個多維數(shù)據(jù)分析服務(wù)器。
基于多維數(shù)據(jù)庫的在線分析工具———OLAP 可以幫助高級用戶從
精細(xì)、多維、復(fù)雜的角度分析數(shù)據(jù),但它與數(shù)據(jù)挖掘工具不同。OLAP 工
具是一種數(shù)據(jù)訪問工具,是對歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)并有效地向系統(tǒng)用戶
顯示。它只是提供“事實(shí)數(shù)據(jù)”,即回答是什么的問題,對今后的預(yù)測則
完全由用戶靠自己的“人腦”判斷。使用OLAP 工具,首先要建立OLAP
分析數(shù)據(jù)庫,對數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行預(yù)處理,比如將月份統(tǒng)計(jì)值(總
和、平均、最低、最高等)以記錄的方式先存放在OLAP 數(shù)據(jù)庫中,當(dāng)用
戶切換視圖時可以利用這些現(xiàn)存的數(shù)據(jù)提高系統(tǒng)的反應(yīng)速度。OLAP 工
具能加強(qiáng)和規(guī)范決策支持的服務(wù)工作,集中和簡化原客戶端和數(shù)據(jù)挖
掘的部分工作,降低系統(tǒng)數(shù)據(jù)傳輸量,提高工作效率。目前,支持OLAP的
數(shù)據(jù)庫有多維數(shù)據(jù)庫和多關(guān)系數(shù)據(jù)庫(即支持多維特性的關(guān)系數(shù)據(jù)庫),
雖然兩種數(shù)據(jù)庫采用不同的數(shù)據(jù)庫模式,但目的都是為了將預(yù)處理的
結(jié)果以合理的方式儲存,以供OLAP 工具使用。
2.2 數(shù)據(jù)倉庫的多維數(shù)據(jù)模型
數(shù)據(jù)倉庫中,可以對數(shù)據(jù)進(jìn)行多維化處理,構(gòu)成多維數(shù)據(jù)模型,它
是數(shù)據(jù)分析時用戶的數(shù)據(jù)視圖,是面向分析的數(shù)據(jù)模型。多維數(shù)據(jù)模型
包括事實(shí)、維和粒度。其中,事實(shí)是分析的目標(biāo)數(shù)據(jù);維是事實(shí)信息的屬
性,也是考察數(shù)據(jù)的角度,每一個維都有一個表與之相關(guān)聯(lián),稱為維表,
它進(jìn)一步描述維的屬性;粒度是維劃分的單位,也就是明細(xì)的程度,可
以用超立方體結(jié)構(gòu)來表示事實(shí)、維和粒度的關(guān)系。所以在數(shù)據(jù)倉庫系統(tǒng)
中的統(tǒng)計(jì)分析就統(tǒng)一歸結(jié)為:從不同的角度(維)、不同的層次(粒度)來觀
察分析數(shù)據(jù)(事實(shí))。
多維數(shù)據(jù)模型有以下兩種基本模式:
⑴星型模式:星型模式是最常見的數(shù)據(jù)倉庫實(shí)現(xiàn)模式,由一個不含
冗余數(shù)據(jù)的大規(guī)模中心表(事實(shí)表)和一組小的附屬表(維度表)構(gòu)成。
其中,維度表只與事實(shí)表發(fā)生聯(lián)系,而各個維度表之間沒有直接關(guān)系,
事實(shí)表中包含了所有維度表的外鍵,這些外鍵指向各維度表的首鍵。
在星型數(shù)據(jù)關(guān)系模型中,事實(shí)表的每個維度都有深度的索引,用戶
查詢時先用體積小的多的維度去過濾很大的事實(shí)表,首先獲得較小的
相關(guān)數(shù)據(jù)集,從而減少數(shù)據(jù)查詢的數(shù)量,提高查詢速度。
⑵雪花型模式:雪花型模式是對星型模式的擴(kuò)展,每個維度表都可
以向外連接到多個詳細(xì)類別表,即子維度表,詳細(xì)類別表在有關(guān)維度上
對事實(shí)表進(jìn)行詳細(xì)描述,達(dá)到縮小事實(shí)表、提高查詢效率的目的。
由于采用標(biāo)準(zhǔn)化和較低的粒度,雪花模式在執(zhí)行查詢時需要更多
的連接操作,所以可能降低瀏覽的性能。
3. 酒店CRM 數(shù)據(jù)倉庫的建立
3.1 數(shù)據(jù)倉庫的數(shù)據(jù)源
數(shù)據(jù)倉庫是面向主題的,酒店CRM系統(tǒng)要實(shí)現(xiàn)的目標(biāo)是通過對酒
店的客戶關(guān)系進(jìn)行分析來評價酒店的客戶滿意度、衡量客戶價值和細(xì)
分客戶群。酒店CRM系統(tǒng)數(shù)據(jù)倉庫的數(shù)據(jù)源主要包括酒店各個部門收
集到的各方面的客戶信息數(shù)據(jù),酒店硬件設(shè)施統(tǒng)計(jì)數(shù)據(jù),另外還有社會
調(diào)查、外部信息等外部數(shù)據(jù)。將這些數(shù)據(jù)源中符合分析需要的客戶信息
數(shù)據(jù)(包括客戶資料數(shù)據(jù)、消費(fèi)數(shù)據(jù)、活動數(shù)據(jù)等)從客戶關(guān)系管理數(shù)據(jù)
庫中提取出來,經(jīng)過清洗與轉(zhuǎn)化,并存入數(shù)據(jù)倉庫,就得到了CRM分析
的基礎(chǔ)數(shù)據(jù)集。在此基礎(chǔ)上對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、抽象化、規(guī)范化分類和
分析,為酒店的管理層提供及時的決策支持,為各個業(yè)務(wù)部門提供有效
的反饋數(shù)據(jù)。
3.2 數(shù)據(jù)倉庫中各表的設(shè)計(jì)
⑴事實(shí)表的設(shè)計(jì)
事實(shí)表反映的是分析的目標(biāo),酒店CRM系統(tǒng)主要針對酒店的客戶
關(guān)系進(jìn)行分析,因此建立客戶關(guān)系事實(shí)表,該表包括客戶號(Customer_
ID)、客戶住宿關(guān)鍵字(Load_ID)、客戶消費(fèi)關(guān)鍵字(Expense_ID)、
客戶滿意度關(guān)鍵字(Satisfaction_ID)等字段。
⑵維度表的設(shè)計(jì)
在酒店CRM系統(tǒng)中共有四個主維度,即直接與事實(shí)發(fā)生聯(lián)系的維
度,分別是客戶信息維度(Customer)、客戶消費(fèi)維度(Expense)、客戶住
宿維度(Load)和客戶滿意維度(Satisfaction)。另外還有五個子維度,分別
是客戶通訊維度(Address)、客戶資料維度(Resource)、酒店服務(wù)維度
(Service)、酒店客房維度(Room)和時間維度(Time)。五個子維度表分別
與相應(yīng)的主維度表相連,
3.3 酒店CRM數(shù)據(jù)倉庫模型的設(shè)計(jì)
本系統(tǒng)中采用星型和雪花型相結(jié)合的模式構(gòu)建的酒店CRM的數(shù)
據(jù)倉庫模型,四個主維度表直接與事實(shí)表相聯(lián)系,五個子維度表