匿名使用者
匿名使用者 發問時間: 教育與參考其他:教育 · 2 0 年前

誰能提供資料挖掘的實例~20

如題~就最好有成功做過的例子~

且是用什麼軟體去做的~

像類神經網路、決策樹等例子~

越詳細越好~

1 個解答

評分
  • 匿名使用者
    2 0 年前
    最佳解答

    資料挖掘工具的評判  要做資料挖掘,當然需要工具。但若靠傳統的自我編程來實現,未免有些費時費力,而且其性能也不一定比商業工具來得強 和穩定。目前,世界上已經有很多商業公司和研究機構開發出了各自的資料挖掘產品,而且功能和使用簡易性也在日益提高。例如:SAS公司的 Enterprise Miner以及IBM公司的 Intelligent Miner,等等。直接採用商業資料挖掘工具來幫助專案實施,是一個很好的選擇。它既節省了大量的開發費用,又可以節約維護和升級的開銷。本文是目前國內第一份對主流資料挖掘工具的評估報告,該報告綜合了國內一流業務專家和資料挖掘專家的意見,為幫助企業進行類似評估提供了很高的參考價值。工具種類資料挖掘工具包括兩種:● 數據挖掘(Mining for Data)工具:其所用的資料都存儲在已經有了明確欄位定義的資料庫或文字檔案裏,我們稱之為結構化的資料挖掘工具。它主要是用來進行預測、聚類分析、關聯分析、時間序列分析以及統計分析等。● 文本挖掘(Text Mining)工具:它是用來從非結構化的文檔中提取有價值的資訊,這些資訊都隱藏在文檔裏並且沒有清晰的欄位定義。文本挖掘主要是應用在市場調研報告中 或呼叫中心(Call Center)的客戶報怨定級、專利的分類、網頁的分類以及電子郵件分類等。根據著名資料挖掘網站KDnuggets統計,目前已有50多種資料挖掘工具 問世。● 一般而言,目前市場上這些資料挖掘工具又可分成兩類——企業型工具以及小型工具。企 業型資料挖掘工具:應用在需要高處理能力、高網路容量和大資料量的場合下。這些工具通常支援多種平臺,並基於客戶機/伺服器結構。它通常可以直接連接一些 複雜的資料管理系統(不像普通文字檔案),並能處理大量的資料。這類資料挖掘工具的另一個特點是它通常提供了多種資料挖掘演算法,並有能力解決多種應用問 題。企業資料挖掘工具的實例有IBM的Intelligent Miner和SAS Enterprise Miner等。● 小型資料挖掘工具:它與企業型的工具著眼點不同。小型資料挖掘工具或者是針對低端、低消費的用戶,或者是為解決特定的應用問題提供特定的解決方案。比如Oracle公司的 Darwin,Insightful公司的Insightful Miner,等等。工具選擇如 何在眾多工具中挑選出最適合本公司的呢?這的確是一個非常具有挑戰性的工作。由於各個公司的背景、財務、挖掘水平各不相同,對資料挖掘工具的需求也就各不 一樣。到目前為止,可供參考的權威評估報告非常少。最近的一份完整而權威的資料挖掘工具評估報告是由John F. Elder IV和Dean W. Abbott在1998年完成的。可以說,它已經過時了。但一般說來,對資料挖掘工具的選擇可從以下幾點著眼:● 公司的資料挖掘需求是短期行為還是長期使用如果是短期行為,就購買那些能解決特定問題的套裝軟體或外包給諮詢公司。如果是長期使用,就需要購買功能比較豐富,使用比較方便,維護升級比較好的企業型資料挖掘工具。● 公司的資料挖掘經驗和水平公司應該根據內部資料挖掘團隊的經驗和水平,選取一些經過基本培訓後就能掌握的工具。而不要盲目求好,最終導致因不會使用工具而將其束之高擱,從而造成資源的浪費。● 公司的資料狀態在挑選資料挖掘工具前,公司必須對現有的資料進行評估。如果沒有具備進行業務主題資料挖掘(比如:風險預測)的資料或者現有格式不能滿足資料挖掘工具的需求,那就需要等資料具備了,才可考慮購買工具。● 公司的預算當然,在評估資料挖掘工具時,公司也要結合自身的財務預算來決定。● 工具的性能好的工具可以更有效地挖掘出高準確和高價值的資訊,所以工具性能的評估也是相當重要的。下面,本文將結合國內某一家大公司資料挖掘工具評估的實際例子,對目前市場上最流行的資料軟體工具從純技術角度進行詳細講解和評估。從而為行內公司進行類似的工作提供參考。工具評判圖1顯示了資料挖掘工具評估的一般過程。首 先我們要通過不同途徑(Internet,雜誌,供應商提交材料等)盡可能多地收集資料挖掘工具的相關資料。然後,根據公司的業務需求、工具性能、公司背 景等情況,確定3~5個初選物件。在確定完評估物件後,我們將從技術、業務需求、資料狀態、供應商實力、財務預算等各個角度來制定比較詳細的評估條款以及 權值。制定完標準後,下一步就是根據所制定的標準進行逐一評分。最後,根據評分結果進行總結,從而提出資料挖掘工具的選取建議。

    圖片參考:file:///C:/Documents%20and%20Settings/admin/My%20Documents/My%20Webs/data_mining_10010_clip_image001.jpg

    下面的案例,是國內某家大公司資料挖掘工具的技術評估過程:該公司於2002年開始啟動資料挖掘專案。對於該公司來說,資料挖掘是一項長期的工程。由於同時考慮到資料量大、業務需求廣泛,因此本次評估對象僅限於企業級的資料挖掘工具。根 據所收集的資料,我們對目前在中國市場上最為流行的三大資料挖掘軟體(SAS公司的 Enterprise Miner、IBM公司的 Intelligent Miner和SPSS公司的 Clementine,進行了評估。本次評估主要有6個主要標準,包括資料存取、資料處理、模型演算法、自動建模、視覺化以及其他系統要求。下面的內容說明 了對每個工具在6個主要標準上進行打分的具體情況。 

還有問題?馬上發問,尋求解答。