- 相關(guān)推薦
淺析數(shù)據(jù)倉庫教學(xué)管理系統(tǒng)
一、數(shù)據(jù)倉庫概述
數(shù)據(jù)倉庫的概念最早是由WH.Inmon提出來的,在他的著作《建立數(shù)據(jù)倉庫》中是這樣定義的:數(shù)據(jù)倉庫是一個面向主題的、集成的、想對穩(wěn)定的、隨時間變化的數(shù)據(jù)集合。數(shù)據(jù)倉庫是在傳統(tǒng)數(shù)據(jù)庫基礎(chǔ)上建立起來的,但是與傳統(tǒng)數(shù)據(jù)庫又有所區(qū)別,傳統(tǒng)的數(shù)據(jù)庫是單一的數(shù)據(jù)資源,即以數(shù)據(jù)庫為中心,進(jìn)行聯(lián)機(jī)事務(wù)處理(OLTP,ONLineTransactionProcessing),數(shù)據(jù)庫技術(shù)的主要任務(wù)存儲數(shù)據(jù),對存儲的數(shù)據(jù)進(jìn)行查詢和修改等操作。而數(shù)據(jù)倉庫是將各業(yè)務(wù)系統(tǒng)數(shù)據(jù)抽取出來,按照決策分析型數(shù)據(jù)要求對數(shù)據(jù)進(jìn)行清理轉(zhuǎn)換重新組織,建立分析處理環(huán)境,然后采用聯(lián)機(jī)分析(OLAP)技術(shù)或者數(shù)據(jù)挖掘技術(shù)處理進(jìn)行數(shù)據(jù)分析,挖掘出潛在的有價值的信息,供用戶參考決策。
二、高校教學(xué)管理數(shù)據(jù)倉庫教學(xué)管理系統(tǒng)的設(shè)計
1.體系結(jié)構(gòu)設(shè)計
數(shù)據(jù)倉庫是基于傳統(tǒng)數(shù)據(jù)庫積累的數(shù)據(jù)和其它渠道收集的各種數(shù)據(jù)信息搭建起來的面向聯(lián)機(jī)分析處理(OLAP,ONLineAnalyticalprocessing)的分析型信息集合,總體結(jié)構(gòu)為三個層次:(源數(shù)據(jù))數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)分析。高校教學(xué)管理系統(tǒng)數(shù)據(jù)倉庫包括數(shù)據(jù)源、數(shù)據(jù)處理,數(shù)據(jù)存儲和數(shù)據(jù)分析四個部分。數(shù)據(jù)源:主要來自數(shù)字化校園管理平臺,涵蓋高校各信息系統(tǒng),教務(wù)管理、學(xué)籍管理、招生就業(yè)管理以及其他信息系統(tǒng)等的數(shù)據(jù)。數(shù)據(jù)處理:包括數(shù)據(jù)抽取、清理、轉(zhuǎn)換和集成。首先從數(shù)據(jù)源中抽取數(shù)據(jù),存儲到臨時數(shù)據(jù)表中,然后對抽取的數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,通過清洗去除決策分析無用的數(shù)據(jù)信息,通過轉(zhuǎn)換使數(shù)據(jù)標(biāo)準(zhǔn)一致,將轉(zhuǎn)換清理后的數(shù)據(jù)集成裝入到數(shù)據(jù)倉庫中。數(shù)據(jù)存儲:各信息系統(tǒng)的數(shù)據(jù)與數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)是相互獨立的,因此各信息系統(tǒng)數(shù)據(jù)的變化不會自動更新數(shù)據(jù)倉庫的數(shù)據(jù),我們需要在設(shè)定數(shù)據(jù)同步存儲機(jī)制,才能實現(xiàn)更新數(shù)據(jù)融入數(shù)據(jù)倉庫存儲。數(shù)據(jù)分析:數(shù)據(jù)抽取、清理、轉(zhuǎn)換、存儲到數(shù)據(jù)倉庫系統(tǒng)以后,我們需要通過各種技術(shù),如聯(lián)機(jī)分析(OLAP)技術(shù)、數(shù)據(jù)挖掘(DM)技術(shù)、商業(yè)智能(BI)技術(shù)等形成統(tǒng)計分析報表供用戶查看并做出相應(yīng)的決策。
2.主題劃分
數(shù)據(jù)倉庫的重要特點是面向主題。當(dāng)數(shù)據(jù)圍繞主題域來組織時,決策分析者將能很明確地找到自己感興趣的東西。建立數(shù)據(jù)倉庫首先要根據(jù)用戶的需要進(jìn)行主題劃分,然后根據(jù)主題建立數(shù)據(jù)倉庫模型,通過ETL工具從數(shù)據(jù)源抽取數(shù)據(jù)到數(shù)據(jù)倉庫,最后采用聯(lián)機(jī)分析(OLAP)技術(shù)或數(shù)據(jù)挖掘(DM)技術(shù)對數(shù)據(jù)進(jìn)行分析挖掘,根據(jù)分析及挖掘結(jié)果做出相應(yīng)的決策。根據(jù)教學(xué)管理系統(tǒng)的應(yīng)用需求,在高校教學(xué)管理新系統(tǒng)中,組織層領(lǐng)導(dǎo)最關(guān)注的教學(xué)質(zhì)量,所以系統(tǒng)確定的主題主要包括:包含學(xué)生、教師、課程、教學(xué)質(zhì)量等幾個方面。
3.數(shù)據(jù)倉庫模型設(shè)計
數(shù)據(jù)倉庫模型比較常用的有兩種:星型和雪花型兩種。星型是由一個事實表和多個維度表進(jìn)行關(guān)聯(lián),具有統(tǒng)計分析和查詢速度快特點,所以在教學(xué)管理信息系統(tǒng)中采我們采用星型模型。下面以教學(xué)質(zhì)量主題為例說明數(shù)據(jù)倉庫模型的設(shè)計。維表我們設(shè)計為時間表、學(xué)生成績表、學(xué)生就業(yè)情況表、學(xué)生獎懲表、學(xué)生學(xué)習(xí)情況、教師教學(xué)水平表,事實表由就業(yè)率、論文發(fā)表等級及數(shù)量、學(xué)生獲獎等級及數(shù)量等構(gòu)成。
4.聯(lián)機(jī)分析(OLAP)
聯(lián)機(jī)分析(OLAP)是針對某一個具體主題,采用聯(lián)機(jī)分析術(shù)(OLAP)或數(shù)據(jù)挖掘(DM)技術(shù)對數(shù)據(jù)倉庫中的信息進(jìn)行統(tǒng)計分析。聯(lián)機(jī)分析包括多維數(shù)據(jù)分析方法,大體上可分為切塊、旋轉(zhuǎn)、鉆取。所謂的旋轉(zhuǎn)就是交換維度的位置關(guān)系,以便于決策人員可以不同角度得到多維數(shù)據(jù),獲取有價值的信息。通過聯(lián)機(jī)分析技術(shù)的旋轉(zhuǎn)方法我們可以很容易的發(fā)現(xiàn)教學(xué)管理系統(tǒng)教學(xué)質(zhì)量問題,如教學(xué)計劃不合理、有些教師水平有待提高等,通過鉆取可以更深入的分析出教學(xué)計劃不合理的各種因素。
三、結(jié)束語
目前絕大部分高校都運行著多個信息系統(tǒng),如學(xué)籍管理、就業(yè)招生、教務(wù)管理等,各系統(tǒng)包含大量歷史信息和當(dāng)前信息。這些數(shù)據(jù)如實的反映了高校過去和現(xiàn)在的運行狀況,但是這些信息因為信息量大并且存在“信息孤島”問題,并沒有體現(xiàn)它潛在的價值,本文提出了基于數(shù)據(jù)倉庫的教學(xué)管理系統(tǒng),將這些信息整合到數(shù)據(jù)倉庫系統(tǒng)中,并借助于聯(lián)機(jī)分析(OLAP)技術(shù)和數(shù)據(jù)挖掘(DM)技術(shù)進(jìn)行數(shù)據(jù)分析并發(fā)現(xiàn)隱藏在這些海量數(shù)據(jù)中的關(guān)聯(lián)規(guī)律,提供給學(xué)校領(lǐng)導(dǎo)層進(jìn)行決策,對于提高高校管理水平和教學(xué)質(zhì)量具有重要的意義。