干部測評統計精選論文
1需求分析
通過(guò)對干部測評的內容和標準進(jìn)行分析,我們發(fā)現干部測評的內容較多,測評項目變化比較頻繁,如果系統采用統一的測評格式不能滿(mǎn)足用戶(hù)的需要。同時(shí),大部分單位采用“無(wú)記名投票”的方式對干部進(jìn)行評價(jià),這種方式簡(jiǎn)單易行,用戶(hù)容易接受。我們對用戶(hù)的選票進(jìn)行對比后發(fā)現:用戶(hù)的選票的內容和數目雖然各不相同,但是基本格式比較類(lèi)似,可以歸類(lèi)實(shí)現。因此,我們決定從選票著(zhù)手,對選票進(jìn)行掃描轉換成圖像格式,利用圖像識別和分析算法對選票進(jìn)行分析計算,從而得到準確的測評數據。
通過(guò)對基于圖像識別的相關(guān)系統進(jìn)行對比,我們發(fā)現對于圖像的識別可以分為三類(lèi):①對復雜的圖像進(jìn)行識別,如人臉、指紋的識別。②利用的專(zhuān)用的硬件設備對專(zhuān)用的卡片進(jìn)行識別,如考試答題卡的識別。③對簡(jiǎn)單圖像的模式識別;如對汽車(chē)牌照數字的識別。我們使用的選票(測評表如圖1所示)是普通的表格(圖1),既沒(méi)有指紋的復雜圖像,也沒(méi)有答題卡的標準格式。在每個(gè)表格中一般是用戶(hù)填寫(xiě)的勾或圈。如果系統進(jìn)行模式識別,需要存儲大量的勾或圈的特征模式庫,將用戶(hù)的勾和模式庫中的圖像數據進(jìn)行對比,這樣識別結果受到模式庫大小的限制,同時(shí)識別的速度較慢。因此我們采用“定位識別區域,比較像素數目”的方法對測評表圖像進(jìn)行識別,這種識別方法在保證識別正確率的同時(shí),提高了識別的速度。
系統完成對測評表圖像的識別后,得到了測評數據。我們需要對測評數據進(jìn)行存儲。測評系統的數據主要包括:測評主體信息,測評表信息、測評數據和系統配置信息。系統中沒(méi)有多媒體數據,數據量不大,因此,采用小型的數據庫系統可以滿(mǎn)足數據的存儲需求。
系統需要為用戶(hù)提供統計結果。因為測評的內容較多,并每個(gè)測評項目包括多個(gè)測評小項,所以,系統要提供對不同測評項目的結果進(jìn)行統計,同時(shí)將得票數加權計算成百分制,最后按照不同的排序方式直觀(guān)地顯示給用戶(hù)。
最后,不同的測評表具有不同的格式,相同的表包括測評項目不同,因此,系統需要提供修改測評表類(lèi)型和測評項目的表定制功能。
1.2系統結構
根據系統的需求分析,系統采用三層結構:數據庫層、數據處理層和用戶(hù)接口層,如圖2所示。
(1)數據庫層是存儲數據的數據庫系統。為了達到較小的數據冗余,保證數據記錄間邏輯關(guān)系合理,在測評項目修改時(shí),減少對測評數據的影響。數據庫的設計按照“數據表盡量小,多表連接”的原則,使用小型的數據表存儲基本數據,將基本表連接后提供不同的數據視圖。數據庫的結構如圖3所示,數據庫中主要包括7個(gè)表:測評數據表、人員信息表、測評客體表、測評內容表(測評小項表)、測評等級表、測評大項表和表基本信息表。各個(gè)表之間按照惟一的ID號進(jìn)行關(guān)聯(lián)。從而構成完整的測評數據庫。(2)數據處理層包括數據的讀寫(xiě)、分析和統計接口。這一層是系統的核心部分,它負責從底層數據庫中讀取數據,將數據統計分析后,提交給上層界面顯示;并且從用戶(hù)接口層接收到輸入的數據進(jìn)行處理,最后寫(xiě)入到數據庫中存儲。處理層包含系統主要的類(lèi):初始化和連接數據庫的CADORecordset類(lèi)和CADOConnection類(lèi),用于數據管理的CDataMgr類(lèi),用于數據統計的CDataStat類(lèi)。
(3)用戶(hù)接口層包括圖像識別、數據顯示、系統設置和打印排序等功能。圖像識別功能提供了用戶(hù)選擇測評主體和顯示識別進(jìn)度的界面。數據顯示功能具有按照測評項目、測評小項、測評等級等多種形式顯示測評結果的能力。系統設置包括對測評主體、測評表類(lèi)型、測評表等級、測評表項目等信息的設置。排序操作提供了對測評結果按照不同屬性進(jìn)行排序的功能。打印操作和普通系統的打印功能不相同,它將測評結果數據導出到Word中顯示,用戶(hù)可以根據自己的需要,修改格式后打印。它避免了部分系統不能完全顯示打印數據的缺陷,同時(shí)提高了打印操作的靈活性。用戶(hù)接口層含有最多的類(lèi),其中有:完成打印功能的CDataPrint類(lèi),提供排序的CDataSort類(lèi),顯示主窗口的CMainFrame類(lèi),顯示主要框架的CUserInfoView類(lèi)和CUserListView類(lèi),還有實(shí)現系統設置功能的類(lèi)。
2關(guān)鍵技術(shù)
2.1圖像識別
由于經(jīng)過(guò)掃描設備掃描生成的是8位BMP灰度圖像文件,文件的每個(gè)字節數據對應圖像的單個(gè)像素,根據這一特點(diǎn)對圖像的每個(gè)有關(guān)像素進(jìn)行讀取和分析。
處理步驟如下:
(1)將文件中的數據讀入緩沖區中,并得到位圖文件的大小,如圖像高度、寬度以及每一行的像素個(gè)數。
(2)從數據緩沖區的一個(gè)較小偏移處開(kāi)始順序讀取。為了避免掃描圖像出現黑邊干擾判讀,取值應避免是圖像邊界,以后每讀到圖像邊界都應跳過(guò)邊界范圍。
(3)由于對于位圖的讀取是按照從下至上、從左至右的順序逐行逐個(gè)像素點(diǎn)讀取。因此,理想情況下得到的第一個(gè)深色像素點(diǎn)且滿(mǎn)足兩根線(xiàn)交叉點(diǎn)條件的點(diǎn)應是表格的左下角點(diǎn),如果得到的第一個(gè)這樣的點(diǎn)經(jīng)過(guò)判定不是左下角點(diǎn),則應該是圖像出現右下傾斜的情況,得到的應是右下角點(diǎn)。為避免這種情況,可給出一定的判定條件,保證得到的第一個(gè)滿(mǎn)足這些條件的點(diǎn)應是表格的左下角點(diǎn)。
(4)根據表格的特點(diǎn)和實(shí)際測評對象數沿線(xiàn)搜索得到評價(jià)區域的左下起始位置點(diǎn)。在搜索過(guò)程中,通過(guò)得到的一些與表格起始位置點(diǎn)同行或同列的點(diǎn)的情況,判斷出表格是否發(fā)生傾斜,如果傾斜超過(guò)一定程度,則應認為這個(gè)圖像出錯,應重新掃描這個(gè)表格生成新的圖像文件。
(5)找到評價(jià)區域左下起始點(diǎn)后,從通用性來(lái)講,應該找到第一行每個(gè)單元格的下邊界點(diǎn),從而以此為依據得到每一列單元格的寬度;再找到第一列每個(gè)單元格的左邊界點(diǎn),從而可以得到每一行單元格的高度。根據這些寬度和高度值得到每一個(gè)單元格的四個(gè)角點(diǎn)的位置,確定每一個(gè)單元格的范圍。
(6)根據每個(gè)單元格的范圍,取一定的子范圍搜索每個(gè)單元格內的深色像素點(diǎn)的個(gè)數,為避免可能將邊框包括在內的情況,對于單元格中同行或同列的深色像素點(diǎn)只按照一個(gè)深色像素點(diǎn)來(lái)計數,這樣即使將四個(gè)邊框都包括進(jìn)來(lái),也只會(huì )認為只有四個(gè)像素點(diǎn),不會(huì )對結果有大的影響。
(7)根據測評表要比較的項目情況,根據先前給出的有關(guān)參數,以一定數目的單元格為一組,對中間出現的深色像素點(diǎn)個(gè)數進(jìn)行比較,找到深色像素點(diǎn)個(gè)數最多的單元格,得到其對應位置,進(jìn)行相應項的計數,作為后面的統計依據。
2.2數據統計和分析
按照需求分析,系統需要提供按照測評項目和不同的測評小項的數據統計,同時(shí)提供票數、分數和等級百分比等多種形式的綜合測評結果。因此,系統需要將測評數據統一存儲,按照用戶(hù)的需求快速地查找并統計出測評結果。為了實(shí)現這個(gè)目標,系統從數據庫層到數據的處理層進(jìn)行了合理的設計。
首先,為了減少數據的冗余,并提供綜合的測評數據,系統的基本數據:人員信息、測評項目、測評等級、測評小項等分別存儲在不同的基本表中,并且具有連續的惟一ID號。如圖4所示,測評等級信息表中的每一個(gè)等級具有惟一的ID號“dj_djid”,并且ID號從‘1’連續編號到‘5’。因此我們在測評數據表“cpdata”中的等級字段只需要存儲等級ID號即可,從而保證了較小的數據冗余度和靈活的數據修改能力,最重要的是ID號可以用于數據統計時(shí)數組的下標。
圖4測評等級信息表
所有的測評數據儲存在基本表“cpdata”中。如圖5所示,這個(gè)表包含基本信息的ID號,如人員ID,測評項目ID和測評等級ID,除此之外,還有所對應的得票數“cd_shumu”。因此,系統通過(guò)讀取此表的信息就可以獲得所有的數據。
圖5測評數據表
對多人員、多項目的分別統計是非常耗時(shí)的'工作,SQL語(yǔ)句沒(méi)有提供這種功能。因此,我們采用一種基于項目ID號的統計方法。系統將測評數據讀入到一個(gè)二維數組中,同時(shí)初始化統計結果的數組。假設我們需要統計不同等級的得票數,我們初始化一個(gè)長(cháng)度為等級數目的數組dj[DJNUM]后從第一條記錄開(kāi)始計算。如圖5所示,第一條記錄等級ID號為‘2’我們將對應的得票數‘12’加入到數組dj[1]中。依次類(lèi)推,當我們?yōu)g覽完所有記錄時(shí),各個(gè)等級的總得票數存入到數組dj中。我們僅讀取一遍數據就可以完成不同數據的統計,從而大大提高了數據的統計速度。
如上所述,我們在瀏覽記錄的同時(shí)可以對多項內容進(jìn)行累加,從而得出多項統計結果。同時(shí),每一測評等級本身具有權值,將此等級所得的票數和權值相乘就得出用戶(hù)所得分數。因此,系統只需進(jìn)行一次數據記錄的遍歷,就可以得出所有的統計值,保證了數據統計的效率。
2.3測評表的定制
用戶(hù)使用的測評表多種多樣,不但格式不盡相同,測評項目也有所變化。因此,為了對多種測評表進(jìn)行圖像識別和數據統計,系統需要提供對測評表的定制功能。通過(guò)對不同的測評表進(jìn)行對比,我們發(fā)現測評表所包含的信息有五類(lèi):測評主體、測評客體、測評項目、測評等級和基本信息。
(1)測評主體,即被評價(jià)人員。不同的測評表所包含的測評主體的數目不相同,相關(guān)信息有所差異。因此,測評表的定制功能需要設置測評主體的數目并提供填寫(xiě)相關(guān)信息的接口。
(2)測評客體是指參評人員的類(lèi)型,如領(lǐng)導和普通人員對測評主體的評價(jià)分量是不相同的。不同測評客體的權值也不相同。
(3)測評項目指評價(jià)指標,測評表的評價(jià)項目不相同,每一種評價(jià)指標的權值不相同。并且可能測評項目下含有不同的測評小項。測評項目是測評表的關(guān)鍵內容,需要詳細進(jìn)行劃分。所以,系統設置了測評項目和測評小項兩類(lèi)數據,分別存儲在不同的基本表中。
(4)測評等級的變化不大,每一種等級需要對應不同的分值,用于最終測評主體得分的計算。
(5)表基本信息包括表的ID號、表的名稱(chēng)、所屬的基本類(lèi)型、表的行列數、表的測評項目數、表的測評等級數和相關(guān)的備注信息。
根據以上對測評表的分析,系統需要分別提供對這些內容的設置接口。用戶(hù)定制或修改表內容是一個(gè)自頂向下的過(guò)程。首先,用戶(hù)添加表的基本信息,如:表名稱(chēng)、表的基本類(lèi)型和行列數。然后,用戶(hù)分別添加各項的信息,在添加測評項目時(shí),先添加測評大項,然后將所屬的測評小項逐一加入。同時(shí),在每項內容的設置界面上提供了查看、修改和刪除項目的功能。
通過(guò)對測評表每項內容的設置,系統提供了統一的表定制功能,這種設置方式簡(jiǎn)單、靈活。用戶(hù)添加新型的測評表后,系統自動(dòng)讀取表的關(guān)鍵信息,如行列數,從而確定圖像識別的有效區域;讀取測評項目和等級信息,完成圖像信息和測評數據的轉換;讀取所有信息完成測評數據的統計和分析。
3應用情況
干部測評統計分析系統已經(jīng)應用于測評工作。我們使用富士通“fi-2150c”型掃描儀將紙質(zhì)測評表掃描成灰度圖像,利用本系統對圖像文件進(jìn)行識別和數據統計。
首先,由于圖像的識別速度遠大于圖像的掃描速度,因此整個(gè)圖像識別工作的速度取決于測評表的掃描速度。同時(shí)系統對掃描的圖像要求較低,所以?huà)呙杷俣认鄬^快,利用富士通掃描儀大約每分鐘可以?huà)呙?0張測評表。
在圖像識別后,測評數據自動(dòng)存儲到數據庫中,用戶(hù)根據自己的需要查看測評結果。數據的統計速度較快,我們利用10000張掃描表進(jìn)行測試,數據計算所花費的時(shí)間為13ms。
通過(guò)對統計結果進(jìn)行驗證,系統除不能識別嚴重變形的圖像外,統計數據的正確率達到100%。
本系統利用圖像識別技術(shù)對測評表進(jìn)行數據識別,采用優(yōu)化的數據統計算法達到多種測評數據的高速統計,提供了靈活的表格定制功能,對不同格式的測評表進(jìn)行數據統計,從而大大地提高測評數據的統計速度和準確率,減輕用戶(hù)的統計負擔。
【干部測評統計論文】相關(guān)文章:
績(jì)效統計的論文03-03
科技論文統計06-13
統計學(xué)論文07-22
統計畢業(yè)論文提綱06-29
統計心理學(xué)相關(guān)論文04-11
中國科技論文統計結果的公布06-13
統計學(xué)教學(xué)模式論文07-04