計算機專業認知實習報告

2021-05-25 13:53:30 字數 3820 閱讀 6571

學號:10104060213

姓名:凌紅康

專業班級:計科102

學院:電子資訊學院

2023年6月

相對於結構化資料而言,不方便用資料庫二維邏輯表來表現的資料即稱為非結構化資料,包括所有格式的辦公文件、文字、**、xml、html、各類報表、影象和音訊/**資訊等等。欄位可根據需要擴充,即欄位數目不定,可稱為半結構化資料,例如exchange儲存的資料。

在資訊社會,資訊可以劃分為兩大類。一類資訊能夠用資料或統一的結構加以表示,我們稱之為結構化資料,如數字、符號;而另一類資訊無法用數字或統一的結構表示,如文字、影象、聲音、網頁等,我們稱之為非結構化資料。結構化資料屬於非結構化資料,是非結構化資料的特例。

隨著網路技術的發展,特別是inter***和intra***技術的飛快發展,使得非結構化資料的數量日趨增大。這時,主要用於管理結構化資料的關聯式資料庫的侷限性暴露地越來越明顯。因而,資料庫技術相應地進入了「後關聯式資料庫時代」,發展進入基於網路應用的非結構化資料庫時代。

所謂非結構化資料庫, 是指資料庫的變長紀錄由若干不可重複和可重複的字段組成,而每個欄位又可由若干不可重複和可重複的子字段組成。

在這次的實習裡,我們主要學習半結構化資料的建模技術,即xml。我們學習了:

1. xml的介紹:認識的表示語言,xml的特色和它的應用;

2. xml的基礎知識:如xml是一種資料描述技術;

3. xml的相關技術:如xsl和css;

4. xml的資料來源物件;

5. xml的文件物件模型:有dom技術。

資料探勘(data mining)旨在從大量的、不完全的、有雜訊的、模糊的、隨機的資料中, 提取隱含在其中的、人們事先不知道的、但又是潛在有用的資訊和知識。還有很多和這一術語相近似的術語,如從資料庫中發現知識(kdd)、資料分析、資料融合(data fusion)以及決策支援等。

資料探勘的任務主要是關聯分析、聚類分析、分類、**、時序模式和偏差分析等。1. 關聯分析(association analysis):

兩個或兩個以上變數的取值之間存在的規律性稱為關聯。資料關聯是資料庫中存在的一類重要的、可被發現的知識。2.

聚類分析(clustering):聚類是把資料按照相似性歸納成若干類別,同一類中的資料彼此相似,不同類中的資料相異。3.

分類(classification):分類就是找出乙個類別的概念描述,它代表了這類資料的整體資訊,即該類的內涵描述,並用這種描述來構造模型,一般用規則或決策樹模式表示。分類是利用訓練資料集通過一定的演算法而求得分類規則。

分類可被用於規則描述和**。4. **(predication):

**是利用歷史資料找出變化規律,建立模型,並由此模型對未來資料的種類及特徵進行**。5. 時序模式(time-series pattern):

時序模式是指通過時間序列搜尋出的重**生概率較高的模式。與回歸一樣,它也是用己知的資料**未來的值,但這些資料的區別是變數所處時間的不同。6.

偏差分析(deviation):在偏差中包括很多有用的知識,資料庫中的資料存在很多異常情況,發現資料庫中資料存在的異常情況是非常重要的。偏差檢驗的基本方法就是尋找觀察結果與參照之間的差別。

資料探勘常的基本技術:1. 統計學。

2. 聚類分析和模式識別:聚類分析主要是根據事物的特徵對其進行聚類或分類,即所謂物以類聚,以期從中發現規律和典型模式。

近些年來模糊聚類和神經網路聚類方法也有了長足的發展。3. 決策樹分類技術。

4. 人工神經網路和遺傳基因演算法。5.

規則歸納。6. 視覺化技術。

資料探勘的過程可以分為6個步驟(1)理解業務。(2)理解資料。(3)準備資料。

(4)建模。(5)模型評估。(6)模型部署。

本次學習資料探勘主要學習了:1.資料探勘的發展簡述:

資料的豐富與知識的貧乏,從資料到知識和資料探勘的產生。2.資料探勘的基本知識:

資料探勘的定義,資料探勘的深入。3.資料探勘的功能:

概念描述:定性與對比,關聯分析,分類與**,聚類分析,異類分析及演化分析。4.

資料預處理。5.關聯挖掘:

關聯規則挖掘和單維布林聯規則挖掘。

空間資料庫的概述與總結:這次學習了1.空間資料庫的概述:

空間資料庫的重要性空間資料庫的組成,空間資料庫管理系統的實現。2.資料庫的特點:

資料庫的複雜性,資料庫處理的多樣性及大量的資料。3,空間資料庫的設計:空間資料庫設計過程,空間資料庫的資料模型設計,空間資料庫設計的原則、步驟、技術方法。

4.空間資料庫庫的實現與維護:空間資料庫的實現,相關的其他設計如安全性,完整性等,空間資料庫的執行與維護。

5.資料庫的資料模型:gis資料庫及其管理:

基於關係型資料庫和檔案系統的管理方法,以關係型資料庫為核心的引入物件導向機制,建立全新的物件導向的資料庫管理系統。gis空間分析:1.

空間分析的概念:定義及重要性。2.

空間分析的主要內容:空間位置,空間分布,空間形態,空間距離,空間關係,3. 基本空間分析技術:

空間查詢與量算,緩衝區分析,疊置分析,網路分析,空間插值,空間統計分析,數字高程模型與數字地形分析。4.空間資料庫的發展:

物件導向模型的應用,多**技術拓寬了地理空間資料庫系統的應用領域,虛擬實境技術促進了地理空間資料庫的視覺化,分布式處理和client/server模式的應用,使地理空間資料庫具有與inter***/intra***的連線能力,實現分布式事物處理、透明訪問、跨平台應用、異構網互聯、多協議自動轉換等。

物件導向的資料庫應用系統的概述與總結:1.概述:物件導向分析,物件導向設計,物件導向程式設計,物件導向測試,ooa 概論,ood 概論,物件導向測試概論,uml 引論,

2.使用案例分析:使用案例,使用案例圖。

3.靜態建模:認定物件與類,確認物件關係,模型的完善,4.

動態建模:建模步驟,序列圖的使用,狀態圖的使用,協作圖的使用,動作圖的使用,5.系統框架建模:

邏輯框架設計,物理框架設計,6.使用uml的軟體過程:cmm軟體成熟度標準,rup 開發周期,軟體架構。

7.物件導向設計案例分析:互動式圖形編輯系統:

用於建立、編輯、瀏覽圖形,圖形由直線、矩形、橢圓和文字組成,約束條件:提供視覺化編輯手段,可瀏覽多個圖形,不考慮圖形的儲存和裝入,需求分析,系統分析,系統建模,系統實現。

實時資料庫技術:1.實時應用的資料處理。

2. 實時資料庫簡介:實時資料庫系統定義,實時系統的主要特性:

及時性、可**性和可靠性等,實時資料庫與傳統資料庫,實時資料庫與其它高階資料庫的聯絡,3. 實時資料庫的特徵:rtdb的資料特徵,rtdb的事務特徵,4.

實時資料庫管理系統:實時資料庫系統的主要問題,實時資料庫系統結構,實時資料庫執行模型,5.實時事務模型:

實時事務的建模特性,實時事務的分類,實時事務的特性,實時事務模型,巢狀實時事務模型,6.實時事務排程與併發控制:實時事務排程,實時事務的併發控制,7.

實時資料庫應用:國內外實時資料庫的發展現狀,實時資料庫系統在企業資訊化的應用,基於實時資料庫的高階資料應用技術。

通過本次的認知學習,我學習了半結構化資料建模:xml的相關知識,基於資料庫的資料探勘,空間資料庫及實時資料庫,還有物件導向的的資料庫應用系統開發的知識。這次學習讓我體會到資料庫技術的複雜和深奧,資料庫是一項包含了大量知識的一門學科,所以說我們如果想精通資料庫,需要有明確的學習目標。

我個人的目標是在接下來的一年裡要抽出一定的時間與精力來學習資料庫,主要是本次認知實習的內容。在接下來的幾周我計畫:第一周:

學習xml和資料探勘,進行實踐的訓練,多讀這方面的書籍,加深理解,以達到自己學習的目標:基本了解並能掌握基本的知識。第二週及還剩餘的時間:

我計畫學習空間資料庫,物件導向資料庫及實時資料庫的知識,不過重點放在物件導向資料庫的學習,可能以後工作最可能用到的就是物件導向資料庫的知識,畢竟它已經在企業的應用還是比較多的。這部分知識更新穎對我來說,也是我比較感興趣的。

計算機專業認知實習報告

隨著網路技術的發展,特別是inter 和intra 技術的飛快發展,使得非結構化資料的數量日趨增大。這時,主要用於管理結構化資料的關聯式資料庫的侷限性暴露地越來越明顯。因而,資料庫技術相應地進入了 後關聯式資料庫時代 發展進入基於網路應用的非結構化資料庫時代。所謂非結構化資料庫,是指資料庫的變長紀錄...

計算機認知實習報告

出去看看才知道自己的眼界有多寬廣,多了解外面的形式與發展才會看清自己所屬專就業前景,才會知道外面的需求情況,帶著這些認知我走近了實習的第一步。我所實習的地方是一家叫作聯想1 1的電腦專賣店,店主首先讓我了解各種電腦軟硬體設施產品,認識不同品牌,不同配件的效能,幫他向顧客介紹一些品牌的優點與缺點,清楚...

計算機專業實習報告

在接下來實習的中,我開始記錄公司倉庫的出貨與進貨的情況,開始我還想記錄這點東西用excel不就可以了嗎?後來發現人家用的都是資料庫。當然了這期間我也用到了在學校期間所學到的資料庫的知識,在學校學到的東西能用到工作中還是令我很開心的,不僅是學有所用,也是證明了我大學期間的學習是很有價值而且很必要的。資...