華南理工大學本科畢業設計開題報告

2021-08-01 06:52:25 字數 4048 閱讀 6194

一、 選題的背景及意義近四十年來,傳統的確定性資料( deterministic data)

管理技術得到了極大的發展,造就了乙個數百億的資料庫產業。

資料庫技術和系統已經成為資訊化社會基礎設施建設的重要支撐。

在傳統資料庫的應用中,資料的存在性和精確性均確定無疑。

近年來,隨著技術的進步和人們對資料採集和處理技術理解的不斷深入, 不確定性資料( uncertain data)

得到了廣泛的重視。

在許多現實的應用中,例如經濟、軍事、物流、金融、電信等領域,資料的不確定性普遍存在,不確定性資料扮演著關鍵角色。

傳統的資料管理技術卻無法有效管理不確定性資料,這就引發了學術界和工業界對研發新型的不確定性資料管理技術的興趣。

由於不確定性資料的產生原因比較複雜(可能是原始資料本身不準確或是採用了粗粒度的資料集合,也可能是為了滿足特殊應用目的或是在處理缺失值、資料整合過程中而產生的),因此,不確定性資料的種類較多,例如關係型資料、半結構化資料、流資料、移動物件資料等,相應地也出現了許多與資料型別緊密相關的資料模型。

定義與應用場景相匹配的資料模型是不確定性資料管理的首要任務. 在不確定性資料管理領域,最常用的模型是可能世界模型(possibleworld model)

。該模型從乙個不確定性資料庫演化出很多確定的資料庫例項(稱為可能世界例項)

,而且所有例項的概率之和為 1. 不確定性資料的種類較多,例如關係型資料、半結構化資料、流資料、移動物件資料等,儘管存在許多與資料型別緊密相關的資料模型, 但是這些模型最終都可以轉化為可能世界模型. 其中,基於 xml 的不確定性資料建模的研究物件主要是半結構化資料模型。

半結構化資料模型( semistructured data model)

能有效描述缺乏嚴格模式結構的資料。

半結構化資料通常可以用文件樹來描述。

dekhtyar 等人提出了一種管理概率半結構化資料(probabilistic semistructured data)

的方法,該方法以關聯式資料庫技術為基礎,支援豐富的代數查詢。

更多的工作則是直接以文件樹形式描述不確定性半結構化資料,例如p2 文件模型( p2document model)

、概率樹模型,以及 pxml 模型 、keulen 等人的概率樹模型、prxml 模型等。

二、 工作任務分析我在小組中的研究部分是不確定性資料的模型。專案開啟後,我的工作與任務可分解分以下幾個部分 1、學習與整理前輩們在不確定性資料方面的研究成果。這專案工作任務主要分三個階段進行。

第一階段是廣泛地收集與了解不確定性資料的相關知識,了解不確定性資料的輪廓,知道相關的術語、概念,方便以後與別人作相關的交流。

第二階段是有針對性學習與理整理現有的不確定性資料模型方面的理論知識。這一階段,要知道各種模型的概念、所針對不同種類的資料、以及它們優勢與不足之處。第三階段是把精力放在不確定性資料研究的某種資料的模型上。

此階段要做到對相關的模型在較深入的理解,不單要知道他們的定義、優劣、具體應用情況,還要理解它們在數學上表述、證明。

2、對現有的不確定性資料模型提出自己的見解。主要包括以下一系列的活動:

1)仔細研究現在模型的優點與不足之處;2)與其它組員(還有指導老師以及相關的研究人員)交流看法,尤其是向其它組員了解在不確定性資料的儲存與查詢方面演算法知識,為優化工作提供依據與靈感。3)整理所收集到的不確定性資料模型的資料。

三、 調研報告 1 不確定性資料與xml 的發展史實際上,針對不確定性資料的研究工作已經有幾十年歷史了。從二十世紀八十年代末開始,針對概率資料庫(probabilistic database)的研究工作就從未間斷, 這類研究工作將不確定性引入到關係資料模型中去,取得較大研究進展。近年來, 針對不確定性資料的研究工作則在更廣的範圍之內取得更大的進展,即:

在更豐富的資料型別上處理更多種類的查詢任務。不確定性資料管理技術的典型框架包含四大部分:模型定義、預處理與整合、儲存與索引、查詢分析處理。

可擴充套件標記語言xml(extensible markup language)〔1〕是一種簡單靈活的文字格式的可擴充套件標記語言,起源於 sgml(standard generalized markup language),是 sgml 的乙個子集合,也就是 sgml 的乙個簡化版本,非常適合於在 web 上或者其它多種資料來源間進行資料的交換。隨著 web 上資料的增多, html 的缺點越來越突出。w3c 的成員認識到,必須有一種方法能夠把資料本身和資料的顯示分離開來,這樣w3c 在1996 年提出了xml 的概念。

xml 不僅保留了sgml 的很多優點,而且更加容易操作以及在world wide web 環境下實現。

1998 年,xml 成了w3c 的推薦標準。

2 不確定性資料的發展方向在傳統資料庫的應用中,資料的存在性和精確性均確鑿無疑。近年來,隨著技術的進步和人們對資料採集和處理技術理解的不斷深入,不確定性資料 (uncertain data)得到廣泛的重視。在許多現實的應用中,例如:

經濟、軍事、 物流、金融、電信等領域,資料的不確定性普遍存在,不確定性資料扮演關鍵角色。傳統的資料管理技術卻無法有效管理不確定性資料,這就引發了學術界和工業界對研發新型的不確定性資料管理技術的興趣。針對不確定性資料的研究工作則在更廣的範圍之內取得更大的進展,即:

在更豐富的資料型別上處理更多種類的查詢任務。

四、 方案擬定與分析 1、採用由大到小,由淺入深的順序進行研究。

不確定性資料對於我來說,是比較新的東西。要想快速把握一樣新的東西, 並不斷深入,從整體上了解它的整個框架,是很重要的。這樣可以防止在研究的過程中迷失方向,同時,從整體上把握了不確定性資料後,也可以更方便更有效率地與別人進行交流,更有效地從網路上檢索到有用的資訊。

萬丈高樓平地起,把握不確定性資料的整體,就是為不確定性資料的模型研究打基礎。基礎紮實,深入研究階段才能底氣。

五、 畢業**撰寫提綱摘要abstract 第一章緒論 1.1 不確定性資料的背景 1.2 不確定性資料的管理框架 1.

2.1 模型定義 1.2.

2 預處理與整合 1.2.3 儲存與索引 1.

2.4 查詢分析處理 1.3 不確定性資料的模型 1.

4 建模的要求與挑戰 1.4.1 龐大的可能世界例項集合 1.

4.2 新出現的維度———概率維 1.4.

3 不確定性資料管理的理論問題第二章可能世界模型 2.1 可能世界模型的簡介 2.2 可能世界模型的舉例與說明第三章針對關係型資料的模型 3.

1 probabilistic ?-table 模型 3.2 probabilistic or-set table 模型 3.

3 probabilistic or-set-?

table 模型 3.4 probabilistic c-table 模型 3.4.

1 三個簡單的表達系統 3.4.2 probabilistic c-table 第四章針對半結構化資料的模型 4.

1 p-document 模型 4.1.1 模型簡介 4.

1.2 xml 4.1.

3 模型定義的相關問題與解決方法 4.2 概率樹模型模型(probabilistic tree model 4.2.

1 模型快照 4.2.2 模型的定義 4.

2.3 模型的不足之處 4.3 pxdb 模型 4.

3.1 pxdb 模型引入 4.3.

2 模型定義 4.3.3 c-formulae 4.

3.4 模型評價第五章其它模型 5.1 針對資料流的模型 5.

1.1 針對資料流的模型 5.1.

2 乙個常用模型的定義 5.1.3 相關視窗的分類 5.

2 針對多維資料的模型 5.2.1 關於olap 5.

2.2 針對多維資料的模型 5.2.

3 相關模型第六章總結 6.1 內容總結 6.2 展望參考文獻致謝

六、 實施計畫設計總共用時3 個半月左右。

具體安排如下:

2010.3.1——2010.4.11 **選題,收集資料,並完成開題報告初稿。

2010.4.12——2010.4.30 學習與整理不確定性資料的相關資料。

2010.5.1——2010.5.15 進入不確定性資料模型深入研究階段,並完成**初稿。

2010.5.16——2010.5.25 修改畢業** 2010.5.26——2010.6.10 整理好材料,裝訂好**,進行答辯準備。

指導教師意見:

簽名:年月日備註:

華南理工大學實習報告

實習報告 早上八點在華工中山像集合,差不多準時出發,經過以個半小時的長途跋涉,經過厚街,虎門,長安,進入深圳,終於到達寶安機場附近。本著對電子業的憧憬,走進了祥和豐,在接待方的引導下,進入祥和豐數碼 在四樓五百平方公尺的廠區,要穿防靜電鞋套才可以進入。那藍色的塑膠袋真是造型奇特了,陸續進入會議室,副...

成本管理華南理工大學

成本管理講義 工商管理學院會計系 目錄第1章成本核算簡介 第2章標準成本管理 第3章戰略成本管理 第4章質量成本管理 第5章目標成本管理 第6章責任成本管理 第7章約束理論簡介 第1章成本核算簡介 主要內容 成本概念和成本核算程式,支出歸集,支出分配,完工產品成本計算方法,作業成本法簡介 一 成本概...

金工實習報告華南理工大學

金工實習報告 為期兩周的金工實習在忙碌中結束了,但是它留在我心裡的感受卻永遠不會結束.這一學期的金工實習比上一學期的精彩得多,它將有一次在我的人生中留下寶貴的一課.因為我真的從中學到了許多 金工實習第一天是三月五號,在經過上乙個學期金工實習的安全教育以及自己的心理覺悟,我們對金工實習期間的安全知識已...