武漢大學資訊檢索整理

2022-12-11 16:18:01 字數 5036 閱讀 7923

名詞解釋

1. 資訊檢索(information retrieval)是指將資訊按一定的方式組織和儲存起來,並根據資訊使用者的需要找出有關資訊的過程。

2. 引文索引是一種將科技期刊、專刊、專題叢書等文獻資料所發表的**後所附的參考文獻的作者、題目、出處等專案,按照引證與被引證的關係進行排列而編制的索引。

3. calis:china academic library and information system中國高等教育文獻保障系統。

4. 鄰近檢索是用一些特定的算符(位置算符)來表達檢索詞與檢索詞之間的關係,並且可以不依賴敘詞表而直接使用自由詞的檢索方法。

5. 搜尋引擎(search engine)是一種 web 上應用的軟體系統,它以一定的策略在 web 上蒐集和發現資訊,在對資訊進行處理和組織後,為使用者提供web資訊查詢服務。使用者可以通過主題瀏覽和關鍵詞檢索的方式搜尋所需資訊。

6. 截詞檢索:是指在檢索標識中保留相同的部分,用相應的截詞符代替可變化部分。檢索中,計算機會將所有含有相同部分標識的記錄全部檢索出來。

截詞符一般用「?」或「*」表示,但不同的資料庫中有所差別。

7. 查準率:是指檢出文獻中合乎需要的文獻數量佔檢出文獻全部數量的比例。

8. 查全率:是指檢出的文獻數量佔資料庫中全部相關文獻數量的比例。

9. 文獻及其要素

「文獻」是泛指「有歷史價值或參考價值的圖書資料。」

要素:1、構成文獻核心的資訊、知識、資料、事實.2、載體資訊、知識、資料、事實的物質載體。 3、記錄資訊、知識、資料、事實的符號系統。

10. 專利文獻:專利文獻是實行專利的國家、地區及國際專利組織在批審專利過程中產生的官方檔案及出版物,包括專利說明書、專利權利要求書、專利公報、專利分類表、專利檢索工具等。

11. 三大檢索系統:sci(《科學引文索引》,ei是美國《工程索引》(theengineeringindex)的簡稱,istp是indextoscientific&technicalproceedings的縮寫。

12. 二次文獻:二次文獻又稱二級次文獻,它是文獻檢索工具,能比較全面、系統地反映某個學科、專業或專題在一定時空範圍內的文獻線索,是積累、報道和檢索文獻資料的有效手段.

13. 受控語言:受控語言是一種規範化的人工語言,包括具有較強族性檢索功能的分類語言和具有較強特性檢索功能的主題語言。

14. 資訊素質教育:是指乙個人的資訊意識教育、資訊道德教育、資訊能力教育

15. 引文追溯法: 追溯法是指不利用一般的檢索工具,而是利用已經掌握的文獻末尾所列的參考文獻,進行逐一地追溯查詢「引文」的一種最簡便的擴大情報**的方法。它還可以從查到的「引文」中再追溯查詢「引文」,像滾雪球一樣,依據文獻間的引用關係,獲得越來越多的內容相關文獻。

16. 同引文獻:與本文有相同參考文獻的文獻,與本文有共同研究背景或依據的文獻。

17. 學科導航:學科導航是按學科門類將學科資訊、學術資源等集中在一起,以實現資源的規範蒐集、分類、組織和序化整理,並能對導航資訊進行多途徑內容揭示,方便使用者按學科查詢相關學科資訊和學術資源的系統工具。

18. 智財權:智財權是指對智力勞動成果依法所享有的占有、使用、處分和收益的權利。智財權是一種無形財產,它與房屋、汽車等有形財產一樣,都受到國家法律的保護,都具有價值和使用價值。

有些重大專利、馳名商標或作品的價值也遠遠高於房屋、汽車等有形財產。

19. ipc:國際專利分類法是國際上通用的專利文獻分類法。用國際專利分類法分類專利文獻(說明書)而得到的分類號,稱為國際專利分類號,通常縮寫為ipc號。

 ipc採用了功能和應用相結合,以功能性為主、應用性為輔的分類原則。採用等級的形式,將技術內容註明:部——分部——大類——小類——大組——小組,逐級分類形成完整的分類體系。

20. nstl: nstl是國家科技圖書文獻中心的簡稱,它是根據***領導的批示於2023年6月12日組建的乙個虛擬的科技文獻資訊服務機構,成員單位包括中國科學院文獻情報中心、工程技術圖書館(中國科學技術資訊研究所、機械工業資訊研究院、冶金工業資訊標準研究院、中國化工資訊中心)、中國農業科學院圖書館、中國醫學科學院圖書館。網上共建單位包括中國標準化研究院和中國計量科學研究院。

中心設辦公室,負責科技文獻資訊資源共建共享工作的組織、協調與管理。

21. 百科全書:百科全書是全面系統的介紹文化科學知識,收集各種專門名詞、術語,按詞典形式編排,解說詳細的大型參考工具書。它彙總了各學科或某一學科的知識,提供人類有關知識領域的基本事實、基本概念和基本理論。

百科全書由眾多專家撰稿、編審,故有較高的權威性。

簡答1.電子圖書有哪些特點?

儲存空間大(磁介質儲存密度高、容量大,一張光碟甚至可以存上百部中外名著)、節省資源(不需消耗紙張等物質資源)、使用方便(借助於專門的軟體便可使用,可以便捷地編輯和查詢特定內容)、傳播過程中的無獨占性和無損壞性(可以同時供多人使用,可無失真地重複使用)。

2.對搜尋引擎的選擇與比較主要從哪些方面考慮?

收錄範圍(索引庫中內容的數量、地域範圍、語言種類、資源型別、資源的深度和廣度)、分類(分類方式是否合理多樣、類名是否規範、分類的廣度與深度是否合適)、檢索功能與效果(是否包含瀏覽檢索和關鍵詞檢索功能、是否支援布林檢索、截詞檢索等高階檢索功能、是否有檢索幫助和提示功能、檢索結果和查全率、查準率及響應時間)、結果處理(結果的排序方式是否多樣、是否有去重功能、能否按照使用者反饋動態調整和顯示檢索結果)、頁面組織(頁面組織是否清晰、類目設定是否合理、介面是否友好)、其他功能與服務(能否滿足使用者多方面的資訊需求)、使用者評價(是否有使用者評價及統計功能)。

2.1搜尋引擎有哪些型別?

搜尋引擎按資訊蒐集方式分:有目錄式搜尋引擎和機械人搜尋引擎;按照資訊組織方式分:有網路資源指南與關鍵詞搜尋引擎;按學科範圍與資源種類分,有綜合性搜尋引擎和專門性搜尋引擎;按照功能和是否有自建索引庫分,有獨立搜尋引擎和元搜尋引擎。

2.2 按資訊採集方式,搜尋引擎分為哪兩種型別?各自的基本特點?列舉至少2個有代表性的搜尋引擎名稱?

3.網路資訊選擇的標準有哪些?

權威性(**及其建站機構的權威性和知名度)、內容(內容應當客觀、切題、標題清楚、組織規範、邏輯性強、有明確的範圍和邊界、有足夠的深度和廣度、有自己的特色)、時效性(**內容及其鏈結應當新穎、應明確地說明其建立和更新週期)、網頁設計(應以合理的方式綜合使用影象、聲音和文字、介面的友好性、清晰直觀)、適用性(應保證使用者能用較短的時間、點選較少的鏈結找到所需資訊)、使用者物件(資訊的專業化程度應能滿足目標使用者的特定需求)、訪問次數或被鏈結次數(網路資訊的被訪問和被其他網頁鏈結的次數)。

4.查詢國內外引文與學位**分別有哪些資料庫?每類中分別舉2個英文資料庫(包括全稱、簡稱與中譯)和1個中文資料庫。

(1)查詢國內外引文可用引文索引資料庫,如查詢國外引文可選擇《科學引文索引》(sci)、《社會科學引文索引》(ssci)、《藝術與人文科學引文索引》(a&hci),即著名的三大引文索引sci、ssci、ahci;查詢國內引文可選擇中國科學引文資料庫(chinese science citation database,簡稱cscd)、中文社會科學引文索引 (chinese social science citation information,簡稱cssci)等。

(2)查詢國內外學位**可用學位**索引與摘要資料庫,如calis的《學位**庫》,萬方資料資源系統中的《中國學位**資料庫》,cnki的《優秀碩博士**資料庫》,美國博碩士**庫pqdd(proquest digital dissertations),美國學位**網路數字圖書館ndltd (networked digital library of thesis and dissertations)等。

5.除商業資料庫和搜尋引擎外,還可以從哪些途徑獲取網路資訊資源?請至少給出5種,每種舉一例。

學科資訊門戶(如calis的學科導航庫、sosig等)、數字圖書館(如國家數字圖書館)、開放獲取資源(如oa期刊、機構知識庫等)、專業機構的**、專業人員的個人**或部落格、國內外**機構的**、國家精品課程**、國外大學的免費課程資源**等。鼓勵自由發揮。

6.布林邏輯檢索的主要運算子有哪些?它們各代表什麼含義?請分別舉一例說明。

布林邏輯檢索的主要運算子有「and」、「not」、「or」,它們分別代表邏輯與(表示檢索結果中必須包含所有的檢索詞)、或(表示檢索結果中只要包含任何乙個檢索詞即可)和非(表示檢索結果中一定不能出現「not」後面的檢索詞),如:美國and 社會保障, 數字圖書館 or 虛擬圖書館,玉公尺 not 甜玉公尺。

論述題1、從哪些方面全面地查詢關於某一主題的研究成果?(20分)

(1)圖書的查詢,包括圖書館目錄、網路書店、讀秀、google books等圖書搜尋引擎的使用等;

(2)期刊**的查詢,包括檢索國內外的期刊資料庫、引文索引庫和oa期刊,利用google scholar查詢等;

(3)學位**的查詢,包括國內外學位**庫的查詢;

(4)會議**的查詢,可以通過搜尋引擎或專門的會議文獻資料庫查詢相關會議文獻;

二、 通過檢索實踐,你認為網路資訊檢索中的主要問題有哪些(10分)?應掌握哪些技巧與注意事項(15分)?該題鼓勵同學們在課本有關內容基礎上進一步發揮。

網路資訊檢索中存在的問題

一是網路資訊良莠不齊。網路資訊的發布具有很大的自由性和隨意性,缺乏規範,無用資訊摻雜其間,垃圾資訊、虛假資訊、冗餘過時資訊的存在,增加了資訊的不確定性和使用者的不安全感,使資訊質量和精度降低,其可靠性、權威性和利用價值受到質疑,令網路使用者無所適從。

二是檢全率低。雖然在網路資訊檢索工具的索引資料庫中包含了成千上萬的網頁,但由於網路蜘蛛跟不上網路發展的速度,加之網路資訊格式多樣性等因素,致使沒有一種網路資訊檢索工具能夠為整個網路建立索引,從而使網路中大量質量高、實用性強的隱性資訊難以查全。

三是檢準率低。利用網路資訊檢索工具找到的往往是一大堆**,檢索結果的重複率相當高,使用者只有逐個瀏覽才能從中篩選出所需的資訊。與利用商業性聯機檢索資料庫相比較,使用者雖然可以節省昂貴的查詢費用,但卻要花費大量的時間對資訊進行判斷。

四是檢索效率低。網路資訊導航只支援單步資訊定位,只允許導航系統一步一步地追蹤資訊,客戶機在追蹤過程中接受了諸多冗餘資訊,造成效率降低,即使是一些優秀的搜尋引擎,也需按螢幕揭示一步一步追蹤,如果查到的位址有幾百條、幾千條,要確定哪個符合要求就很困難。

五是無統一檢索規範。由於各網路資訊檢索工具收集資訊的方式、資訊覆蓋面、索引編制和標引方式、檢索功能和檢索結果的描述和排列方式都不一樣,一方面使得相同的檢索在不同的網路資訊檢索工具中會產生不同的檢索結果;另一方面使用者在利用不同的網路檢索工具時需要經過不同的適應過程,增加了使用者的負擔。

齊齊哈爾大學資訊檢索解析

資訊檢索作業 學院 班級 姓名 學號 指導教師 日期 作業內容 一 請按學生學號尾數或序號選擇畢業設計課題題目,查詢與該課題相關的電子圖書 中外文期刊 學位 專利文獻及標準文獻資訊 5 10要求用資料庫高階檢索功能查詢 記錄命中各文獻型別的文獻數目,分別 兩條相關題錄資訊。1.寫出作業題目 烏拉草 ...

資訊檢索複習 東北石油大學

資訊 廣義 資訊是事物屬性的表徵狹義 資訊是指系統傳輸和處理的物件。知識 是人類在改造世界的實踐中所獲得的認識和經驗的總和。文獻概念 為了把人類知識傳播開來和繼承下去,人們用文字 圖形 符號 聲頻 等手段將其記錄下來,或寫在紙上,或曬在藍圖上,或攝製在感光片上,或錄製在唱片上,或儲存在磁碟上。這種附...

資訊檢索心得

21世紀是知識經濟和網路時代。快捷準確,及時有效地檢索和利用資訊,是知識經濟和網路時代對資訊檢索提出的新要求,也是置身21世紀的人們必須具備的基本資訊素養。在這個充滿機遇和挑戰的時代,資訊檢索對我們的創意或事業能否取勝也是關鍵所在。以下就是我對資訊檢索的 一 對資訊檢索的認識 資訊檢索能幫助人們快捷...