出版資源的數位化

2022-10-17 16:09:06 字數 2639 閱讀 4598

未經過規範化處理的出版資源,即使是以「數位化」形式存在,也只不過是以數字形式儲存的出版資源而已,這類資源很難在數字出版領域中成為可利用的資源並發揮其應有的價值。而目前許多傳統出版單位,正熱衷於將其所掌握的出版資源大規模地進行數位化工作,而這種不按數字出版規範處理程式進行的資料加工方式,只能稱其為出版資源的數位化過程,而其產生的後果只能產生大量的資料垃圾,為數位化資源建設造成極大的浪費。

那麼,什麼樣的資源才能真正成為數位化的出版資源呢?對照上面提出的問題,我想數位化出版資源起碼要具備以下幾個基本要求:

一、 資源的可用性

可用性是指兩個方面,一是資源的版權有效性,即資源經過數位化加工處理後,出版單位對其是否具有版權意義上的使用權。二是資源自身的價值,是否具有一次加工,多次復用價值。

1.版權的有效性在傳統出版時代,出版單位獲得的大多是專用出版權, 有的甚至只是非專用出版權,而並沒有獲得改編權以及其他載體形式的出版權,特別是對於數字出版最為重要的網路傳播權。而這些法律上的授權問題如果不能得到真正解決,即使出版單位花費大量人力、物力和精力將其作品數位化,卻可能面臨數字環境下運營的合法問題而無法使用。

為此,對具有一定價值且需要進行數位化的資源或已形成數位化的資源需要二次加工的資源,首先要進行版權授權的認證工作,未獲得有效許可的資源是不能進行二次開發的。

2.可復用性並非所有的出版資源都具有可復用性,或者是利用復用性不強。在傳統出版資源中,復用性較強的資源有工具書、教材等長銷類產品,其次是以提供資料分析和資訊服務類的資料庫產品,最後是經典讀物以及瀏覽性讀物。

對於不同的資源,其資料處理水平及加工要求也各有不同。

工具書、教材這是數位化出版資源的核心,對這類資源要在完成同類資源的大規模整合後,要進行資料的深度標引,並完成查重排歧,才具有可使用的價值。這也是加工難度最大一項工作,其中涉及如何利用計算機技術進行資料探勘、資訊整理和知識管理、知識服務等數字出版核心技術。

資料分析和資訊服務類的資料庫產品向面某一領域或特定讀者群的非工具書或教材類的出版資源,其單一資源的可復用性較弱,但大規模整合後,可形成一定強度的資源庫,通過積累和沉澱,可形成新形態的資訊產品,如清華同方的資源庫,這類資源是通過大規模整合之後形成新的衍生性資訊消費產品,可滿足新的消費需求,並促進原來產品的發行與銷售。其可行性關鍵在於整合度和資訊提取度。 並非一兩家傳統出版單位可實現的,一般來說,要形成行業整合才有可能形成有效的規模產品,支撐產業的數字閱讀需求。

如在集團層面上整合,則專題性的整合度不足,難以形成有效消費群。

在技術層面上,由於對內容資訊需求的多樣性和複雜性,其底層資料結構及資訊提取等問題,需要大量資料庫和網路資訊處理的專業人才,因此,要在基於新的資訊消費產業鏈的基礎上,進行跨**、跨部門、跨行業、跨領域的優質資源整合,才可取得成效。

經典性讀物及大眾閱讀性讀物這類出版物由於其瀏覽性、實效性強、典藏性和資源性相對較弱,因此,大多以**發布,順序瀏覽為主,能滿足公眾利用網路或手機閱讀終端,實現情節性淺閱讀的基本需求。

二、 資源的可流通性

出版資源的流通性也要多不同的角度來看,一是資料自身的可流通性、二是載體的相容性、三是內容的需求性。

1.資料的可流通性要達到在不同載體上一次加工多次利用的目的,首先要解決字元的規範性問題。而國內目前各出版單位所擁有的「數位化資源」,大多是基於gb18030的字符集,這個字符集所收漢字263個,難發滿足出版用字的需求。

因此資源中存在大量非標造字,不具有可流通性。要想提高資源的流通性,必須將資源構架的的基礎上,也就是超大字符集的基礎上,並實現現有資源用字元的五同問題,即:文同字(同字異形的認同))、字同形(同形異構的認同)、形同碼(同形異碼的認同),碼同位(同字異碼的碼位歸併),符同碼(各類符號系統在符號集中的同一性)。

只有在超大字符集的基礎上,解決了五同問題,資料才真正具有可流通性。

2.載體的可相容性要想出版資源在不同載體形式上發布,重點需要解決不同**形態資源的儲存格式和精度問題。**格式一定要採用國際通用標準,如採用非國際標準的企業格式,將造成載體間相容性的瓶頸,使得資源無法有效傳播和利用。

精度問題也是數位化資源中存在的乙個嚴重問題,特別是**資源,往往由於前期採集精度不足,導致可用性大大降低,以至不可用。因此,對具有利用價值的**資源,特別是珍貴資源,要按全張印刷的精度採集,並分層儲存。

3. 內容的需求性數字出版物的傳播方式是被動傳播,即資源儲存在運營環境中是靜態的,如無使用者需求導致的閱讀點選行為的產生,則根本不可能實現傳播。因此, 閱讀需求越少的內容資訊,越不具有可流通性,要提高資源的流通性,就要認真解決在網路環境下讀者需求的動態採集和使用者需求的定性量化分析,只有解決了需求描述和描述機制,才能真正做到按需定製,按需生產、按需加工、按需提供,才能真正提高資源的流通性和可用性。

三、可獲取性

由於數字環境下的資源是以靜態的形式存在,如何有效地將資源組織起來以便於讀者的查詢和檢索,如何類聚地提供資訊和內容、如何基於使用者的認智規律,拓展性地組織和關聯資訊,並有效地利用多種**形態,綜合藝術地動態推送展示內容,是提高靜態內容的動態流動性所必須解決的問題。

四、可維護性

數字出版資源的特點之一是可不斷地對資源進行動態地更新維護,以滿足和響應不同使用者群體的閱讀需求。因此,能否建立起一支強大的,具有強大的資訊利用和處理能力的編輯隊伍,不斷對資源進行更新和維護,才是使資源具有生命力和可持續展發生命力最為核心的問題,乙個資源如不能及時更新和補充,則需求就會枯竭,使用者就會消失,資源本身的價值就會下降甚至消亡。

當然,在數位化資源建設過程中,存在的問題還很多,筆者僅就一兩個區域性的問題,提出個人之淺見,不當之處,還望業界同仁批評指正。

數位化城管

為加強 社會管理和公共服務職能,提公升城市管理精細化水平,更好地為人民群眾服務,按照 省 辦公廳 省建設廳關於推進數位化城市管理工作意見的通知 蘇政辦發 2007 57號 精神,2011年5月31日,常熟市城市管理監督指揮中心成立,數字城管系統正式啟動執行。運 況 數位化城市管理系統平台業務範圍覆蓋...

數位化管理

一 結構及要素 店鋪首頁 寶貝列表頁 寶貝詳情頁 二 色彩的選擇 1 色彩的屬性 色相 飽和度 明度 2 配色技巧 單色搭配 對比色搭配 同色系搭配3 風格選擇 不同亞瑟代表不同的含義,根據產品選擇不同的顏色4 網頁導航 導航 顯形導航 一 企業機理與經營的目的 不管您現在經營的是乙個什麼樣的企業,...

數位化建設匯報

沙子溝小學 數位化校園建設工作匯報材料 發放鎮沙子溝小學是一所六年制完全小學。學校建立於1946年,占地面積給8884平方公尺。現有6個班,128名學生,16名教師。目前,根據上級要求,我校把學校教育資訊化作為我校提高教育教學質量的方式,確定建立數位化校園。因此把構建數位化校園,實現我校的跨越式發展...