半監督學習演算法的現實性評價

2023-01-25 11:06:03 字數 903 閱讀 7351

編者按:半監督學習是近年來非常熱門的乙個研究領域,畢竟機器學習模型的本質是個「吃」資料的「怪獸」,雖然現實世界擁有海量資料,但針對某個問題的標記資料卻仍極度稀缺。為了用更少的標記資料完成更多現實任務,研究人員想出了這種從無標記資料中提取資料結構的巧妙做法。

那麼它能被用於現實任務嗎?今天論智帶來的是nips 2018收錄的一篇google brain**:realistic evaluation of semi-supervised learning algorithms。

摘要當遇到標籤有限或沒有足夠經費請人標記資料等問題時,半監督學習(ssl)提供了乙個強大的框架。近年來,基於深層神經網路的ssl演算法在標準基準測試任務中被證明是有用的。但是,我們認為這些基準測試並不能解決在應用於實際任務時,這些演算法將面臨的各種問題。

我們為一些廣泛使用的ssl演算法重新建立了統一實現,並在一系列任務中對它們進行了測試。實驗發現:那些不使用未標記資料的簡單基線的效能通常被低估了;對於不同數量的標記資料和未標記資料,ssl演算法的敏感程度也不同;並且當未標記資料集中包含不屬於該類的資料時,網路效能會大幅降低。

為了幫助指導ssl研究真正能適應現實世界,我們公開了**的統一重新實現和評估平台。

簡介無數實驗已經證實,如果我們對大量資料進行標記,那麼深層神經網路就能在某些監督學習任務上實現和人類相仿,甚至超人的表現。然而,這種成功是需要代價的。也就是說,為了建立大型資料集,我們往往要耗費大量的人力、財力和風險在資料標記上。

因此對於許多現實問題,它們沒有足夠的資源來構建足夠大的資料集,這就限制了深度學習的廣泛應用。

解決這一問題的一種可行方法是使用半監督學習框架。和需要標記資料的監督學習演算法相比,ssl演算法能從未標記資料中提取資料結構,進而提高網路效能,這降低了操作門檻。而最近的一些研究結果也表明,在某些情況下,即便給定資料集中的大部分資料都遺失了標籤,ssl演算法也能接近純監督學習的表現。

基於半色調技術的影象影藏演算法

本文是對image hiding algorithms based on halftoning technique 的乙個實現 1 摘要 halftoning演算法經常被用來將連續色調的影象轉換成純黑白影象。本文的主要貢獻是應用前人提出乙個halftoning隱藏方法,將小的二值影象影藏到乙個大二值...

學習企業管理的現實意義

認真聽完在梧桐莊培訓基地的兩天培訓課程,我有很多的收穫,現在對其進行乙個較細的總結。這次培訓讓我們了解和掌握企業管理的一般原理 理論和方法,培養我們專業性的企業管理意識和企業管理思維,為從事具體企業管理工作奠定理論基礎。企業管理學是一門應用性很強的學科,它直接指導企業管理的具體實踐,促進企業管理水平...

學習企業管理學的現實意義

企業管理學是一門應用性很強的學科,它直接指導企業管理的具體實踐,促進企業管理水平的提高,在我國社會主義市場經濟下,努力提高管理,增強企業的競爭能力和發展能力,已成為當務之急。因此學習現代企業管理具有十分重要的理論意義和現實意義。通過學習,我們應該掌握現代企業管理基本原理和基本知識,熟悉企業管理的主要...