面向科學計算和海量資料處理的雲計算平台

2022-10-15 16:24:08 字數 847 閱讀 4279

作者:梁軍

**:《中國教育資訊化·高教職教》2023年第09期

編者按:為總結和提煉近年來教育資訊化建設成果,了解高校對雲服務的需求,**高校雲服務體系和運營模式,發掘雲服務研究領域專家,從今年4月份開始,本刊在全國範圍內連續舉辦了八次「高校雲服務建設調研座談會」。座談會得到各地高校資訊化建設者的熱情支援,先後有20多所知名高校在會上分享了雲服務建設的成果,本刊特選編其中部分特色明顯的案例,推出「高校雲服務建設」系列專欄文章,供廣大教育資訊化建設者及相關專家學習、交流、參考。

一、需求分析

(1)大型工程分析與科學研究的數值模擬要求的計算量與儲存量都是巨大的,甚至是海量的。多cpu並行機與大規模的集群環境為使用者求解數百萬、數千萬甚至更多的自由度提供了可能,同時也為複雜和大規模的工程與科學計算找到了出路。石油勘探、****預報、氣候模擬與天氣預報、人體基因與遺傳工程、醫學影象的快速處理、海洋環流和超導模擬等。

此外,還可以作為超級伺服器用於資訊服務、事務處理、決策支援等進行應用。

(2)資訊科技的不斷發展,使得各行業的資訊量呈**性增長趨勢,一些科學應用中的資料量已經從幾十個terabytes發展到petabytes,並且在不斷擴大。2023年科學應用每年需要處理的總資料量已經達到數百terabytes,2023年科學應用每年所要處理的資料量預計將要達到數百petabytes;資料規模指數級的增長已經超過了由摩爾定律所**的計算能力和儲存空間的增長。

(3)高能物理學實驗:大型強子對撞器(large hadron collider,lhc)通過把高度活躍的質子以超快速度撞擊到一起來完成高能物理學實驗,2023年夏天啟動以來,這些物理學實驗每年都會產生數pb的原始資料和派生資料,預計會持續15年。分布於世界各地的科學家將會以協作的方式對這些資料進行科學分析。

海量資料處理面試題

何謂海量資料處理?所謂海量資料處理,無非就是基於海量資料上的儲存 處理 操作。何謂海量,就是資料量太大,所以導致要麼是無法在較短時間內迅速解決,要麼是資料太大,導致無法一次性裝入記憶體。那解決辦法呢?針對時間,我們可以採用巧妙的演算法搭配合適的資料結構,如bloom filter hash bit ...

海量資料處理筆試面試題

1.給定a b兩個檔案,各存放50億個url,每個url各佔64位元組,記憶體限制是4g,讓你找出a b檔案共同的url?方案1 可以估計每個檔案安的大小為50g 64 320g,遠遠大於記憶體限制的4g。所以不可能將其完全載入到記憶體中處理。考慮採取分而治之的方法。s 遍歷檔案a,對每個url求取...

十七道海量資料處理面試題

十七道海量資料處理面試題與bit map詳解 作者 小橋流水,redfox66,july。文章性質 整理。前言 本部落格內曾經整理過有關海量資料處理的10道面試題 十道海量資料處理面試題與十個方法大總結 此次除了重複了之前的10道面試題之後,重新多整理了7道。僅作各位參考,不作它用。同時,程式設計師...