百度面試題

2021-05-06 10:24:27 字數 6287 閱讀 2681

1、題目:兩個檔案都保留有千萬個以上的10位以內的正整數,像qq號碼差不多吧。。那如何找出其中的相同的呢?

解法(個人理解):

基本思想是利用記憶體中的位對數字進行標記。就是對 0000000000-9999999999共100億個數字進行數字的匹配,呵呵,想一下也知道可以使用雜湊表的方法,這裡的方法就是類似的,對上面區間內的每乙個數進行標記,使用的是記憶體的乙個位,比如說0000000000 - 0000000007這7個數對應的記憶體位址為0x00000000,當然這是記憶體中的乙個位元組,其中的8個位,分別對應這8個數,錄入乙個數,則置該位為1,利用這樣的方法,可以很快地定位到發生衝突的數字。即找到相同的兩個或多個數了。

不過這個方法的弊端是記憶體不夠:需要100億/8 /1024^3=1.164gb的記憶體。

其實我想還是有改進的地方,因為兩個檔案內的正整數個數只是千萬個以上,遠小於100億。因此有許多記憶體是浪費的。因此,我們可以對特別大的正整數進行對映,對映成較小的數。

首先, 我們確定檔案的正整數個數,比如說5千萬個(千萬個以上),而其中大於某個大數n,如***的有多少個,比如說4千萬個。也就是說有1千萬個數是小於***的,而這4千萬個數,完全可以按照某種規則對映到50000000 -100000000的區間之上。這樣,我們就可以將100億壓縮到1億的範圍內,此時需要記憶體為1億/8/1024^3=1.

164gb/100=0.01164gb,也就是11兆左右的記憶體。當然,n的選擇也能影響到最終記憶體的使用量。

而這個n應該需要與檔案中數字的分布有關,這裡沒有給出嚴格的證明,請大牛們指教了。還有一點就是對映規則,這個規則的構建也是issue之一。

2、請定義乙個巨集,比較兩個數a、b的大小,不能使用大於、小於、if語句

2、如何輸出原始檔的標題和目前執行行的行數

3、兩個數相乘,小數點後位數沒有限制,請寫乙個高精度演算法

4、寫乙個病毒

5、有a、b、c、d四個人,要在夜裡過一座橋。他們通過這座橋分別需要耗時1、2、5、10分鐘,只有一支手電,並且同時最多只能兩個人一起過橋。請問,如何安排,能夠在17分鐘內這四個人都過橋?

2023年騰訊招聘

選擇題(60)

c/c++ os linux 方面的基礎知識 c的sizeof函式有好幾個!

程式填空(40)

1.(20) 4空x5

不使用額外空間,將 a,b兩鍊錶的元素交叉歸併

2.(20) 4空x5

mfc 將樹序列化轉存在陣列或鍊錶中!

1, 計算 a^b << 2 (運算子優先順序問題)

2 根據先序中序求後序

3 a[3][4]哪個不能表示 a[1][1]: *(&a[0][0]) *(*(a+1)+1) *(&a[1]+1) *(&a[0][0]+4)

4 for(int i...)

for(int j...)

printf(i,j);

printf(j)

會出現什麼問題

5 for(i=0;i<10;++i,sum+=i);的執行結果

6 10個數順序插入查詢二叉樹,元素62的比較次數

7 10個數放入模10hash鍊錶,最大長度是多少

8 fun((exp1,exp2),(exp3,exp4,exp5))有幾個實參

9 希爾冒泡快速插入哪個平均速度最快

10 二分查詢是順序儲存鏈儲存按value有序中的哪些

11 順序查詢的平均時間

12 *p=null *p=new char[100] sizeof(p)各為多少

13 頻繁的插入刪除操作使用什麼結構比較合適,鍊錶還是陣列

14 enum的宣告方式

15 1-20的兩個數把和告訴a,積告訴b,a說不知道是多少,

b也說不知道,這時a說我知道了,b接著說我也知道了,問這兩個數是多少

大題:1 把字串轉換為小寫,不成功返回null,成功返回新串

char* tolower(char* ssrcstr)

return sdest;

} 2 把字串轉換為整數例如:"-123" -> -123

main()

int num(char* string)

return num;

} 附加題:

1 linux下除錯core的命令,察看堆疊狀態命令

2 寫出socks套接字服務端客戶端通訊程式

3 填空補全程式,按照我的理解是添入:win32調入dll的函式名

查詢函式入口的函式名找到函式的呼叫形式

把formview加到singledoc的宣告將singledoc加到app的宣告

4 有關係 s(sno,sname) c(cno,cname) sc(sno,cno,grade)

1 問上課程 "db"的學生no

2 成績最高的學生號

3 每科大於90分的人數

主要是c/c++、資料結構、作業系統等方面的基礎知識。好像有sizeof、樹等選擇題。填空題是補充完整程式。

附加題有寫演算法的、程式設計的、資料庫sql語句查詢的。還有一張開放性問題。

請定義乙個巨集,比較兩個數a、b的大小,不能使用大於、小於、if語句

#define max(a,b) ( a/b)?a:b

如何輸出原始檔的標題和目前執行行的行數

int line = __line__;

char *file = __file__;

cout<<"file name is "<<(file)<<",line is "<兩個數相乘,小數點後位數沒有限制,請寫乙個高精度演算法

寫乙個病毒

while (1)

不使用額外空間,將a,b兩鍊錶的元素交叉歸併

將樹序列化轉存在陣列或鍊錶中

structst;

sizeof(structst);

8 char*p1;

void*p2;

intp3;

charp4[10];

sizeof(p1...p4)=?

4,4,4,10

二分查詢

快速排序

雙向鍊錶的刪除結點

有12個小球,外形相同,其中乙個小球的質量與其他11個不同

給乙個天平,問如何用3次把這個小球找出來

並且求出這個小球是比其他的輕還是重

解答:哈哈,據說這是微軟前幾年的乙個面試題。很經典滴啊!三次一定能求出來,而且能確定是重還是輕。

資料結構的知識還沒怎麼學透,不過這個題我到是自己研究過,可以分析下。

將12個球分別編號為a1,a2,a3.......a10,a11,a12.

第一步:將12球分開3撥,每撥4個,a1~a4第一撥,記為b1,a5~a6第2撥,記為b2,其餘第3撥,記為b3;

第二步:將b1和b2放到天平兩盤上,記左盤為c1,右為c2;這時候分兩中情況:

1.c1和c2平衡,此時可以確定從a1到a8都是常球;然後把c2拿空,並從c1上拿下a4,從a9到a12四球裡隨便取三球,假設為a9到a11,放到c2上。此時c1上是a1到a3,c2上是a9到a11。

從這裡又分三種情況:

a:天平平衡,很簡單,說明沒有放上去的a12就是異球,而到此步一共稱了兩次,所以將a12隨便跟11個常球再稱一次,也就是第三次,馬上就可以確定a12是重還是輕;

b:若c1上公升,則這次稱說明異球為a9到a11三球中的乙個,而且是比常球重。取下c1所有的球,並將a8放到c1上,將a9取下,比較a8和a11(第三次稱),如果平衡則說明從c2上取下的a9是偏重異球,如果不平衡,則偏向哪盤則哪盤裡放的就是偏重異球;

c:若c1下降,說明a9到a11裡有乙個是偏輕異球。次種情況和b類似,所以接下來的步驟照搬b就是;

2.c1和c2不平衡,這時候又分兩種情況,c1上公升和c1下降,但是不管哪種情況都能說明a9到a12是常球。這步是解題的關鍵。 也是這個題最妙的地方。

a:c1上公升,此時不能判斷異球在哪盤也不能判斷是輕還是重。取下c1中的a2到a4三球放一邊,將c2中的a5和a6放到c1上,然後將常球a9放到c2上。

至此,c1上是a1,a5和a6,c2上是a7,a8和a9。此時又分三中情況:

1)如果平衡,說明天平上所有的球都是常球,異球在從c1上取下a2到a4中。而且可以斷定異球輕重。因為a5到a8都是常球,而第2次稱的時候c1是上公升的,所以a2到a4裡必然有乙個輕球。

那麼第三次稱就用來從a2到a4中找到輕球。這很簡單,隨便拿兩球放到c1和c2,平衡則剩餘的為要找球,不平衡則哪邊低則哪個為要找球;

2)c1仍然保持上公升,則說明要麼a1是要找的輕球,要麼a7和a8兩球中有乙個是重球(這步懂吧?好好想想,很簡單的。因為a9是常球,而取下的a2到a4肯定也是常球,還可以推出換盤放置的a5和a6也是常球。

所以要麼a1輕, 要麼a7或a8重)。至此,還剩一次稱的機會。只需把a7和a8放上兩盤,平衡則說明a1是要找的偏輕異球,如果不平衡,則哪邊高說明哪個是偏重異球;

3)如果換球稱第2次後天平平衡打破,並且c1降低了,這說明異球肯定在換過來的a5和a6兩求中,並且異球偏重,否則天平要麼平衡要麼保持c1上公升。確定要找球是偏重之後,將a5和a6放到兩盤上稱第3次根據哪邊高可以判定a5和a6哪個是重球;

b:第1次稱後c1是下降的,此時可以將c1看成c2,其實以後的步驟都同a,所以就不必要再重複敘述了。至此,不管情況如何,用且只用三次就能稱出12個外觀手感一模一樣的小球中有質量不同於其他11球的偏常的球。

而且在稱的過程中可以判定其是偏輕還是偏重。

給乙個奇數階n幻方, 填入數字1,2,3...n*n,使得橫豎斜方向上的和都相同

答案:#include

#include

#include

using namespace std;

int main()

num++;

} for(i=0;i

for(i=0;i delete [ ]matr[ i ];

return 1;

}騰訊的一道面試題:(與百度相似,可惜昨天百度死在這方面了)////

在乙個檔案中有10g個整數,亂序排列,要求找出中位數。記憶體限制為2g。只寫出思路即可。

答案:1, 把整數分成256m段,每段可以用64位整數儲存該段資料個數,256m*8=2g記憶體,先清0

2,讀10g整數,把整數對映到256m段中,增加相應段的記數

3,掃瞄256m段的記數,找到中位數的段和中位數的段前面所有段的記數,可以把其他段的記憶體釋放

4,因中位數段的可能整數取值已經比較小(如果是32bit整數,當然如果是64bit整數的話,可以再次分段),對每個整數做乙個記數,再讀一次10g整數,只讀取中位數段對應的整數,並設定記數。

5,對新的記數掃瞄一次,即可找到中位數。

如果是32bit整數,讀10g整數2次,掃瞄256m記數一次,後一次記數因數量很小,可以忽略不記

(設是32bit整數,按無符號整數處理

整數分成256m段?整數範圍是0-2^32-1一共有4g種取值,4g/256m=16,每16個數算一段0-15是1段,16-31是一段,...

整數對映到256m段中?如果整數是0-15,則增加第一段記數,如果整數是16-31, 則增加第二段記數,...

其實可以不用分256m段,可以分的段數少一寫,這樣在掃瞄記數段時會快一些,還能節省一些記憶體)

乙個檔案中有40億個整數,每個整數為四個位元組,記憶體為1gb, 寫出乙個演算法:求出這個檔案裡的整數裡不包含的乙個整數

答:方法一: 4個位元組表示的整數,總共只有2^32約等於4g個可能。

為了簡單起見,可以假設都是無符號整數。

分配500mb記憶體,每一bit代表乙個整數,剛好可以表示完4個位元組的整數,初始值為0。基本思想每讀入乙個數,就把它對應的bit位置為1,處理完40g個數後,對500m的記憶體遍歷,找出乙個bit為0的位,輸出對應的整數就是未出現的。

演算法流程:

1)分配500mb記憶體buf, 初始化為0

2)unsignedintx=0x1;

foreachintjinfile

buf=buf x <

方法二:

檔案可以分段讀啊,這個是o(2n)演算法,應該是很快的了,而且空間也允許的。

不過還可以構造更快的方法的,更快的方法主要是針對定位輸出的整數優化演算法。

思路大概是這樣的,把值空間等分成若干個值段,比如值為無符號數,則

00000000h-00000fffh

00001000h-00001fffh

......

0000f000h-0000ffffh

.....

fffff000h-ffffffffh

這樣可以訂立乙個規則,在乙個值段範圍內的數第一次出現時,對應值段指示值xn=xn+1,如果該值段的所有整數都出現過,則xn=1000h,這樣後面輸出定位時就可以直接跳過這個值段了,因為題目僅僅要求輸出乙個,這樣可以大大減少後面對標誌數值的遍歷步驟。

理論上值段的劃分有一定的演算法可以快速的實現,比如利用位運算直接定位值段對應值進行計算。

百度筆試面試題

好晶元,說明你所用的比較次數上限 其中 好晶元和其它晶元比較時,能正確給出另一塊晶元是好還是壞 壞晶元和其它晶元比較時,會隨機的給出好或是壞。4 40分 請設計乙個網頁儲存系統,能儲存千萬量級的網頁。要求 1.支援按照url為鍵值的隨機新增,刪除和修改網頁2.支援多個執行緒同時新增,修改和刪除 3....

百度 谷歌 微軟 MTK經典面試題

1.有乙個整數陣列,請求出兩兩之差絕對值最小的值。記住,只要得出最小值即可,不需要求出是哪兩個數。microsoft 方法1 兩兩作差求絕對值,並取最小,o n2 方法2 排序,相鄰兩點作差求絕對值,並取最小,o nlgn 方法3 有沒有o n 的解法?網上有如下解法 設陣列a 求 s min ai...

參加百度Android的面試經歷和面試題版本

上周末,參加了android的面試 分筆試和面試,其中面試分一面二和三面.這個流程走下來,差不多一天多了.關於筆試 以下題目不一定按筆試時順序,是麥洛憑藉回憶,盡量將筆試的題目還原 筆試共有10道題目 基礎題,輸入結果是什麼?public static void main string args c...