中國人才網(wǎng)推薦百度招聘筆試題目精選集合!
一,簡答題(本題共30分)
1. 當前計算機系統(tǒng)一般會采用層次結(jié)構(gòu)來存儲數(shù)據(jù),請介紹下典型的計算機存儲系統(tǒng)一般
分為哪幾個層次,為什么采用分層存儲數(shù)據(jù)能有效提高程序的執(zhí)行效率?(10分)
2. Unix/Linux系統(tǒng)的僵尸進程是如何產(chǎn)生的?有什么危害?如何避免?(10)
3. 簡述Unix/Linux系統(tǒng)中使用socket庫編寫服務器程序的流程,請分別用對應的socket
通信函數(shù)表示。
二,算法與程序設計題(本題共45分)
1, 使用C/C++語言寫一個函數(shù),實現(xiàn)字符串的反轉(zhuǎn),要求不能用任何系統(tǒng)函數(shù),且時間復
雜度最小。函數(shù)原型是:char *reverse_str(char *str)(15分)
2, 給定一個如下輸入格式的字符串,(1,(2,3),(4,(5,6),7))括號內(nèi)的元素可以是
數(shù)字,也可以另一個括號,請實現(xiàn)一個算法消除嵌套的括號。比如把上面的表達式變成:(1,2,3,4,5,6,7),如果表達式有誤請報錯。(15分)
3, 相似度計算用于衡量對象之間的相似程度,在數(shù)據(jù)挖據(jù),自然語言處理中使一個基礎性
計算,在廣告檢索服務中往往也會判斷網(wǎng)民檢索Query和廣告Adword的主題相似度。假設Query或者Adword的主題屬性定義為一個長度為10000的浮點數(shù)據(jù)Pr[10000](稱之為主題概率數(shù)組),其中Pr[i]表示Query或者Adword屬于主題Id為i的概率,而Query和Adword的相似度簡化定義為兩者主題概率數(shù)組的內(nèi)積,即sim(Query,Adword)=sum(QueryPr[i]*AdwordPr[i])(0<==i<10000).在實際應用場景中,由于大多數(shù)主題的概率都為0,所以主題概率數(shù)組往往比較稀疏,在實現(xiàn)時會以一個緊湊型數(shù)組topic_info_t[]的方式保存,其中100<=數(shù)組大小<=1000,并按照topic_id遞增排列,0<=topic_id<10000,0
現(xiàn)在給出Query的topic_info_t數(shù)組和N(N>=5000)個Adwords的 topic_info-t數(shù)組,現(xiàn)要求出Query與Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i& query_topic_info, Const vector adwords_topic_info[], Int adwords_number);
編寫代碼求時間復雜度最低的算法,并給出時間復雜度分析。(15分)
三,系統(tǒng)設計題(本題共25分)
在企業(yè)中,對生產(chǎn)數(shù)據(jù)進行分析具有很重要的意義。但是生產(chǎn)數(shù)據(jù)通常不能直接用于數(shù)據(jù)分析,通常需要進行抽取,轉(zhuǎn)換和加載,也就是業(yè)界常識的ETL
相關文章推薦: