hadoop可以解決什么問題 2022-09-08
hadoop可以解決什么問題?Hadoop用處主要有兩方面,其一是把單機的工作任務(wù)拆分,將之變?yōu)閰f(xié)同工作的集群;其二是可以用來解決逐漸增加的文件存...詳情>
怎么才能學(xué)好hadoop 2022-09-07
怎么才能學(xué)好hadoop?Hadoop是學(xué)好大數(shù)據(jù)必不可少的一環(huán),它幾乎和大數(shù)據(jù)是相互綁定的,誰也離不開誰。那么怎么學(xué)Hadoop,其實就是Hadoop如何入...詳情>
Spark SQL 結(jié)構(gòu)化數(shù)據(jù)處理流程及原理是什么? 2022-09-05
在兼容 Hive 的早期版本的 Spark 中,我們可以在查詢中使用某些關(guān)鍵詞,這樣做是完全可行的。然而,這在 Spark SQL 3 中是不允許的,因為它有...詳情>
Apache Spark與 Apache Hadoop數(shù)據(jù)科學(xué)工具有哪些區(qū)別? 2022-09-05
與 Apache Spark 一樣,它的安全性可以通過其他 Apache 實用程序進一步提高。如果您是需要大量數(shù)據(jù)科學(xué)實用程序來存儲和處理大數(shù)據(jù)的數(shù)據(jù)科學(xué)...詳情>
大數(shù)據(jù)的核心架構(gòu)層是哪些 2022-09-05
這種即席查詢通常是現(xiàn)有的報表和數(shù)據(jù)共享層的數(shù)據(jù)并不能滿足他們的需求,需要從數(shù)據(jù)存儲層直接查詢。數(shù)據(jù)同步任務(wù)需要等數(shù)據(jù)分析任務(wù)完成后才...詳情>
Kafka Partition 如何保證副本數(shù)據(jù)的一致性 2022-08-31
為了保證可用性,Kafka 的分區(qū)是多副本的,可以在創(chuàng)建分區(qū)時通過 replication-factor 參數(shù)指定該分區(qū)的副本數(shù),某一副本丟失并不會造成實際數(shù)...詳情>
Kafka如何在數(shù)據(jù)一致性和可用性做平衡的 2022-08-31
如果Leader失敗了,一個未完全同步數(shù)據(jù)的Replication被選擇為了Leader,數(shù)據(jù)是否會丟失呢這種情況下,數(shù)據(jù)會丟失,可以保證可用性,但是不能保...詳情>
Kafka ACK機制 2022-08-31
Producer只要收到一個分區(qū)副本成功寫入的通知就認為推送消息成功了。這個副本必須是leader副本, 只有l(wèi)eader副本成功寫入了,Producer才會認為...詳情>
消息系統(tǒng)Kafka筆試題:Kafka底層的文件存儲結(jié)構(gòu) 2022-08-29
如何根據(jù)Offset來查找一條消息: 根據(jù)指定的偏移量,使用二分法查詢定位出該偏移量對應(yīng)的消息所在的分段索引文件和日志數(shù)據(jù)文件。然后通過二分...詳情>
hiveSQL的分組topN問題 2022-08-29
大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助...詳情>
熱問標簽 更多>>
在線提問
專業(yè)導(dǎo)師線上坐鎮(zhèn),解答個性化學(xué)習(xí)難題
提交問題