Förstå Hadoop Distributed File System av John Karry

TheHadoop Distributed File System är en helt bärbar filsystem, vilket isalso distribueras, samt skalbar för ramverket Hadoop. Det är också afile system som har skrivits i Java för samma ram. Varje HDFScluster som tillhör denna särskilda filsystemet innehåller ett enda namn läge, samt ett individuellt kluster av datanoder, som inte alltid måste bepresent inom varje HDFS kluster hela tiden. Denna specifika distribuerade filsystemet är det som ger regelbunden tillgång till applikationsdata och thisapplication uppgifter är något som alltid måste tillåtas denna tillgång viathe portal via HDFS. Varje data nod som är en del av HDFS klustret doesserve sitt syfte; och detta syfte är att tjäna främst konstant block ofdata via nätverket med hjälp av en unik protokoll som hör bara till theHDFS.

HadoopDistributed File System Omdömen använder TCP /IP-lagret för att genomföra out itscommunications. HDFS kan lagra stora filer, och storleken på dessa filer isequivalent till ungefär en multipel av 64 MB. Kunder som inte vill communicatedirectly med HDFS måste ha RPC, som är en förkortning för Remote Procedure Callin för att kommunicera på rätt sätt. De stora filer som HDFS kan överföra gå tomultiple maskiner samtidigt. Sälja Hadoop bygger på en Java-plattform och stöder Theprocessing av stora datamängder, precis vad vi hittar på Google. Den HadoopDistributed File System är en helt integrateddevelopment miljö

som används en hel del av många differentcompanies och organisationer för båda, produkter och att bedriva forskning. Hadoopdistributed filsystemet är orsaken till snabb överföring av data mellan noder, sålunda, så att ett system för att funktionellt avbrott i händelse av ett misslyckande. Themain tillämpningen av detta system har varit i sökmotorer och advertisingonline.

Låt oss förstå logiken bakom HDFS. Den lagrar largefiles genom att distribuera data mellan en pool av datanoder. Master /slavearchitecture används i denna, där befälhavaren kontrollerar ett eller flera slavar. Theinformation om datanoder lagras i individuella namn noder, och datanodes är kopplade till varandra som ett kluster. Till användaren, kommer den att representera onesingle fil. Fördelen med HDFS är en tillförlitlig lagringslösning för largefiles. Den bakomliggande orsaken till skapandet av HDFS är tillförlitlighet, även i händelse av fel.