본문 바로가기 메뉴 바로가기

코딩베짱이의 무언가 생산적인 일을 하는 블로그

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

코딩베짱이의 무언가 생산적인 일을 하는 블로그

검색하기 폼
  • 분류 전체보기 (65)
    • Programming (31)
      • Fundamentals (0)
      • Language (3)
      • Data (5)
      • Tools (5)
      • settings (5)
      • DB (2)
      • Django (6)
      • WEB etc (3)
      • Algorithms (1)
      • JS (0)
    • Studies (2)
      • 스터디파이 - 통계 (2)
      • 풀잎스쿨 10기 (1)
      • 파이썬 아키텍처 (2)
    • Reviews (12)
      • books (10)
      • Lectures (2)
    • Languages (1)
      • General English (0)
      • 엉터리번역 (1)
    • chat (3)
    • 취미 (6)
      • 해외여행 (6)
    • Unclassified (0)
  • 방명록

pyspark (1)
PySpark : 1. Hadoop, Mapreduce, Spark

*유데미 강의 'PySpark 로 빅데이터 분석하기 with Python'로 공부한거 정리 분산시스템 필요성: 램보다 큰 데이터를 처리하는 경우의 해결 방법의 일환으로, 분산시스템을 활용해 여러 기계와 컴퓨터로 데이터를 분배해서 데이터를 처리할 수 있다. 하나의 메인 컴퓨터(마스터 노드)에서 데이터 처리 및 계산을 다른 컴퓨터들에 분배한다. 여기서 마스터노드의 CPU와 램은 슬레이브노드의 CPU와 램이 잘 동작하는 것을 관장한다. 여러 컴퓨터들의 힘을 모아 강력한 단일 컴퓨터보다 더 나은 성능을 발휘할 수 있음, 즉 다소 성능이 떨어지는 컴퓨터나 서버라도 분산시스템을 통해 연산을 잘 분배해서 동작할 수 있다. 단일 컴퓨터가 스케일업하는 것보다 분산시스템이 스케일 아웃하기 좋음 내고장성(fault tole..

Programming/Data 2024. 1. 28. 17:38
이전 1 다음
이전 다음
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 인스타그램
  • 깃허브
TAG
  • Python
  • 싱가포르
  • udemy
  • 해외여행
  • SQL기초구문
  • SRE를위한시스템설계와구축
  • 싱가폴
  • Docker
  • 아토믹코틀린
  • askcompany
  • 리액트와함께장고시작하기
  • 파고다강남후기
  • Singapore
  • django
  • 머신러닝파워드애플리케이션
  • 혼자공부하는얄팍한코딩지식
  • 싱가폴여행
  • 파고다갓생후기챌린지
  • 한빛출판사
  • 그래프QL인액션
  • BookDiscussion
  • 동남아
  • 나는리뷰어다2022
  • 한빛미디어
  • 개발자리뷰어
  • 유데미강의
  • 파고다후기
  • 다시미분적분
  • 나는리뷰어다
  • 길벗출판사
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바