이 글에서는 kubernetes상에서 Ray Cluster를 구축해서 사용해보는 과정을 적어보려고 한다. Ray Cluster를 사용하려는 이유는 다음과 같다.현재 진행하는 프로젝트에서는 실시간으로 쌓이는 대규모 데이터를 분석하고 이것을 활용하기 위함이다.더 자세하게는 보다 효율적으로, 빠르게 데이터를 불러오고 분석하기 위해서 사용을 결정했다. Ray 말고 다른 분산 처리, 학습을 지원하는 다양한 도구들이 존재하지만 Ray를 선택하게 된 이유는 Kubernetes에서 다른 도구들보다 유연하고, 쉽게 사용 가능할 것 같아서이다. 필자와 같은 경우는 대규모 데이터를 효율적으로 처리하기 위해 Apache Spark를 사용해 데이터를 분석, 처리 할것이다.그렇기 때문에 RayDP를 Ray Cluster에 적용시..
Tech (5)
kubernetes에서 Ray를 이용해 분산학습을 하기 위해 도커 이미지를 사용해 클러스터를 구축하려고 했지만, 내가 원하는 사항이 들어가지 않아서 도커 이미지를 바꿔서 사용해야 하는 상황이 되었다.그냥 도커 이미지만 바꿔서 사용하면 되지만 Docker hub에 내 이미지를 올려 사용해보고 싶은 생각이 들어서 해보았다. 우선 도커허브 로그인을 해준다docker login -u {user name} 다음 필요한 Dockerfile을 수정한다. FROM rayproject/ray:latest@sha256:c864e37f4ce516ff49425f69cac5503a51e84c333d30928416714a2c3da55b43 ARG HTTP_PROXY ARG HTTPS_PROXY # set htt..
노드들의 네트워크 인터페이스 이름을 일치시켜줘야하는 일이 생겨서 변경하게 되었다.커맨드는 생각보다 간단하다.# Deactive network interface.$ sudo ip link set down [interface_name]# Change network interface name.$ sudo ip link set [interface_name] name [new_interface_name]# Active new network interface$ sudo ip link set [new_interface_name] up 사용중인 네트워크 인터페이스 이름을 변경하려면 아마 다음과 같은 안내가 나올것이다.RTNETLINK answers: Device or resource busy 그러므로 네트워크 인터페이..
여러 노드들을 운영하다 보면 노드들 사이에 패스워드 없이 접속하는 방법이 필요할 때가 있다.예를 들어 Hadoop을 사용한다던가, OpenMPI를 사용하는 경우에 해당된다.이제 순서대로 패스워드 없이 노드에 ssh 접속을 하는 방법을 정리하도록 하겠다.설치 환경SSH 설정1. 설치 환경Node01- OS: Ubuntu 22.04- Host name: node01- IP: 192.168.0.10Node02- OS: Ubuntu 22.04- Host name: node02- IP: 192.168.0.11 2개의 노드를 준비했다.node01 에서 node02 ssh 접속을 패스워드 없이 하는 과정이다.2. SSH 설정우선 리눅스에 SSH가 설치 되어있지 않다면 설치를 진행해 주어야 한다.모든 노드에서 진행해준..
NFS란?NFS 사용이유?설치 환경설치설치 후 테스트1. NFS란?Network File System의 약자로 네트워크를 통해 파일을 저장하는 메커니즘이다. 2. NFS 사용이유?NFS를 사용하게된 이유는 Horovod를 사용하기 위해서 OpenMPI를 사용하는데 필요한 파일 시스템이기 때문에 사용하게 되었다.이 문서에서는 2개의 노드에서 NFS을 설치하고 테스트까지 정리하도록 하겠다. 3. 설치 환경Master Node- OS: Ubuntu 22.04- Host name: nfsmaster- IP: 192.168.0.10Client Node- OS: Ubuntu 22.04- Host name: nfsclient- IP: 192.168.0.11※ 중요노드들 사이에 ssh 접속이 패스워드 없이 가능해야한다..