1 분 소요

1. Hail 설치

Hail(Version 0.2.70)은 Mac OS 또는 Linux 환경에서만 설치를 지원합니다. Ubuntu 18.04 LTS에서 설치를 진행하였습니다. Hail은 Spark(Version 3.1.1)를 기반으로 한 Python Library이기 때문에 Java, Python의 설치가 필요합니다.

Hail 설치의 첫걸음부터 시작해보겠습니다.

Requirements

  • Java 8 JRE
  • g++
  • BLAS
  • LAPACK
  • Python (Version >=3.6)

Java 8과 GNU Compiler, BLAS, LAPACK 먼저 설치하겠습니다.

$ apt-get install -y \
  openjdk-8-jre-headless g++ \
  libopenblas-base liblapack3

Python의 경우 pip 명령어를 통해서 설치하는 방법과 conda 가상환경을 이용하여 설치하는 방법 두가지가 있는데 후자의 방법을 추천합니다. conda 가상환경을 만들어 설치하는 것을 추천하는 이유는 Hail의 Dependency 유지를 통해 구동 환경을 안정화할 수 있기 때문입니다.

1) pip 설치

$ apt-get install –y python3 python3-pip
$ pip install hail

2) conda 가상환경 구축

우선 Conda 웹페이지에서 Linux miniconda installer를 다운로드하고 terminal에서 설치를 진행합니다. 설치완료되면 가상환경을 만들어 Hail을 설치합니다.

$ bash Miniconda3-latest-Linux-x86_64.sh
$ conda create -n hail python'>=3.6'
$ conda activate hail
$ pip install hail


2. 구동 테스트

Hail이 잘 설치되었는지 확인하기 위해서 다음 코드를 실행하여 봅시다. 저는 jupyter notebook을 사용하면 python script를 짜거나 구동 테스트를 하기 편해서 자주 사용합니다.

다음 코드를 작성해보고 실행하여 봅시다. 가상의 개체군 3개가 섞여있는 Sample 500개와 Variants 50,000개를 포함하는 파티션이 32개인 Matrix Table을 생성하고 내용을 확인하는 스크립트입니다.

import hail as hl
mt = hl.balding_nichols_model(n_populations=3,
                              n_samples=500,
                              n_variants=500000,
                              n_partitions=32)
mt.show()

실행 결과는 다음과 같습니다.

script-result
< Script의 결과 >


이것은 제가 jupyter을 이용하여 직접 실행한 결과의 html 파일 링크이니 참고하시면 좋을 것 같아요.

설치를 해보았으니 이제 본격적으로 Hail의 기능을 하나씩 파헤쳐 보겠습니다.

Reference

댓글남기기