2018년 9월 5일 수요일

홍미4 primer 업데이트

글로벌 업데이트로 9.6.1.0 버전이 나왔는데... 뭔가 오류가 난다고 안된다..
업데이트 하지 말아야지..
지난 번에 비슷한 경우가 있었는데 프로그램이 아주 꼬여서 난감했었거든...

2018. 12. 03.

업데이트 이후 문자메시지가 안되서 초기화 하여 해결한 적이 있었다. 그런데 그 이후 업데이트를 하면서 또다시 문자메시지가 안된다. APN 은 아무리 건드려도 안되더만... Mi 메세지라는 걸 On 하니 이제서야 된다..

설정 > 시스템 앱 > 메시지 > Mi 메시지 활성화

2018년 7월 6일 금요일

Trinity 설치 중...

RNA-seq 을 de novo assemble 하고 분석하는 툴인 Trinity를 설치 중이다.
2.6.6 으로 신버전이 나왔길래 설치 중... 기존 버전이 2.3 이었다.

그런데.. 아쒸.. 뭔가 바뀐게 있다.. jellyfish가 안된단다...
jellyfish 가 1.x 랑 2.x 두 가지 버전으로 나뉘어 있는데 2.x 버전을 찾는다. 기존 PATH 하고 안 맞는 듯.. 결국 PATH를 수정해서 해결했다.
그런데 여전히 안된다.. 에러 메세지를 찾아보니 salmon ㅡ_ㅡ?? 이라는게 없단다..
아, 이건 또 뭐냐.. 찾아보니 새로운 RNA 분석 툴인가 뭔가란다..

웹사이트를 뒤져 salmon 을 찾아 설치했다.. 초장부터 안된다.. ㅜ_ㅜ
뭐가 문제냐!!
에러 메시지에 boost 가 필요하단다.. 에휴...
boost 를 찾아 설치하려다가 문득.. 그냥 root 를 이용해서 설치하자..

apt-get install libboost-all-dev

로 해결해버렸다. 일일히 컴파일하기 귀찮음.. ;;

다시 위로 올라가서 salmon 에 cmake 를 실행하고.. 에러 메시지 있나 찾아보고..
make 실행 중... 아.. 뭔가 잔뜩 뜨는게 불안하다...

아.. 짜증.. salmon 버전이 안 맞는단다.. 뭔 소리냐.. 대체...
현재 버전이 0.10.2 인데 0.9.1 을 사용하니까 실행이 된다..
0.10.x 로 바뀌면서 설치 방법도 바뀌었는데 그뿐 아니라 많은 점에서 바뀌어서 그런 듯 하다. 그럴꺼면 사용 버전 좀 표시해놔라.. trinity 야...

2018년 4월 7일 토요일

이놈의 시놀로지 NAS...

DS414 NAS 를 토렌트 머신으로 사용한지 4년이 되어가나보다..
그런데도 참 적응이 안된다..

지난 3월말? 4월초 쯤 업데이트가 있었는데 그 이후 토렌트가 안된다...
버전이... DSM 6.1.6-15266 란다..

이후 언젠가 되겠지... 라구 냅뒀는데 안되겠어서 주말을 기회삼아 건드렸다가 하루가 다 지났다.
알고보니.. 권한 문제 였던 듯.. 하지만 권한을 아무리 건들여도 안된다.. 껏다켜보고.. 재설치해보고... 에러인 듯한 파일을 찾아서 수정해보고... 하루 종일 해봤다..

결국 모든 토렌트 파일을 다시 받고 마그넷도 텍스트 파일로 하나하나 재저장한 다음 다시 해보니 이제서야 된다...
권한 문제가 맞기는 한데 전의 권한 설정이 워낙 강력한 탓인지 복구가 안된다..

그게 아니면 이번 업데이트에서 뭔가 많이 변했는데 그걸 제대로 반영 안 한듯 싶다.



2018년 4월 3일 화요일

snpEffector 로 variant 분석하기

사용한지 몇년 됐는데 이제서야 글을 남겨보네요.. DB 만드는 법도 있는데 안 쓸 듯 합니다.

java -Xmx64G -jar snpEff.jar ann -c ./snpEff.config -csvStats file.csv -i vcf -o vcf -stats file.html DB_name file.vcf >file.screen

-Xmx64G - java 에 최대 64GB 메모리 할당 가능하다는 옵션이다. 별로 중요하지 않음. 안 붙여도 되고..
-c - snpEffector 에서 사용할 config 파일의 위치.
-csvStats - summary report 를 저장할 때 csv 파일을 저장하라는 옵션. 나중에 excel 로 변환하기 편하다.
-i - input 파일 포멧
-o - output 파일 포멧
-stats - summary report 를 html 파일로 저장하라는 옵션. 그림을 생성해주기에 편하다.
DB_name - reference 가 무엇인지 알려주는 것이다. 먼저 DB 를 검색해서 맞는 name 을 정확히 써줘야 한다.
file.vcf - samtools 나 GATK 등을 이용하여 만든 vcf 파일이다.
file.screen - 실행하고 있으면 뭔가 잔뜩 나오는데 이걸 저장할 파일. vcf 파일이 screen out 되는 듯 싶다.

2018년 3월 28일 수요일

vcf 파일로부터 chromosome 별로 variants 의 밀도와 분포도 표시하기

bowtie2 와 picard, GATK 를 이용하여 BAM 파일을 만들고 이것을 다시 재정리하여 vcf 파일을 만들었다. 이것을 snpEffector 를 이용하여 분석을 하였지만 window size 가 너무 큰 관계로 chromosome 별 밀도와 분포를 자세히 표시할 수가 없었다.
window size 를 10kb 로 만드는 방법을 알아내었다.
해답은 무척 쉬운데 엄청 헤멨다.

방법은 bedtools 를 이용하는 것이다. 먼저 reference 의 각 chromosome size 를 정리하여야 한다.

[chromosome name]<TAB>[size] 로 정리 되어 있어야 한다.

1       43270923
2       35937250
3       36413819
4       35502694
5       29958434
6       31248787
7       29697621
8       28443022
9       23012720
10      23207287
11      29021106
12      27531856

정리해보면 위와 같다. 내용을 파일로 저장하자. 그 다음..

bedtools makewindows -g filename -w 10000 --> 10000 으로 windows 작성하는 것이다.

그러면 결과가 다음과 같이 나온다.
1 0 10000
1 10000 20000
1 20000 30000
1 30000 40000
1 40000 50000
1 50000 60000
1 60000 70000
1 70000 80000
1 80000 90000
.................

위의 결과를 다시 저장해둔다.

bedtools intersect -a filename -b vcf_filename -c

위를 실행하면 다음과 같이 뜬다.
1       0       10000   0
1       10000   20000   0
1       20000   30000   0
1       30000   40000   0
1       40000   50000   0
1       50000   60000   0
1       60000   70000   0
1       70000   80000   0
1       80000   90000   0
1       90000   100000  0
..............

chromosome name, start position, end position, count 개수 순서이다. '-c' 옵션은 -a 의 범위내에 -b 가 위치할 경우 그 개수를 세어주는 것이다. 여기에 -f 혹은 -F 옵션을 사용하여 최소 counts 개수를 지정할 수 있지만 필요가 없는 관계로 자세한 설명은 넘어간다.