Bioinformatics 주간 뉴스 - 2026년 6월 1주차
이번 주 Bioinformatics 커뮤니티 주요 소식을 모았습니다. (논문 5편, 툴 2개, 이벤트 3건, 뉴스 3건)
이번 주 논문
Barbell reveals and resolves demultiplexing and trimming issues in Nanopore data
- 저널/서버: Bioinformatics (Oxford Academic)
- 저자: Beeloo et al.
- 요약: Oxford Nanopore 시퀀싱에서 기존 demultiplexer(Dorado 등)가 놓치는 복잡한 바코드 배열(전체 reads의 약 17%)을 감지하고 오염 reads를 99.96% 감소시키는 패턴 인식 기반 demultiplexer Barbell을 개발하였으며, NCBI 공개 데이터베이스에서도 광범위한 Nanopore 오염이 존재함을 확인하였음.
- 링크: 10.1093/bioinformatics/btag349
pAnno: a comprehensive, precise, and fast proteogenomic workflow for the discovery of novel coding regions
- 저널/서버: Genome Biology
- 저자: Wang et al.
- 요약: 유전체·전사체·단백체 데이터를 통합하는 엔드-투-엔드 proteogenomics 워크플로 pAnno는 50배 큰 데이터베이스 크기에서도 단 3% 추가 처리 시간으로 신규 단백질 코딩 영역(스플라이싱, 돌연변이, 비표준 HLA 펩타이드 포함)을 고정밀로 식별함.
- 링크: 10.1186/s13059-026-04111-0
Benchmarking reveals the superiority of nucleic acid foundation models in predicting lncRNA coding potential
- 저널/서버: Genome Biology
- 저자: Yang et al.
- 요약: codlncRNA(코딩 잠재력이 있는 lncRNA) 예측을 위한 최초의 다종(multi-species) 벤치마크를 구축하고 12개 고전 툴과 4개 foundation model을 비교한 결과, DNA만 학습한 DNABERT-2가 RNA 특화 모델과 동등하거나 우수한 성능을 보임.
- 링크: 10.1186/s13059-026-04134-7
GraphScrDom: Reference-informed spatial domain detection using weak supervision for spatial transcriptomics
- 저널/서버: Genome Research
- 저자: Ma et al.
- 요약: 소량의 scribble 어노테이션과 scRNA-seq 레퍼런스를 약지도학습(weakly supervised) 대조 학습으로 통합하는 GraphScrDom이 다양한 공간전사체 플랫폼에서 기존 방법보다 일관되게 우수한 조직 도메인 분할 성능을 달성함.
- 링크: 10.1101/gr.281260.125
FunBind: A unified multimodal model for generalizable zero-shot and supervised protein function prediction
- 저널/서버: Bioinformatics (Oxford Academic)
- 저자: Boadu et al.
- 요약: 단백질 서열·텍스트 설명·도메인 어노테이션·구조·GO 용어 5가지 모달리티를 대조 학습으로 통합한 FunBind는 기존에 학습하지 않은 GO 기능 용어에 대해서도 제로샷 예측이 가능하며, 지도 학습 fine-tuning 시 최신 딥러닝 방법들을 능가함.
- 링크: 10.1093/bioinformatics/btag356
새로운 툴 & 소프트웨어
scikit-bio 0.7.3
- 설명: Python 바이오인포매틱스 핵심 라이브러리로 서열 분석, 거리 행렬, 계통수 추정, 다양성 지표 등 광범위한 기능을 제공한다. 이번 0.7.3(2026-06-01 릴리즈)에서 Python Array API 표준 기반 GPU 컴퓨팅 지원, mmvec(마이크로바이옴-대사체 공존 패턴 분석) 통합, 최소 진화 계통수 알고리즘 속도 개선, rclr 조성형 데이터 변환 함수가 추가됐다.
- 링크: GitHub
- 주요 기능: GPU 컴퓨팅 지원, mmvec 멀티오믹스 분석, rclr 변환, 계통수 알고리즘 성능 개선
- 인기도: ⭐ 1,200 (GitHub)
scvi-tools 1.4.3
- 설명: 단일세포 오믹스 데이터 분석을 위한 Python 딥러닝 프레임워크로, 변분 오토인코더 기반 모델(scVI, scANVI, totalVI 등)을 통해 배치 보정, 세포 타입 분류, 멀티모달 데이터 통합을 수행한다. Scanpy, Seurat, Bioconductor 워크플로우와 긴밀하게 연동된다.
- 링크: GitHub
- 주요 기능: scRNA-seq/ATAC-seq/공간전사체 통합 분석, Scanpy·Seurat 연동, 다중 모달리티 지원
- 인기도: ⭐ 수천 개 (scverse 생태계 표준 도구)
컨퍼런스 & 이벤트
| 학회 | 개최일 | 마감 | 링크 |
|---|---|---|---|
| ISMB/ECCB 2026 | 2026-07-12 ~ 2026-07-16 | 호텔 할인 예약: 2026-06-19 | 공식 사이트 |
| IWBBIO 2026 | 2026-07-15 ~ 2026-07-17 | 초록 제출: 2026-06-07 | 공식 사이트 |
| InCoB/ISCB-APAC 2026 | 2026년 하반기 (미정) | 초록 제출: 2026-06-15 | 공식 사이트 |
IWBBIO 2026 초록 제출 마감이 내일(2026-06-07)로 매우 임박했습니다. 스페인 그란 카나리아에서 개최되는 바이오인포매틱스·생의학공학 국제 학술대회입니다.
업계 뉴스
NHGRI, AnVIL 클라우드 게놈 분석 플랫폼 지속 운영 지원 공고 발표
- 출처: NIH/NHGRI (Simpler Grants, 2026-06-02)
- 요약: NHGRI가 클라우드 기반 유전체 분석 플랫폼 AnVIL(Analysis, Visualization, and Informatics Lab-space)의 갱신 지원 공고(U54)를 발표했다. 5 페타바이트 이상의 데이터와 약 30만 명의 연구 참여자 데이터를 보유한 AnVIL은 FAIR 원칙 강화 및 NIH 연방 데이터 생태계 내 상호운용성 개선을 핵심 목표로 한다.
- 링크: 원문
UCSC 게놈 브라우저, hg38에 MPRA 기능 변이 트랙 신규 추가
- 출처: UCSC Genome Browser (2026-06-02)
- 요약: UCSC 게놈 브라우저가 hg38 어셈블리에 MPRA Base 및 MPRAVarDB 트랙을 새로 추가했다. 대규모 병렬 리포터 어세이(Massively Parallel Reporter Assay) 데이터를 통해 비코딩 변이의 기능적 영향을 브라우저 상에서 직접 시각화·탐색할 수 있게 됐다.
- 링크: UCSC Genome Browser
FastOMA, 2,000개 진핵생물 단백질체 직교군 분석을 하루 만에 처리
- 출처: SIB Swiss Institute of Bioinformatics (2026-06-01)
- 요약: SIB가 FastOMA 도구를 공개했다. 기존 OMA(Orthologous MAtrix) 방법론의 정확도를 유지하면서 2,000개의 진핵생물 단백질체에 대한 직교군 추론을 하루 안에 처리할 수 있어, 대규모 비교유전체학 연구의 계산 비용을 대폭 낮출 것으로 기대된다.
- 링크: GitHub
댓글남기기