Gene Analysis

“유전체 DB 분석으로 바이러스 10만 개 새로 발견”

2022-01-27
MARKET NEWS

단 한 종의 바이러스가 수 백만명의 목숨을 앗아가고 세계경제를 마비시켰다. 비슷한 일을 저지를지 모를 바이러스가 도대체 얼마나 될까? 먼저 지구상에 존재하는 바이러스의 정체부터 파악해야 한다. 하지만 인류가 모르는 바이러스의 숫자가 수조 단위는 될 것으로 과학자들은 추정한다.

이를 해결하기 위해 컴퓨터 프로그램으로 지금까지 인류가 확보한 생물체의 게놈 데이터베이스를 분석한 결과 10만 개 이상 새로운 바이러스의 신원이 밝혀졌다. 26일(현지시간) 《네이처》에 게재된 논문을 토대로 과학전문지 《사이언스》가 보도한 내용이다.

이번 연구를 주도한 캐나다의 컴퓨터생물학자 아르템 바바이안 박사는 코로나19 팬데믹이 시작된 2020년 초 얼마나 많은 코로나바이러스가 기존 유전체 데이터에서 발견될 수 있는지 궁금했다. 그래서 슈퍼컴퓨터 전문가인 제프 테일러와 함께 인류가 발견한 생명체의 유전자 정보를 모아둔 세계 유전자 서열 데이터베이스를 검색해보기로 했다.

현재 이 데이터베이스에는 지구상의 다양한 생명체의 유전자정보가 16페타바이트(1페타바이트=1024테라바이트)나 수집돼 있다. 여기에는 다른 유기체를 감염시키는 바이러스의 유전자 염기서열도 포함돼 있기는 하지만 별도로 분류돼 있지 않았다.

지금은 영국 케임브리지 소속 연구원이 된 바바이안 박사는 테일러와 함께 이 방대한 데이터베이스 분석을 위해 클라우드 기반 데이터를 검색하는 데 특화된 컴퓨터 프로그램을 개발했다. 여러 생물정보학자들의 도움을 받아가며 이 소프트웨어를 보완했다. 그리고 코로나바이러스뿐 아니라 전체 바이러스 사냥에 나섰다. 이를 위해 모든 RNA 바이러스의 복제의 핵심인 RNA 의존성 RNA 중합효소와 관련된 핵심 유전정보와 일치하는 유전체 탐색을 수행했다. 여기에는 코로나바이러스뿐 아니라 독감, 소아마비, 홍역, 간염을 일으키는 바이러스도 포함된다.

바바이안 연구진이 개발한 프로그램을 통한 검색은 데이터 세트당 1센트 미만의 컴퓨팅 비용으로 하루 100만 개의 데이터 세트를 처리할 수 있을 만큼 빨랐다. 그 결과 모두 9종의 코로나바이러스와 D형간염바이러스 관련 300종의 바이러스를 포함한 13만2000개의 바이러스를 발견했다. 이번 연구는 종전엔 헤아릴 수 없었던 어마어마한 DNA와 RNA를 분석할 수 있는 ‘페타바이트 유전체학(Petabyte Genomics)’의 출범을 알리는 것이기도 했다.

논문을 검토한 미국 캘리포니아대 데이비스 캠퍼스(UC 데이비스)의 C 타이터스 브라운 교수(생물정보학)은 “놀라운 엔지니어링 업적”이라고 찬사를 보냈다. 미국국립정보센터(NCBI)의 생물정보학자인 J 로드니 브리스터 박사는 “다른 연구에 초석을 놓는 대단한 연구”라고 평가했다. 미국의 비영리 환경보건연구기관인 ‘에코헬스 얼라이언스’의 피터 다스작 대표는 “바이러스에 대해 우리가 얼마나 지식이 부족한지를 보여주는 결과물”이라고 말했다.

연구진이 이번 발견을 토대로 구축한 데이터베이스는 바이러스의 완전한 유전자 서열이 담기지 않았다. 대부분 RNA 중합효소에 대한 유전정보만이 담겼을 뿐이다. 하지만 이는 바이러스들이 서로 어떻게 연결되고 분기했는지를 보여주는 가계도 작성에 도움을 줄 수 있다. 또한 특정 바이러스가 발견된 위치 및 해당 호스트의 위치를 확인할 수 있게 해준다.

브라운 교수는 일부 발견이 인간 병원체가 어떻게 발생하는지 더 잘 이해하거나 바이러스 감염에 대한 진단 검사를 개선하는 데 도움이 될 수 있다고 말했다. 마지막으로 환자를 감염시킨 바이러스를 추출했을 때 그 바이러스가 다른 곳에서도 발견됐는지 여부를 확인시켜준다. 바바이안 박사는 “거대한 바이러스 감시 네트워크가 될 수 있는 데이터베이스를 구축한 셈”이라고 설명했다.

연구진은 보통 박쥐를 기원으로 하는 것으로 알려진 코로나바이러스가 예상밖의 생물에도 서식하고 있음을 발견했다. 복어와 아흘로틀(도롱뇽의 일종)에 서식하는 코로나바이러스를 발견한 것. 또 일부 수생동물에서 단일 RNA가닥이 아니라 2개의 RNA가닥이 고리형태로 연결됐을 것으로 추정되는 코로나바이러스의 특이한 유전서열도 발견됐다고 연구진은 밝혔다.

연구진은 또한 주로 조류(藻類)에서 발견되고 박테리아(세균)도 감염시키는 거대 바이러스가 250개 이상 된다는 증거도 발견했다. 세균을 감염시키는 바이러스를 박테리아파지라고 부르는데 연구진은 이 ‘거대 박테리아파지’가 조류뿐 아니라 영국의 고양이와 개 그리고 방글라데시아에선 사람에게서도 발견됐다고 밝혔다. 이 거대 바이러스는 숙주의 종을 옮겨 다닐 때 그 유전자를 옮겨갈 수 있을 만큼 크다고 바바이안 박사는 밝혔다. 다스작 대표는 “바이러스의 세계를 파고들 때마다 놀라움을 얻게 되는데 이번에 발견된 바이러스들도 다르지 않다”고 말했다.

연구진은 자신들이 구축한 데이터베이스를 다른 연구자들도 이용할 수 있도록 인터넷 공개 사이트를 구축했다. 바바이안 박사는 이를 매년 업데이트할 예정인데 현재 13만 개인 RNA 바이러스 정보를 10년 뒤 1억 개까지 확대하는 게 목표라고 밝혔다.


출처: 코메디닷컴

원문 보기


Return to list