신과학/철학
초심리학/잠재능력
UFO/신물리학
오컬티즘/미스터리

과학적, 비과학적 의학
동서양 대체의학

창조론/과학적 사실성
창조론/철학과 정치

스켑틱스/기타 주제
KOPSA 박물관

 

대중매체 모니터링
질문과 답

토론방법
토론사례

연구회원 게시판
연구위원 게시판

 

자유토론
   
  인간 게놈 백과사전 완성: 게놈은 유전자의 단순한 집합체가 아니다
  글쓴이 : 노을추억     날짜 : 12-09-10 11:22     조회 : 2122    
   http://mirian.kisti.re.kr/global/global_v.jsp?cn=GTB2012090128&service… (761)
인간의 게놈(genome: 유전체)은 유전정보의 총체(總體)로서, 단백질을 코딩하는 유전자 말고도 다양한 정보를 포함하고 있는 것으로 밝혀졌다. 1990년대 후반, 일단(一團)의 과학자들이 인간 게놈의 염기서열을 분석하는 인간 게놈 프로젝트(human genome project)를 시작하기로 결정했을 때, 그들은 `전통적 개념`의 유전자를 발견하여 생명현상을 유지하는데 필요한 모든 단백질들을 밝혀내는데 초점을 맞추었다. 즉, 그들은 고등학교 생물 교과서에 나오는 `전통적 개념`에 따라, "모든 유전자는 DNA를 이루는 개별적 구성요소(a discrete piece)이며, DNA의 염기서열은 곧 특정 단백질의 코드"라고 생각했던 것이다.

그러나 각고의 노력 끝에 인간 게놈을 해독하는데 성공한 과학자들은 - 놀랍게도 - "유전자가 게놈 전체에서 차지하는 비율은 불과 3% 미만이며, 유전자 사이에는 수십억 개의 다른 염기가 존재한다"는 사실을 깨닫게 되었다. 유전자 사이에 존재하는 염기들은 아무런 목적을 수행하지 않는 것처럼 보였으며, 그들은 이것을 쓰레기 「DNA(junk DNA)」라고 불렀다.

이제 미 국립보건원(NIH)이 후원하는 「DNA 구성요소 백과사전(ENCODE: Encyclopedia of DNA Elements)」이라는 이름의 다국적 프로젝트팀은 "「쓰레기 DNA」 중 상당 부분이 인간의 생명현상을 유지하는데 일익을 담당한다"는 사실을 밝혀냈다. 그들에 의하면, 이들 DNA는 특정 유전자가 발현(on)되거나 침묵(off)하는 것을 도와주는 스위치의 역할을 하며, 어떤 세포가 신장 세포가 되고 어떤 세포가 뇌세포가 되는 것은 바로 이 스위치 때문이라고 한다. 이번 프로젝트가 제공하는 통찰력은 과학자들이 「유전과 질병 사이의 관련성」을 이해하는데 큰 도움을 줄 것으로 보인다. "우리가 이번 프로젝트를 통해 질병 연구자들에게 제공하는 정보는 다른 분야의 과학자들이 도저히 제공할 수 없는 것들"이라고 ENCODE를 이끈 유럽 유전정보학 연구소(European Bioinformatics Institute, 영국 힝스턴 소재)의 이완 버니 박사(생물정보학)는 말했다. "게놈 속에는 유전자 말고도 많은 정보들이 포함되어 있다"고 예일 대학의 마크 거스타인 박사(생물정보학)는 말했다.

ENCODE에 참가한 32개의 연구기관, 442명의 과학자들은 (게놈을 구성하는) 30억 개의 염기들이 수행하는 역할을 개별적으로 파악하기 위해, (6가지 유형으로 대별되는) 147개의 인간 세포를 대상으로 컴퓨터 분석, 생화학적 검사, 염기서열 분석을 실시하였다. 분석 결과, 기존의 통념과는 달리 게놈의 약 80%가 생화학적 활성을 보유하는 것으로 밝혀졌다. 그들은 이러한 연구결과를 정리하여 Nature 9월 6일호에 발표하였다.

연구진에 의하면, DNA 염기 중의 일부는 유전자의 활성에 영향을 미치는 단백질의 착륙지점(landing spot)이 되고, 일부 염기는 RNA 가닥으로 전환되어 자체적인 기능(예: 유전자 발현 조절)을 수행하는 것으로 밝혀졌다. [RNA는 흔히 `단백질의 합성을 돕는 중간 매개자(intermediary messenger)`로 간주된다. 그러나 ENCODE에 의하면, 상당수의 RNA는 그 자체로서 완제품(end product)이며, 단백질을 생성하는데 사용되지 않는다고 한다.] 그리고 다수의 염기들은 화학 수식(chemical modifications)이 일어나는 장소를 제공하여, 염색체의 신장부(stretches)를 침묵시키는 데 기여하는 것으로 밝혀졌다.

ENCODE의 결과는 유전자에 대한 과학자들의 생각을 바꿔 놓을 것으로 보인다. ENCODE에 의하면, 게놈 DNA의 76%는 몇 가지 종류의 RNA로 전사된다고 하는데, 이는 당초 과학자들이 예상했던 것을 상회하는 수준이다. ENCODE에 의해 밝혀진, 게놈의 DNA에 포함된 정보들을 요약하면 다음과 같다:

① 21,000개에 약간 못 미치는 단백질 코딩 유전자 - 한때 일부 과학자들은 이러한 유전자가 10만 개 이상이라고 추정했었다.
② 8,800개의 짧은 RNA(small RNA)와 9,600개의 기다란(200bp 이상) 비코딩 RNA(long noncoding RNA)
③ 僞유전자로 분류되는 11,224개의 신장부(stretches) - 위유전자란 기능을 상실한 `죽은 유전자`로, 특정인이나 일부 세포에서는 활성을 보유한 것으로 알려져 있다.

더욱이 연구진이 각 유전자들의 코딩 영역(coding region)에서 시작 부분(beginning end)을 분석한 결과, 여러 유전자들은 서로 중첩되며, 각자 복수(複數)의 시작 부분과 끝 부분을 보유하고 있는 것으로 나타났다.

ENCODE는 인간의 DNA에서 400만 개의 지점(spots)을 발견했는데, 이 지점들은 유전자의 활성을 조절하는 스위치로 작용하는 것으로 밝혀졌다. 이 스위치들은 대상 유전자에 근접해 있거나 멀리 떨어져 있는데, 상이한 조합(組合)을 이루어 상이한 세포들에게 독특한 유전적 정체성(genomic adentity)을 부여하는 것으로 나타났다. 더욱이 게놈에 의해 생성되는 일부 RNA 가닥들 역시, 특정 유전자로부터 생성되는 단백질의 양을 조절하는데 기여한다고 한다. 따라서 특정 유전자의 활성을 조절하는 과정은 지금껏 생각되었던 것보다 훨씬 복잡한 것으로 보인다.

ENCODE의 결과는 9월 5일자 Nature에 6편의 논문으로 실렸으며, 일부는 Genome Research and Genome Biology에 실렸다. Science(온라인판)에도 2건의 논문이 추가로 게재되었다. ENCODE 팀은 이번 연구결과를 바탕으로 하여 모든 상이한 염기의 역할을 보여주는 지도(ENCODE map)를 제작하였는데, 마치 구글맵처럼 인간의 게놈을 속속들이 보여준다. 예컨대, 우리는 구글맵으로 특정 지역을 다양한 관점에서 바라보고 확대 축소를 자유자재로 할 수 있는데, ENCODE 맵 역시 염색체 수준에서부터 개별 염기 수준까지 확대와 축소가 가능하며, 관점을 바꾸어 특정 염기가 RNA를 생성하는지, 아니면 DNA 조절 단백질(DNA-regulatory proteins)이 결합하는 장소인지를 살펴볼 수도 있다(http://genome.ucsc.edu/ENCODE/aboutScaleup.html). "ENCODE는 인간 게놈에 대한 우리의 생각과 그것을 활용하는 방식을 바꿀 것"이라고 ENCODE에 참가한 존 스태마토이아노폴로스 박사(워싱턴 대학교)는 말했다.

ENCODE의 내용 중 상당 부분은 인터넷을 통해 만천하에 공개된 상태이며(http://genome.ucsc.edu/ENCODE/), 스태마토이아노폴로스 박사를 비롯한 과학자들은 「게놈이 질병에 미치는 영향」을 연구하기 위해 이 정보를 이미 활용하고 있다. 많은 대규모 연구들은 특정 염기의 변화(돌연변이)가 (당뇨병에서 관절염에 이르기까지) 각종 질병의 발병 위험을 증가시키거나 감소시킨다고 밝혀 왔는데, ENCODE를 이용하면 해당 돌연변이가 유전자 조절에 관여하는지, 만일 그렇다면 어떤 유전자의 발현을 조절하는지를 알아낼 수 있다. "ENCODE의 데이터는 질병 연구의 토대로 활용될 것"이라고 캐나다 토론토 대학에서 암과 후성유전학 간의 관계를 연구하는 마티유 루피엔 박사(분자생물학)는 논평했다.

※ 원문정보:
1. The ENCODE Project Consortium, "An integrated encyclopedia of DNA elements in the human genome", Nature 489,57?74(06 September 2012)doi:10.1038/nature11247
2. International Human Genome Sequencing Consortium Nature 431, 931?945 (2004).
3. The ENCODE Project Consortium Nature 447, 799?816 (2007).
4. Thurman, R. E. et al. Nature 489, 75?82 (2012).
5. Neph, S. et al. Nature 489, 83?90 (2012).
6. Gerstein, M. B. et al. Nature 489, 91?100 (2012).
7. Djebali, S. et al. Nature 489, 101?108 (2012).
8. Sanyal, A., Lajoie, B. R., Jain, G. & Dekker, J. Nature 489, 109?113 (2012).