/

미생물 암흑 물질의 계통 발생 및 코딩 가능성에 대한 통찰력

미생물 암흑 물질의 계통 발생 및 코딩 가능성에 대한 통찰력

현재 미생물 유전자는 대부분 미생물을 배양할 수 없다. 역사적으로 부족한 현상으로 계통발생학적 범위가 제한적이다. 과학자들은 단세포 유전체학을 미생물 암흑 물질이라고 부른다. 암흑 물질은 미개척 교균 및 세균 세포를 대상으로 배열한다. 미생물은 지구상에서 가장 다양하고 풍부한 세포 생물이다. 미생물 종류는 수백만 종으로 예측된다.

대규모 단일 세포 미생물 유전체학

과학자들 후보 계통에서 풍부한 서식지를 식별하기 위해 커뮤니티 프로파일링을 사용하여 수많은 물리 화학적 및 지리적으로 다양한 환경 샘플을 선별하는 것으로 시작했고 심층 단일 세포 분석을 위해 9개를 목표로 삼았다. 새로운 계통을 나타내는 세포는 높은 처리량의 단일 세포 흐름 정렬, 전체 유전자 증폭 및 단일 증폭 유전자의 스크리닝을 사용하여 식별되었다. 21개와 8개의 고도로 과소 표현된 주요 박테리아 및 고고학적 계통을 대표하는 총 201개의 SAG가 전체 유전자 시퀀싱을 위해 선택되었다. 어셈블리를 개선하기 위해 SAG 시퀀스 데이터를 디지털 표준화하여 증폭 바이어스로 인한 과표현 영역을 줄였다. 테트라 뉴클레오타이드 주파수, BLAST 및 단일 복사 마커 유전자 분석을 사용하여 결과 어셈블리의 충실도를 검증했습니다. 초안 SAG의 크기는 148 킬로 베이스 쌍에서 2.4까지 다양했다. Mb는 어셈블리당 평균 59개의 주요 콘티 그로 구성됩니다. 유전자 완전성은 139개의 박테리아 유전자와 162개의 고고학적 보존 마커 유전자의 유무에 기초하여 10% 미만에서 90% 이상까지로 추정되었다. 동일한 모집단에 속하는 단일 세포의 판독, 즉 평균 뉴클레오타이드 동일성이 97% 이상인 것을 결합하면 조립체가 개선되고 90% 이상의 완성도를 가진 7개의 집단 유전자가 생성된다.

유전체 기반 계통학적 추론

SSU rRNA 트리는 측면 유전자 전달에 의한 수직 하강이 모호함에도 불구하고 계통발생적 참신성의 건전한 예측자로 알려져 있다. 그러나 보편적으로 분포된 여러 단일 복사 마커 유전자의 연결 정렬은 일반적으로 종 트리를 추정하기 위한 어떤 개별 유전자보다 더 큰 계통발생학적 분해능을 제공하는 것으로 간주된다. 과학자들 15개의 분류군 구성과 함께 일반적으로 사용되는 보존 마커 유전자 최대 38개의 연결을 기반으로 부트스트랩 최대 가능성 트리를 구성했다. 대체 모델은 긴 가지 유도를 포함한 알려진 문제를 해결하기 위해 선택되었다. 개별 마커 유전자 토폴로지의 상호 일치성을 독립적으로 평가하여 유전자 트리 재구성을 위한 이러한 유전자 패밀리의 선택을 확인하였다. 3명 이상의 SAG 대표를 가진 모든 후보 계통군은 그들의 rRNA 서술과 일치하는 단 계통군으로 해결되었다. 이것들은 후보 박테리아 계통 SAR406, OP3, OP8, WS1, WS3, BRC1, CD12, EM19, EM3, NKB19, Oct-Spa1-106에 대한 최초의 실질적인 유전자 데이터이다. 과학자들 추론된 생리학 및 구별되는 특성을 기반으로 두 명 이상의 대표자를 가진 후보 계통 이름을 제안한다. 연결된 유전자 데이터 세트가 제공하는 더 큰 계통발생학적 해상도 덕분에 rRNA 계통발생과 비교하여 계통발생 간에 많은 강력한 연관성을 식별할 수 있었다. 여기에는 rRNA 분석에 기초하여 전립 선충류와 전립 선충류를 포함하는 것으로 제안된 잘 알려진 전립 선충류(Planctomycetes-Verrucomicrobia-Clamidiae superphophylum)가 포함된다. 유전자 기반 분석은 이러한 그룹화를 확인했고 과학자들 옴니 트로피카 유전자에서 제안된 PVC 시그니처 유전자를 발견했다. 피브로박테레스-클로로비-박테로이데스 초문(Fibrovacteres-Clorobi-Bacteroidetes superphylum)은 마리니미크로비아, 라테시박테리아, 클로아시모네테스, 젬마티모나데스, 칼디트릭스와 함께 강력하게 해결되었다. 비교 유전체학은 세포외단백질효소의 보존된 카르복시 말단 도메인이 FCB 초문 멤버에서만 발견된다는 것을 밝혔다. 여기에는 원래의 섬유 박테리아 계통, 클로로비 계통, 박테로이데스 계통, 후보 계통인 클로아시모네테스 계통, 마리니미크로비아 계통, 라테시박테리아 계통, 칼디트릭스 계통 등이 포함된다. ‘지상적’ 박테리아 계통인 악티노박테리아, 시아노박테리아, 테르미, 클로로플렉시, 피르미쿠테스로 구성된 테라 박테리아는 아르마 티모나데테스의 추가 멤버로 우리의 분석에서 해결되었다. 아마도 테라 박테리아를 통합하는 육지에서의 삶에 대한 고대의 적응 주장보다 더 설득력 있는 것은 세포 외피 구조의 공통점일 것이다. 이 초문(超文)은 단배엽과 비정형 단배엽 계통을 포함한다. 과학자들 단배엽과 단배엽의 가장 특징적인 유전자에 대해 추가로 제안된 테라 박테리아 계통군을 평가하고 모든 유전자가 단배엽과 유사하거나 비정형적인 유전자 보체를 가지고 있음을 확인했다. Cloacimonetes의 계통발생학적 위치는 rRNA 비교 분석에 기초하여 결정적이지 않았다. 원래 후보 문으로 제안되었으며 최근에는 스피로카에테스 문 내의 분류로 제안되었다. 이 그룹의 유전자 표현을 상당히 확장한 우리의 분석은 스피로채테스와의 특정 제휴에 대한 지지를 찾지 못했다. 더 작은 데이터 세트를 기반으로 Acidobacteria가 Deltaprotobacteria와 재현적으로 군집한다는 것이 제안되었지만, 이는 우리의 분석에 의해 뒷받침되지 않는다. 대신에, 아시도박테리아는 아미나세난테스와 번식할 수 있게 제휴한다. 후보문 OP11은 원래 제안된 바와 같이, OP11, OD1, SR1을 포함한 여러 계통군으로 세분화하자는 제안을 이끌어내는 단 계통군으로서 일관되게 해결되지 않았다. 여기서 과학자들 마이크로 유전자과 파쿠 박테리아 유전자는 그라실리박테리아와 함께 연결된 마커 유전자 분석을 기반으로 한 단 계통군으로 재현적으로 해결되었다는 것을 발견했다. 이러한 연관성을 인식하기 위해, 과학자들 이러한 계통 33의 감소된 대사 용량을 반영하는 초문명 ‘Patescibacteria’를 제안한다. 과학자들 더 큰 박테리아 특정 마커 유전자 세트를 사용하여 파테 스키 박테리아와 테라 박테리아 사이의 특정 연관성에 대한 지지를 발견했다. 이 연관성은 파테스시박테리아에서 단배엽과 유사한 유전자 보체와 일치하지만, 이러한 계통에 속하는 추가 유전자는 사용 가능할 때 검증될 필요가 있다. 우리의 고고학적 단세포 유전자과 칸디다투스 파바르카이움, 칸디다투스 미크라르카에움, 칸디다투스 나노살리나나룸, 칸디다투스 나노살리나룸과 같은 최근 설명된 매우 작은 세포의 유전자 서열 계통에 대한 계통발생학적 분석을 바탕으로, 과학자들 디아프로트로테스, 파르카에오타, 아에니그마코타, 나노할로아카에 대해 제안한다. ota, Nanohaloarchaeota는 최근에 제안된 분류 Nanohaloarchaea를 포함하고 있는데, 이는 부적절한 아웃 그룹 표현으로 인해 Euryarchaeota에 잘못 배치되었다. 과학자들 작은 세포와 유전자 크기가 이러한 계통수의 특징을 통일하고 있으며, 고고학적 나무에서 나노아르카에오타와 함께 이러한 계통들이 우리가 식별자 DPANN을 제안하는 단 계통적 초문군을 형성한다고 예측한다. 고고학적 영역에 대한 확장된 유전자 표현과 분석은 또한 TACK 슈퍼 p에 대한 제안을 지지한다. 그러나 최근 36개의 유전자 데이터 세트를 사용하여 재조사된 진핵생물을 고고학적 영역 내에 두는 에오사이티 가설과 일치하지 않는다. 더 많은 유전자과 개선된 계통적 추론 방법이 손에 들어오면, 우리가 제안한 계통 묘사는 더 평가될 수 있다.

기능적 다양성과 새로운 발견

배양된 미생물이 에너지와 영양분을 얻기 위해 사용하는 수많은 전략은 미배양 미생물 대다수에 많은 대사 놀라움이 남아 있음을 시사한다. 여기서 과학자들 조사된 많은 후보 계통 및 새로운 계통들의 잠재적인 기능적 다양성을 처음으로 엿볼 수 있다. 우리 연구에서 대부분의 박테리아와 몇몇 고고학적 단세포 유전자는 아미노산과 당의 분해를 위한 많은 유전자 배열을 가지고 있는데, 이는 이질적인 생활 방식을 가리킨다. 과학자들 파쿠 박테리아, 마이크로게노마테스, 그라실리박테리아 및 라테시박테리아 구성원을 제외하고 대부분의 세균 SAG에서 전자 수송 사슬에 대한 증거를 찾았고, 따라서 더 완전한 세포 호흡 과정을 수행할 수 있는 능력을 발견했다. 탄소 고정에 필요한 유전자는 세균 SAG에서 더 제한적인 분포를 보이는 광범위한 고고학적 SAG에서 발견되었다. 수소 대사는 새로운 계통 사이에 널리 퍼져 있으며, 두 개의 SAG는 황 이용에 대한 유전자를 가지고 있다. 글리신에 대한 오팔 스톱 코돈 UGA의 새로운 기록이 그라실리박테리아에서 확인되었다. 최근 후보 문 SR1에서 동일한 기록이 발견되고 생화학적으로 검증되었으며, 이는 코돈 재분배가 특성화되지 않은 계통에서 계통발생적으로 널리 퍼져 있을 수 있음을 시사한다. 이것은 이전에 셀레노시스테인과 트립토판에 대해 보고된 UGA에 대한 알려진 대체 코딩을 확장한다. Gracilibacteria 단세포 유전자의 매우 낮은 구아닌-사이토신 함량은 특히 글리신이 세 번째로 일반적으로 사용되는 아미노산이기 때문에 UGA의 재코딩을 더 낮은 구아닌-사이토신 글리신 코돈 대체물로 이끌었을 수 있다. 퓨린 생합성은 박테리아와 고균에서 리보핵산 포밀화를 담당하는 경로의 두 번째 단계 측면에서 고도로 보존된다. 지금까지 서열화된 모든 박테리아는 이 단계를 위해 PurH1 효소를 사용하는 반면, 고균의 대다수는 PurP 효소를 사용한다. 그러나, 박테리아 초문인 파테스시박테리아의 구성원들은 PurH1 유전자를 가지고 있지 않으며, 대신에 대부분의 퓨린 생합성 수술의 고대 측면 전달의 결과로 파테스시박테리아의 조상에게 Euryarchaeal PurP와 유사한 유전자를 가지고 있다. DPANN 초문에는 외래 유전 요소를 공동 채택할 수 있는 능력을 나타내는 여러 가지 대사 신규성이 포함되어 있다. 나노아르카에오타 유전자는 슬라임 곰팡이 딕티오스테륨 디스코이데움과 가장 밀접한 관련이 있는 산화환원효소를 암호화하고 이 유전자에 대한 진핵 진화 방사선 내에 위치한다. 우리가 아는 한, 이것은 진핵생물에서 고균으로의 측면 유전자 이동의 첫 번째 사례이다. 시그마 인자는 박테리아에서만 발견되는 RNA 전사 개시 인자로, 고균에서 보존된 시그마 인자 도메인이 보고되었다. 여기서 과학자들 특히 디아페로이트의 두 멤버와 나노아르카에오타의 한 대표에서 고균에서 완전한 박테리아 같은 시그마 인자의 첫 사례를 보고합니다. 이는 세균 공여체로부터 다수의 횡방향 전달의 결과인 것으로 보인다. 세 가지 시그마 인자는 모두 비필수 γ70 그룹에 속하며, 숙주는 표준 고고학적 TATA 결합 단백질 유전자 조절 장치를 유지하며, 이는 공동 선택된 전체 길이의 박테리아 시그마 인자가 유전자 조절의 특수한 사례에 사용되거나 다른 기능을 제공한다는 것을 시사한다. 자명종이라 불리는 다중 도메인 신호 전달 분자의 배치에 기초한 잘 설명된 박테리아 엄격한 반응은 디아페로트라이트와 나노아르카에오타 각각 하나의 구성원에서 확인되었다. 이는 RelA/SpoT 상동체 슈퍼패밀리에 속하는 주요 ppGpp 합성 유전자의 박테리아 공여체로부터의 고대 이동의 결과로 보인다. 다수의 에우리아르카에오타에서 추정 단일 도메인 알람톤이 발견되었지만, 이것은 합성효소, 가수분해효소 및 조절 도메인을 포함하는 완전한 다중 도메인 고고 알람톤에 대한 첫 번째 보고이며, 일부 DCANN 고균은 세포 내 신호의 감각에 반응하여 ppGpp를 생성할 수 있음을 시사한다. 마지막으로, 나노아르카에오타의 두 멤버에서 박테리아와 유사한 용혈성 트랜스글리코실레이스가 발견되었다. 이 효소는 박테리아에 어디에나 존재하며 펩티도글리칸 천골 내에서 생합성, 재활용 및 세포 분열을 위한 공간을 만드는 역할을 하며, 강력한 활성 때문에 엄격하게 조절된다. 고균은 펩티도글리칸이 부족하고 나노아르카에오타에서 펩티도글리칸 합성에 대한 증거가 없기 때문에, 과학자들 뮤레인 트랜스글리코실레이스가 세포에서 분비되어 박테리아에 대한 방어 메커니즘으로 사용되거나 아마도 박테리아와 세포 간 상호 작용을 촉진하는 메커니즘으로 사용될 것으로 추측한다.

미생물 유전체의 계통학적 고정

유전체학의 주요 과제는 익명의 유전자 조각의 계통발생학적 기원을 결정하는 것이다. 유전체 단편을 분류하는 우리의 능력은 고도로 편향된 참조 유전자 데이터 세트에 반영된 MDM의 엄청난 언더 샘플링으로 인해 방해를 받는다. 우리의 계통발생학적으로 새로운 단세포 유전자 세트가 메타 유전체 비닝을 개선하는지 여부를 결정하기 위해, 과학자들 201개의 SAG가 있거나 없는 비중복 데이터베이스에 대해 공개적으로 사용 가능한 메타 유전체 893개를 분류했다. 이러한 메타 유전자의 절반 이상이 새로운 또는 개선된 읽기 앵커를 보여주었으며, 이는 총 3억 4천만 번의 읽기를 차지했다. 이 평균 비율은 작아 보일 수 있지만, 일부 메타 유전자의 경우 최대 20%의 고정률을 달성하여 미생물 다양성의 계통발생학적으로 유도된 유전자 특성화의 필요성을 강화했다. 도 4에는 MDM-SAG-enable read anchoring이 2% 이상인 메타 유전자를, 기타 메타 유전자는 모두 부칙에 나타내었다. 평균적으로 재분류된 3억 4천만 개의 판독치 중 BLASTX 일치률은 약 27%의 아미노산 동일성이 증가하여 이러한 판독치의 3분의 2에 대해 더 높은 해상도를 할당하였다. 이 중 78%와 22%는 각각 문체 수준에서 새로 배정되거나 재 할당되었다. 가장 두드러진 개선은 마리니미크로비아, 아미나세난테스, 클로아시모네테스, 파쿠 박테리아, 아티 박테리아, 마이크로게노마테스를 포함한 SAG 데이터 세트에서 잘 표현되는 계통군에 속하는 지배적인 개체군으로 구성된 서식지에서 볼 수 있었다. 이러한 개선에도 불구하고, 475개의 메타 유전자의 읽기 대부분은 MDM 탐사의 지속적인 필요성을 증명하는 도메인 수준을 넘어 분류될 수 없었다.