/

세 개의 척추 스틱백 적응적 진화의 유전체 기반

세 개의 척추 스틱백 적응적 진화의 유전체 기반

스틱백은 온대 수역에서 서식하는 물고기이다. 스틱백은 세 개의 척추를 가지고 있고 유라시아와 북아메리카에 서식한다. 스틱백은 빙하기 이후 형성된 수천 개의 하천과 호수에서 적응적 진화를 한다. 과학자들은 세 개의 척추 스틱백의 유전체 샘플을 얻게 된다. 그들의 연구는 스틱백에 대한 놀라운 결과를 알려준다.

세 개의 척추 스틱백 샘플 생성

스틱백 진화에 대한 연구를 용이하게 하기 위해, 과학자들은 먼저 알래스카 베어포 호수에서 온 동형 담수 스틱백으로부터 참조 유전체 어셈블리를 생성했다. 서열화된 개체는 부분적으로 교배되었고 700개의 염기쌍 중 약 1개의 이형접합성을 유지하였다. 조립품인 가스 Acu1.0은 Sanger 시퀀스 데이터에서 9.0배 커버리지로 생성되었으며 길이 가중 중위수 콘티그 크기는 2 킬로 베이스, 길이 가중 중위수 비계 크기는 10.8 메가 베이스, 총 갭 크기는 463Mb로 이전 추정치인 530Mb에 근접한다. 가장 큰 113개의 비계들은 해양-담수 교차로에 있는 스티클백 연결 그룹에 고정되었다. 1,812개의 작은 비계 중 Mb는 고정되지 않은 채로 남아 있다. 부분적으로 교배된 단일 개체의 사용, 다양한 유전체 라이브러리 크기의 구축 및 조립, 그리고 스틱백 유전체의 비교적 낮은 반복 및 복제 내용은 다른 공개된 텔레 오스트보다 훨씬 큰 콘티그 및 스캐폴드 크기를 가진 매우 연속적인 고정 유전체 어셈블리를 생성했다. 스틱백 서열은 Ensembl 파이프라인을 사용하여 주석을 달았는데, 이 파이프라인은 20,787개의 단백질 코딩과 1,617개의 RNA 유전자를 예측했다. 단백질 코딩 유전자 중 7,614개는 포유류와 일대일 맞춤법을, 192개는 어류 간 일대일 맞춤법을 각각 보였다. 다른 5,981개의 유전자는 스틱백 적응에 기여하는 일부 혈통 특이적 유전자 확장을 포함하여 복잡한 정형 관계를 보여주었다. 스틱백 유전체의 총 13.4%는 파스트콘을 사용하는 다른 물고기와 비교했을 때 진화적 제약을 받는 것으로 보였다. 보존된 부분은 단백질 코딩 서열과 비코딩 서열로 대략 균등하게 나뉘었고, 후자의 약 71%는 포유류와 공유되었고, ~29%는 어류 고유의 보존 서열을 나타낸다.

추가 스틱백 모집단 쌍 순서 지정

스틱백에서 반복되는 진화의 기초가 되는 위치를 찾기 위해, 과학자들은 먼저 특징적인 해양 및 담수 형태를 보여주는 개체군을 식별했다. 다양한 해양과 담수 환경에 반복적으로 적응하면서 체형, 길이, 깊이, 지느러미 위치, 척추 길이, 눈 크기 및 갑옷 번호에 현저한 상관관계가 있는 변화를 초래했다. 이러한 형질을 제어하는 정량적 형질 위치가 많은 다른 염색체에 매핑되기 때문에, 이 형태학적 화면은 해양과 담수 간의 차이에 기초하는 적응적 위치의 유전체 전체 범위에서 서로 다른 개체군을 식별해야 한다. 해양 물고기와 민물 물고기의 뚜렷한 형태학적 군집으로부터, 과학자들은 해양-담수 하이브리드 구역을 가진 강의 반대쪽 끝에서 온 개인을 포함하여 태평양과 대서양 개체군 모두에서 여러 해양-담수 쌍을 선택했다. 샘플링 전략은 유전체의 중립 영역의 국소 교환 기회를 최대화하는 동시에 데이터 세트의 지리적 편향을 최소화해야 한다. Illumina 시퀀싱을 사용하여 개인당 평균 2.3배 커버리지를 생성했습니다. 단일 뉴클레오티드 다형성을 식별하기 위해, 과학자들은 모든 물고기의 데이터를 모았고 최소 4개의 읽기가 변형 대립 유전자를 지원하는 위치를 식별했다. 이 기준은 5,897,368명의 후보 SNP를 식별했으며, 대부분은 실험 검증에 기초한 참 양성이었다.

병렬 진화에 대한 유전체 전체 조사

이전의 연구는 스틱백의 반복적인 갑옷 진화가 EDA 위치의 고대 변형을 통해 발생한다는 것을 보여주었는데, 이는 여러 담수 개체군에서 재사용되고 강력한 선택을 받을 수 있다. 해양 물고기와 민물 물고기의 적응적 분기 동안 대립 유전자가 유사하게 반복적으로 사용된 위치를 식별하기 위해, 과학자들은 대부분의 민물 물고기의 서열이 서로 유사하지만 해양 개체군에서 일반적으로 발견되는 서열과 다른 영역을 찾기 위해 두 가지 방법을 사용했다. 이 패턴은 개별 담수 개체군에 고유한 적응 변형을 식별하지 않고 개체군에 걸쳐 생물학적 복제의 놀라운 증거를 가진 변종에 초점을 맞춘다. 먼저, 과학자들은 21명의 개인들 사이에서 가장 일반적인 20개의 유전적 관계 패턴을 식별하기 위해 자체 조직 지도 기반 반복적 은닉 마르코프 모델을 개발했다. 유전체 영역은 HMM 전이를 사용하여 정의된 경계와 함께 우도에 따라 패턴 유형에 할당되었다. 이 방법은 분해능이 증가하는 국소 유전체 기반으로 반복되는 계통 발생 패턴을 반복적으로 모델링한다. 유전체의 대부분은 개체군 사이의 지리적 관계를 설명하는 나무에 할당되었다. 2,096,101 bp로 구성된 총 215개 지역이 대부분의 해양 물고기와 대부분의 민물고기를 분리하는 4개의 나무 중 하나에 할당되었다. 여과 후, 가장 일반적인 해양-담수 발산 나무는 중앙 크기가 4,266 bp인 90개의 유전체 영역을 확인했고, 848,691 bp를 덮었다. 둘째, 과학자들은 유전체에서 각각 877,568개의 겹치는 창에 대해 21*21 쌍으로 뉴클레오티드 발산 행렬을 구축하는 것을 기반으로 한 유전적 거리 기반 접근법을 사용했다. 각 거리 행렬은 해양-담수 클러스터 분리 점수를 계산하기 위해 사용되었으며, 생태형 내 변동을 고려한 후 해양 클러스터와 담수 클러스터 사이의 평균 거리를 정량화했다. 점수는 유전적 거리와 높은 상관관계가 있지만, 높은 발산 하에서 분해능이 증가한다. 순열 테스트 후, 과학자들은 총 1,214,500 bp를 커버하는 174개의 해양-담수 발산 지역과 2% FDR에서 479,500 bp를 커버하는 84개의 발산 지역을 복구했다. 매우 다양한 유전체 영역에서 클러스터 멤버십을 할당하기 위해, 과학자들은 또한 안내되지 않은 베이지안 모델 기반 데이터 기반 클러스터링을 사용했다. 유전체의 각 창에 대해, 과학자들은 가장 가능성이 높은 별개의 물고기 군집과 군집 구성원 수를 추정했다. 독립적인 SOM/HMM과 CSS 접근 방식은 모두 앞서 설명한 염색체 IV EDA 위치를 가장 높은 점수를 받는 해양-담수 분기 영역 중에서 성공적으로 복구한다. 특히, DDC가 할당한 클러스터 멤버십은 스틱백의 주요 위치를 제어하는 장갑판 차이에 대한 다년간의 위치 복제 연구에 의해 이전에 정의된 최소 16kb 공유 담수 EDA 하플로 타입의 중단점을 성공적으로 재구성한다. 발달 신호 유전자 WNT7B를 둘러싼 영역과 호르몬, 신경전달물질 결합 및 신진대사에 관여하는 위치를 포함하여 유사한 해양-담수 발산 패턴을 가진 추가 영역이 동일한 염색체에서 확인되었다. SOM/HMM과 CSS는 두 방법 중 하나로 확인된 242개 영역과 둘 다로 확인된 147개 영역을 포함하여 세계적으로 공유된 해양-담수 분산을 보여주는 많은 다른 위치를 정의했다. 회복된 영역의 중앙 크기는 개별 유전자의 크기에 근접하며, 종종 염색체 XIX의 BANP와 RAS 사이에서 식별된 비부호화 영역과 같이 순수하게 유전자 간 영역을 강조한다. SOM/HMM 및 CSS 분석으로 복구된 11개 영역의 SNP에 대한 유전자형 분석을 사용하여, 테스트된 영역의 91%가 독립적인 해양 및 담수 개체군에서 생태형 대립 유전자의 유의미한 농도를 보인다는 것을 발견했다. 이러한 결과는 과학자들의 실험 설계가 구별되는 해양 및 담수 생태형의 병렬 진화와 일관되게 알려진 새로운 위치를 모두 성공적으로 식별한다는 것을 확인한다. 유전체 전체와 비교하여, 해양-담수 진화의 반복에 관련된 242개 영역은 유전자 밀도가 더 높고 유전자 간 영역에서 보존된 비코딩 서열의 농도가 더 높다는 것을 보여주며, 아마도 더 복잡한 조절 구조를 반영할 것이다. 유전자 온톨로지 분석은 신호에 대한 세포 반응, 유기체 간의 행동 상호작용, 아민과 지방산 대사, 세포-세포 접합 및 WNT 신호 전달에 관여하는 유전자의 상당한 농도를 보여준다. 이러한 생물학적 과정과 병렬 발산 분석에 의해 정의된 개별 유전자의 변화는 아마도 이전에 해양 및 담수 스틱백에서 기술된 형태, 생리학 및 행동의 반복적 차이를 뒷받침한다. 예를 들어, 유전체 조사에 의해 확인된 WNT7 B 및 WNT11 가족 구성원은 이전에 관의 길이와 직경을 수집하는 신장을 제어하는 파라클린 신호 전달 경로에 관련되었다. 민물에 사는 물고기는 해양 물고기에 비해 대량의 저소변을 생성하며, 민물에 대한 장기 적응은 상피 세포 분열을 양극화하고 다른 동물의 신장 관 형성을 조절하는 동일한 발달 신호 경로에서 변종을 선택할 수 있다.

하이브리드 영역에서의 병렬 재사용 범위

과학자들의 방법은 스틱백 진화 동안 반복적으로 사용되는 영역을 식별하지만, 그러한 영역이 특정 해양-담수 종 쌍에서 모든 차별화된 위치 사이에서 얼마나 널리 퍼져 있는지 알려주지 않는다. 이를 해결하기 위해 스코틀랜드 타인 리버의 해양-담수 하이브리드 구역에서 유전체 분화의 패턴을 분석했습니다. 이전의 연구들은 생태학적으로 매개된 후 공생물의 선택이 잡종화와 광범위한 유전자 흐름의 기회에도 불구하고 이 시스템에서 뚜렷한 생태형을 유지한다는 것을 보여준다. 타인 하이브리드 존의 양쪽 끝에서 한 쌍의 해양 물고기와 민물 물고기의 전체 유전체 염기서열 분석은 높은 분산을 가진 유전체 창 세트를 확인했다. 상위 0.1% 범위 내에서 35.3%는 세계적으로 공유되는 해양-담수 분기를 포함하고 있으며, 이는 이 해양-담수 종 쌍에서 고도로 분화된 대립 유전자를 가진 많은 지역(전부는 아니지만)의 고대 공유 기원을 나타낸다. 이전의 연구들은 스틱백의 일부 특성이 개체군마다 다른 독립적인 돌연변이에 의해 진화한다는 것을 보여주었다. 타인의 비글로벌 공유 발산 대립 유전자는 또한 최근 또는 국소적으로 발생한 적응 변이를 나타낼 수 있지만, 이러한 변이를 특정 형질과 연결하거나 스틱백 유전체의 중립적이지만 매우 가변적인 영역과 구별하기 위해 추가 연구가 필요할 것이다.

해양-민물 염색체 반전

하이브리드 시스템에서 적응적 분기가 발생할 때, 이론은 선택이 독립적인 적응적 위치 사이의 재조합을 억제하는 분자 메커니즘을 선호할 수 있다고 예측한다. 과학자들은 염색체 I, XI, XXI에서 각각 442kb, 412kb, 1,700kb에 걸쳐 높아진 CSS의 확장된 확장을 관찰했다. 경계에서 CSS 점수와 DDC 클러스터 할당의 급격한 전환을 기반으로, 과학자들은 염색체 역전이 이러한 확장된 영역을 설명한다는 가설을 세웠다. 해양 대형 삽입 세균 인공 염색체 라이브러리에서 쌍 끝 시퀀스 판독을 분석하여 민물 참조 유전체 어셈블리에 대한 크기 및 방향 이상을 가진 개별 클론을 식별했습니다. 염색체 I, XI, XXI에 매핑된 5개 이상의 비정상적인 클론을 가진 유일한 위치이며, 이러한 이상 징후는 해양 물고기와 민물 참조 유전체 사이에 역 염색체 세그먼트가 존재함으로써 해결될 수 있다. 예측된 반전 중단점을 측면으로 하는 시퀀스는 염색체 내 재조합에 의한 반전 생성과 일치하는 반전 반복을 포함한다. 특히, 염색체 XI 반전을 측면으로 하는 반복에는 전압 개폐 칼륨 채널 유전자 KCNH4에 대한 대체 엑손이 포함되어 있었다. KCNH4 전사는 반전 내에서 시작되므로 대체 반전 방향은 해양 및 담수 특이적 KCNH4 동위원소를 생성할 수 있다. 이러한 생태형 특이적 아이소폼의 기능적 결과는 알려지지 않았지만, KCNH4 상동어는 휴식 전류를 유지하고, 심장 수축성에 영향을 미치며, 마우스에서 교란될 경우 인지 작업에 대한 성능을 변화시킨다. 또한, 두 가지 뚜렷한 해양-담수 발산 형상에 대한 QTL은 이전에 염색체 XXI 반전의 넓은 영역에 매핑되었다. 만약 역전이 서로 다른 적응형 QTL 사이의 연결을 유지하는 데 도움이 된다면. 중요한 것은 DDC에 의한 개별 물고기의 군집 배정은 P에서 대부분의 해양과 담수 개체군이 있음을 보여준다. 반전 영역의 대조적인 형태에 대한 산성 운반. 대서양 분지에서 염색체 I, XI에 대한 유사한 생태형 연관성이 관찰되며, 염색체 XXI에 대한 연관성은 더 작다. 염색체 I와 XXI 영역 내의 유전자 마커는 잡종 영역에서 다형성이며, 인접한 상류 및 하류 어류에서 유전자형을 할 때 큰 빈도 차이를 보여 해양 및 담수 서식지에서 서로 다른 선택을 받는다는 것을 확인할 수 있다. 과학자들의 결과는 보이는 유전체 발산 패턴을 더 폭넓게 설명하는 데 도움이 되며, 염색체 역전이 자연 집단을 혼성화하는 데 있어 대조적인 에코 타입을 유지하는 일반적인 유전체 메커니즘이라는 증거를 추가하는 데 도움이 된다.