KR20220070075A

KR20220070075A - 아데노-관련 바이러스 변이체 캡시드 및 그 용도

Info

Publication number: KR20220070075A
Application number: KR1020227017132A
Authority: KR
Inventors: 데이비드 H. 크린; 멜리사 코터맨; 데이비드 샤퍼
Original assignee: 4디 몰레큘러 테라퓨틱스 아이엔씨.
Priority date: 2017-09-20
Filing date: 2018-09-19
Publication date: 2022-05-27
Also published as: EP3684423B1; DK3684423T5; EP4218828A3; CL2020000728A1; US20220251145A1; PT3684423T; SG11202002276VA; CN111836649A; WO2019060454A3; JP6825167B2; EP3684423A2; US11840704B2; AU2018337833B2; RU2020113681A; EP4218828A2; NZ763018A; BR112020005436B1; RU2020113681A3; MX2020003176A; IL273261A

Abstract

본원에서 모 AAV 캡시드 단백질에 대해 아미노산 서열에서 하나 이상의 변형을 갖는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이 제공되며, 이때 상기 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질은 AAV 비리온에 존재할 때 변형되지 않은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 하나 이상의 유형의 근육 세포의 증가된 감염성을 부여한다. 또한, 재조합 AAV 비리온 및 본원에 개시된 변이체 AAV 캡시드 단백질을 포함하는 이의 약학적 조성물, rAAV 캡시드 단백질 및 비리온의 제조 방법, 및 연구 및 임상 실습에서, 예를 들어 근육 질환 및 질병의 치료를 위한 하나 이상의 근육 세포로 핵산 서열의 전달에서 이들 rAAV 캡시드 단백질 및 비리온을 사용하는 방법이 제공된다.

Description

아데노-관련 바이러스 변이체 캡시드 및 그 용도{ADENO-ASSOCIATED VIRUS VARIANT CAPSIDS AND METHODS OF USE THEREOF}

본 출원은 2017년 9월 20일에 출원된 미국 가 특허출원 제62/560,901호의 혜택을 주장하며, 이들의 전체 개시 내용은 본원에 참고로 포함된다.

본원에 개시된 발명은 일반적으로 변이체 캡시드 단백질을 포함하는 아데노-관련 바이러스(AAV) 비리온의 분야 및 유도 진화 기술을 이용한 이 같은 변이체 캡시드의 생성에 관한 것이다.

근육은 다양한 중증 유전적 질환과 관련된다. 근육은 많은 근육 이상증 질병에 대한 유전자 요법에서 표적 조직이며, 또한 전신성 질병을 치료하기 위해 분비 인자를 생성하기 위한 바이오팩토리(biofactory)로서 잘 활용될 수 있다. 인간의 근육 조직에 치료 유전자를 전달하는 것은 근육-관련 질병을 치료하는 데 있어서 가장 긴급한 만족스럽지 못한 요구라는 것이 거의 틀림없다.

근육-유도 유전자 전달을 달성하기 위한 하나의 접근법은 유전자-기반 아데노-관련 바이러스(AAV)-매개 요법이며, 여기서 재조합 아데노 관련 바이러스(rAAV)는 하나 이상의 근육 세포에 유전자를 전달하는데, 예를 들어, 미싱 유전자(missing gene)를 대체하고, 우성 결함 유전자를 정정하거나, 또는 연속적인 단백질 치료를 위한 템플릿을 제공하는데 사용된다. AAV-기반 임상 유전자 요법이 점점 더 성공적이었지만, 예를 들어, 높은 효율로 근육의 원하는 세포를 표적화하는 것을 포함하는 바이러스 벡터 특성과 관련하여 결점이 여전히 많습니다. 따라서, 질병의 치료를 위해 근육의 세포에 더 효과적인 유전자-기반 전달을 제공할 수 있는 우수한 형질도입 능력을 갖는 새로운 AAV 변이체에 대한 필요성이 당업계에 존재한다. 당업계에 공지된 바와 같은 야생형 AAV 및 AAV 변이체와 비교하여,--일부 경우에 광범위하게, 다른 경우에서, 특정 근육 세포 유형에 대해 우선적으로-- 개선된 근육 형질도입 프로파일을 나타내는 이러한 AAV 변이체에 대한 필요성이 당업계에 존재한다.

자연적으로 발생하는 AAV는 3개의 오픈 리딩 프레임(open reading frame)인 rep, cap 및 aap를 함유하는 단일 가닥 DNA 바이러스이다. 첫 번째 유전자인 rep는 게놈 복제에 필요한 4개의 단백질(Rep78, Rep68, Rep52 및 Rep40)을 암호화하고, 두 번째, cap는 바이러스 캡시드를 형성하기 위해 조립되는 3개의 구조 단백질(VP1-3)을 발현하고, 세 번째는 캡시드 조립에 필수적인 조립 활성화 단백질(AAP)을 발현한다. AAV는 활성 복제를 위한 아데노바이러스(adenovirus) 또는 헤르페스바이러스(herpesvirus)와 같은 헬퍼 바이러스(helper virus)의 존재에 의존한다. 헬퍼 바이러스의 부재 하에 AAV는 게놈이 에피솜(episome)적으로 유지되거나 AAVS1 유전자좌(locus) 내의 숙주 염색체에 통합되는 잠복 상태를 확립한다.

시험관 내(in vitro) 및 생체 내(in vivo) 유도 진화 기술은 현재의 AAV 기반 유전자 전달 벡터보다 개선된 AAV 변이체을 선택하는데 사용될 수 있다. 이 같은 유도 진화 기술은 당해 기술 분야에 공지되어 있으며, 예를 들어, PCT 공보 WO 2014/194132 및 Kotterman ＆ Schaffer(Nature Review Genetics, AOP, published online 20 May 2014; doi: 10.1038/nrg3742)에 기재되어 있으며, 이의 전체 내용은 본 명세서에 참고로 포함된다. 유도 진화는 반복적인 유전적 다양화 및 선택 과정을 통해 자연적 진화를 모방하는 캡시드 공학 접근법으로, AAV 기반 비리온과 같은 생체 분자의 기능을 점진적으로 개선시키는 유익한 돌연변이의 축적을 가능하게 한다. 이 접근법에서 야생형 AAV cap 유전자는 바이러스 입자의 라이브러리를 생성하기 위해 일괄 처리되는 대형 유전자 라이브러리를 만들기 위해 다양화되고, 유전자 전달 장벽을 극복할 수 있는 우수한 표현형을 가진 독특한 변이체를 분리하기 위해 선택 압력이 가해진다.

AAV 변이체는, 예를 들어 미국 특허 제9,193,956호; 제9,186,419호; 제8,632,764호; 제8,663,624호; 제8,927,514호; 제8,628,966호; 제8,263,396호; 제8,734,809호; 제8,889,641호; 제8,632,764호; 제8,691,948호; 제8,299,295호; 제8,802,440호; 제8,445,267호; 제8,906,307호; 제8,574,583호; 제8,067,015호; 제7,588,772호; 제7,867,484호; 제8,163,543호; 제8,283,151호; 제8,999,678호; 제7,892,809호; 제7,906,111호; 제7,259,151호; 제7,629,322호; 제7,220,577호; 제8,802,080호; 제7,198,951호; 제8,318,480호; 제8,962,332호; 제7,790,449호; 제7,282,199호; 제8,906,675호; 제8,524,446호; 제7,712,893호; 제6,491,907호; 제8,637,255호; 제7,186,522호; 제7,105,345호; 제6,759,237호; 제6,984,517호; 제6,962,815호; 제7,749,492호; 제7,259,151호; 및 제6,156,303호; 미국 공개공보 제2013/0295614호; 제2015/0065562호; 제2014/0364338호; 제2013/0323226호; 제2014/0359799호; 제2013/0059732호; 제2014/0037585호; 제2014/0056854호; 제2013/0296409호; 제2014/0335054호; 제2013/0195801호; 제2012/0070899호; 제2011/0275529호; 제2011/0171262호; 제2009/0215879호; 제2010/0297177호; 제2010/0203083호; 제2009/0317417호; 제2009/0202490호; 제2012/0220492호; 제2006/0292117호; 및 제2004/0002159호; 유럽 공개공보 제2692731 A1호; 제2383346 B1호; 제2359865 B1호; 제2359866 B1호; 제2359867 B1호; 및 제2357010 B1호; 제1791858 B1호; 제1668143 B1호; 제1660678 B1호; 제1664314 B1호; 제1496944 B1호; 제1456383 B1호; 제2341068 B1호; 제2338900 B1호; 제1456419 B1호; 제1310571 B1호; 제1456383 B1호; 제1633772 B1호; 및 제1135468 B1호; 및 국제 (PCT) 공개공보 제WO2014/124282호; 제WO2013/170078호; 제WO2014/160092호; 제WO2014/103957호; 제WO2014/052789호; 제WO2013/174760호; 제WO2013/123503호; 제WO2011/038187호; 및 제WO2008/124015호; 제WO 2003/054197호에 개시되어 있지만; 이러한 참고 문헌들 중 어느 것도 본원에 개시된 AAV 변이체의 실시형태 및/또는 특징 및/또는 조성물 및/또는 물질 구조가 개시되어 있지 않다.

본 명세서 및 인용된 특허 문헌에 인용된 모든 문헌 및 참고 문헌은 본원에 참고로 포함된다.

발명의 요약

본원에서는 모(Parental) AAV 캡시드 단백질에 대해 아미노산 서열에서 하나 이상의 변형을 갖는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이 제공되며, 이때 상기 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질은 AAV 비리온에 존재할 때 변형되지 않은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 하나 이상의 유형의 근육 세포의 증가된 감염성을 부여한다. 또한, 재조합 AAV 비리온 및 본원에 개시된 변이체 AAV 캡시드 단백질을 포함하는 이의 약학적 조성물, 변이체 rAAV 캡시드 단백질 및 비리온의 제조 방법, 및 연구 및 임상 실습에서, 예를 들어 질환 및 질병의 치료를 위한 하나 이상의 근육 세포로의 핵산 서열의 전달에서, 이들 rAAV 캡시드 단백질 및 비리온을 사용하는 방법이 제공된다.

본원의 일부 양태에서, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이 제공되며, 이러한 변이체 AAV 캡시드 단백질은 모 AAV 캡시드에 비해 아미노산 서열에서 하나 이상의 변형을 가지며, 이때 상기 모 AAV 캡시드는 AAV 비리온에 존재하는 경우에 아미노산 서열 변형을 포함하지 않는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 하나 이상의 유형의 근육 세포(예를 들어, 골격근 세포 및/또는 심근 세포)의 증가된 감염성을 부여한다. 본원의 관련 양태에서, 변이체 AAV 캡시드 단백질은, AAV 비리온에 존재하는 경우 항-AAV 항체에 의한 중화에 대해 향상된 내성을 부여한다.

본원의 일부 양태에서, 재조합 AAV(rAAV) 비리온이 제공되며, 이러한 rAAV 비리온은 본원에 기재된 바와 같은 변이체 캡시드 단백질을 포함하며, 여기서 rAAV 비리온은 상응하는 변형되지 않은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성에 비해 하나 이상의 유형의 근육 세포(예를 들어, 골격근 세포 및/또는 심근 세포)의 증가된 감염성을 부여한다. 일부 실시형태에서, rAAV 비리온은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 비해 모든 근육 세포의 증가된 감염성을 나타낸다. 다른 실시형태에서, rAAV 비리온은 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 비해 특정 근육 세포 유형만의 증가된 감염성을 나타낸다. 달리 말하면, rAAV 비리온은 특정 근육 세포 유형에 대해만 우선적인 증가된 감염성을 나타내지만, 예를 들어 rAAV는 골격근 섬유아세포, 골격근 위성 세포, 심장 섬유아세포, 심장 전구 세포, 평활근 세포 및/또는 횡경막 근육 세포로부터 선택되는 하나 이상의 세포 유형의 우선적으로 증가된 감염성을 입증하지만, 모든 세포 유형의 증가된 감염성을 입증하지 못한다.

일부 실시형태에서, rAAV 비리온은 이종성 핵산을 포함한다. 일부 이러한 실시형태에서, 이종성 핵산은 폴리펩타이드를 인코딩하는 RNA를 인코딩한다. 이 같은 다른 실시형태에서, 이종성 핵산 서열은 폴리펩타이드를 인코딩하지 않는 RNA, 예를 들어, 이종성 핵산 서열은 RNA 간섭 제, 핵산 분해 효소에 대한 가이드 RNA 등을 인코딩한다.

또한, 본 발명의 감염성 rAAV 비리온 및 약학적으로 허용 가능한 담체를 포함하는 약학적 조성물이 본원에 제공된다.

또한, 표적 세포를 rAAV 비리온과 접촉시킴으로써 이종성 핵산을 표적 세포 (예를 들어 심근 세포)에 전달하는 방법에 본원에 기재된 바와 같은 변이체 캡시드 단백질을 포함하는 rAAV 비리온의 용도가 제공된다. 일부 실시형태에서, 표적 세포는 심혈관 질환 치료를 필요로 하는 개인의 심장에서와 같이 생체 내에서 존재한다. 다른 실시형태에서, 표적 세포는 시험관 내에 존재한다.

또한, 본원에 기재된 바와 같은 변이체 캡시드 단백질을 포함하는 유효량의 rAAV 비리온 또는 유효량의 rAAV 비리온을 포함하는 약학적 조성물을 이 같은 치료를 필요로 하는 대상에 투여함으로써 질병(예를 들어 심근 또는 골격근 질환)을 치료 및 또는 예방하는 방법이 제공된다.

또한, 본원에 기재된 바와 같은 변이체 AAV 캡시드 단백질을 인코딩하는 서열을 포함하는 단리된 핵산, 및 단리된 핵산을 포함하는 숙주 세포가 본원에 제공된다. 또 다른 실시형태에서, 단리된 핵산 및/또는 단리된 숙주 세포는 rAAV를 포함한다.

일부 양태에서, 변이체 AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해, 캡시드 단백질의 GH-루프에는 약 5개의 아미노산 내지 약 20개의 아미노산("이종성 펩타이드" 또는 "펩타이드 삽입물")의 삽입물을 포함하며, 여기서 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다. 일부 실시형태에서, 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41), 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택되는 서열을 포함하거나 필수적으로 이루어진다. 일부 바람직한 실시형태에서, 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29) 및 LATNKIGVTS(서열 식별 번호 37)로 이루어진 군으로부터 선택되는 서열을 포함하거나 필수적으로 이루어진다.

일부 양태에서, AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해 하나 이상의 아미노산 치환을 포함하며, 여기서 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우에 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다.

일부 실시 양태에서, AAV2에 비해 P363L 치환을 포함하고, 임의로 AAV2에 비해 E347K 및/또는 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.

관련 양태에서, 변이체 AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해 펩타이드 삽입 및 하나 이상의 아미노산 치환을 포함하며, 여기서 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우에 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다. 몇몇 실시 양태에서, AAV2에 비해 펩타이드 삽입체 및 V708I 치환을 포함하는 변이체 AAV 캡시드 단백질을 제공되며, 여기서 상기 펩타이드 삽입체는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군, 바람직하게는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA (서열 식별 번호 29) 및 LATNKIGVTS(서열 식별 번호 37)로 이루어진 군으로부터 임의로 선택된다. 몇몇 실시 양태에서, AAV2에 비해 펩타이드 삽입체 및 P363L 치환를 포함하는 변이체 AAV 캡시드 단백질이 제공되며, 여기서 상기 펩타이드 삽입체는 GNLTKGN(서열 식별 번호 16), LAGNLTKGNA(서열 식별 번호 30), QADTTKN(서열 식별 번호 23) 및 LAQADTTKNA(서열 식별 번호 39)로 이루어진 군으로부터 임의로 선택된다.

일부 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKIQRTDA(서열 식별 번호 27) 및 V708I 치환을 포함하며, 임의로 AAV2에 비해 A593E 및/또는 S109T 및/또는 T330A 및/또는 R588M 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKIQRTDA(서열 식별 번호 27) 및 A35P 치환을 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종 펩타이드 LANKIQRTDA(서열 식별 번호 27) 및 아미노산 치환 N312K, N449D, N551S, I698V 및 L735Q를 포함하며, 임의로 AAV2에 비해 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.

일부 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKTTNKDA(서열 식별 번호 28) 및 V708I 치환을 포함하며, 임의로 AAV2에 비해 S109T 및/또는 W694C 및/또는 W606C 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종 펩타이드 LANKTTNKDA(서열 식별 번호 28) 및 I698V 치환을 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종성 펩타이드 LANKTTNKDA(서열 식별 번호 28) 및 아미노산 치환 N312K, N449D, N551S, I698V 및 L735Q를 포함하며, 임의로 AAV2에 비해 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.

일부 실시 양태에서, AAV2에 비해 이종 펩타이드 LATNKIGVTA(서열 식별 번호 29) 및 V708I 치환을 포함하며, 임의로 AAV2에 비해 N449K 및/또는 G222S 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다. 다른 실시 양태에서, AAV2에 비해 이종성 펩타이드 LATNKIGVTA(서열 식별 번호 29) 및 아미노산 치환 N312K, N449D, N551S, I698V 및 L735Q를 포함하며, 임의로 AAV2에 비해 V708I 치환을 추가로 포함하는 변이체 AAV 캡시드 단백질이 개시된다.

일부 실시 양태에서, 본원에 기재된 바와 같은 이종성 펩타이드 및 AAV2에 비해 P363L 치환을 포함하는 변이체 AAV 캡시드 단백질이 개시된다.

또한, 본원에 개시된 바와 같은 변이체 AAV 캡시드를 포함하는 rAAV의 제조 및/또는 전달 방법이 본원에 개시된다. 또한, 본원에 개시된 바와 같은 변이체 AAV 캡시드를 포함하는 rAAV를 포함하는, 본원에 기재된 방법에 사용하기 위한 키트가 본원에서 제공된다.

다른 실시형태에서, 이전 단락에서 변이체 캡시드 단백질을 포함하는 AAV 비리온은 이전 또는 이후에 개시된 임의의 실시형태를 포함할 수 있다. 사실상, 명확한 설명을 위해 별도의 실시형태들의 문맥에 설명되어 있는 본 발명의 특정 특징부는 단일 실시형태로 함께 제공될 수도 있다. 반대로, 간략화를 위해, 단일 실시형태의 문맥에 설명되어 있는 본 발명의 다양한 특징부가 또한 개별적으로 제공되거나, 임의의 적합한 하위 조합으로 제공될 수 있다. 본 발명에 속하는 실시형태의 모든 조합은 본 발명에 구체적으로 포함되며, 거의 모든 조합이 개별적 및 명시적으로 개시되는 바와 같이 본원에 개시된다. 또한, 다양한 실시형태의 모든 하위 조합 및 이의 성분은 본 발명에 구체적으로 포함되며, 거의 모든 하위 조합이 본원에서 개별적 및 명시적으로 개시되는 바와 같이 본원에 개시된다.

본 발명의 요약은 특허청구범위를 한정하고자 하는 것이 아니며, 임의의 방식으로 본 발명의 범위를 제한하려는 것도 아니다.

본원에 개시된 본 발명의 다른 특징 및 이점은 하기 도면, 상세한 설명 및 특허청구범위로부터 명백하게 될 것이다.

본 발명은 첨부된 도면과 함께 해석되는 경우에 하기 상세한 설명으로부터 가장 잘 이해되 것이다. 특허 또는 출원 파일에는 색으로 표시된 하나 이상의 도면이 포함되어 있다. 컬러 도면(들)이 있는 이러한 특허 또는 특허 출원 공개공보의 사본은 요청에 따라 필요한 수수료의 지불과 함께 특허청이 제공할 것이다. 통상적인 실시에 따르면, 도면의 다양한 특징부는 척도에 맞게 도시되지 않는다는 것이 강조된다. 반대로, 다양한 특징부의 치수는 명확성을 위해 임의로 확장되거나 축소된다. 도면에는 하기 도가 포함된다.
도 1은 유도 진화 방법론의 실시형태를 나타낸다. 단계(a)는 DNA 돌연변이 기술과 cap 유전자의 조합을 포함하는 바이러스 캡시드 라이브러리의 생성을 나타낸다. 단계(b)는 각 바이러스 입자가 캡시드를 인코딩하는 cap 유전자를 둘러싸고 있는 돌연변이 캡시드로 구성되고 정제되도록 바이러스를 패키징하는 것을 나타낸다. 그 후, 캡시드 라이브러리는 시험관 내 또는 생체 내에서 선택적 압력을 받게 된다. 유도 진화 기술의 이러한 양태에서, 관심이 있는 조직 또는 세포 물질은 그 표적을 성공적으로 감염시켰던 AAV 변이체의 단리를 위해 수확되고, 바이러스가 성공적으로 회수된다. 단계(c)는 반복 선택을 통한 성공적인 클론의 단계 1 농축(enrichment)을 나타낸다. 단계(d)는 바이러스 적합성을 반복적으로 증가시키기 위해 재다양화 및 추가의 선택 단계를 거치는 선택된 cap 유전자의 단계 2 농축을 나타낸다. 단계(e)는 재조합 AAV 벡터로서 제조되고 다양한 세포 유형 및 조직 표적의 형질 도입 수준에 대해 특징지어지는 벡터 선별 단계 1 및 2 동안 히트(hit)로 확인된 변이체를 나타낸다. AAV 유도 진화 과정의 본질에 의해, 본원에 개시된 변이체는 선별 과정 도중에 근육 세포를 형질 도입하고 게놈(변이체 cap 유전자를 인코딩하는 게놈)을 전달하는 능력이 이미 입증되어 있다.
도 2는 대표적인 선택으로부터 심장 및 골격 근육 조직으로부터 바이러스 게놈의 PCR 증폭을 나타낸다. 적색 박스 내의 밴드는 바이러스 게놈의 성공적인 증폭을 나타낸다.
도면 3A-3C는 서열 분석 내에서의 모티프의 빈도를 나타낸다. 도 3A는 심장 조직에 대한 정맥 내 전달의 선택적인 압력에 대한 라운드 4 시퀀싱 분석을 제공한다. 도 3B는 심장 조직에 대한 중화 항체의 존재 하에서의 정맥내 전달의 선택적인 압력에 대한 라운드 2 시퀀싱 분석을 제공한다. 도 3C는 골격 근육 조직에 대한 정맥내 전달의 선택적인 압력에 대한 라운드 3 시퀀싱 분석을 제공한다. 도 3A는 57.40% LANKTTNKDA 모티프, 16.96% LANKTTNKDA 모티프, 7.32% A593E 모티프, 7.32% 다른 모티프, 4.88% V708I 모티프 및 4.88% LASNTVKAIA 모티프를 나타낸다. 도 3B는 21.14% 다른 모티프, 20.33% LAQADTTKNA 모티프, 15.45% LANKTTNKDA 모티프, 15.45% LAASNKAA 모티프, 15.45% AAV6/AAV5 키메라 모티프 및 12.20% LANTVKLSTA 모티프를 나타낸다. 도 3C는 43.21% A593E 모티프, 41.98% P363L 모티프 및 14.81% 다른 모티프를 나타낸다.
도 4A 내지 4C, 도 4A는 아미노산 587 및 V708I 치환에 따른 랜덤 헵타머(heptamer)를 함유하는 AAV2의 대표적인 3차원 모델이다. 도 4B는 V229I, A490T 및 A581T 치환(서열 식별 번호 62로 제시된 아미노산 서열에 상응하는)을 함유하는 AAV6/AAV5 키메라(chimera)의 대표적인 3차원 모델이다. 도 4C는 P363L 치환을 함유하는 AAV2의 대표적인 3차원 모델이다.
도 5A-E는 야생형(자연 발생) 혈청형 AAV1, AAV2, AAV3A, AAV3B 및 AAV4-10의 및 사이의 아미노산 위치를 보여주는 야생형 AAV 서열 식별 번호 1-11의 배열을 제공한다.
도면 6A-6E는 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 및 신규한 LATTKIGVTA + V708I 변이체 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심근 세포의 형질 도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 조절하에 GFP 이식 유전자(transgene)를 발현한다. 도 6A: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 LATTKIGVTA + V708I.CAG.GFP 또는 야생형 대조군 AAV1.CAG.GFP, AAV2.CAG.GFP, 및 AAV9.CAG.GFP로 20,100,500 및 2500 MOIs에서 감염시켰다. 모든 MOIs에서 감염 후 6일째에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AV1, AV2, 또는 AAV9 캡시드보다 더 우수한 심근 세포를 형질 도입한다는 것을 입증한다. 도 6B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 심근 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AV1, AV2, 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의적인 용량-의존적 개선을 제공한다는 것을 나타낸다. *P < 0.005. 도 6C-6D: 웨스턴 블롯에 의해 각 배양물에서 GFP의 양을 정량화하는 것은, 신규한 AAV 변이체는 야생형 AV1, AV2, 또는 AAV9 캡시드에 대한 이식 유전자의 발현에 있어서 유의적인 개선을 제공한다는 것을 나타낸다. NT = 형질 도입되지 않음. 도 6E: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 LATTKIGVTA + V708I.CAG.GFP 또는 야생형 대조군 AAV1.CAG.GFP, AAV2.CAG.GFP 및 AAV9.CAG.GFP로 감염시켰다. 500 MOI에서 감염 후 1, 2, 3 및 5일째에 세포 배양물의 면역 형광 이미징은 야생형 AV1, AV2, 또는 AAV9 캡시드보다 신규한 AAV 변이체 캡시드가 심근 세포를 더 잘 형질 도입시키고 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 7A-E는 CAG 프로모터의 조절하에 GFP 이식 유전자를 발현하는, 서열 식별 번호 62의 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심근 세포의 형질 도입에 대한 데이터를 제공한다. 도 7A: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드 또는 야생형 대조군 AAV1.CAG.GFP, AAV8.CAG.GFP 및 AAV9.CAG.GFP로 100, 500, and 2500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 6일째에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV1, AAV8 또는 AAV9 캡시드보다 더 우수한 심근 세포를 형질 도입시킴을 입증한다. 도 7B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 심근 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV1, AAV8 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의적인 용량-의존적 개선을 제공한다는 것을 나타낸다. *P < 0. 도 7 C-7D: 웨스턴 블롯에 의해 각 배양물에서 GFP 의 양을 정량화하는 것은 신규한 AAV 변이체가 야생형 AAV1, AAV8 또는 AAV9 캡시드에 대한 이식 유전자의 발현에 유의적인 개선을 제공한다는 것을 나타낸다. 비히클(vehicle) = 형질 도입되지 않음. 도 7E: 인간 만능 줄기 세포주로부터 심근 세포로 분화된 세포를 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드 또는 야생형 대조군 AAV8.CAG.GFP로 감염시켰다. 2500 MOI에서 감염 후 3, 4, 5 및 6일째에 세포 배양물의 면역 형광 이미징은 야생형 AAV8 캡시드보다 신규한 AAV 변이체 캡시드가 심근 세포를 더 잘 형질 도입시키며 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 8A-C는 신규한 AAV 변이체 LANKQRTDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 골격 근육 섬유의 형질 도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 8A: 인간 초기 근육 모세포로부터 골격 근육 섬유로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV8.CAG.GFP 및 AAV9CAG로 100, 500 및 2500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 7일 후에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV8 또는 AAV9 캡시드보다 더 우수한 골격 근육 섬유를 형질 도입시킨다는 것을 입증한다. 도 8B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 골격근 섬유의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV8 또는 AAV9 캡시드를 통해 형질 도입된 세포의 수에 있어서 유의한 용량-의존성 개선을 제공한다는 것을 나타낸다. *P < 0.05. 도 8C: 인간 초기 근육 모세포로부터 골격 근육 섬유로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV8.CAG.GFP 및 AAV9.CAG.GFP로 감염시켰다. 2500 MOI에서 감염 후 2-7일째에 세포 배양물의 면역 형광 이미징은 야생형 AAV8 또는 AAV9 캡시드보다 신규한 AAV 변이체 캡시드가 골격 근육 섬유를 더 잘 형질 도입시키며 더 빨리 GFP 이식 유전자를 발현하기 시작한다는 것을 입증한다.
도 9A-B는 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 근육 전구 세포의 형질도입에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 9A: 인간 만능 줄기 세포주로부터 근육 전구 세포로 분화된 세포를 신규한 AAV 변이체 LANKIQRTDA + V708I.CAG.GFP, 신규한 AAV 변이체 LANKTTNKDA + V708I.CAG.GFP, 신규한 AAV 변이체 AAV6/AAV5 키메라.CAG.GFP 또는 야생형 대조군 AAV9.CAG.GFP로 500 MOI에서 감염시켰다. 모든 MOI에서 감염 후 6일 후에 세포 배양물의 면역 형광 이미징은 신규한 AAV 변이체 캡시드가 야생형 AAV9보다 더 나은 근육 전구 세포를 형질 도입한다는 것을 입증한다. 도면 9B: 유동 세포 분석법에 의해 각 배양물에서 GFP-양성 근육 전구 세포의 백분율을 정량화하는 것은 신규한 AAV 변이체 캡시드가 야생형 AAV9를 통해 형질 도입된 세포의 수에 있어 유의한 개선을 제공한다는 것을 나타낸다. *P < 0.05.
도 10A-B는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드, 신규한 AAV 변이체 LANKTTNKDA + V708I 캡시드 및 신규한 AAV 변이체 AAV6/AAV5 키메라 캡시드를 포함하는 재조합 AAV 바이러스에 의해 시험관 내에서 인간 심장 근육 세포 및 인간 골격 근육 섬유의 형질 도입의 개선 규모에 대한 데이터를 제공하며, 각각은 CAG 프로모터의 제어하에 GFP 이식 유전자를 발현한다. 도 10A: 야생형 AAV8 및 AAV9와 비교하여 신규한 AAV 캡시드 변이체에 의해 인간 심장 근육 세포의 형질 도입에서 폴드 증가(fold increase), 근육 질병에 대한 임상 적용에 가장 널리 사용된 혈청형. 도 10B: 야생형 AAV8 및 AAV9 와 비교하여 신규한 AAV 캡시드 변이체에 의해 인간 골격 근육 섬유의 형질 도입에서 폴드 증가.
도 11A-B는 CAG 프로모터의 조절하에 루시페라제(luciferase) 이식 유전자를 발현하는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드를 포함하는 재조합 AAV 바이러스에 의해 생체 내에서 생쥐 조직의 형질 도입에 대한 데이터를 제공한다. 생쥐에게 꼬리 정맥을 통해 동물당 2 X 10¹¹ 바이러스 게놈의 단일 정맥 내 주사를 주었다. 도 11A: 14일(좌측) 및 28일(우측) 투여 후 루시페라제의 생전(in life) 이미징은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 세포를 형질 도입시킬 수 있음을 입증한다. 도 11B: 심장, 횡경막 및 사두근에서 56일 투여 후의 루시페라제 활성은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 심장 및 골격 근육을 형질 도입할 수 있다는 것을 입증한다.
도 12A-B는 CAG 프로모터의 조절하에 GFP 이식 유전자를 발현하는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드를 포함하는 재조합 AAV 바이러스에 의해 생체 내에서 비-인간 영장류 골격 근육의 형질 도입에 대한 데이터를 제공한다. 비-인간 영장류를 각각 10¹¹개의 바이러스 게놈의 3회 근육 내 주사로 좌측 외측광근(vastus lateralis) 내로 투여하고, 4주 투여 후 근육 조직을 분석하였다. 도 12A: 2x, 4x 및 20x 배율에서 근위(proximal) 생검 부위의 횡단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있다는 것을 입증한다. 도면 12B: 2x, 4x 및 20x 배율에서 원위(distal) 생검 부위의 종단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있음을 입증한다.

본 발명의 방법 및 조성물을 기재하기 전에, 본 발명은 기재된 특정 방법 또는 조성물에 제한되지 않으며, 따라서 다양할 수 있음을 이해되어야 한다. 또한, 본원에 사용된 용어는 단지 특정 실시형태만을 설명하기 위한 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서만 제한될 것이므로 제한적인 것으로 의도되지 않는다는 것이 이해되어야 한다.

본원에 개시된 본 발명은 도면 및 설명에 예시되어 있다. 그러나 특정 실시형태가 도면에 도시되어 있지만, 본 발명을 도시 및/또는 개시된 특정 실시형태에 제한하기 위함은 아니다. 오히려, 본원에 개시된 본 발명은 본 발명의 사상 및 범위 내에 속하는 모든 변경, 대안적인 구성 및 등가물을 포함하도록 의도된다. 이와 같이, 도면은 예시적인 것이며 제한적인 것이 아닌 것을 의도된다.

값의 범위가 제공되는 경우, 그 범위의 상한 및 하한 사이의, 문맥상 명확히 달리 지시하지 않는 한 하한의 단위의 십분의 일까지의, 각 중간 값(intervening value)이 구체적으로 개시되는 것으로 이해된다. 명시된 범위 내에서 임의의 명시된 값 또는 중간 값 사이의 보다 작은 범위, 및 그러한 명시된 범위 내의 임의의 다른 명시된 값 또는 중간 값이 본 발명에 포함된다. 이들 작은 범위의 상한 및 하한은 독립적으로는 범위에 포함 또는 배제될 수 있고, 상한 및 하한 중 어느 하나 또는 둘 모두가 작은 범위에 포함되는 범위 각각이 또한 본 발명에 포함되며, 명시된 범위에서 임의의 구체적으로 배제된 제한을 받는다. 명시된 범위가 상한 및 하한 중 하나 또는 둘 모두를 포함하는 경우, 이들 포함된 상한 및 하한 중 하나 또는 둘 모두를 제외한 범위도 본 발명에 포함된다.

달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 개시된 것과 유사하거나 동등한 임의의 방법 및 재료가 본 발명의 실시 또는 시험에 사용될 수 있지만, 일부 잠재적이고 바람직한 방법 및 재료가 이하에 설명된다. 본원에 언급된 모든 간행물은 간행물이 인용되는 방법 및/또는 재료를 개시하고 설명하기 위해 본원에 참고로 포함된다. 본 개시내용은 모순이 있는 범위까지 포함된 간행물의 임의의 개시내용을 대체하는 것으로 이해된다.

본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기술되고 예시된 개별 실시형태 각각은 본 발명의 범위 또는 사상에서 벗어나지 않는 한 임의의 다른 몇몇 실시형태로부터 용이하게 분리되거나 이들 실시형태와 조합될 수 있는 개별 성분 및 특징을 갖는다. 인용된 모든 방법은 열거된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.

본원 및 첨부된 특허청구범위에서 사용된 바와 같이, 단수 형태 "하나", "일" 및 "그"는 문맥상 명확하게 달리 지시하지 않는 한 복수 대상을 포함한다. 따라서, 예를 들어, "재조합 AAV 비리온"에 대한 인용은 복수의 이 같은 비리온을 포함하고, "근육 세포"에 대한 인용은 하나 이상의 근육 세포 및 당업자 등에게 공지된 이의 등가물에 대한 인용을 포함한다. 특허청구범위는 임의의 선택적인 성분을 배제하도록 작성될 수 있는 것으로 추가로 주지된다. 이와 같이, 이러한 진술은 특허청구범위의 성분의 인용 또는 "부정적인" 제한의 사용과 관련하여 "단독으로", "오직" 등과 같은 배타적인 용어의 사용을 위한 선행 기준으로서 역할을 하기 위한 것이다.

본원에서 논의된 간행물은 본 출원의 출원일 이전에 그들의 공개를 위해서만 제공된다. 본원에서는 어떠한 것도 본 발명이 선행 발명으로 인해 이 같은 간행물보다 시기를 선행할 자격을 갖지 않는다는 인정으로 해석되어서는 안 된다. 또한, 제공된 간행물의 날짜는 실제 공개일과 다를 수 있으며, 이는 독립으로 확인해야 할 수도 있다.

정의

아데노-관련 바이러스는 비-외피성, 20면체 캡시드 내에 4.7kb 길이의 단일 가닥 DNA 게놈으로 구성된 비병원성 파보바이러스(parvovirus)이다. 게놈은 복제 및 패키징(packaging) 신호의 바이러스 기원으로 기능 하는 역전된 말단 반복(ITR)에 의해 측면에 놓인 3개의 오픈 리딩 프레임(ORF)을 포함한다. rep ORF는 바이러스 복제, 전사 조절, 부위 특이적 통합 및 비리온 조립에서 역할을 하는 4개의 비구조적 단백질을 인코딩한다. cap ORF는 3개의 구조 단백질(VP 1-3)을 인코딩하고, 이들 단백질은 조립되어 60-머(mer)의 바이러스 캡시드를 형성한다. 마지막으로, cap 유전자 내에서 대체 리딩 프레임으로서 존재하는 ORF는 AAV 캡시드 단백질을 핵소체(nucleolus)에 국한시키고 캡시드 조립 과정에서 기능을 하는 바이러스 단백질인 조립-활성화 단백질(AAP)을 생성한다.

몇몇 자연적으로 발생하는("야생형") 혈청형 및 100종 이상의 공지된 AAV 변이체가 존재하며, 이들 각각은 특히 캡시드 단백질의 초가변 영역 내에서 아미노산 서열이 다르며, 따라서 그들의 유전자 전달 특성이 다르다. 어떠한 AAV도 인간 질병과 관련이 없었으며, 그 결과 재조합 AAV가 임상 적용에 매력적인 것이 되었다.

본원에서 개시의 목적상, "AAV"라는 용어는 바이러스 자체 및 그의 유도체를 포함하지만 이에 제한되지 않는 아데노-관련 바이러스의 약어이다. 달리 명시된 경우를 제외하고, 상기 용어는 모든 아형 또는 혈청형 및 복제 가능 형태 및 재조합 형태 모두를 지칭한다. 용어 "AAV"는 AAV 타입 1(AAV-1 또는 AAV1), AAV 타입 2(AAV-2 또는 AAV2), AAV 타입 3A(AAV-3A 또는 AAV3A), AAV 타입 3B(AAV-3B 또는 AAV3B), AAV 타입 4(AAV-4 또는 AAV4), AAV 타입 5(AAV-5 또는 AAV5), AAV 타입 6(AAV-6 또는 AAV6), AAV 타입 7(AAV-7 또는 AAV7), AAV 타입 8(AAV-8 또는 AAV8), AAV 타입 9(AAV-9 또는 AAV9), AAV 타입 10(AAV-10 또는 AAV10 또는 AAVrh10), 조류 AAV, 소 AAV, 개 AAV, 염소 AAV, 말 AAV, 영장류 AAV, 비영장류 AAV 및 양 AAV를 포함하지만 이에 제한되지 않는다. "영장류 AAV"는 영장류를 감염시키는 AAV를 지칭하며, "비영장류 AAV"는 비영장류 포유동물을 감염시키는 AAV를 지치하며, "소 AAV"는 소 포유동물 등을 감염시키는 AAV를 지칭한다.

AAV의 다양한 혈청형의 게놈 서열뿐만 아니라 천연 말단 반복(native terminal repeats)(TRs), Rep 단백질 및 캡시드 서브유닛의 서열은 당업계에 공지되어 있다. 이 같은 서열은 문헌 또는 유전자은행(GenBank)과 같은 공공 데이터베이스에서 찾아 볼 수 있다. 예를 들어, 유전자은행(GenBank) 수탁번호: NC_002077.1(AAV1), AF063497.1(AAV1), NC_001401.2(AAV2), AF043303.1(AAV2), J01901.1(AAV2), U48704.1(AAV3A), NC_001729.1(AAV3A), AF028705.1(AAV3B), NC_001829.1(AAV4), U89790.1(AAV4), NC_006152.1(AA5), AF085716.1(AAV-5), AF028704.1(AAV6), NC_006260.1(AAV7), AF513851.1(AAV7), AF513852.1(AAV8), NC_006261.1(AAV-8), AY530579.1(AAV9), AAT46337(AAV10) 및 AAO88208(AAVrh10)을 참고하며, 이의 전문은 AAV 핵산 및 아미노산 서열을 교시하기 위해 본원에 참고로 포함된다. 예를 들어, Srivistava et al. (1983) J. Virology 45:555; Chiorini et al. (1998) J. Virology 71:6823; Chiorini et al. (1999) J. Virology 73:1309; Bantel-Schaal et al. (1999) J. Virology 73:939; Xiao et al. (1999) J. Virology 73:3994; Muramatsu et al. (1996) Virology 221:208; Shade et. al. (1986) J. Virol. 58:921; Gao et al. (2002) Proc. Nat. Acad. Sci. USA 99:11854; Moris et al. (2004) Virology 33:375-383; 국제 특허 공보 제WO 00/28061호, 제WO 99/61601호, 제WO 98/11244호; 및 미국 특허 제6,156,303호를 또한 참고한다.

AAV 혈청형과 관련된 자연적으로 존재하는 캡 (캡시드) 단백질의 서열은 당업계에 공지되어 있으며, AAV1(서열 식별 번호 1), AAV2(서열 식별 번호 2), AAV3A(서열 식별 번호 3), AAV3B(서열 식별 번호 4), AAV4(서열 식별 번호 5), AAV5(서열 식별 번호 6), AAV6(서열 식별 번호 7), AAV7(서열 식별 번호 8), AAV8(서열 식별 번호 9), AAV9(서열 식별 번호 10), AAV10(서열 식별 번호 11) 및 AAVrh10(서열 식별 번호 12)으로서 본원에 개시된 것들을 포함한다. 용어 "변이체 AAV 캡시드 단백질" 또는 "AAV 변이체"는 자연적으로 존재하거나 "야생형"의 AAV 캡시드 단백질 서열, 예를 들어, 본원에서 서열 식별 번호 1 내지 서열 식별 번호 12에 개시된 바와 같은 서열에 대해 적어도 하나의 변형 또는 치환(결실, 삽입, 점 돌연변이 등을 포함함)을 포함하는 아미노산 서열을 포함하는 AAV 캡시드 단백질을 지칭한다. 변이체 AAV 캡시드 단백질은 야생형 캡시드 단백질의 아미노산 서열에 대해 약 80% 이상의 동일성, 예를 들어 야생형 캡시드 단백질의 아미노산 서열에 대해 85% 이상의 동일성, 90% 이상의 동일성 또는 95% 이상의 동일성, 예를 들어 야생형 캡시드 단백질에 대해 98% 또는 99%의 동일성을 가질 수 있다. 변이체 AAV 캡시드 단백질은 야생형 캡시드 단백질이 아닐 수 있다.

본원에서 개시의 목적상, "AAV 비리온" 또는 "AAV 바이러스 입자"는 적어도 하나의 AAV 캡시드 단백질 및 캡시드화된 AAV 폴리뉴클레오타이드로 구성된 바이러스 입자를 지칭한다.

본원에서 개시의 목적상, 용어 "rAAV"는 재조합 아데노-관련 바이러스를 지칭하는 약어이다. 폴리뉴클레오타이드에 적용되는 "재조합체"는 클로닝, 제한 또는 연결 단계 및 기타 과정의 다양한 조합 산물을 의미하며, 이때 상기 산물은 폴리뉴클레오타이드가 자연계에서 발견되는 폴리뉴클레오타이드와 구별되는 구조체을 생성한다. 재조합 바이러스는 재조합 폴리뉴클레오타이드를 포함하는 바이러스 입자이다. 상기 용어는 각각 원래의 폴리뉴클레오타이드 구조체의 복제물 및 원래의 바이러스 구조체의 자손을 포함한다.

용어 "rAAV 벡터"는 정의상 rAAV 폴리뉴클레오타이드를 포함하는 rAAV 비리온 (즉, rAAV 바이러스 입자)(예를 들어, 전염성 rAAV 비리온)을 포함하고; 또한 rAAV (예를 들어, rAAV를 인코딩하는 단일 가닥 폴리뉴클레오타이드(ss-rAAV); rAAV를 인코딩하는 이중 가닥 폴리뉴클레오타이드(ds-rAAV), 예를 들어 rAAV를 인코딩하는 플라스미드; 및 기타)를 인코딩하는 폴리뉴클레오타이드를 포함한다.

AAV 비리온이 이종성 폴리뉴클레오타이드(즉, 야생형 AAV 게놈 이외의 폴리뉴클레오타이드, 예를 들어, 표적 세포로 전달되는 이식 유전자, 표적 세포로 전달되는 RNAi 작용제 또는 CRISPR 작용제 등)를 포함하는 경우, 이는 전형적으로 "재조합 AAV(rAAV) 비리온" 또는 "rAAV 바이러스 입자"로서 지칭된다. 일반적으로, 이종성 폴리뉴클레오타이드는 적어도 하나, 일반적으로 2개의 AAV 전위(inverted) 말단 반복서열(ITR) 옆에 위치한다.

용어 "패키징"은 AAV 입자의 조립 및 캡시드화를 초래하는 일련의 세포 내 사건을 지칭한다. AAV "rep" 및 "cap" 유전자는 아데노-관련 바이러스의 복제 및 캡시드화 단백질을 인코딩하는 폴리뉴클레오타이드 서열을 지칭한다. AAV rep 및 cap은 본원에서 AAV "패지징 유전자"로서 지칭된다.

AAV에 대한 용어 "헬퍼 바이러스"는 AAV(예를 들어, 야생형 AAV)가 포유동물 세포에 의해 복제되고 패키징될 수 있도록 하는 바이러스를 지칭한다. 아데노바이러스, 헤르페스바이러스, 및 우두 바이러스(vaccinia)와 같은 수두 바이러스를 비롯하여 AAV에 대한 이 같은 다양한 헬퍼 바이러스가 당업계에 공지되어 있다. 하위그룹 C의 아데노바이러스 5형이 가장 보편적으로 사용되지만, 아데노바이러스는 다수의 상이한 하위그룹을 포함한다. 인간, 비인간 포유류 및 조류 기원의 수많은 아데노바이러스가 공지되어 있으며 ATCC와 같은 기탁기관에서 구입 가능하다. 헤르페스 부류의 바이러스에는, 예를 들어 헤르페스 심플렉스 바이러스(HSV) 및 엡스타인-바 바이러스(Epstein-Barr virus; EBV)뿐만 아니라, 사이토메갈로바이러스(cytomegalovirus; CMV) 및 슈도레이비스 바이러스(pseudorabies virus; PRV)를 포함하며, 이들은 또한 ATCC와 같은 기탁기관에서 구입 가능하다.

용어 "헬퍼 바이러스 기능(들)"은 (본원에서 개시된 복제 및 패키징에 대한 기타 요건과 함께) AAV 복제 및 패키징을 허용하는 헬퍼 바이러스 게놈에서 인코딩된 기능(들)을 지칭한다. 본원에 기재된 바와 같이, "헬퍼 바이러스 기능"은 헬퍼 바이러스를 제공하거나, 예를 들어 필수 기능(들)을 인코딩하는 폴리뉴클레오타이드 서열을 생산자 세포에 트랜스 방식으로 제공하는 것을 포함하는 많은 방법으로 제공될 수 있다. 예를 들어, 하나 이상의 아데노바이러스 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 플라스미드 또는 다른 발현 벡터는 rAAV 벡터와 함께 생산자 세포 내로 형질 감염된다.

용어 "감염성" 바이러스 또는 바이러스 입자는 만능적으로 조립된 바이러스 캡시드를 포함하는 것이며, 바이러스 종이 주성(tropism)이 있는 세포 내로 폴리뉴클레오타이드 성분을 전달할 수 있다. 상기 용어는 반드시 바이러스의 복제 능력을 의미하는 것은 아니다. 감염성 바이러스 입자를 계수하기 위한 분석은 본 개시내용 및 당업계의 다른 부분에서 개시되어 있다. 바이러스 감염성은 전체 바이러스 입자에 대한 감염성 바이러스 입자의 비율로 나타낼 수 있다. 전체 바이러스 입자에 대한 감염성 바이러스 입자의 비율을 측정하는 방법은 당업계에 공지되어 있다. 예를 들어, Grainger et al. (2005) Mol. Ther. 11:S337(TCID50 전염성 역가 분석이 기술되어 있음); 및 Zolotukhin et al. (1999) Gene Ther. 6:973을 참고한다. 또한, 실시예를 참고한다.

본원에 사용된 용어 "주성(Tropism)"은 특정 숙주 종의 세포 또는 숙주 종 내의 특정 세포 유형의 바이러스(예를 들어, AAV)에 의한 우선적 표적화를 의미한다. 예를 들어, 심장, 폐, 간 및 근육의 세포를 감염시킬 수 있는 바이러스는 폐 및 근육 세포만을 감염시킬 수 있는 바이러스에 비해 더 넓은(즉, 증가된) 주성을 갖는다. 주성은 또한, 숙주의 특정 유형 세포 표면 분자에 대한 바이러스의 의존성을 포함할 수 있다. 예를 들어, 일부 바이러스는 표면 글리코스아미노글리칸이 있는 세포만을 감염시킬 수 있는 반면, 다른 바이러스는 시알산이 있는 세포만을 감염시킬 수 있다 (이 같은 의존성은 바이러스 감염에 대한 잠재적인 숙주 세포로서 특정 종류의 분자가 결핍된 다양한 세포주를 사용하여 시험할 수 있음). 경우에 따라, 바이러스의 주성은 바이러스의 상대적 선호도를 설명한다. 예를 들어, 첫 번째 바이러스는 모든 세포 유형을 감염시킬 수 있지만 표면 글리코스아미노글리칸으로 이들 세포를 감염시키는데 훨씬 더 성공적이다. 두 번째 바이러스도 동일한 특성을 선호한다면 비록 절대 형질 도입 효율이 유사하지 않을지라도 두 번째 바이러스는 첫 번째 바이러스와 유사(또는 동일)한 주성을 가진 것으로 간주될 수 있다(예를 들어, 두 번째 바이러스도 표면 글리코스아미노글리칸으로 이들 세포를 감염시키는데 더 성공적임). 예를 들어, 두 번째 바이러스는 테스트한 모든 소정의 세포 유형을 감염시킬 때 첫 번째 바이러스보다 더 효율적일 수 있지만, 상대 선호도가 유사(동일)하면 두 번째 바이러스는 여전히 첫 번째 바이러스와 유사(또는 동일)한 주성을 갖는 것으로 간주될 수 있다. 일부 실시형태에서, 대상 변이체 AAV 캡시드 단백질을 포함하는 비리온의 주성은 자연적으로 발생하는 비리온에 비해 변경되지 않는다. 일부 실시형태에서, 대상 변이체 AAV 캡시드 단백질을 포함하는 비리온의 주성은 자연적으로 발생하는 비리온에 비해 확대된다(즉, 넓어진다). 일부 실시형태에서, 대상 변이체 AAV 캡시드 단백질을 포함하는 비리온의 주성은 자연적으로 발생하는 비리온에 비해 감소된다.

용어 "복제 가능(replication-competent)" 바이러스(예를 들어, 복제 가능 AAV)는 감염성이고 감염 세포에서(즉, 헬퍼 바이러스 또는 헬퍼 바이러스 기능의 존재 하에) 복제될 수 있는 표현형적으로 야생형 바이러스를 지칭한다. AAV의 경우, 복제 가능성은 일반적으로 기능적 AAV 패키징 유전자의 존재를 필요로 한다. 일반적으로, 본원에 기재된 바와 같은 rAAV 벡터는 하나 이상의 AAV 패키징 유전자가 없기 때문에 포유동물 세포(특히 인간 세포)에서 복제 불가능하다. 전형적으로, 이 같은 rAAV 벡터에는 AAV 패키징 유전자와 유입되는 rAAV 벡터 사이의 재조합에 의해 복제 가능 AAV가 생성될 가능성을 최소화하기 위해 임의의 AAV 패키징 유전자 서열이 결여되어 있다. 다수의 실시형태에서, 본원에 기재된 바와 같은 rAAV 벡터 제제는 복제 가능 AAV(rcAAV; RCA로도 지칭됨)를 거의 함유하지 않는 제제(예를 들어, 10²개의 rAAV 입자당 약 1개 미만의 rcAAV, 10⁴개의 rAAV 입자당 약 1개 미만의 rcAAV, 10개의 rAAV 입자당 약 1개 미만의 rcAAV, 10¹²개의 rAAV 입자당 약 1개 미만의 rcAAV 또는 rcAAV 없음)이다.

용어 "폴리뉴클레오타이드"는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 또는 이의 유사체를 비롯하여 임의의 길이를 갖는 중합체 형태의 뉴클레오타이드를 지칭한다. 폴리뉴클레오타이드는 메틸화 뉴클레오타이드 및 뉴클레오타이드 유사체와 같은 변형된 뉴클레오타이드를 포함할 수 있으며, 비뉴클레오타이드 성분에 의해 중단되어 있을 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 중합체의 조립 이전 또는 이후에 부여될 수 있다. 본원에 사용된 용어 폴리뉴클레오타이드는 이중 가닥 및 단일 가닥 분자를 지칭하며, 이들은 상호 교환 가능하다. 달리 특정되거나 요구되지 않는 한, 폴리뉴클레오타이드를 포함하는 본원의 임의의 실시형태는 이중 가닥 형태 및 이중 가닥 형태를 구성하는 것으로 공지되거나 예측되는 2개의 상보적인 단일 가닥 형태의 각각을 둘 모두 포함한다.

폴리뉴클레오타이드 또는 폴리펩타이드는 다른 폴리뉴클레오타이드 또는 폴리펩타이드와 일정 비율의 "서열 동일성"을 가지며, 이는 배열 시에 2개의 서열을 비교할 때의 염기 또는 아미노산의 비율이 동일하다는 것을 의미한다. 서열 유사성은 다수의 상이한 방식으로 결정될 수 있다. 서열 동일성을 결정하기 위해, BLAST를 포함한 방법 및 컴퓨터 프로그램을 사용하여 서열을 배열할 수 있으며, 이는 월드와이드웹 ncbi.nlm.nih.gov/BLAST/에서 구입 가능하다. 또 다른 배열 알고리즘은 옥스포드 몰레큘러 그룹 인코포레이티드(Oxford Molecular Group, Inc)의 자회사인 미국 위스콘신 주 매디슨 소재의 유전학 컴퓨팅 그룹(Genetics Computing Group; GCG) 패키지에서 이용 가능한 FASTA이다. 배열를 위한 기타 기법은 문헌[Methods in Enzymology, vol. 266: Computer Methods for Macromolecular Sequence Analysis (1996), ed. Doolittle, Academic Press, Inc., a division of Harcourt Brace ＆ Co., San Diego, California, USA]에 기재되어 있다. 특히 흥미로운 것은 서열에서 갭을 허용하는 배열 프로그램이다. 스미스-워터먼(Smith-Waterman)은 서열 배열에서 갭을 허용하는 알고리즘의 한 유형이다. 문헌[Meth. Mol. Biol. 70:173-187 (1997)]을 참고한다. 또한, 니들맨(Needleman) 및 분쉬(Wunsch) 배열 방법을 사용하는 GAP 프로그램을 이용하여 서열을 배열할 수 있다. 문헌[J. Mol. Biol. 48:443-453 (1970)]을 참고한다.

용어 "유전자"는 세포에서 어떤 종류의 기능을 수행하는 폴리뉴클레오타이드를 지칭한다. 예를 들어, 유전자는 유전자 산물을 인코딩할 수 있는 오픈 리딩 프레임을 함유할 수 있다. 유전자 산물의 한 예는 유전자로부터 전사되고 번역되는 단백질이다. 유전자 산물의 다른 예로는 RNA, 예를 들어 기능성 RNA 산물, 예를 들어 앱타머(aptamer), 간섭 RNA, 리보솜 RNA(rRNA), 전달 RNA(tRNA), 비-코팅 RNA(ncRNA), 뉴클레아제용 가이드 RNA 등이 있으며, 전사는 되지만 번역되지는 않는다.

용어 "유전자 발현 산물" 또는 "유전자 산물"은 상기에서 정의된 바와 같은 특정 유전자의 발현으로부터 얻어진 분자이다. 유전자 발현 산물은, 예를 들어 폴리펩타이드, 앱타머(aptamer), 간섭 RNA, 메신저 RNA(mRNA), rRNA, tRNA, 비-코딩 RNA(ncRNA) 등을 포함한다.

용어 "siRNA 작용제"("소형 간섭" 또는 "짧은 간섭 RNA"(또는 siRNA))는 관심 있는 유전자("표적 유전자")로 표적화하는 뉴클레오타이드의 RNA 이중체(duplex)이다. "RNA 이중체"는 이중 가닥 RNA(dsRNA)의 영역을 형성하는 RNA 분자의 2개의 영역 사이의 상보적인 쌍형성으로 형성된 구조를 지칭한다. siRNA는 siRNA의 이중체 부분의 뉴클레오타이드 서열이 표적 유전자의 뉴클레오타이드 서열에 상보적이라는 점에서 유전자에 "표적화"된다. 일부 실시형태에서, siRNA의 이중체는 30개 미만의 뉴클레오타이드 서열이다. 일부 실시형태에서, 이중체는 29개, 28개, 27개, 26개, 25개, 24개, 23개, 22개, 21개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개 또는 10개의 뉴클레오타이드 서열일 수 있다. 일부 실시형태에서, 이중체는 19개 내지 25개의 뉴클레오타이드 서열이다. 일부 실시형태에서, siRNA는 매개 유전자 표적화는 동물 세포의 내생성 RNA 간섭(RNAi) 경로를 활성화하기 위해 DNA 구조체를 이용하는 유전자 사일런싱 기법(gene-silencing technique)인 DNA-유도 RNA 간섭을 사용하여 수행된다. 이 같은 DNA 구조체는 자기-상보적인 이중 가닥 RNA, 전형적으로는 짧은 헤어핀 RNA(short-hairpin RNA)(shRNA)를 발현하기 위해 설계된 것이며, 이는 일단 가공되면 표적 유전자 또는 유전자들의 사일런싱을 초래한다. 내생성 mRNA 또는 바이러스 RNA를 포함하는 임의의 RNA는 목적하는 mRNA 표적에 상보적인 이중 가닥 RNA를 발현하는 구조체를 설계함으로써 사일런싱될 수 있다. 이와 같이, siRNA 작용제의 RNA 이중체 부분은 shRNA로서 지칭되는 짧은 헤어핀 구조의 일부일 수 있다. 이중체 부분 이외에도, 헤어핀 구조는 이중체를 형성하는 2개의 서열 사이에 위치한 루프 부분을 함유할 수 있다. 루프는 길이가 다를 수 있다. 일부 실시형태에서, 루프는 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 13개의 뉴클레오타이드 서열이다. 상기 헤어핀 구조는 또한 3' 또는 5' 돌출 부분을 함유할 수 있다. 일부 실시형태에서, 돌출부는 0개, 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드 서열을 갖는 3' 또는 5' 돌출부이다. 일반적으로, 표적 유전자의 발현 산물(예를 들어, mRNA, 폴리펩타이드 등)의 수준은 5' 비번역(UT) 영역, ORF 또는 3' UT 영역을 포함하는 표적 유전자 전사체의 적어도 19개 내지 25개의 뉴클레오타이드 서열의 긴 분절(예를 들어, 20개 내지 21개의 뉴클레오타이드 서열)에 대해 상보적인 특정 이중 가닥 뉴클레오타이드 서열을 함유하는 siRNA 작용제(예를 들어, siRNA, shRNA 등)에 의해 감소된다. 일부 실시형태에서, 짧은 간섭 RNA는 약 19개 내지 25개의 뉴클레오타이드 서열이다. 예를 들어, siRNA 기술의 설명에 대해서는 PCT 출원 제WO O0/44895호, 제WO 99/32619호, 제WO 01/75164호, 제WO 01/92513호, 제WO 01/29058호, 제WO 01/89304호, 제WO 02/16620호 및 제WO 02/29858호; 및 미국 특허 공개공보 제2004/0023390호를 참고한다. siRNA 및/또는 shRNA는 핵산 서열에 의해 인코딩될 수 있고, 핵산 서열은 또한 프로모터를 포함할 수 있다. 핵산 서열은 또한 폴리아데닐화 신호를 포함할 수 있다. 일부 실시형태에서, 폴리아데닐화 신호는 최소 합성 폴리아데닐화 신호이다.

용어 "안티센스 RNA"는 유전자 발현 산물에 대해 상보적인 RNA를 포함한다. 예를 들어, 특정 mRNA에 표적화되는 안티센스 RNA는 mRNA에 대해 상보적인 RNA 기반 작용제(또는 변형된 RNA 일 수 있음)이며, 여기서 mRNA에 대한 안티센스 RNA의 혼성화는(예를 들어, RNA의 안정성의 변경, RNA의 번역의 변경 등을 통해) mRNA의 발현을 변경시킨다. 또한 "안티센스 RNA"에는 안티센스 RNA를 인코딩하는 핵산이 포함된다.

"CRISPR/Cas9 작용제"와 관련하여 용어 "CRISPR"은 침입 핵산의 사이런싱을 유도하기 위해 CRISPR RNA(crRNA)를 사용하여 박테리아와 고세균(archaea)에 바이러스 및 플라스미드에 대한 적응성 면역력을 제공하도록 진화한 군집형의 일정하게 분포하는 짧은 회문 구조 반복 서열(clustered regularly interspaced short palindromic repeats)/CRISPR 관련 (Cas) 시스템을 포함한다. Cas9 단백질(또는 이의 기능적 등가물 및/또는 변이체, 즉 Cas9-유사 단백질)은 당연히 crRNA 및 tracrRNA(가이드 RNA로도 지칭됨)로 지칭되는 2개의 자연적으로 발생하거나 합성인 RNA 분자와 단백질의 결합에 의존하는 DNA 엔도뉴클레아제 활성을 포함한다. 일부 경우, 2개의 분자가 공유 결합되어 단일 분자를 형성한다(단일 가이드 RNA("sgRNA")로도 지칭됨). 따라서, Cas9 또는 Cas9-유사 단백질은 DNA-표적화 RNA(이의 용어는 2분자 가이드 RNA 구성 및 단일 분자 가이드 RNA 구성 둘 모두를 포함함)와 결합하며, 이는 Cas9 또는 Cas9-유사 단백질을 활성화시키고, 상기 단백질을 표적 핵산 서열로 유도한다.

Cas9 또는 Cas9-유사 단백질이 이의 천연 효소 기능을 유지하면, 이는 표적 DNA를 절단하여 이중 가닥 파열을 생성하고, 이는 게놈 변경(즉, 편집: 결실, 삽입(공여체 폴리뉴클레오타이드가 존재하는 경우))을 야기할 수 있으며, 그 결과 유전자 발현을 변경할 수 있다. Cas9의 일부 변이체(이의 변이체는 Cas9-유사라는 용어에 의해 포함됨)는 DNA 절단 활성이 감소하도록 변경되었다(일부 경우에 이들은 표적 DNA의 두 가닥 대신 단일 가닥을 절단하는 반면, 다른 경우에는 DNA 절단 활성이 없을 때까지 심각하게 감소하였다). DNA 절단 활성이 감소된 Cas9-유사 단백질(심지어 DNA 절단 활성이 없음)은 여전히 RNA 중합효소 활성을 차단하기 위해 표적 DNA로 유도될 수 있다. 대안적으로, Cas9 또는 Cas9-유사 단백질은 VP64 전사 활성화 도메인을 Cas9 단백질에 융합시키고 테트라루프(tetraloop) 및 스텝-루프(stem-loop)에서 융합 단백질을 MS2 RNA 앱타머를 포함하는 MS2-P65-HSF1 헬퍼 단백질 및 단일 가이드 RNA와 함께 동시 전달하여 전사를 활성화시키는 세포에서 협주적 활성화 매개인자(synergistic activation mediator; Cas9-SAM) 복합체를 형성함으로써 변형될 수 있다. 따라서 효소적 불활성 Cas9-유사 단백질은 표적 DNA의 전사를 차단하거나 활성화하기 위해 DNA-표적화 RNA에 의해 표적 DNA의 특정 위치에 표적화될 수 있다. 본원에 사용된 용어 "CRISPR/Cas9 작용제"는 상기에서 기재된 바와 같거나 당업계에 공지된 모든 형태의 CRISPR/Cas9를 포함한다.

CRISPR 작용제에 대한 자세한 정보는, 예를 들어 (a) 문헌[Jinek et. al., Science. 2012 Aug 17; 337 (6096):816-21:"A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity"]; (b) 문헌[Qi et al., Cell. 2013 Feb 28; 152(5):1173-83:"Repurposing CRISPR as an RNA- guided platform for sequence- specific control of gene expression"], 및 (c) 미국 특허 출원 번호 제13/842,859호 및 PCT 출원 번호 제PCT/US13/32589호에서 찾아볼 수 있으며, 이들 전문은 전체가 본원에 참고로 포함된다. 따라서, 본원에서 사용된 용어 "CRISPR 작용제"는 Cas9-기반 시스템(예를 들어, Cas9 또는 Cas9-유사 단백질; DNA-표적화 RNA, 예를 들어 crRNA-유사 RNA, tracrRNA-유사 RNA, 단일 가이드 RNA 등의 임의의 요소; 공여체 폴리뉴클레오타이드; 및 기타)에서 사용될 수 있는 자연적으로 발생하고/하거나 합성인 서열을 포함하는 임의의 작용제(또는 이 같은 작용제를 인코딩하는 핵산)를 포함한다.

"아연-핑거 뉴클레아제"(ZFN)는 아연 핑거 DNA 결합 도메인을 DNA 절단 도메인에 융합시킴으로써 생성되는 인공 DNA 엔도뉴클레아제를 의미한다. ZFN은 목적하는 DNA 서열을 표적화하도록 가공될 수 있으며, 이는 아연-핑거 뉴클레아제가 독특한 표적 서열을 절단할 수 있도록 한다. 세포에 도입되면 ZFN은 이중 가닥 파열을 유도함으로써 세포(예를 들어, 세포 게놈) 내의 표적 DNA를 편집(edit)하는 데 사용될 수 있다. ZFN 사용에 대한 추가의 정보를 얻기 위해, 예를 들어 문헌[Asuri et al., Mol Ther. 2012 Feb; 20(2): 329-38]; 문헌[Bibikova et al. Science. 2003 May 2; 300(5620): 764]; 문헌[Wood et al. Science. 2011 Jul 15; 333(6040): 307]; 문헌[Ochiai et al. Genes Cells. 2010 Aug; 15(8): 875-85]; 문헌[Takasu et. al., Insect Biochem Mol Biol. 2010 Oct; 40(10): 759-65]; 문헌[Ekker et al, Zebrafish 2008 Summer; 5(2): 121-3]; 문헌[Young et al, Proc Natl Acad Sci U S A. 2011 Apr 26; 108(17): 7052-7]; 문헌[Goldberg et al, Cell. 2010 Mar 5; 140(5): 678-91]; 문헌[Geurts et al, Science. 2009 Jul 24; 325(5939): 433]; 문헌[Flisikowska et al, PLoS One. 2011; 6(6): e21045. doi: 10.1371/journal.pone.0021045. Epub 2011 Jun 13]; 문헌[Hauschild et al, Proc Natl Acad Sci U S A. 2011 Jul 19; 108(29): 12013-7]; 및 문헌[Yu et al, Cell Res. 2011 Nov;21(l 1): 1638-40]을 참고하며; 이의 전문은 ZFN에 관한 이들의 교시를 위해 본원에서 참고로 포함된다. 용어 "ZFN 작용제"는 아연 핑커 뉴클레아제 및/또는 아연 핑거 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함한다.

"전사 활성화제-유사 이펙터 뉴클레아제" 또는 "TALEN" 작용제는 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN)를 지칭한다. TALEN은 TAL(전사 활성화제-유사) 이펙터 DNA 결합 도메인을 DNA 절단 도메인에 융합시킴으로써 생성되는 인공 DNA 엔도뉴클레아제이다. TALEN은 임의의 목적하는 DNA 서열에 실질적으로 결합하도록 신속하게 가공될 수 있으며, 세포에 도입되는 경우 TALEN은 이중 가닥 파열을 유도함으로써 세포(예를 들어, 세포 게놈)의 표적 DNA를 편집하기 위해 사용될 수 있다. TALEN 사용에 대한 추가의 정보를 얻기 위해, 예를 들어 문헌[Hockemeyer et al. Nat Biotechnol. 2011 Jul 7; 29(8): 731-4]; 문헌[Wood et al. Science. 2011 Jul 15; 333(6040): 307]; 문헌[Tesson et al. Nat Biotechnol. 2011 Aug 5; 29(8): 695-6]; 및 문헌[Huang et. al., Nat Biotechnol. 2011 Aug 5; 29(8): 699-700]을 참고하며; 이의 전문은 TALEN과 관련하여 그들의 교시를 위해 본원에서 참고로 포함된다. 용어 "TALEN 작용제"는 TALEN 및/또는 TALEN을 인코딩하는 뉴클레오타이드 서열을 포함하는 폴리뉴클레오타이드를 포함한다.

용어 "제어 요소" 또는 "제어 서열"은 폴리뉴클레오타이드의 복제, 복사, 전사, 접합, 번역 또는 분해를 포함하는 폴리뉴클레오타이드의 기능 조절에 기여하는 분자의 상호 작용에 관련된 뉴클레오타이드 서열을 지칭한다. 상기 조절은 과정의 빈도, 속도 또는 특이성에 영향을 미칠 수 있으며, 특성상 강화되거나 억제될 수 있다. 당해 기술분야에 공지된 제어 요소는, 예를 들어 프로모터 및 인핸서(enhancer)와 같은 전사 조절 서열을 포함한다. 프로모터는 RNA 중합효소에 결합하고 일반적으로 프로모터로부터 하류(3' 방향)에 위치하는 코딩 영역의 전사를 개시하는 특정 조건하에서 가능한 DNA 영역이다. 프로모터는 편재적으로 작동할 수 있으며, 예를 들어 CAG 또는 CMV 프로모터와 같이 많은 세포 유형에서 활성이거나;조직 또는 세포 특이적으로 활성일 수 있다, 예를 들어 프로모터가 심장 근육 세포의 발현에 대해 조직 특이적일 수 있다.

용어 "작동 가능하게 연결된" 또는 "작동성으로 연결된"은 유전 요소가 병치(juxtaposition)된 것을 지칭하며, 이때 상기 요소는 이들이 예상되는 방식으로 작동할 수 있도록 하는 관계에 있다. 예를 들어, 프로모터가 코딩 서열의 전사를 개시하는 것을 돕는 경우, 프로모터는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 프로모터와 코딩 영역 사이에는 개재 잔기가 존재할 수 있다.

용어 "발현 벡터"는 관심 있는 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드 영역을 포함하는 벡터를 포함하고, 의도된 표적 세포에서 단백질의 발현을 수행하는데 사용된다. 발현 벡터는 또한 표적에서 단백질의 발현을 촉진하기 위해 인코딩 영역에 작동 가능하게 연결된 제어 요소를 포함할 수 있다. 제어 요소와 이들이 발현을 위해 작동 가능하게 연결된 유전자 또는 유전자들의 조합은 때때로 "발현 카세트(expression cassette)"로서 지칭되며, 이들 중 다수는 당업계에 공지되어 있고 이용 가능하거나, 당업계에서 이용 가능한 성분으로부터 용이하게 구성될 수 있다.

용어 "이종성"은 그것이 비교되는 나머지 독립체(entity)와 유전자형으로 별개인 독립체로부터 유래한다는 것을 의미한다. 예를 들어, 유전 공학 기술에 의해 다른 종에서 유래한 플라스미드 또는 벡터에 도입된 폴리뉴클레오타이드는 이종성 폴리뉴클레오타이드이다. 천연의 코딩 서열로부터 제거되고 그것이 자연적으로 발견되지 않는 코딩 서열에 작동 가능하게 연결된 프로모터는 이종성 프로모터이다. 따라서, 예를 들어 이종성 유전자 산물을 인코딩하는 이종성 핵산 서열을 포함하는 rAAV는 자연적으로 발생적하는 야생형 AAV에 정상적으로 포함되지 않는 폴리뉴클레오타이드를 포함하는 rAAV이고, 인코딩된 이종성 유전자 산물은 정상적으로는 자연적으로 발생하는 야생형 AAV에 의해 정상적으로 인코딩되지 않은 유전자 산물이다.

용어 "유전적 변경" 및 "유전적 변형"(및 문법상 이의 변이체)은 유전 요소 (예를 들어, 폴리뉴클레오타이드)가 유사 분열 또는 감수 분열이 아닌 방식으로 세포 내로 도입되는 과정을 지칭하기 위해 상호 교환 가능하게 본원에서 사용된다. 상기 요소는 세포에 대해 이종성일 수도 있고, 이는 세포에 이미 존재하는 요소의 추가 사본 또는 개선된 버전일 수도 있다. 유전적 변경은, 예를 들어 전기 천공(electroporation), 인산칼슘 침전 또는 폴리뉴클레오타이드-리포솜 복합체와의 접촉과 같은 당업계에 공지된 임의의 과정을 통해 세포를 재조합 플라스미드 또는 기타 폴리뉴클레오타이드로 형질 감염시킴으로써 수행될 수 있다. 또한, 유전적 변경은, 예를 들어 DNA 또는 RNA 바이러스 또는 바이러스 벡터에 의한 형질 도입 또는 감염에 의해 수행될 수 있다. 일반적으로, 유전적 요소는 세포 내의 염색체 또는 미니-염색체에 도입되지만; 세포 및 이의 자손의 표현형 및/또는 유전자형을 변경시키는 임의의 변경도 이러한 용어에 포함된다.

세포 변형과 관련하여 외생성 DNA(예를 들어, 재조합 바이러스를 통해)에 의해 "유전적으로 변형된" 또는 "형질 전환된" 또는 "형질 감염된" 또는 "형질 도입된"이라는 용어는 이 같은 DNA가 세포 내로 도입되는 경우를 지칭한다. 외생성 DNA가 존재하면 영구적 또는 일시적인 유전적 변화가 일어난다. 형질 전환 DNA는 세포의 게놈 내에 통합(공유 결합)될 수 있거나 통합(공유 결합)되지 않을 수 있다. "클론(clone)"은 유사 분열에 의한 단일 세포 또는 공통 조상으로부터 유래하는 세포 집단이다. "세포주"는 여러 세대 동안 시험관 내에서 안정적으로 성장할 수 있는 일차 세포의 클론이다.

본원에서 사용된 바와 같이, 서열이 시험관 내에서 장기간 세포 배양 도중에 및/또는 생체 내에서 장기간 동안 이의 기능을 수행할 수 있다면, 세포는 유전자 서열에 의해 "안정적으로" 변경, 형질 도입, 유전적 변형 또는 형질 전환되는 것으로 간주된다. 일반적으로, 이 같은 세포는 또한 유전적 변형이 도입되어 변경된 세포의 자손으로 유전될 수도 있다는 점에서 "유전적으로" 변경(유전적으로 변형)된다.

용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 임의의 길이의 아미노산의 중합체를 지칭하기 위해 본원에서 상호 교환 가능하게 사용된다. 또한, 상기 용어는, 예를 들어 이황화 결합 형성, 글리코실화, 지질화, 인산화, 또는 표지화 성분과의 접합과 같이 변형되어 있는 아미노산 중합체를 포함한다. 포유동물 대상에게 유전자 산물을 전달하는 것과 관련하여 논의되는 경우, 항-혈관 신생 폴리펩타이드, 신경 보호 폴리펩타이드 등과 같은 폴리펩타이드 및 이에 대한 조성물은 개개의 온전한 폴리펩타이드 또는 이의 임의의 단편 또는 유전적으로 조작된 유도체을 지칭하며, 이때 이들은 온전한 단백질의 목적하는 생화학적 기능을 유지한다. 유사하게, 항-혈관 신생 폴리펩타이드를 인코딩하는 핵산, 신경 보호 폴리펩타이드를 인코딩하는 핵산, 및 포유류 대상에 대한 유전자 산물의 전달에 사용하기 위한 기타 이 같은 핵산(수용체 세포에 전달될 "이식 유전자"로도 지칭될 수 있음)에 대한 인용은 온전한 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드 또는 목적하는 생화학적 기능을 보유하는 임의의 단편 또는 유전적으로 조작된 유도체를 포함한다.

본원에서 사용된 바와 같이, "단리된" 플라스미드, 핵산, 벡터, 바이러스, 비리온, 숙주 세포, 단백질 또는 다른 물질은 물질 또는 유사한 물질이 자연적으로 발생하거나 초기에 제조되는 곳에 또한 존재할 수 있는 적어도 일부의 기타 성분이 결여된 물질의 제제를 지칭한다. 따라서, 예를 들어 단리된 물질은 정제 기술을 사용하여 원료 혼합물로부터 농축시킴으로써 제조될 수 있다. 농축은 용액의 부피당 중량과 같은 절대 기준으로 측정될 수 있거나, 원료 혼합물에 존재하는 제2의 잠재적 간섭 물질과 관련하여 측정될 수 있다. 본 개시내용에서 실시형태의 농축의 증가는 점점 더 단리되게 된다. 단리된 플라스미드, 핵산, 벡터, 바이러스, 숙주 세포 또는 다른 물질은 일부 실시형태에서, 예를 들어 약 80% 내지 약 90% 순도, 적어도 약 90% 순도, 적어도 약 95% 순도, 적어도 약 98% 순도, 또는 적어도 약 99% 이상의 순도로 정제된다.

본원에서 사용된 바와 같이, 용어 "치료", "치료하기" 등은 목적하는 약리학적 및/또는 생리학적 효과를 얻는 것을 지칭한다. 상기 효과는 질병 또는 이의 증상을 완전히 또는 부분적으로 예방한다는 관점에서 예방적일 수 있고/있거나 질병 및/또는 질병에 기인하는 부작용에 대한 부분적 또는 완전한 치료의 관점에서는 치료적일 수 있다. 본원에서 사용된 바와 같은 "치료"는 포유동물, 특히 인간에서의 질병의 임의의 치료를 포함하며, (a) 질병에 걸리기 쉽거나, 질병에 걸릴 위험이 있지만 아직 질병에 걸린 것으로 진단받은 적이 없는 대상에서 질병(및/또는 질병에 의해 유발된 증상)이 발생하지 않도록 예방하는 단계; (b) 질병(및/또는 질병에 의해 유발된 증상)을 억제하는 단계, 즉 이의 발달을 중지시키는 단계; (c) 질병 (및/또는 질병에 의해 유발된 증상)을 완화시키는 단계, 즉 질병(및/또는 질병에 의해 유발된 증상)의 퇴행을 야기하는 단계, 즉 질병 및/또는 질병의 하나 이상의 증상을 완화시키는 단계를 포함한다. 예를 들어, 대상 조성물 및 방법은 근육 질병의 치료에 관한 것일 수 있다. 근육 질병 및 이의 치료를 평가하기 위한 비제한적인 방법은 치료 단백질 생산을 측정하는 것(예를 들어, 근육 생검, 이어서 면역 조직 화학 검사법 또는 혈청 샘플링, 이어서 ELISA 또는 효소 활성 분석), 심부전 증상(예를 들어, 뉴욕 심장 관련 기능적 분류 또는 심부전 설문지를 갖는 미네소타 리빙), 기능적 심장 상태(예를 들어, 6분 보행 테스트 또는 피크 최대 산소 소비), 바이오 마커 분석(예를 들어, N-말단 프로호르몬 뇌 나트륨이뇨 펩타이드), 좌심실 기능/리모델링(예를 들어, 좌심실 박출 분율 또는 좌심실 말단-수축기 부피), 근육 강도(예를 들어, 의료 연구 협회(MEDICAL RESEARCH COUNCIL)가 뒤셴형 디스트로피(Duchenne Dystrophy), 핸드-헬드 동력 측정법(dynamometry), 또는 최대 중량 리프트의 임상 조사를 기준화한다), 근육 기능(예를 들어, 비그노스(Vignos) 스케일, 시한 기능 테스트, 해머스미스(Hammersmith) 운동 능력 점수, 바닥으로부터의 시한 오름, 보행 테스트, 운동 기능 측정 스케일, 노스 스타(North Star) 이동성 평가, 9홀 PEG 테스트 또는 필라델피아 아동 병원 신경근 장애의 유아 테스트), 근육 질병 증상(예를 들어, 신경근 증상 점수 또는 전반적 임상 인상(Clinical Global Impression)), 미토콘드리아 기능(예를 들어, ³¹P 자기 공명 분광법), 생활의 질, 환자-보고된 결과, 또는 일일 활동의 질의-기반 평가를 즉정하는 것을 포함한다.

용어 "개인", "숙주", "대상" 및 "환자"는 본원에서 상호 교환 가능하게 사용되며, 인간을 포함하지만 이에 제한되지는 않는 포유류; 유인원을 포함한 비인간 영장류; 스포츠 포유동물(예를 들어, 말); 농장 포유동물(예를 들어, 양, 염소 등); 포유류 애완동물(개, 고양이 등); 설치류(예를 들어, 생쥐, 쥐 등)을 지칭한다.

일부 실시형태에서, 개체는 이전에 자연적으로 AAV에 노출되었으며, 그 결과 항-AAV 항체(즉, AAV 중화 항체)를 함유하게 된 인간이다. 일부 실시형태에서, 개체는 이전에 AAV 벡터가 투여되었던(그 결과, 항-AAV 항체를 함유할 수 있는) 인간이고, 다른 병태의 치료 또는 동일한 병태의 추가적인 치료를 위해 벡터의 재투여가 요구되는 인간이다. 예를 들어, 간, 근육 및 망막-이러한 비히클에 대한 중화 항체에 의해 영향을 받는 모든 조직-에 대한 AAV 유전자의 전달을 포함하는 임상 시험에서의 양성 결과에 기초하여, 다수의 이 같은 치료 응용/질병 표적이 존재한다.

본원에 사용된 바와 같은 용어 "유효량"은 유익하거나 목적하는 임상 결과를 달성하기에 충분한 양이다. 유효량은 하나 이상의 투여분으로 투여될 수 있다. 본 개시내용의 목적상, 화합물(예를 들어, 감염성 rAAV 비리온)의 유효량은 특정 질병 상태(예를 들어, 근육 질병) (및/또는 이와 연관된 증상)의 완화, 개선, 안정화, 반전, 예방, 감속 또는 진행을 지연시키기에 충분한 양이다. 따라서, 감염성 rAAV 비리온의 유효량은 개체의 표적 세포(또는 표적 세포들)에 이종성 핵산을 효과적으로 전달할 수 있는 감염성 rAAV 비리온의 양이다. 유효량은, 예를 들어 RT-PCR, 웨스턴 블랏팅(Western blotting), ELISA, 형광 또는 다른 리포터 판독 등과 같은 당업계에 널리 공지된 기술을 사용하여, 예를 들어 이종성 핵산 서열에 의해 인코딩되는 유전자 산물(RNA, 단백질)을 세포 또는 조직에서 검출함으로써 전임상으로 결정될 수 있다. 유효량은, 예를 들어 본원에 기술되고 당업계에 공지된 바와 같이, 당업계에 공지된 방법, 예를 들어 6분 보행 테스트, 좌심실 박출 분율, 핸드-헬드 동력 측정법, 비그노스 스케일 등을 사용하여 예를 들어 질병의 발병 또는 진행의 변화를 검출함으로써 임상적으로 결정될 수 있다.

용어 "근육 세포" 또는 "근육 조직"은 본원에서 골격 근육, 심장 근육, 평활근(예를 들어, 소화관, 방광 및 혈관) 및 횡경막 근육을 제한 없이 포함하는, 임의의 종류의 근육으로부터 유도된 세포 또는 세포 그룹을 지칭한다. 이와 같은 근육 세포들, 예를 들어 근육 모세포, 근육 세포, 근관 세포, 심장 근육 세포, 및 심장 근육 모세포는 분화되거나 미분화될 수 있다. 근육 조직이 순환계에 용이하게 접근할 수 있기 때문에, 생체 내 근육 세포 및 조직에 의해 생성 및 분비되는 단백질은 전신 혜택을 위해 혈류에 논리적으로 들어갈 것이고, 이에 의해 근육으로부터 단백질 분비의 지속된 치료 수준을 제공한다.

용어 "유도 진화"는 반복적인 유전적 다양화 및 선택 과정을 통해 자연적 진화를 모방하여 생체 분자의 기능을 점진적으로 개선시키는 유익한 돌연변이를 축적하는 시험관 내 및/또는 생체 내 캡시드 공학 방법을 지칭한다. 유도 진화는 종종 변이체가 관심 있는 세포 또는 조직 유형의 감염성의 보다 효율적인 수준을 갖는 라이브러리로부터 AAV 변이체의 선택을 위해 "바이오 패닝(biopanning)"으로도 지칭되는 생체 내 방법을 포함한다.

상세한 설명

아데노-관련 바이러스(AAVs)는 비외피성 캡시드 내에 함유된 4.7kb 길이의 단일 가닥 DNA 게놈을 갖는 파보바이러스의 부류이다. 자연적으로 발생하는 AAV의 바이러스 게놈은 2개의 역위 말단 반복서열(ITR)-바이러스 복제 원점(origin of replication) 및 패키징 신호(packaging signal)로 작용을 함-을 가지며, 이는 2개의 오픈 리딩 프레임(ORF), 즉 rep(바이러스 복제, 전사 조절, 부위-특이적 통합 및 비리온 조립에 작용하는 단백질을 인코딩함) 및 cap에 인접해 있다. cap ORF는 3개의 구조 단백질을 코딩하고, 이들 단백질은 조립되어 60-머(mer)의 바이러스 캡시드를 형성한다. 다수의 자연적으로 발생하는 AAV 변이체 및 혈청형이 분리되었으며, 어떠한 것도 인간 질병과 연관되어 있지 않았다.

AAV의 재조합 버전(recombinant version)은 rep 및 cap 대신에 ITRs 사이에 관심있는 마커 또는 치료용 유전자가 삽입되는 유전자 전달 벡터로 사용될 수 있다. 이들 벡터는 시험관 내 및 생체 내 분열 및 비-분할 세포 모두를 형질 전환하는 것으로 나타났으며, 사후 유사 분열 조직에서 수년간 안정한 형질 전환 유전자의 발현을 초래할 수 있다. 예를 들어, 문헌[Knipe DM, Howley PM. Fields’ Virology. Lippincott Williams ＆ Wilkins, Philadelphia, PA, USA, 2007; Gao G-P, Alvira MR, Wang L, Calcedo R, Johnston J, Wilson JM. 인간 유전자 치료를 위한 벡터로서 붉은털 원숭이에서 유래된 새로운 아데노-관련 바이러스. Proc Natl Acad Sci USA 2002; 99: 11854-9; Atchison RW, Casto BC, Hammon WM. 아데노바이러스 관련 결함 바이러스 입자. Science 1965; 149: 754-6; Hoggan MD, Blacklow NR, Rowe WP. 다양한 아데노바이러스 제제에서 발견되는 작은 DNA 바이러스 연구: 물리적, 생물학적 및 면역학적 특성. Proc Natl Acad Sci USA 1966; 55: 1467-74; Blacklow NR, Hoggan MD, Rowe WP. 사람으로부터 아데노바이러스-관련 바이러스의 분리. Proc Natl Acad Sci USA 1967; 58: 1410-5; Bantel-Schaal U, zur Hausen H. 생식기 부위로부터 분리된 결함있는 사람 파보바이러스의 DNA 특성 분석. Virology 1984; 134: 52-63; Mayor HD, Melnick JL. 작은 데옥시리보핵산 함유 바이러스(피코드나 바이러스 그룹). Nature 1966; 210: 331-2; Mori S, Wang L, Takeuchi T, Kanda T. 게잡이 원숭이에서 두 개의 새로운 아데노-관련 바이러스: 캡시드 단백질의 위형 특성. Virology 2004; 330: 375-83; Flotte TR. 유전자 치료 과정 및 전망: 재조합 아데노-관련 바이러스(rAAV) 벡터. Gene Ther 2004; 11 : 805-10]을 참조한다.

재조합 AAV(본원에서 간단히 "AAV"로 언급됨)는 증가하는 임상 시험에서 유망한 결과를 가져왔다. 그러나 항-캡시드 면역 반응, 특정 조직의 낮은 형질 도입, 특정 세포 유형에 표적화 전달에 대한 무능력 및 상대적으로 낮은 운반 능력과 같은 AAV의 유용성을 제한할 수 있는 유전자 전달에 장애가 있다. 많은 경우 AAV를 향상시키는 능력을 가진 합리적인 설계에 효과적으로 힘을 실어 줄 수 있는 충분한 기계론적 지식이 부족하다. 대안으로, 유도 진화는 특정 생물의학적 요구를 충족시키는 새로운 AAV 변이체를 만드는 전략으로 부상했다. 유도 진화 전략은 생체 분자의 기능을 점진적으로 향상시키는 유익한 돌연변이의 축적을 가능하게 하는 유전적 다양화 및 선택 과정을 활용한다. 이 과정에서 야생형 AAV cap 유전자는 바이러스 입자의 라이브러리를 생성하기 위해 패키징되는 대형 유전자 라이브러리를 만들기 위한 여러 접근법에 의해 다양화되고, 그 후 선택적인 압력이 유전자 전달 장벽을 극복할 수 있는 새로운 변이체를 분리하기 위해 적용된다. 중요하게, 유전자 전달 문제의 기초가 되는 기계론적 근거는 기능의 유도 진화에 대해 알려질 필요가 없으므로 향상된 벡터의 개발을 가속화할 수 있다.

전형적으로, 본원에 개시된 변이체는 AAV 라이브러리 및/또는 라이브러리들의 사용을 통해 생성되었다. AAV 캡시드의 구조 단백질을 인코드하는 유전자인 cap 유전자를 바이러스 게놈 공학 분야에서 숙련된 기술자에 알려지고 쉽게 이용 가능한 일련의 유도 진화 기술에 의해 돌연변이시킴으로써 이러한 AAV 라이브러리 또는 라이브러리들이 생성된다. 예를 들어, Bartel et al. Am. Soc. Gene Cell Ther. 15^th Annu. Meet. 20, S140(2012); Bowles, D. et al. J. Virol. 77, 423-432(2003); Gray et al. Mol. Ther. 18, 570-578(2010); Grimm, D. et al. J. Virol. 82, 5887-5911; Koerber, J. T. et al. Mol. Ther. 16, 1703-1709(2008); Li W. et al. Mol. Ther. 16, 1252-1260(2008); Koerber, J. T. et al. Methods Mol. Biol. 434, 161-170(2008); Koerber, J. T. et al. Hum. Gene Ther. 18, 367-378(2007); and Koerber, J. T. et al. Mol. Ther. 17, 2088-2095(2009)를 참고한다. 이 같은 기술은, 제한되지 않지만, 다음과 같다: i) 실수 유발 PCR로 미리 정해진 수정 가능한 속도로 무작위 점돌연변이를 AAV cap 오픈 리딩 프레임(ORF)에 도입한다; ii) 다중 AAV 혈청형으로 유전자 라이브러리를 생성하기 위해 AAV cap 유전자의 무작위 키메라를 생성하는 시험관 내 또는 생체 내 바이러스 재조합 또는 "DNA 셔플링(suffling)"; iii) cap ORF 내의 퇴화된 올리고뉴클레오타이드의 연결에 의한 캡시드의 한정된 부위에서의 무작위 펩타이드 삽입; iv) 트랜스포존 돌연변이 유발을 이용한 AAV cap ORF의 무작위 위치로의 펩타이드-인코딩 서열의 한정된 삽입; v) "루프 스왑(loop-swap)" 라이브러리를 생성하기 위해 천연 AAV 혈청형 및 변이체 중 각 아미노산 위치의 보존 수준에 기초하여 생체 정보로 설계된 펩타이드 서열의 라이브러리로 AAV 캡시드의 표면 루프를 대체; vi) 조상 변이체의 라이브러리를 생성하기 위해 AAV 혈청형 사이의 퇴행성 위치에서 무작위 아미노산 치환(Santiago-Ortiz et al., 2015); 및 이러한 기술들의 조합을 포함한다.

DNA 셔플링은 키메라를 생성하고, 이 키메라는 부모의 속성을 독특하고 종종 유익한 방식으로 결합한다; 그러나, 일부는 패키징할 수 없으므로 사실상 라이브러리의 다양성을 감소시킬 수 있다. 캡시드의 특정 영역(들) 내로의 라이브러리의 다양성 정도는 제한되지 않지만 상기 iii-iv)와 같은 펩타이드 삽입 기술을 통해 달성된다. 라이브러리의 다양성은 상기 v)와 같은 기술로 캡시드의 특정 영역(들) 내에 또한 집중되어 있으며, 이러한 집중은 AAV 캡시드의 표면 노출 루프에 있는 다중 초가변 영역으로 지향된다. 많은 기술이 캡시드의 작은 면적만이 변이되는 변이체 캡시드를 생성하지만, 이들 기술은 추가의 돌연변이 유발 전략과 쌍을 이루어 완전한 캡시드를 변형시킬 수 있다.

일단 AAV 라이브러리 또는 라이브러리들이 생성되면, 각 AAV 입자가 캡시드를 인코딩하는 cap 유전자를 둘러싸는 돌연변이 캡시드로 구성되도록 바이러스는 패키징되고 정제된다. 그런 다음, 라이브러리의 변이체는 AAV 분야에서 숙련된 기술자에 의해 공지되어 쉽게 활용할 수 있는 시험관 내 및/또는 생체 내 선택압 기술에 적용된다. 예를 들어, Maheshri, N. et al. Nature Biotech. 24, 198-204(2006); Dalkara, D. et al. Sci. Transl. Med. 5, 189ra76(2013); Lisowski, L. et al. Nature. 506, 382-286(2013); Yang, L. et al. PNAS. 106, 3946-3951(2009); Gao, G. et al. Mol. Ther. 13, 77-87(2006); 및 Bell, P. et al. Hum. Gene. Ther. 22, 985-997(2011)를 참고한다. 예를 들어, 제한 없이, AAV 변이체는 i) 상이한 분획의 용출이 변경된 결합 특성을 갖는 변이체를 생성하는 친화성 컬럼; ii) 1차 세포 - 인체 세포의 행동을 모방하는 조직 표본 또는 불멸 세포주로부터 분리된 - 증가 된 효율 및/또는 조직 특이성을 갖는 AAV 변이체를 생산; iii) 동물 모델 - 임상 유전자 치료 환경을 모방한 - 표적 조직을 성공적으로 감염시킨 AAV 변이체를 생산; iv) 이식된 인간 세포를 감염하는 AAV 변이체를 생산하는 인간 이종 이식 모델; 및/또는 이들의 선택 기술의 조합을 사용하여 선택될 수 있다.

일단 바이러스가 선택되면, 제한 없이, 아데노바이러스 - 매개 복제, PCR 증폭, 차세대 시퀀싱 및 클로닝 등과 같은 공지된 기술에 의해 회수될 수 있다. 그런 다음, 선택 기법을 반복하여 바이러스 복제를 풍부하게 하고 AAV DNA를 분리하여 관심있는 특정 변이체 cap 유전자를 회수한다. 이 같은 선택된 변이체는 추가 변형 또는 돌연변이를 받아 AAV 바이러스 적합성을 반복적으로 증가시키기 위한 추가 선별 단계의 새로운 출발점으로 작용할 수 있다. 그러나 어떤 경우에는, 성공적인 캡시드가 추가 돌연변이 없이 생성되었다.

본원에 개시된 AAV 변이체는 적어도 부분적으로 생체 내 유도 진화 방법론, 예를 들어 정맥 내 투여 후 영장류 심장 및 골격 근육 스크린의 사용을 포함하는 전술한 기술의 사용을 통해 생성되었다. 이와 같이, 본원에 개시된 AAV 변이체 캡시드는 상응하는 모 AAV 캡시드 단백질보다 영장류 근육 세포의 더 효율적인 형질 도입을 부여하는 아미노산 서열의 하나 이상의 변형을 포함한다. 본원에 사용된 "상응하는 모 AAV 캡시드 단백질"은 본 발명의 변이체 AAV 캡시드 단백질과 동일한 야생형 또는 변이체 AAV 혈청형의 AAV 캡시드 단백질을 지칭 하나, 본 발명 변이체 AAV 캡시드 단백질의 하나 이상의 아미노산 서열 변형을 포함하지 않는다. 특정 실시 양태에서, 본원에 기재된 바와 같은 변이체 AAV 캡시드 단백질을 포함하는 AAV는 전신 또는 조직-표적화된 투여 후 신체 전체에 걸쳐 심장 근육 및/또는 다중 골격 근육 그룹에 대하여 전신성 주성을 갖는다.

일부 실시 양태에서, 본 발명의 변이체 AAV 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질에 비해 AAV 캡시드 단백질 GH 루프 또는 루프 IV에 공유 결합에 의해 삽입된 약 5개 아미노산 내지 약 20개 아미노산의 이종성 펩타이드를 포함한다. AAV 캡시드 단백질의 "GH 루프" 또는 루프 IV는 당업계에서 AAV 캡시드 단백질의 GH 루프 또는 루프 IV로 언급되는 용매 - 접근 가능한 부분을 의미한다. AAV 캡시드의 GH 루프/루프 IV에 대해서는, 예를 들어, van Vliet et al. (2006) Mol. Ther. 14:809; Padron et al.(2005) J. Virol. 79:5047; 및 Shen et al.(2007) Mol. Ther. 15:1955 참고한다. 따라서, 예를 들어, 삽입 부위는 AAV VP1 캡시드 단백질의 약 아미노산 411-650 내에 있을 수 있다. 예를 들어, 삽입 부위는 AAV1 VP1의 아미노산 571-612 내, AAV2 VP1의 아미노산 570-611 내, AAV3A VP1의 아미노산 571-612 내, AAV3B VP1의 아미노산 571-612 내, AAV4 VP1의 아미노산 569-610 내, AAV5 VP1의 아미노산 560-601 내, AAV6 VP1의 아미노산 571 내지 612 내, AAV7 VP1의 아미노산 572 내지 613 내, AAV8 VP1의 아미노산 573 내지 614 내, AAV9 VP1의 571 내지 612 내 또는 AAV10 VP1의 아미노산 573 내지 614 내 또는 그의 임의의 변이체의 상응하는 아미노산일 수 있다. 당업자는 다양한 AAV 혈청형의 캡시드 단백질의 아미노산 서열의 비교에 기초하여, "AAV2의 아미노산에 상응하는" 삽입 부위가 임의의 주어진 AAV 혈청형의 캡시드 단백질에 존재할 것이라는 것을 알 것이다. 야생형(자연 발생) 혈청형 AAV1, AAV2, AAV3A, AAV3B 및 AAV4-10 사이의 아미노산 위치를 제공하는 야생형 AAV 서열 식별 번호 1-11의 정렬에 대해서는 도 6을 또한 참조한다.

특정 실시 양태에서, 삽입 부위는 임의의 야생형 AAV 혈청형 또는 AAV 변이체의 VP1의 아미노산 570-614 사이에 위치한 2개의 인접한 아미노산 사이의 단일 삽입 부위이며, 예를 들어, 삽입 부위는 임의의 AAV 혈청형 또는 변이체의 VP1의 아미노산 570-610, 아미노산 580-600, 아미노산 570-575, 아미노산 575-580, 아미노산 580-585, 아미노산 585-590, 아미노산 590-600 또는 아미노산 600-614에 위치한 2개의 인접한 아미노산 사이이다. 예를 들어, 삽입 부위는 아미노산 580 및 581, 아미노산 581 및 582, 아미노산 583 및 584, 아미노산 584 및 585, 아미노산 585 및 586, 아미노산 586 및 587, 아미노산 587 및 588, 아미노산 588 및 589, 또는 아미노산 589 및 590 사이일 수 있다. 삽입 부위는 아미노산 575와 576, 아미노산 576과 577, 아미노산 577과 578, 아미노산 578과 579, 또는 아미노산 579와 580 사이일 수 있다. 삽입 부위는 아미노산 590 및 591, 아미노산 591 및 592, 아미노산 592 및 593, 아미노산 593 및 594, 아미노산 594 및 595, 아미노산 595 및 596, 아미노산 596 및 597, 아미노산 597 및 598, 아미노산 598 및 599, 또는 아미노산 599 및 600 사이일 수 있다. 예를 들어, 삽입 부위는 AAV2의 아미노산 587과 588 사이, AAV1의 아미노산 590과 591 사이, AAV3A의 아미노산 588과 589 사이, AAV3B의 아미노산 588과 589 사이, AAV4의 아미노산 584와 585 사이, AAV5의 아미노산 575와 576 사이, AAV6의 아미노산 590과 591 사이, AAV7의 아미노산 589와 590 사이, AAV8의 아미노산 590과 591 사이, AAV9의 아미노산 588과 589 사이, 또는 AAV10의 아미노산 588과 589 사이일 수 있다.

일부 실시 양태에서, 본원에 개시된 펩타이드 삽입은 5개의 아미노산, 6개의 아미노산, 7개의 아미노산, 8개의 아미노산, 9개의 아미노산, 10개의 아미노산, 11개의 아미노산, 12개의 아미노산, 13개의 아미노산, 14개의 아미노산, 15개의 아미노산, 16개의 아미노산, 17개의 아미노산, 18개의 아미노산, 19개의 아미노산 또는 20개의 아미노산 서열을 갖는다. 또 다른 실시 양태에서, 본원에 개시된 펩타이드 삽입은 본원에 개시된 펩타이드 삽입 중 어느 하나의 아미노 말단(N-말단) 및/또는 카르복실 말단(C-말단)에서 1 내지 4개의 스페이서 아미노산을 포함한다. 예시적인 스페이서 아미노산은, 제한 없이, 루신(L), 알라닌(A), 글리신(G), 세린(S), 트레오닌(T) 및 프롤린(P)을 포함한다. 특정 실시 양태에서, 펩타이드 삽입은 N-말단에 2개의 스페이서 아미노산 및 C-말단에 2개의 스페이서 아미노산을 포함한다. 다른 실시 양태에서, 펩타이드 삽입은 N-말단에 2개의 스페이서 아미노산 및 C-말단에 1개의 스페이서 아미노산을 포함한다.

본원에 개시된 펩타이드 삽입은 이전에 기재되지 않았거나 AAV 캡시드에 삽입되지 않았다. 이론에 구속되기를 바라지 않고, 임의의 개시된 펩타이드 삽입의 존재는 바이러스 형질 도입 경로 내에서 세포 외 또는 세포 내 단계를 변화시킬 수 있는 헤파린 황산염에 대한 변이체 캡시드의 친화성을 낮추도록 작용을 할 수 있다. 또한, 본원에 개시된 펩타이드 삽입 모티프는 세포 표면 수용체 결합 도메인의 첨가를 통한 근육 세포(예를 들어, 심장 근육 세포)의 향상된 형질 도입을 부여할 수 있다.

일부 바람직한 실시 양태에서, 삽입 펩타이드는 하기 화학식의 어느 하나의 아미노산 서열을 포함한다.

일부 양태에서, 삽입 펩타이드는 화학식 1a의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:

[화학식 1a]

Y₁Y₂X₁X₂X₃X₄X₅X₆X₇Y₃

여기서 각각의 Y₁-Y₃은, 존재하는 경우, 독립적으로 Ala, Leu, Gly, Ser, Thr, Pro로부터 선택되고

X₁은 Ala, Asn, Thr, Gly, Ser, Ala, Gln 및 Asp로부터 선택되고

X₂는 Lys, Asn, Thr, Ser, Ala 및 Gln으로부터 선택되고

X₃은 Ile, Thr, Lys, Leu, Val, Asn, Asp 및 Arg로부터 선택되고

X₄는 Gln, Thr, Ile, Lys, Val, Ser 및 Tyr로부터 선택되고

X₅는 Arg, Asn, Gly, Lys, Leu, Thr, Ala, Ser 및 Gln으로부터 선택되고

X₆은 Thr, Lys, Val, Gly, Ser, Ala, Arg, and Pro로부터 선택되고

X₇은 Asp, Thr, Asn, Ile, Ala 및 Ser로부터 선택된다.

특정 실시 양태에서, 화학식 1a의 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25) 및 ASDSTKA(서열 식별 번호 26)로부터 선택되는 아미노산 서열을 포함한다. 다른 실시 양태에서, 화학식 1a의 삽입 펩타이드는 NKTTNKD(서열 식별 번호 14), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24) 및 NQDYTKT(서열 식별 번호 22)로부터 선택되는 아미노산 서열을 포함하지 않는다.

다른 양태에서, 삽입 펩타이드는 화학식 1b의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:

[화학식 1b]

Y₁Y₂X₁X₂X₃X₄X₅X₆X₇Y₃

X₁은 Thr 및 Asn으로부터 선택되고

X₂는 Asn 및 Lys로부터 선택되고

X₃은 Lys, Ile 및 Thr로부터 선택되고

X₄는 Ile, Gln 및 Thr로부터 선택되고

X₅는 Gly, Arg 및 Asn으로부터 선택되고

X₆은 Val, Thr 및 Lys로부터 선택되고

X₇은 Thr 및 Asp로부터 선택된다.

특정 실시 양태에서, 화학식 1b의 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다. 다른 실시 양태에서, 화학식 1a의 삽입 펩타이드는 NKTTNKD(서열 식별 번호 14)를 포함하지 않는다.

다른 양태에서, 삽입 펩타이드는 화학식 1c의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:

[화학식 1c]

Y₁Y₂X₁X₂X₃X₄X₅X₆X₇Y₃

X₁은 Thr 및 Asn으로부터 선택되고

X₂는 Asn 및 Lys로부터 선택되고

X₃은 Lys 및 Ile로부터 선택되고

X₄는 Ile 및 Gln으로부터 선택되고

X₅는 Gly 및 Arg로부터 선택되고

X₆은 Val 및 Thr로부터 선택되고

X₇은 Thr 및 Asp로부터 선택된다.

특정 실시 양태에서, 화학식 1c의 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다.

다른 양태에서, 삽입 펩타이드는 화학식 1d의 7 내지 10개의 아미노산 서열의 펩타이드일 수 있다:

[화학식 1d]

Y₁Y₂X₁X₂X₃X₄X₅X₆X₇Y₃

X₁은 Asn 및 Thr로부터 선택되고

X₂는 Asn 및 Lys로부터 선택되고

X₃은 Lys 및 Thr로부터 선택되고

X₄는 Ile 및 Thr로부터 선택되고

X₅는 Gly, Lys 및 Thr로부터 선택되고

X₆은 Lys, Arg 및 Val로부터 선택되고

X₇은 Asp, Thr 및 Asn으로부터 선택된다.

특정 실시 양태에서, 화학식 1d의 삽입 펩타이드는 TNKIGVT(서열 식별 번호 15)를 포함한다.

다른 실시 양태에서, 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다. 관련 실시 양태에서, 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13) 및 TNKIGVT(서열 식별 번호 15)로부터 선택되는 아미노산 서열을 포함한다.

일부 실시 양태에서, 삽입 펩타이드는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25) 및 ASDSTKA(서열 식별 번호 26)로부터 선택되는 아미노산 서열을 포함한다.

다른 바람직한 실시 양태에서, 삽입 펩타이드는 NKIQRTD (서열 식별 번호 13), NKTTNKD (서열 식별 번호 14), TNKIGVT (서열 식별 번호 15), GNLTKGN (서열 식별 번호 16), NTVKLST (서열 식별 번호 17), SNTVKAI (서열 식별 번호 18), ASNITKA (서열 식별 번호 19), DNTVTRS (서열 식별 번호 20), NKISAKD (서열 식별 번호 21), NQDYTKT (서열 식별 번호 22), QADTTKN (서열 식별 번호 23), TNRTSPD (서열 식별 번호 24), SNTTQKT (서열 식별 번호 25) 및 ASDSTKA (서열 식별 번호 26)로부터 선택되는 아미노산 서열의 아미노 및/또는 카르복시 말에 1 내지 3개의 스페이서 아미노산(Y₁-Y₃)을 갖는다. 이러한 특정 실시 양태에서, 삽입 펩타이드는 LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.

일부 실시 양태에서, 본 발명의 변이체 AAV 캡시드 단백질은 GH 루프 또는 루프 IV에서 약 5개 아미노산 내지 약 20개 아미노산의 펩타이드 삽입 이외의 다른 아미노산 서열 변형을 포함하지 않는다. 예를 들어, 일부 실시 양태에서, 본 발명의 변이체 AAV 캡시드 단백질은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25),ASDSTKA(서열 식별 번호 26),LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41), and LAASDSTKAA(서열 식별 번호 42)로 이루어진 군에서 선택되는 아미노산 서열을 포함하는 펩타이드 삽입을 포함하고, 변이체 AAV 캡시드는 다른 아미노산 치환, 삽입, 또는 결실을 포함하지 않는다(즉, 변이체 AAV 캡시드 단백질은 상기 삽입을 포함하고, 그렇지 않으면 상응하는 AAV 캡시드 단백질과 동일하다). 달리 말하면, 상기 삽입을 포함하는 변이체 AAV 캡시드 단백질은 펩타이드가 삽입된 모 AAV 캡시드 단백질과 동일하다. 또 다른 예로서, 본 발명의 변이체 AAV 캡시드 단백질은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로부터 선택되는 아미노산 서열을 포함하는 펩타이드 삽입을 포함하며, 펩타이드 삽입이 AAV2 캡시드의 VP1의 아미노산 587과 588 사이; AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이; AAV7의 VP1의 아미노산 589 및 590 사이; AAV1, AAV6 또는 AAV8의 VP1의 아미노산 590 내지 591 사이; AAV4의 VP1의 아미노산 584 및 585 사이 또는 AAV5의 VP1의 아미노산 575 및 576 사이에 위치하며, 달리 변이체 AAV 캡시드 단백질 서열은 상응하는 모 AAV 캡시드 단백질 서열, 예를 들어, 서열 식별 번호 1-12의 임의의 아미노산 서열과 동일하다.

다른 실시 양태에서, 예를 들어, 본원에 개시된 또는 당업계에 공지된 바와 같이 펩타이드 삽입을 GH 루프에 포함하는 것 이외에 본 발명의 변이체 AAV 캡시드 단백질은 모 AAV 캡시드 단백질과 비교해 약 1 내지 약 100개의 아미노산 치환 또는 결실, 예를 들어, 1 내지 약 5, 약 2 내지 약 4, 약 2 내지 약 5, 약 5 내지 약 10, 약 10 내지 약 15, 약 15 내지 약 20, 약 20 내지 약 25, 약 25-50, 약 50-100 아미노산 치환 또는 결실을 포함한다. 따라서, 일부 실시 양태에서, 본 발명의 변이체 캡시드 단백질은 상응하는 모 AAV 캡시드, 예를 들어 서열 식별 번호 1-12에 개진된 바와 같은 야생형 캡시드 단백질과 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상, 또는 99% 동일성을 갖는 아미노산 서열을 포함한다.

추가의 실시 양태에서, 하나 이상의 아미노산 치환은 펩타이드 삽입 이전에 번호가 매겨진 AAV2 VP1 캡시드 단백질의 아미노산 잔기(들) 35, 109, 195, 213, 222, 229, 312, 319, 330, 333, 347, 363, 427, 447, 449, 453, 490, 527, 551, 581, 585, 588, 593, 606, 649, 651, 694, 698, 708 및/또는 735, 또는 다른 AAV 캡시드 단백질의 상응하는 아미노산 잔기(들)에 있다. 일부 이러한 실시 양태에서, 하나 이상의 아미노산 치환은 펩타이드 삽입 이전에 번호가 매겨진 AAV2 VP1 캡시드 단백질의 A35P, S109T, P195L, D213N, G222S, V229I, N312K, A319T, T330A, A333S, E347K, P363L, A427D, V447F, N449D, N449K, G453R, A490T, K527Q, N551S, A581T, Y585S, R588M, A593E, W606C, K649E, R651H, W694C, I698V, V708I 및 L735Q로 이루어진 군으로부터 선택되거나 다른 AAV 캡시드 단백질의 상응하는 아미노산 잔기(들)에서 선택된다.

바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) 캡시드 단백질의 GH-루프에 있고, NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로부터 선택된 아미노산 서열을 포함하는 펩타이드 삽입, 및 b) AAV2(서열 식별 번호 2)의 아미노산 서열과 비교하여 다음의 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환 중 하나 이상을 포함하고, 치환된 아미노산(들)은 상응하는 위치에 자연적으로 발생되지 않는다: V708I, V708I + A593E, V708I + S109T, V708I + T330A, A35P, V708I + R588M, V708I + W606C, V708I + W694C, I698V, N312K + N449D + N551S + I698V + L735Q, N312K + N449D + N551S + I698V + V708I + L735Q, V708I + N449K 및 V708I + G222S 및 이들의 조합. 일부 실시 양태에서, 하나 이상의 아미노산 치환은 바람직하게는, 펩타이드 삽입 부위는 AAV2 캡시드의 아미노산 587 및 588 사이, AAV2 캡시드의 아미노산 587 및 588 사이, AAV3A, AAV3B, AAV9 또는 AAV10 캡시드의 아미노산 588 및 589 사이, AAV7 캡시드의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8 캡시드의 아미노산 590 및 591 사이, AAV4 캡시드의 아미노산 584 및 585 사이, 또는 AAV5 캡시드의 아미노산 575 및 576 사이에 위치한다.

특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 708에서의 V708I 아미노산 치환을 추가로 포함하고, AAV2 또는 다른 AAV 모 혈청형에서의 상응하는 치환에 대해 A593E 및/또는 S109T 및/또는 T330A 및/또는 R588M 치환을 선택적으로 더 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다. 특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 35에서의 A35P 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 추가로 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이 또는 상응하는 모 AAV 캡시드와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKIQRTDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 43)

특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2 캡시드의 VP1의 587과 588 사이 또는 다른 AAV 혈청형의 캐시드 단백질에서의 상응하는 아미노산 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 또는 다른 AAV 모 혈청형에서의 상응하는 치환과 비교해 N312K 아미노산 치환을 포함하고, AAV2 캡시드 또는 다른 AAV 모 혈청형에서의 상응하는 치환의 아미노산 서열과 비교해 (i) N449D, N551S, I698V 및 L735Q 또는 (ii) N449D, N551S, I698V, L735Q 및 V708I 아미노산 치환을 선택적으로 더 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL K FKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRT D TPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKT S VDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKIQRTDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPE V QYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRN Q (서열 식별 번호 44)

또 다른 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이, AAV7의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 아미노산 590 및 591 사이, AAV4의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 내지 576 사이에 위치하는 펩타이드 삽입을 포함하되, 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13) 및 LANKIQRTDA(서열 식별 번호 27)로부터 선택되는 아미노산을 포함하고, 및 b) AAV3A 또는 AAV3B의 아미노산 709에서의 발린에서 이소류신(isoleusine) 치환, AAV1 또는 AAV6의 709 위치에서의 알라닌에서 이소류신 치환, AAV4의 아미노산 707 또는 AAV9의 아미노산 709에서의 아스파라긴에서 이소류신 치환 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서의 트레오닌에서 이소류신 치환 또는 AAV5의 아미노산 697에서의 글루타민에서 이소류신 치환을 포함하며, 선택적으로 달리 임의의 서열 식별 번호 1 및 3-12와 동일하다. 바람직한 실시형태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하고, 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함한다.

또 다른 바람직한 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에 발린에서의 발린에서 이소류신 아미노산 치환을 포함한다.

또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하거나 또는 아미노산 서열 LANKIQRTDA(서열 식별 번호 27)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2의 아미노산과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKIQRTDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 45)

특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드의 아미노산 서열과 비교해 V708I 아미노산 치환을 포함하고, AAV2 또는 다른 AAV 모 혈청형에서의 상응하는 치환에 대해 N449K 및/또는 G222S 치환을 선택적으로 더 포함하며, 치환된 아미노산들은 상응하는 위치에서 자연적으로 발생하지 않는다. 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 혈청형의 캡시드 단백질에서의 상응하는 위치 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA (서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2의 아미노산 서열 또는 다른 AAV 모 혈청형에서의 상응하는 치환(들)과 비교해 N312K, N449D, N551S, I698V 및 L735Q 및 선택적으로 V708I 아미노산 치환을 포함하고, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LATNKIGVTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 46)

또 다른 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이, AAV7의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 아미노산 590 및 591 사이, AAV4의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 내지 576 사이에 위치하는 펩타이드 삽입을 포함하되, 펩타이드 삽입은 TNKIGVT(서열 식별 번호 15), LATNKIGVTA(서열 식별 번호 29) 및 LATNKIGVTS(서열 식별 번호 37)로부터 선택되는 아미노산을 포함하고, 및 b) AAV3A 또는 AAV3B의 아미노산 709에서의 발린에서 이소류신 치환, AAV1 또는 AAV6의 709 위치에서의 알라닌에서 이소류신 치환, AAV4의 아미노산 707 또는 AAV9의 아미노산 709에서의 아스파라긴에서 이소류신 치환 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서의 트레오닌에서 이소류신 치환 또는 AAV5의 아미노산 697에서의 글루타민에서 이소류신 치환을 포함한다. 바람직한 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2의 아미노산 서열과 비교하여 아미노산 708(V708I)에서의 발린에서 이소류신 아미노산 치환을 포함하고, 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 바람직하게 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성이 있다.

또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다.

또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 TNKIGVT(서열 식별 번호 15)를 포함하거나 또는 아미노산 서열 LATNKIGVTA(서열 식별 번호 29) 또는 LATNKIGVTS(서열 식별 번호 37)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LATNKIGVTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 47)

다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14) 또는 LANKTTNKDA(서열 식별 번호 28)을 포함하는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 708에서의 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 추가로 포함하고, AAV2 또는 다른 AAV 모 혈청형에서의 상응하는 치환과 비교해 S109T 및/또는 W694C 및/또는 W606C 아미노산 치환을 선택적으로 더 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다. 특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 아미노산 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 잔기 698에서 또는 다른 AAV 캡시드의 상응하는 잔기에서의 I698V 아미노산 치환을 더 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이 또는 상응하는 모 AAV 캡시드와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKTTNKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별번호 48)

특히 다른 바람직한 실시 양태에서, 변이체 AAV 캡시드는 AAV2 캡시드 단백질의 아미노산 587과 588 사이 또는 다른 AAV 혈청형의 캡시드 단백질에서의 상응하는 위치 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)을 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교해 N312K 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 추가로 포함하고, AAV2 캡시드의 아미노산과 비교해 N449D, N551S, I698V 및 L735Q 및 선택적으로 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 선택적으로 더 포함한다. 변이체 AAV 캡시드는 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 그 이상의 아미노산 서열 동일성을 가질 수 있다. 특히 바람직한 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRL K FKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRT D TPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKT S VDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKTTNKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPE V QYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRN Q (서열 식별 번호 49)

다른 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) AAV3A, AAV3B, AAV9 또는 AAV10의 VP1의 아미노산 588 및 589 사이, AAV7의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 아미노산 590 및 591 사이, AAV4의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 내지 576 사이에 위치하는 펩타이드 삽입을 포함하되, 펩타이드 삽입은 NKTTNKD(서열 식별 번호 14) 및 LANKTTNKDA(서열 식별 번호 28)로부터 선택되는 아미노산을 포함하고, 및 b) AAV3A 또는 AAV3B의 아미노산 709에서의 발린에서 이소류신 치환, AAV1 또는 AAV6의 709 위치에서의 알라닌에서 이소류신 치환, AAV4의 아미노산 707 또는 AAV9의 아미노산 709에서의 아스파라긴에서 이소류신 치환 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서의 트레오닌에서 이소류신 치환 또는 AAV5의 아미노산 697에서의 글루타민에서 이소류신 치환을 포함하며, 선택적으로 달리 임의의 서열 식별 번호 1 및 3-12와 동일하다. 바람직한 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하며, 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함한다.

또 다른 실시 양태에서, 변이체 캡시드 단백질은 a) AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, b) AAV2의 아미노산 서열과 비교하여 아미노산 708에서의 발린에서 이소류신 아미노산 치환을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다.

다른 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다.

다른 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하거나 또는 아미노산 서열 LANKTTNKDA(서열 식별 번호 28)을 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하며, 달리 서열 식별 번호 2의 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKTTNKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 50)

바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질이 제공되고, 이는 a) 캡시드 단백질의 GH-루프에 있고, GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25) 및 ASDSTKA(서열 식별 번호 26)로부터 선택된 아미노산 서열을 포함하는 펩타이드 삽입, 및 b) AAV2(서열 식별 번호 2)의 아미노산 서열과 비교하여 다음의 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환 중 하나 이상을 포함하고, 치환된 아미노산(들)은 상응하는 위치에 자연적으로 발생되지 않는다: A35P, S109T, P195L, D213N, G222S, V229I, N312K, A319T, T330A, A333S, E347K, P363L, A427D, V447F, N449D, N449K, G453R, A490T, K527Q, N551S, A581T, Y585S, R588M, A593E, W606C, K649E, R651H, W694C, I698V, V708I, L735Q 및 이들의 조합. 일부 실시 양태에서, 하나 이상의 아미노산 치환은 V708I, S109T, R651H, A319T, P195L, P363L, I698V, D213N, G453R 및 이들의 조합으로 이루어지는 군으로부터 선택된다. 일부 바람직한 실시 양태에서, 하나 이상의 아미노산 치환은 적어도 V708I 및/또는 P363L 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함한다. 바람직하게는, 펩타이드 삽입 부위는 AAV2 캡시드의 아미노산 587 및 588 사이 또는 다른 AAV 혈청형의 캡시드 단백질에서의 상응하는 위치 사이에 위치한다. AAV2 캡시드의 아미노산 587 및 588 사이, AAV3A, AAV3B, AAV9 또는 AAV10 캡시드의 아미노산 588 및 589 사이, AAV7 캡시드의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8 캡시드의 아미노산 590 및 591 사이, AAV4 캡시드의 아미노산 584 및 585 사이, 또는 AAV5 캡시드의 아미노산 575 및 576 사이에 위치한다.

일부 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 다음의 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환 중 하나 이상을 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않는다: V708I, V708I + S109T, R651H, A319T + P195L, P363L, P363L + V708I. 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2) 또는 다른 AAV 캡시드의 상응하는 잔기의 아미노산 서열에 대해 V708I 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2) 또는 다른 AAV 캡시드의 상응하는 잔기의 아미노산 서열에 대해 P363L 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2) 또는 다른 AAV 캡시드의 상응하는 잔기의 아미노산 서열에 대해 R651H 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이에 아미노산 서열 GNLTKGN(서열 식별 번호 16)을 포함하거나 또는 아미노산 서열 LAGNLTKGNA(서열 식별 번호 30)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAGNLTKGNA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 51)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NTVKLST(서열 식별 번호 17)를 포함하거나 또는 아미노산 서열 LANTVKLSTA(서열 식별 번호 31)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)에 대해 V708I 아미노산 치환 또는 다른 모 AAV 혈청형에서의 상응하는 치환을 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않으며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이에 아미노산 서열 NTVKLST(서열 식별 번호 17)를 포함하거나 또는 아미노산 서열 LANTVKLSTA(서열 식별 번호 31)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANTVKLSTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 52)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 SNTVKAI(서열 식별 번호 18)를 포함하거나 또는 아미노산 서열 LASNTVKAIA(서열 식별 번호 32)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 SNTVKAI(서열 식별 번호 18)를 포함하거나 또는 아미노산 서열 LASNTVKAIA(서열 식별 번호 32)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LASNTVKAIA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 53)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 ASNITKA(서열 식별 번호 19)를 포함하거나 또는 아미노산 서열 LAASNITKAA(서열 식별 번호 33)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 ASNITKA(서열 식별 번호 19)를 포함하거나 또는 아미노산 서열 LAASNITKAA(서열 식별 번호 33)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAASNITKAA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 54)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 DNTVTRS(서열 식별 번호 20)를 포함하거나 또는 아미노산 서열 LADNTVTRSA(서열 식별 번호 34)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 DNTVTRS(서열 식별 번호 20)를 포함하거나 또는 아미노산 서열 LADNTVTRSA(서열 식별 번호 34)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 I698V 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 DNTVTRS(서열 식별 번호 20)를 포함하거나 또는 아미노산 서열 LADNTVTRSA(서열 식별 번호 34)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LADNTVTRSA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 55)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NKISAKD(서열 식별 번호 21)를 포함하거나 또는 아미노산 서열 LANKISAKDA(서열 식별 번호 35)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NKISAKD(서열 식별 번호 21)를 포함하거나 또는 아미노산 서열 LANKISAKDA(서열 식별 번호 35)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANKISAKDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 56)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NQDYTKT(서열 식별 번호 22)를 포함하거나 또는 아미노산 서열 LANQDYTKTA(서열 식별 번호 36)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다, 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 NQDYTKT (서열 식별 번호 22)를 포함하거나 또는 아미노산 서열 LANQDYTKTA (서열 식별 번호 36)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 I698V 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환을 포함하며, 치환된 아미노산은 상응하는 위치에서 자연적으로 발생하지 않고, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 NQDYTKT (서열 식별 번호 22)를 포함하거나 또는 아미노산 서열 LANQDYTKTA (서열 식별 번호 36)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LANQDYTKTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 57)

일부 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)을 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, AAV2(서열 식별 번호 2)의 아미노산 서열에 대해 다음의 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환 중 하나 이상을 더 포함하고, 치환된 아미노산(들)은 상응하는 위치에 자연적으로 발생되지 않는다: V708I, D213N, P363L 및 G453R. 일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 P363L 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 D213N 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 G453R 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2 캡시드의 아미노산 587과 588 사이에 아미노산 서열 QADTTKN(서열 식별 번호 23)를 포함하거나 또는 아미노산 서열 LAQADTTKNA(서열 식별 번호 39)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAQADTTKNA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 58)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 TNRTSPD(서열 식별 번호 24)를 포함하거나 또는 아미노산 서열 LATNRTSPDA(서열 식별 번호 40)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 아미노산 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LATNRTSPDA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKS I NVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 59)

일부 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 SNTTQKT(서열 식별 번호 25)를 포함하거나 또는 아미노산 서열 LASNTTQKTA(서열 식별 번호 41)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LASNTTQKTA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 60)

일부 실시 양태에서, 변이체 AAV 캡시드는 (i) AAV2의 VP1의 587과 588 사이 또는 다른 AAV 캡시드의 상응하는 아미노산 사이에 아미노산 서열 ASDSTKA(서열 식별 번호 26)를 포함하거나 또는 아미노산 서열 LAASDSTKAA(서열 식별 번호 42)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, (ii) AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열에 대해 V708I 치환 또는 다른 AAV 모 혈청형에서의 상응하는 치환을 포함하며, 치환된 아미노산(들)은 상응하는 위치에서 자연적으로 발생하지 않으며, 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다. 다른 실시 양태에서, 변이체 AAV 캡시드는 AAV2의 아미노산 587과 588 사이에 아미노산 서열 ASDSTKA(서열 식별 번호 26)를 포함하거나 또는 아미노산 서열 LAASDSTKAA(서열 식별 번호 42)를 포함하거나, 본질적으로 이루어지거나 또는 이루어지는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%의 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGN LAASDSTKAA RQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL(서열 식별 번호 61).

여러 양태에서, AAV 캡시드 단백질이 제공되고 이는 상응하는 모 AAV 캡시드 단백질에 대해 하나 이상의 아미노산 치환을 포함하며, 상기 변이체 캡시드 단백질은 AAV 비리온에 존재하는 경우에 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포(예를 들어 골격 또는 심장 근육 세포)의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여한다.

일부 실시 양태에서, AAV 캡시드 단백질 변이체는 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 363 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 위치에 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 캡시드 단백질은 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 363에서 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2), AAV3A 캡시드(서열 식별 번호 3) 또는 AAV3B 캡시드(서열 식별 번호 4)의 아미노산 서열과 비교하여 P363L 아미노산 치환; 또는 AAV1 캡시드(서열 식별 번호 1) 또는 AAV6 캡시드(서열 식별 번호 7)의 아미노산 서열과 비교하여 P364L 아미노산 치환; 또는 AAV7 캡시드(서열 식별 번호 8) 또는 AAV9 캡시드(서열 식별 번호 10)의 아미노산 서열과 비교하여 P365L 아미노산 치환; 또는 AAV8 캡시드(서열 식별 번호 9) 또는 AAV10 캡시드(서열 식별 번호 11)의 아미노산 서열과 비교하여 P366L 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 서열 식별 번호 2의 아미노산 서열과 비교하여 P363L 치환 또는 임의의 서열 식별 번호 1 및 3-12와 비교하여 상응하는 치환을 포함하며 서열 식별 번호 2 또는 임의의 서열 식별 번호 1 및 3-12에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 갖는다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 서열 식별 번호 2에 개진된 아미노산 서열과 비교하여 P363L 아미노산 치환을 포함하는 아미노산 서열을 포함하며 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 서열 식별 번호 2의 아미노산 서열과 비교하여 P363L 아미노산 치환 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 치환을 포함하고, 상기 변이체 캡시드 단백질은 서열 식별 번호 2에 개진된 AAV2 캡시드 단백질의 아미노산 서열과 비교하여 또는 다른 AAV 모 혈청형에서의 캡시드 단백질의 아미노산 서열과 비교하여 1 내지 5, 5 내지 10 또는 10 내지 15개의 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 AAV 캡시드 단백질은 P363L 아미노산 치환을 포함하고 서열 식별 번호 2의 아미노산 서열과 비교하여 E347K 및/또는 V708I 아미노산 치환(들) 또는 다른 AAV 모 혈청형(즉, AAV2 이외)으로부터의 캡시드에서의 상응하는 치환들을 더 포함한다. 다른 바람직한 실시 양태에서, 변이체 캡시드는 서열 식별 번호 2와 비교하여 P363L 아미노산 치환 또는 다른 AAV 모 혈청형으로부터의 캡시드에서의 상응하는 치환을 포함하고, 바람직하게는 AAV2의 VP1의 아미노산 587 및 588 사이, AAV7의 VP1의 아미노산 589 및 590 사이, AAV1, AAV6 또는 AAV8의 VP1의 아미노산 590 및 591 사이, AAV4의 VP1의 아미노산 584 및 585 사이, 또는 AAV5의 아미노산 575 및 576 사이에 위치하는 펩타이드 삽입을 더 포함하며, 상기 펩타이드 삽입은 바람직하게는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로부터 선택된, 더 바람직하게는 GNLTKGN(서열 식별 번호 16), LAGNLTKGNA(서열 식별 번호 30), QADTTKN(서열 식별 번호 23) 및 LAQADTTKNA(서열 식별 번호 39)로부터 선택된 아미노산 서열을 포함하며, 1 내지 5, 5 내지 10 또는 10 내지 15개의 아미노산 치환 선택적으로 포함하거나 또는 달리 서열 식별 번호 2의 아미노산 서열 또는 상응하는 모 AAV 캡시드 단백질 서열과 동일하다.

다른 실시 양태에서, 변이체 AAV 캡시드 단백질는 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 593 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 위치에 아미노산 치환을 포함한다. 일부 바람직한 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2)와 비교하여 아미노산 593에서 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 아미노산 서열 동일성을 가지거나 또는 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 일부 실시 양태에서, 변이체 캡시드 단백질은 AAV1, AAV3A, AAV6 또는 AAV9의 아미노산 서열과 비교하여 아미노산 594에서, 또는 AAV5의 아미노산 583에서, 또는 AAV8 또는 AAV10의 아미노산 596에서의 글루탐산(glutamate) 아미노산 치환에 대한 글리신, 또는 AAV3B의 아미노산 594에서의 글루탐산 아미노산 치환에 대한 아르기닌, 또는 AAV4의 아미노산 592에서의 글루탐산 아미노산 치환에 대한 아스파르트산염(aspartate) 또는 AAV7의 595 위치에서의 글루탐산 아미노산 치환에 대한 글루타민을 포함한다. 다른 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E 아미노산 치환을 포함하고 AAV2의 아미노산 서열과 비교하여 하기 아미노산 치환 중 하나 이상을 포함하지 않는다: I19V, V369A, K26R, N215D, G355S, V46A 및 S196P. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E 및 V708I 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E 및 S109T 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2에 개진된 아미노산 서열과 동일하다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 A593E, V708I 및 S109T 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 서열과 비교하여 A593E, V708I 및 N551S 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 서열과 비교하여 A593E, V708I 및 K649E 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 다른 실시 양태에서, 변이체 캡시드는 AAV2의 아미노산 서열과 비교하여 A593E, V708I, S109T 및 K527Q 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다.

다른 실시 양태에서, 변이체 AAV 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 708 또는 다른 AAV 모 혈청형(즉, AAV2 이외)에서의 상응하는 위치에 아미노산 치환을 포함하며, 치환된 아미노산은 상응하는 위치에서 자연적으로 발생하지 않는다. 바람직하게는, rAAV 비리온은 AAV2와 비교하여 아미노산 250 또는 다른 AAV 모 혈청형의 상응하는 아미노산에서 세린 치환에 대한 프롤린을 포함하지 않는다. 일부 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드(서열 식별 번호 2)의 아미노산 서열과 비교하여 아미노산 708에서 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다. 바람직한 실시 양태에서, 변이체 캡시드 단백질은 AAV2 캡시드의 아미노산 서열과 비교하여 아미노산 708에서 이소류신(V708I) 치환에 대한 발린을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하며, 상기 변이체 캡시드 단백질은 P250S 아미노산 치환을 포함하지 않는다. 일부 실시 양태에서, 변이체 캡시드 단백질은 AAV3A 또는 AAV3B의 아미노산 709에서 이소류신 치환에 대한 발린, AAV1의 위치 709에서 이소류신 치환에 대한 알라닌, AAV4의 아미노산 709 또는 AAV9의 아미노산 709에서 이소류신 치환에 대한 아스파라긴 또는 AAV7의 아미노산 710 또는 AAV8 또는 AAV10의 아미노산 711에서 이소류신 치환에 대한 트레오린 또는 AAV5의 아미노산 697에서 이소루이신 치환에 대한 글루타민을 포함한다. 관련된 실시 양태에서, 변이체 캡시드 단백질은 AAV2의 아미노산 서열과 비교하여 V708I 아미노산 치환을 포함하며, 상기 변이체 캡시드 단백질은 2 내지 5, 5 내지 10, 또는 10 내지 15개의 아미노산 치환을 포함하고 상기 변이체 캡시드 단백질은 P250S 아미노산 치환을 포함하지 않는다. 다른 실시 양태에서, 변이체 캡시드 단백질은 V708I 아미노산 치환을 포함하고, 또한 AAV2의 아미노산 서열과 비교하여 A333S 및/또는 S721L 아미노산 치환을 포함한다. 다른 관련된 실시 양태에서, 변이체 캡시드는 V708I 아미노산 치환을 포함하고, 또한 AAV2의 아미노산 서열과 비교하여 A333S 및/또는 S721L 아미노산 치환을 포함하고, 서열 식별 번호 2에 개진된 아미노산 서열의 전체 길이와 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 또는 적어도 약 99% 또는 그 이상의 동일성을 가지거나 또는 달리 서열 식별 번호 2와 동일하다.

다른 실시 양태에서, 변이체 AAV 캡시드 단백질은 서열 식별 번호 1, 2, 3, 4, 5, 6, 7, 8, 10, 11 및 12로 이루어진 군으로부터 선택된 야생형 AAV 캡시드 서열과 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열을 포함하며, i)A35P, D213N, A319T + P195L, P363L, P363L + V708I, G453R, R651H, I698V, V708I, V708I + A593, V708I + S109T, V708I + T330A, V708I + R588M, V708I + W694C, V708I + W606C, V708I + N449K, V708I + G222S, N312K + N449D + N551S + I698V + L735Q, N312K + N449D + N551S + I698V + V708I + L735Q 로 이루어진 군으로부터 선택된 하나 이상의 아미노산 치환, 및/또는 (ii) NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택되는 펩타이드 삽입을 또한 포함한다. 일부 실시 양태에서, 변이체 AAV 캡시드는 특정된 하나 이상의 아미노산 치환 및/또는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 1 내지 12로 이루어지는 군으로부터 선택된 서열과 동일하다.

일부 실시 양태에서, 변이체 AAV 캡시드 단백질은 본원에 기재된 바와 같은 하나 이상의 펩타이드 삽입(들) 및/또는 아미노산 치환을 포함하는 조상(ancestral) 캡시드 단백질이다. 조상 캡시드 단백질은 오늘날 자연에서 발견되는 캡시드 단백질의 진화론적 조상을 의미한다. 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAVrh10, AAV11, AAV12, AAV13은 오늘날 자연에서 발견되는 AAV 캡시드 단백질 간의 축중(degeneracy) 위치에서 무작위 아미노산 치환에 의해 인실리코(in silico)에서 생성된다.

다른 실시 양태에서, 변이체 AAV 캡시드 단백질은 AAV5 캡시드(서열 식별 번호 6)의 아미노산 130-725 또는 그것과 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열을 포함하는 키메라이다.

일부 양태에서, 변이체 AAV 캡시드 단백질은 (i) AAV6(서열 식별 번호 7)의 아미노산 1-129 또는 그것과 적어도 90% 이상, 적어도 95% 이상 또는 적어도 98% 이상 동일한 아미노산 및 (ii) AAV5(서열 식별 번호 6)의 아미노산 130-725 또는 그것과 적어도 90% 이상, 적어도 95% 이상 또는 적어도 98% 이상 동일한 아미노산을 포함하고, AAV5(서열 식별 번호 6)의 서열에 대해 V229I, A490T 및 A581T 및 임의로 V447F 또는 Y585S 아미노산 치환을 더 포함하는 키메라이다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDR I VTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAF T TTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAP T TGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(서열 식별 번호 62)

다른 양태에서, 변이체 AAV 캡시드 단백질은 (i) AAV2(서열 식별 번호 2)의 아미노산 1-61 또는 그것과 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열, (ii) AAV6(서열 식별 번호 7)의 아미노산 62-129 또는 그것과 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열, 및 (iii) AAV5(서열 식별 번호 6)의 아미노산 130-725을 포함하고, AAV5(서열 식별 번호 6)의 서열에 대해 V229I, A490T 및 A581T 아미노산 치환을 더 포함하는 키메라이다. 일부 실시 양태에서, 변이체 AAV 캡시드는 하기 아미노산 서열과 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98% 서열 동일성 또는 100% 동일한 아미노산 서열을 갖는다:

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDR I VTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAF T TTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAP T TGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(서열 식별 번호 63)

본원에 개시된 AAV 변이체는 정맥 내 투여 후 영장류 심장 및 골격 근육 스크린의 사용을 포함하는 생체 내 유도 진화의 사용을 통해 생성되었다. 일부 실시양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 비리온에 존재할 때 상응하는 모 AAV 캡시드 단백질 또는 야생형 AAV를 포함하는 AAV 비리온에 의한 근육 세포의 형질 도입과 비교하여 근육 세포의 증가된 형질 도입을 부여한다. 예를 들어, 일부 실시 양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 비리온에 존재할 때 상응하는 모체 AAV 캡시드 단백질 또는 야생형 AAV 캡시드 단백질을 포함하는 AAV 비리온보다 영장류 근육 세포의 더욱 효과적인 형질 도입을 부여하고, 예를 들어 근육 세포는 모 AAV 캡시드 단백질 또는 야생형 AAV를 포함하는 AAV 비리온보다 본 변이체 AAV 캡시드 단백질을 포함하는 AAV 비리온을 더 많이 취한다. 일부 이러한 실시 양태에서, AAV 변이체 비리온 또는 변이체 rAAV는 야생형 AAV 비리온 또는 상응하는 모 AAV 캡시드 단백질을 포함하는 rAAV에 의한 근육 세포의 형질 도입과 비교하여, 근육 세포의 형질 도입이 적어도 2배, 적어도 5배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 25배, 적어도 50배, 또는 50배 이상의 증가를 보인다. 바람직한 실시 양태에서, AAV 변이체 비리온 또는 변이체 rAAV는 야생형 AAV8 또는 AAV9에 의한 근육 세포의 형질 도입과 비교하여, 근육 세포의 형질 도입이 적어도 2배, 적어도 5배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 25배, 적어도 50배, 적어도 100배, 적어도 1000배 또는 1000배 이상의 증가를 보인다. 이러한 특정 양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 비리온에 존재할 때, 상응하는 모 AAV 캡시드 단백질 또는 야생형 AAV 캡시드 단백질을 포함하는 AAV 비리온보다 광범위한 영장류 근육 세포의 형질 도입을 부여한다. 즉, 변이체 AAV 비리온은 상응하는 모 AAV 캡시드 단백질을 포함하는 비리온에 의해 형질 도입되지 않는 세포형을 형질 도입시키고 이에 따라 상응하는 모 AAV 비리온보다 근육에서 더 많은 유형의 세포를 형질 도입시킨다. 일부 실시 양태에서, AAV 변이체 비리온은 우선적으로 근육 세포를 형질 도입시키고, 예를 들어 본 rAAV 비리온은 다른 근육 세포 또는 비-근육 세포보다 근육 세포를 2배, 5배, 10배, 15배, 20배, 25배, 50배, 50배 이상 특이적으로 감염시킨다. 일부 실시 양태에서, 형질 도입된 근육 세포는 심장 근육 세포(예를 들어, 심장 근육 세포, 심장 섬유 모세포, 또는 심장 전구 세포)이다. 일부 실시 양태에서, 근육 세포는 골격 근육 세포(예를 들어, 근육 모세포, 근육 대롱 또는 위성 세포)이다. 일부 실시형태에서, 망막 세포는 망막 상피세포 (RPE 세포)이다. 일부 실시형태에서, 망막 세포는 뮐러 (Muller) 교세포이다. 일부 실시형태에서, 망막 세포는 소교 세포이다. 일부 실시형태에서, 망막 세포는 무축삭 세포이다. 일부 실시형태에서, 망막 세포는 양극성 세포이다. 일부 실시형태에서, 망막 세포는 수평 세포이다. 근육 세포의 형질 도입의 증가, 예를 들어, 형질 도입의 증가된 효율, 보다 광범위한 형질 도입, 보다 우선적인 형질 도입 등은 유전자 발현 측정 기술의 임의의 수의 방법에 의해 시험관 내 또는 생체 내에서 용이하게 평가될 수 있다. 예를 들어, AAV는 유비쿼터스 또는 조직 특이적 프로모터의 제어하에 리포터 유전자, 예를 들어 형광 단백질을 포함하는 발현 카세트를 포함하는 게놈으로 패키징 될 수 있으며, 형질 전환의 정도는 예를 들어 형광 현미경에 의한 형광 단백질을 검출함으로써 평가된다. 또 다른 예로서, AAV는 바 코딩된 핵산 서열을 포함하는 게놈으로 패키징 될 수 있고, 형질 전환의 정도는 예를 들어 PCR에 의해 핵산 서열을 검출함으로써 평가될 수 있다. 또 다른 예로서, AAV는 근육 질병의 치료를 위한 치료적 유전자를 포함하는 발현 카세트를 포함하는 게놈으로 패키징 될 수 있고, 형질 도입의 정도는 AAV가 투여된 고통받는 환자의 근육 질병의 치료를 검출함으로써 평가될 수 있다.

본원에 개시된 변이체 rAAV 벡터 또는 비리온 및/또는 방법을 사용하여 치료될 수 있는 질병은 단일유전인자 질병, 복합 질병 및 외상성 상해를 포함하지만, 이에 제한되지 않는다. 단일유전인자 질병의 예로는, 이에 한정되는 것은 아니지만, 뒤셴(Duchenne), 베커(Becker), 선천성(베틀렘 근육질환, 울리히 근이영양증, 후쿠야마 디스트로피, 인테그린-결핍, 메로신-결핍 근육 이상증 및 워커-워버그 증후군), 말단(Gowers-Laing, Miyoshi 및 Nonaka를 포함하나, 이에 한정되지 않는다), 에메리-드레스(Emery-Drefruss), 얼굴어깨위팔, 팔다리 이음, 근육 긴장 및 근육 디스트로피; 선천성 근육 긴장 및 선천성 근육 이상증; 근관 근육질환; 중심핵 근육질환; 데시민 관련 섬유성 근육질환; 아네미아; 안데르슨-타윌(Andersen-Tawil) 증후군; 네말린 근육질환; 브로디병; 리소좀 저장 장애, 예컨대 알파-만노시도시스, 아스파르틸글루코사민뉴리아, 베타-만노시도시스, 시스틴증, 파버(Farber)병, 푸코시도시스(fucosidosis), 게이처(Gaucher)병, 갈락토시알리시스(galactosialidosis), 갈글리오시도스(gangliosidose)(제한 없이, AB 변이체, 활성화제 결핍, 베타-갈락토시다아제 파브리병, 샌드호프병 및 쉰들러병을 포함), 글리코겐 저장 장애(제한 없이, 안데르센 질병, 코리 질병, 다논 질병, 포브르스 질병, 글루코오스-6-인산 결함, 허스 질병, 젖산 탈수소 효소 A 결핍, 폼페병, 타루이병 및 폰 기르케씨병 병을 포함), 유아 프리 시알산 저장 질환(infantile free sialic acid storage disease), 리소좀 산 리파아제의 결핍, 리소좀 산 리파제 결핍, 크라베병, 메타크롬 류코디스트로피(metachrohme Leukodystrophy), 뮤코폴리사카리도스(mucopolysaccharidose)(제한 없이, 히알루로니다아제 결핍, 헌터 증후군, 헐러(Hurler) 증후군, 헐러-스키(Scheie) 증후군, 마르코티옥스-라미(Markoteaux-Lamy) 증후군, 산필리포(Sanfilippo) 증후군, 스케리(Scherie) 증후군 및 스라이(Sly) 증후군을 포함), 뮤콜리피도시스(mucolipidosis)(제한 없이, 시알리도시스(Sialidosis), I-세포 질환, 뮤콜리피딘 1 결핍 및 슈디(Psuedy)-헐러 폴리디스트로피를 포함), 다수의 설파아제 결핍증, 니만난-픽(Niemann-Pick) 질병, 뉴런 세노이드 리포푸사제(제한 없이, 배튼-스피넬메이어-보그트 질병, 선천성 카뎁신 D 결핍증, 독일/세르비안 레이트(Late) 인팬타일(infantile), 잔스키-비엘시오스키(Jansky-Bielschowsky) 질병, 커프스(Kufs) 질환, 레이트 인팬타일, 레이트 인팬타일 변이체, 노턴 간질, 산타뷰오리-할티아(Santavuori-Haltia) 질병 및 터키쉬 레이트 인팬타일을 포함), 피누이상증, 살라 질환, 사포신 B 결핍증, 테이새크병 및 울만 질환; 대사 장애, 예컨대 아데노신 1 인산 탈아미노 효소 결핍증, 알 캅톤 뇨증, 카르니틴 결핍증, 카르니틴 팔미틸 전이 효소 결핍증, 하트넙(Hartnup) 장애, 호모 시스틴 뇨증, 메이플 시럽 뇨 질병, 미오포스포릴라제 결핍증, 포스포후위키나아제 결핍증, 포스포글리세레이트 키나제 결핍증, 포스포글리세레이트 뮤타아제 결핍증, 포스포릴라제 결핍증 및 탄지아 질병; 프리에드리히 아타시아(ataxia); 아타시아 탈렌지엑타시아(talengiectasia); 비타민 E 결핍 아타시아; 주기성 마비, 예컨대 갬스토그프(Gamstorp) 질병 및 하이포칼레믹(hypokalemic) 주기기성 마비; 미토콘드리아 질병, 예컨대 바쓰(Barth) 증후군, 컨스-세이래(Kearns-Sayre) 증후군, 미토콘드리아 근육질환, 미토콘드리아 뇌병증 락트산증 및 발작 유사 에피소드, 울퉁불퉁한(ragged-red) 섬유를 갖는 간대성 근경련 간질 및 피어슨 증후군; 가족성 비대성 심근증; 확장된 심근증; 가족성 선천성 심장 질환 예컨대, 가족성 대동맥 판막 질환 및 선천성 심장 결함을 갖는 좌심실의 비-압축; 가족성 부정맥 예컨대, 앤더슨 심장 율동 주기성 마비, AV 전도 결함을 갖는 심방 중격 결함, 브루가라(Brugada) 증후군, 심장 전도성 결함, 카테콜린성 다형성 심실 빈맥 및 선천성 심장 마비; 가족성 혈관 장애, 예컨대 동맥 비틀림성 증후군, 카다실(CADASIL)(cerebral autosomal dominant arteriopathy with subcortical infacts and leukoencephalopathy), CRDASIL(cerebral recessive dominant arteriopathy with subcortical infacts and leukoencephalopathy), 가족성 대동맥 동맥류, 마팬(Marfan) 증후군, 엘러스-단로스(Ehlers-Danlos) 증후군, 비알(Beals) 선천성 수축성(contractual) 대동맥 동맥류, 로지스-디에츠(Loesys-Dietz) 증후군 및 탄력 섬유성가황색종; 부정맥성 우심실 심근증; 가족성 부정맥성 우심실 이형성증; 나가신 질환(Naxos disease); 좌심실 비-압축; 가족성 심방세동; 가족성 심실 빈맥; 가족성 울프-파킨슨 증후군; 긴 QT 증후군; 짧은 QT 증후군; 시크 시누스(Sick sinus) 증후군; 지단백질 질병, 예컨대 무베타지질단백혈증 및 지단백질 리파제 결핍증; 알파-1 안티트립신 결핍증; 응고 인자 VIII 결핍증(혈우병 A) 또는 응고 인자 IX 결핍(혈우병 B); 탈라세미아; 진행성 골화성 섬유이형증; LMNA 돌연변이(maninopathies); 헌팅톤병(Huntington disease); 선천성 근무력증 증후군; 허치슨-길포드 조로증(Hutchinson-Gilford Progrearia) 증후군; 루난(Noonan) 증후군; 선천성 섬유형 불균형(disproportion) 근육질환; 안외 근육의 선천성 섬유증; 미니코어(minicore) 근육질환; 리플(rippling) 근육 질병; 슈발츠-얌펠(Schwartz-Jampel) 증후군; 관골 골격(tubular aggregate) 근육질환 및 제브라 바디(zebra body) 근육질환. 복합 질병의 예는 심장/심혈관 질환(예를 들어, 울혈성 심부전, 심근경색, 협심증, 관상동맥 질환, 허혈성 심질환, 심근병증); 암; 당뇨병; 및 감염을 포함하나, 이에 한정되지 않는다. 외상성 상해의 예는, 근육의 바이러스 감염, 근육 열상; 및 근육 타박상을 포함하나, 이에 한정되지 않는다. 바람직한 실시 양태에서, 본원에 개시된 변이체 rAAV 벡터 또는 비리온 및/또는 방법은 파브리병(Fabry disease), 프리드리히 운동실조(Friedreich ataxia), 뒤셴형 근이영양증(Duchenne muscular dystrophy), 베커 근이영양증(Becker muscular dystrophy), 폼페병(Pompe disease), 근육 인산분해효소 결핍증(myophosphorylase deficiency), 얼굴어깨위팔 근이영양증(facioscapulohumerical muscural dystrophy), 팔다리 이음 근이영양증(limb girdle muscular dystrophy) 또는 근육 긴장성 이영양증(myotonic dystrophy)을 치료하는데 사용된다.

다른 실시 양태에서, 본원에 개시된 변이체 캡시드는 유전자 산물, 예를 들어, 제한 없이, 간섭 RNA, 긴 비-코딩 RNA, 짧은 비-코딩 RNA, 안티센스 RNA, 앱타머, 폴리펩타이드, 분비된 항체, 단일 사슬 항체, V_HH 도메인, 가용성 수용체, 결합체(affibody), 노틴(knottin), DARPin, 센추린, 샤페론, 유전자 기능의 녹-다운(knock-down)을 제공하는 부위 특이적 뉴클레아제 또는 전사의 유전자 특이적 활성화를 제공하는 변형된 부위 특이적 뉴클레아제를 인코딩하는 뉴클레오타이드 서열을 포함하는 이종성 핵산을 포함한다.

본원에 개시된 rAAV 변이체 비리온는 유전자 산물을 인코딩하는 뉴클레오타이드 서열을 포함하는 이종성 핵산을 포함한다. 일부 실시 양태에서, 유전자 산물은 안티센스 RNA, microRNA(miRNA), 짧은 헤어핀 RNA(shRNA) 또는 작은 간섭 RNA(siRNA) 또는 그의 전구체 또는 모방체이다. 일부 실시 양태에서, 유전자 산물은 긴 비-코딩 RNA이다. 일부 실시 양태에서, 유전자 산물은 짧은 비-코딩 RNA이다. 일부 실시 양태에서, 유전자 산물은 안티센스 RNA이다. 일부 실시 양태에서, 유전자 산물은 앱타머이다. 일부 실시 양태에서, 유전자 산물은 폴리펩타이드이다. 일부 실시 양태에서, 유전자 산물은 분비된 항체이다. 일부 실시 양태에서, 유전자 산물은 단일 사슬 항체이다. 일부 실시 양태에서, 유전자 산물은 V_HH 도메인이다. 일부 실시 양태에서, 유전자 산물은 가용성 수용체이다. 일부 실시 양태에서, 유전자 산물은 결합체이다. 일부 실시 양태에서, 유전자 산물은 노틴이다. 일부 실시 양태에서, 유전자 산물은 DARPin이다. 일부 실시 양태에서, 유전자 산물은 센투린이다. 일부 실시 양태에서, 유전자 산물은 샤페론이다. 일부 실시 양태에서, 유전자 산물은 부위 특이적 뉴클레오타이드로서 유전자 기능의 부위 특이적 녹-다운을 제공한다.

유전자 산물의 용도는 세포에서 인자(factor)의 수준을 높이는 것, 인자의 분비를 통해 이웃 또는 원거리 세포에서 인자의 수준을 높이는 것, 세포에서 인자의 수준을 줄이는 것, 또는 인자의 분비를 통해 이웃 또는 원거리 세포에서 인자의 수준을 줄이는 것을 포함하나, 이에 제한되지 않는다. 유전자 산물은 누락 유전자 산물의 결함 수준을 보충하고, 누락 유전자 산물의 결함 수준을 감소시키며, 새로운 지지 유전자 산물을 도입하고, 지지 유전자 산물의 수준을 보충하고, 방해 유전자 산물의 수준을 감소시키고, 지지 유전자 산물의 수준을 도입하거나 보충한다.

본 AAV 변이체에 의해 전달된 유전자 산물은 근육 질병 및 외상에 직접적으로 또는 간접적으로 연결된 유전자 산물 또는 유전자 산물 활성의 수준을 변경하는데 사용될 수 있다. 또한, 본 AAV 변이체로 형질 도입된 골격, 심장 또는 평활근은 원거리 장기의 도중에(in trans)서 질병의 치료를 위한 치료적 단백질을 생산 및 분비하기 위한 바이오팩토리(biofactory)로서 사용될 수 있다. 유전자 산물이 유전적 질병에 직접 또는 간접적으로 연결된 유전자는 예를 들어, 다음의 유전자 산물 중 임의 것을 인코딩하는 유전자를 포함한다: 디스미니-및 마이크로-디스트로핀(DMD; 예를 들어 유전자은행 수탁번호NP_003997.1; 서열 식별 번호 64); 티틴(TTN); 티틴 캡(TCAP) α-사르코글리칸(SGCA), β-사르코글리칸(SGCB), γ-사르코글리칸(SGCG) 또는 δ-사르코글리칸(SGCD); α-1-안티트립신(A1-AT); 미오신 중쇄 6(MYH6); 미오신 중쇄 7(MYH7); 미오신 중쇄 11(MYH11); 미오신 경쇄 2(ML2); 미오신 경쇄 3(ML3); 미오신 경쇄 키나제 2(MYLK2); 미오신 결합 단백질 C(MYBPC3); 데시민(DES); 다이나민 2(DNM2); 라미닌 α2(LAMA2); 라미닌 A/C(LMNA); 라민 B(LMNB); 라민 B 수용체(LBR); 디스페린(DYSF); 에머린(EMD); 인슐린; 혈액 응고 인자, 비제한적으로 인자 VIII 및 인자 IX를 포함; 에리트로포이에틴(EPO); 지단백질 리파제(LPL); 사르코플라스믹 망상 Ca2⁺⁺-ATPase(SERCA2A), S100 칼슘 결합 단백질 A1(S100A1); 근관(MTM); DM1 단백질 키나제(DMPK; 예를 들어 유전자은행 수탁번호 NG_009784) 1; 서열 식별 번호 65); 글리코겐 포스포릴라제 L(PYGL); 글리코겐 포스포릴라제, 근육 관련(PYGM; 예를 들어 유전자은행 수탁번호 NP_005600.1; 서열 식별 번호 66); 글리코겐 신타제 1(GYS1); 글리코겐 신타제 2(GYS2); α-갈락토시다제 A(GLA; 예를 들어 유전자은행 수탁번호 NP_000160.1; 서열 식별 번호 67); α-N-아세틸갈락토사미니다제(NAGA); 산 α-글루코시다제(GAA; 예를 들어 유전자은행 수탁번호 NP_000143.2; 서열 식별 번호 68), 스핑고미엘리나제 포스포디에스테라제 1(SMPD1); 리소좀 산 리파제(LIPA); 콜라겐 타입 I α1 사슬(COL1A1); 콜라겐 타입 I α2 사슬(COL1A2); 콜라겐 타입 III α1 사슬(COL3A1); 콜라겐 타입 V α1 사슬(COL5A1); 콜라겐 타입 V α2 사슬(COL5A2); 콜라겐 타입 VI α1 사슬(COL6A1); 콜라겐 타입 VI α2 사슬(COL6A2); 콜라겐 타입 VI α3 사슬(COL6A3); 프로콜라겐-리신 2-옥소글루타레이트 5-디옥시게나제(PLOD1); 리소좀 산 리파제(LIPA); 프라탁신(FXN; 예를 들어 유전자은행 수탁번호 NP_000135.2; 서열 식별 번호 69); 미오스타틴(MSTN); β-N-아세틸 헥소사미니다제 A(HEXA); β-N-아세틸헥소사미니다제 B(HEXB); β-글루코세레브로시다제(GBA); 아데노신 모노포스페이트 디아미나제 1(AMPD1); β-글로빈(HBB); 이두로니다아제(IDUA); 이두로니다아제 2-황산염(IDS); 트로포닌 1(TNNI3); 트로포닌 T2(TNNI2); 트로포닌 C(TNNC1); 트로포미오신 1(TPM1); 트로포미오신 3(TPM3); N-아세틸-α-글루코사미니다제(NAGLU); N-설포글루코사민 설포하이드롤라제(SGSH); 헤파란-α-글루코사미나이드 N-아세틸트랜스퍼라제(HGSNAT); 인테그린 α7(IGTA7); 인테그린 α9(IGTA9); 글루코사민(N-아세틸)-6-술파타제(GNS); 갈락토사민(N-ㅇ아아세틸)-6-술파타제(GALNS); β-갈락토시다아제(GLB1); β-글루쿠로니다제(GUSB); 히알루로글루코사미니다제 1(HYAL1); 산 세라미다제(ASAH1); 갈락토실세르미다아제(GALC); 카뎁신 A(CTSA); 카뎁신 D(CTSA); 카뎁신 K(CTSK); GM2 강글리오사이드 활성화제(GM2A); 아릴술파타제 A(ARSA); 아릴술파타제 B(ARSB); 포르밀글리신-발생 효소(SUMF1); 뉴라미니다아제 1(NEU1); N-아세틸글루코사민-1-포스페이트 트랜스퍼라제 α(GNPTA); N-아세틸글루코사민-1-포스페이트 트랜스퍼라제 β(GNPTB); N-아세틸글루코사민-1-포스페이트 트랜스퍼라제 γ(GNPTB); 뮤코릴핀-1(MCON1); NPC 세포 내 수송체 1(NPC1); NPC 세포 내 수송체 2(NPC2); 세로이드 리포푸스시노시스 5(CLN5);세로이드 리포푸스시노시스 6(CLN6); 세로이드 리포푸스시노시스 8(MFSD8); 팔미토일 단백질 티오에스테라제 1(PPT1); 트리펩티딜 펩티다아제 1(TPP1); 배테민(CLN3); DNAJ 열 충격 단백질 패밀리 40 멤버 C5(DNAJC5); 주요 촉진제 슈퍼패밀리 도메인 함유 8(MFSD8); 만노시다제 α 클래스 2B 멤버 1(MAN2B1); 만노시다제 β(MANBA); 아스파르틸글루코사미니다제(AGA); α-L-푸코시다제(FUCA1); 시스티노신, 리소좀 시스테인 트랜스포터(CTNS); 사이알린; 용질 캐리어 패밀리 2 멤버 10(SLC2A10); 용질 캐리어 패밀리 17 멤버 5(SLC17A5); 용질 캐리어 패밀리 6 멤버 19(SLC6A19); 용질 캐리어 패밀리 22 멤버 5(SLC22A5); 용질 캐리어 패밀리 37 멤버 4(SLC37A4); 리소좀 관련 막 단백질 2(LAMP2); 나트륨 전압-게이트 채널 α 서브유닛 4(SCN4A); 나트륨 전압-게이트 채널 β 서브유닛 4(SCN4B); 나트륨 전압-게이트 채널 α 서브유닛 5(SCN5A); 나트륨 전압-게이트 채널 α 서브유닛 4(SCN4A); 칼슘 전압-게이트 채널 서브유닛 α1c(CACNA1C); 칼슘 전압-게이트 채널 서브유닛 α1s(CACNA1S); 포스포글리세레이트 키나제 1(PGK1); 포스포글리세레이트 뮤타제 2(PGAM2); 아밀로-α-1, 6-글루코시다제, 4-α-글루카노트랜스퍼라제(AGL); 칼륨 전압-게이트 채널 ISK-관련 서브패밀리 멤버 1(KCNE1); 칼륨 전압-게이트 채널 ISK-관련 서브패밀리 멤버 2(KCNE2); 칼륨 전압-게이트 채널 서브패밀리 J 멤버 2(KCNJ2); 칼륨 전압-게이트 채널 서브패밀리 J 멤버 5(KCNJ5); 칼륨 전압-게이트 채널 서브패밀리 H 멤버 2(KCNH2);칼륨 전압-게이트 채널 KQT-유사 서브패밀리 멤버 1(KCNQ1); 과분극-활성화된 사이클릭 뉴클레오타이드-게이트 칼륨 채널 4(HCN4); 클로라이드 전압-게이트 채널 1(CLCN1); 카르니틴 팔미토일트랜스퍼라제 1A(CPT1A); 리아노딘 수용체 1(RYR1); 리아노딘 수용체 2(RYR2); 브릿징 적분기 1(BIN1); LARGE 자일로실-및 글루쿠로닐트랜스퍼라제 1(LARGE1); 도킹 단백질 7(DOK7); 퓨쿠틴(FKTN); 퓨쿠틴 관련 단백질(FKRP); 셀렌단백질 N(SELENON); 단백질 O-만노실트랜스퍼라제 1(POMT1); 단백질 O-만노실트랜스퍼라제 2(POMT2); 단백질 O-연결 만노오스 N-아세틸글루코사미닐트랜스퍼라제 1(POMGNT1); 단백질 O-연결 만노오스 N-아세틸글루코사미닐트랜스퍼라제 2(POMGNT2); 단백질-O-만노오스 키나제(POMK); 이소프레노이드 신타제 도메인 함유(ISPD); 렉틴(PLEXC); 콜린성 수용체 니코틴성 엡시론 서브유닛(CHRNE); 콜린 O-아세틸트랜스퍼라제(CHAT); 콜린 키나제 β(CHKB); 비대칭 아세틸콜린에스터라제의 콜라겐 유사 꼬리 서브유닛(COLQ); 시냅스의 단백질 관련 수용체(RAPSN); 포 앤드 하프(four and a half) LIM 도메인 1 (FHL1); β-1,4-글루쿠로닐트랜스퍼라제 1(B4GAT1); β-1,3-N-아세틸갈락토사미닐트랜스퍼라제 2(B3GALNT2); 디스트로글리칸 1(DAG1); 막횡단 단백질 5(TMEM5); 막횡단 단백질 43(TMEM43); SECIS 결합 단백질 2(SECISBP2); 글루코사민(UDP-N-아세틸)-2-에피머라제/N-아세틸만노사민 키나제(GNE); 아녹타민 5(ANO5); 염색체 가요성 힌지 도메인 함유 1의 구조적 유지(SMCHD1); 락테이트 데하이드로게나제 A(LDHA); 락테이트 데하이드로게나제 B(LDHB); 칼파인 3(CAPN3); 카베올린 3(CAV3); 3부로 된 모티프 함유 2(TRIM32); CCHC-형 아연 핑거 핵산 결합 단백질(CNBP); 네불린(NEB); 액틴, α1, 골격 근육(ACTA1); 액틴, α1, 심장 근육(ACTC1); 액틴 α2(ACTN2); 폴리(A)-결합 단백질 핵 1(PABPN1); LEM 도메인-함유 단백질 3(LEMD3); 아연 메탈로프로테이나제 STE24(ZMPSTE24); 마이크로좀 트리글리세라이드 전달 단백질(MTTP); 콜린성 수용체 니코틴성 α1 서브유닛(CHRNA1); 콜린성 수용체 니코틴성 α2 서브유닛(CHRNA2); 콜린성 수용체 니코틴성 α3 서브유닛(CHRNA3); 콜린성 수용체 니코틴성 α4 서브유닛(CHRNA4); 콜린성 수용체 니코틴성 α5 서브유닛(CHRNA5); 콜린성 수용체 니코틴성 α6 서브유닛(CHRNA6); 콜린성 수용체 니코틴성 α7 서브유닛(CHRNA7); 콜린성 수용체 니코틴성 α8 서브유닛(CHRNA8); 콜린성 수용체 니코틴성 α9 서브유닛(CHRNA9); 콜린성 수용체 니코틴성 α10 서브유닛(CHRNA10); 콜린성 수용체 니코틴성 β1 서브유닛(CHRNB1); 콜린성 수용체 니코틴성 β2 서브유닛(CHRNB2); 콜린성 수용체 니코틴성 β3 서브유닛(CHRNB3); 콜린성 수용체 니코틴성 β4 서브유닛(CHRNB4); 콜린성 수용체 니코틴성 γ 서브유닛(CHRNG1); 콜린성 수용체 니코틴성 δ 서브유닛(CHRND); 콜린성 수용체 니코틴성 ε 서브유닛(CHRNE1); ATP 결합 카세트 서브 패밀리 A 멤버 1(ABCA1); ATP 결합 카세트 서브패밀리 C 6 멤버(ABCC6); ATP 결합 카세트 서브 패밀리 C 멤버 9 (ABCC9); ATP 결합 카세트 서브 패밀리 D 1 멤버(ABCD1); ATP 아제 사르코플라스민/소포체 CA2+ 수송 1(ATP2A1); ATM 세린/트레오닌 키나제(ATM); α 토코페롤 트랜스퍼라제 단백질(TTPA); 키네신 패밀리 멤버 21A(KIF21A); 페어링 유사(paired-like) 호메오박스 2A (PHOX2A); 헤파란 설페이트 프로테오글리칸 2(HSPG2); 스트로마 상호작용 분자 1(STIM1); 노치 1(NOTCH1); 노치 3(NOTCH3); 디스트로브레빈 α(DTNA); 단백질 키나아제 AMP-활성화, 비촉매 γ2(PRKAG2); 시스테인-및 글리신-풍부 단백질 3(CSRP3); 빈쿨린(VCL); 미오제닌 2(MyoZ2); 미오팔라딘(MYPN); 정토필린 2(JPH2); 포스폴람반(PLN); 칼레티쿨린 3(CALR3); 넥시린 F-액틴-결합 단백(NEXN); LIM 도메인 결합 3(LDB3); 아이 어브센트(eyes absent) 4(EYA4); 헌팅틴(HTT); 안드로겐 수용체(AR); 단백질 티로신 포스페이트 비-수용체 타입 11(PTPN11); 접합 플라코글로빈(JUP); 데스모플라킨(DSP); 플라코필린 2(PKP2); 데스모글레인 2(DSG2); 데스모콜린 2(DSC2); 카테닌 α3(CTNNA3); NK2 호메오박스 5(NKX2-5); A-키나아제 앵커 단백질 9(AKAP9); A-키나아제 앵커 단백질 10(AKAP10); 구아닌 뉴클레오타이드-결합 단백질 α-억제 활성 폴리펩타이드 2(GNAI2); 안키린 2(ANK2); 신트로핀 α-1(SNTA1); 칼모듈린 1(CALM1); 칼모듈린 2(CALM2); HTRA 세린 펩티다아제 1(HTRA1); 피브릴린 1(FBN1); 피브릴린 2(FBN2); 자일로실트랜스퍼라제 1(XYT1); 자일로실트랜스퍼라제 2(XYT2); 타파진(TAZ); 호모겐티신산 1,2-디옥시게나제(HGD); 글루코스-6-포스파타제 촉매 서브유닛(G6PC); 1,4-알파-글루칸 효소 1(GBE1); 포스포프룩토키나제, 근육(PFKM); 포스포릴라제 키나제 조절 서브유닛 알파 1(PHKA1); 포스포릴라제 키나제 조절 서브유닛 알파 2(PHKA2); 포스포릴라제 키나제 조절 서브유닛 베타(PHKB); 포스포릴라제 키나제 촉매 서브유닛 감마 2(PHKG2); 포스포글리세레이트 뮤타제 2(PGAM2); 시스타티오닌-베타-신타제(CBS); 메틸렌테트라하이드로폴레이트 리덕타제(MTHFR); 5-메틸테트라하이드로 폴레이트-호모시스테인 메틸트랜스퍼라제(MTR); 5-메틸 테트라하이드로폴레이트-호모시스테인 메틸트랜스퍼라제 리덕타제(MTRR); 메틸말로닌산산성뇨 및 호모시스테인뇨증, clbID 타입(MMADHC); 미토콘드리아 DNA, 제한 없이, 미토콘드리아 인코딩된 NADH: 유비퀴논 옥시도리덕타제 코어 서브유닛 1(MT-ND1); 미토콘드리아 인코딩된 NADH: 유비퀴논 옥시도리덕타제 코어 서브유닛 5(MT-ND5); 미토콘드리아 인코드된 tRNA 글루탐산(MT-TE); 미토콘드리아 인코드된 tRNA 히스타딘(MT-TH); 미토콘드리아 인코드된 tRNA 루신 1(MT-TL1); 미토콘드리아 인코드된 tRNA 리신(MT-TK); 미토콘드리아 인코드된 tRNA 세린 1(MT-TS1); 미토콘드리아 인코드된 tRNA 발린(MT-TV)을 제한 없이 포함한다; 미토겐-활성화 단백질 키나아제 키나제 1(MAP2K1); B-Raf 프로토-종양유전자, 세린/트레오닌 키나제(BRAF); raf-1 프로토-종양유전자, 세린/트레오닌 키나제(RAF1); 성장 인자, 제한 없이, 인슐린 성장 인자 1(IGF-1); 형질 전환 성장 인자 β3(TGFP3); 형질 전환 성장 인자 β 수용체, 타입 I(TGFβR1); 형질 전환 성장 인자 β 수용체, 타입 II(TGFβR2), 섬유 모세포 성장 인자 2(FGF2), 섬유 모세포 성장 인자 4(FGF4), 혈관 내피 성장 인자 A(VEGF-A), 혈관 내피 성장 인자 B(VEGF-B); 혈관 내피 성장 인자 C(VEGF-C), 혈관 내피 성장 인자 D(VEGF-D), 혈관 내피 성장 인자 수용체 1(VEGFR1) 및 혈관 내피 성장 인자 수용체 2(VEGFR2)를 포함한다; 인터류킨; 면역부착; 사이토 카인; 및 항체.

바람직한 실시 양태에서, 본 AAV 변이체에 의해 전달된 유전자 산물은 알파 갈락토시다제 A(GLA), 프라탁신(FXN), 디스트로핀(DMD), 산 알파 글루코시다아제(GAA) 및 근육 글리코겐 포스포릴라제(PYGM)으로부터 선택된다. 일부 바람직한 실시 양태에서, 본 AAV 변이체는 (i) 서열 식별 번호 67로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 GLA 폴리펩타이드, (ii) 서열 식별 번호 69로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 FXN 폴리펩타이드, (iii) 서열 식별 번호 64로 개진된 아미노산 서열의 기능적 단편(예를 들어, 미니 또는 마이크로 디스트로핀, 바람직하게는 24개의 스펙트린-유사 반복 중 적어도 4개의 완전한 액틴-결합 도메인 및 디스트로글리칸-결합 도메인을 포함한다)을 포함하거나 이들로 이루어진 DMD 폴리펩타이드, (iv) 서열 식별 번호 68로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 GAA 폴리펩타이드, (v) 서열 식별 번호 66로 개진된 아미노산 서열을 포함하거나 이들로 이루어진 PYGM 폴리펩타이드, (vi) 또는 (v) 서열 식별 번호 64 및 66-69 중 어느 하나와 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일한 아미노산 서열을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분절(segment)을 포함한다.

다른 바람직한 실시 양태에서, 본 AAV 변이체는 DMPK의 발현을 감소시키는 간섭 RNA, 예를 들어, 안티센스 RNA, miRNA, shRNA 또는 siRNA를 인코딩하는 이식 유전자를 포함한다. 일부 양태에서, 간섭 RNA는 서열 식별 번호 65로 개진된 바와 같은 뉴클레오타이드 서열 또는 서열 식별 번호 65와 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 서열을 갖는 핵산에 의해 인코딩되는 DMPK의 발현을 감소시킨다.

유전자 산물이 세포 사멸(apoptosis)을 유도하거나 촉진시키는 유전자는 본원에서 "프로-세포 사멸(pro-apoptotic) 유전자"로 지칭되며, 이들 유전자(mRNA; 단백질)의 산물은 "프로-세포 사멸 유전자 산물"로 지징된다. 프로 세포 사멸 표적은, 예를 들어, Bax 유전자 산물; Bid 유전자 산물; Bak 유전자 산물; Bad 유전자 산물; Bcl-2; Bcl-X1을 포함한다. 항-세포 사멸 유전자 산물은 X-결합된 세포 사멸 억제제를 포함한다.

유전자 산물이 혈관 신생(angiogenesis)를 유도하거나 촉진시키는 유전자는 본원에서 "프로-혈관 신생(pro-angiogenic) 유전자"로 지칭되며, 이들 유전자(mRNA; 단백질)의 산물은 "프로-혈관 신생 유전자 산물"로 지칭된다. 프로-혈관 신생 표적은, 예를 들어, 혈관 내피 성장 인자(VEGFa, VEGFb, VEGFc, VEGFd); 혈관 내피 성장 인자 수용체 1(VEGFR1); 혈관 내피 성장 인자 수용체 2(VEGFR2); Fms 관련 티로신 키나아제 1(Flt1); 태반 성장 인자(PGF); 혈소판 유래 성장 인자(PDGF); 안지오포이에틴; 소닉 헤지호그를 포함한다. 유전자 산물이 혈관 신생을 억제하는 유전자는 본원에서 "항-혈관 신생 유전자"로 지칭되고, 이들 유전자(mRNA; 단백질)의 산물은 "항-혈관 신생 유전자 산물"로 지칭된다. 항-혈관 신생 유전자 산물은 엔도스타틴; 텀스타틴; 안지오스타틴; 색소 상피-유도 인자(PEDT), 및 융합 단백질 또는 프로-혈관 신생 표적 및/또는 그들의 수용체에 특이적인 항체, 예를 들면 VEGF 특이적 항체 Avastin^TM 등을 포함한다.

유전자 산물이 면역 조절자, 예를 들어 보체 인자, 톨-유사 수용체로서 기능하는 유전자를 "면역 조절 유전자(immunomodulatory genes)"라고 부른다. 예시적인 면역 조절 유전자는 사이토카인, 케모카인, 및 이들 및/또는 이들의 수용체, 예를 들면 항 IL-6 융합 단백질 Rilonacept^TM, 보체 인자 H-특이적 항체 람파미주맙 등에 대해 특이적인 융합 단백질 또는 항체를 포함한다. 유전자 산물이 근육 보호 인자, 예를 들어 인슐린 성장 인자 1(IGF-1); 형질 전환 성장 인자 β(TGFβ); 섬유 모세포 성장 인자(FGF)로서 기능 하는 유전자.

일부 양태에서, 관심 있는 유전자 산물은, 예를 들어, 엔도뉴클레아제가 근육 질병과 관련된 대립유전자를 녹아웃 하는 경우, 유전자 기능의 부위-특이적 녹다운을 제공하는 부위-특이적 엔도뉴클레아제이다. 예를 들어, 우세 대립유전자가야생형인 경우, 근육 구조 단백질이고 및/또는 정상 근육 기능을 제공하는 유전자의 결함 복제(copy)를 인코딩하는 경우, 부위-특이적 엔도뉴클레아제는 결함 대립유전자에 표적화 될 수 있고 결함 대립유전자를 녹아웃할 수 있다.

결함 대립유전자를 녹아웃 하는 것 이외에, 부위-특이적 뉴클레아제는 또한 결함 대립유전자에 의해 인코딩되는 단백질의 기능적 복제를 인코딩하는 도너(donor) DNA와의 상동 재조합을 자극하는 데 사용될 수 있다. 따라서, 예를 들어, 본 rAAV 비리온은 결함 대립유전자를 녹아웃 하는 부위-특이적 엔도뉴클레아제를 전달하는데 사용될 수 있고, 결함 대립유전자의 기능적 복제를 전달하는데 사용될 수 있어, 결함 대립유전자의 회복을 초래함에 따라, 기능성 근육 단백질(예를 들어, 기능성 라민 A/C, 기능성 피브릴린, 기능성 콜라겐 타입 VI 등)의 생산을 제공한다. 일부 실시 양태에서, 본원에 개시된 rAAV 비리온은 부위-특이적 엔도뉴클레아제를 인코드하는 이종성 뉴클레오타이드 서열; 및 결함 대립유전자의 기능적 복제를 인코드하는 이종성 뉴클레오타이드 서열을 포함하며, 여기서 기능성 복제는 기능성 근육 단백질을 인코드한다. 기능성 근육 단백질은 예를 들어, 라민 A/C, 피브릴린 1, COL6A1, COL6A2, COL6A3 등을 포함한다.

사용하기에 적합한 부위-특이적 엔도뉴클레아제는, 예를 들어, 메가뉴클레아제; 징크 핑거 뉴클레아제(ZFNS); 전사 활성화제-유사 이펙터 뉴클레아제(TALENS); 및 클러스터링된 규칙적으로 상호 이격된 짧은 회기성(palindromic) 반복/CRISPR-연관(Cas)을 포함하며, 여기서 이러한 부위-특이적 엔도뉴클레아제는 비-자연적으로 발생하고 특정 유전자를 표적화하도록 변형된다. 이러한 부위-특이적 뉴클레아제는 게놈 내의 특정 위치를 절단하도록 조작될 수 있고, 비-상동성 말단 결합은 수 개의 뉴클레오타이드를 삽입 또는 삭제하면서 파단을 회복할 수 있다. 이러한 부위-특이적 엔도뉴클레아제("INDELs"로도 지칭됨)는 이어서 단백질을 프레임으로부터 버리고, 효과적으로 유전자를 녹아웃 한다. 예를 들어, 미국 특허 공보 제2011/0301073호를 참조한다.

본원에 개시된 변이체 rAAV 벡터의 일부 실시 양태에서, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 구성적 프로모터에 작동 가능하게 연결된다. 적합한 구성적 프로모터는 예를 들어, 사이토메갈로바이러스 프로모터(CMV)(Stinski et al. (1985) Journal of Virology 55(2): 431-441), CMV 초기 인핸서/치킨 β-액틴(CBA) 프로모터/토끼 β-글로빈 인트론(CAG)(Miyazaki et al. (1989) Gene 79(2): 269-277, CB^SB (Jacobson et al. (2006) Molecular Therapy 13(6): 1074-1084),인간 신장 인자 1α 프로모터(EF1α)(Kim et al. (1990) Gene 91(2): 217-223), 인간 포스포글리세레이트 키나제 프로모터(PGK)(Singer-Sam et al. (1984) Gene 32(3): 409-417, 미토콘드리아 중쇄 프로모터(Loderio et al. (2012) PNAS 109(17): 6513-6518), 유비퀴틴 프로모터(Wulff et al. (1990) FEBS Letters 261: 101-105)를 포함한다.

다른 실시 양태에서, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 유도성 프로모터에 작동 가능하게 연결된다. 일부 경우에, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 조직-특이적 또는 세포 유형 - 특이적 조절 요소에 작동 가능하게 연결된다. 예를 들어, 일부 경우에, 관심있는 유전자 산물을 인코딩하는 뉴클레오타이드 서열은 근육-특이적 조절 요소(예를 들어, 심장 특이적 프로모터 또는 골격 근육 특이적 프로모터), 예를 들어, 근육 세포에서 작동 가능하게 연결된 유전자의 선택적 발현을 부여하는 조절 요소에 작동 가능하게 연결된다. 적합한 근육-특이적 조절 요소는 예를 들어, 골격 근육 α-액틴 프로모터(Muscat and Kedes (1987) Mol. Cell. Biol. 7:4089-4099); 심장 근육 α-액틴 프로모터(Minty and Kedes (1986) Mol. Cell. Biol. 6:2125-2136); 평활근 α-액틴 프로모터(Nakano et al. (1991) Gene 99:285-289); 혈관 평활근 α-액틴 프로모터(Keogh et al. (1999) Gene Therapy 6(4):616-628); 근육 크레아틴 키나제 프로모터(Bartlett et al. (1996) Cell Transplantation 5(3):411-419); 미오신 경쇄 1 및 미오신 경쇄 3 프로모터(Seidel and Arnold (1989) J. Biol. Chem. 264(27):16109-16117): 16109-16117): 미오신 경쇄 2v(MLC2v) 프로모터(Su et al. (2004) PNAS 101(46):16280-16285): 미오제닉(myogenic) 인자 5(Myf5) 프로모터(Fujimaki et al. (2004) Journal of Biological Chemistry 289(11):7399-7412); 미오제닉 분화 1(Myod1) 프로모터(Zingg et al. (1994) Nucleic Acids Research 22(12):2234-2241); 미오제닌(Myogenin)(Myog) 프로모터(Salminen et al. (1991) Journal of Cell Biology 115(4):905-917); 쌍을 이룬 박스 유전자 7(Pax7) 프로모터(Murmann et al. (2000) Biol Chem. 381(4):331-335); 쌍을 이룬 유사한 호메오도메인 3(Pitx3) 프로모터(Coulon et al. (2007) Journal of Biological Chemistry 282:33192-33200); MHCK7 프로모터(Salva et al. (2007) Mol. Ther. 15(2):320-329); MCK/SV40 프로모터(Takeshita et al. (2007) International Journal of Molecular Medicine 19:309-315); C5-12 프로모터(Li et al. (1999) Nature Biotechnology 17:241-245); 이중 및 삼중 탠덤 MCK 인핸서/프로모터(Wang et al. (2008) Gene Therapy 15:1489-1499); 미오신 중쇄 7(MYH7) 프로모터(Iwaki et al. (2104) PLoS ONE 9(4):e88610); 미오신 중쇄 6(MYH6) 프로모터(Pacak et al. (2008) Genet. Vaccines Ther. 6:13); 심장 트로포닌 T(TNNT2) 프로모터(Farza et al. (1998) J. Mol. Cell Cardiol.　30(6):1247-53); α-트로포미오신 프로모터(Helfman et al. (1986) Molecular and Cellular Biology 6(11):3582-3595); 심장 트로포닌 C(TNNC1) 프로모터(Scheier et al. (1990) Journal of Biological Chemistry 34(5):21247-21253); 심장 미오신-결합 단백질 C 프로모터(Lin et al. (2013) PLoS ONE 8(7):e69671); 심장 트로포닌 I (TNNI3) 프로모터(Bhavsar et al. (1996) Genomics 35(1):11-23); 데스민 프로모터(Li et al. (1991) Journal of Biological Chemistry 10(5):6562-6570); 나트륨-칼슘 교환기(NCX1) 프로모터(Scheller et al. (1997) Journal of Biological Chemistry 273(13):7643-7649); 심장 나트륨이뇨 인자 프로모터(Durocher et al. (1996) Molecular and Cellular Biology 16(9):4648-4655); 및 SM22α 프로모터(Kemp et al. (1995) Biochemical Journal 310(3):1037-1043)를 포함한다.

본 발명의 목적을 위해, 본원의 개시는 전술한 바와 같은 변이체 AAV 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산을 제공한다. 단리된 핵산은 AAV 벡터, 예를 들어, 재조합 AAV 벡터일 수 있다.

본원의 개시는 또한 근육 질병을 치료하는 방법을 제공하며, 상기 방법은 본원에 개시되고 상기에 기재된 바와 같은 관심있는 이식 유전자를 포함하는 유효량의 rAAV 변이 비리온을 그것을 필요로 하는 개인에게 투여하는 것을 포함한다. 당업자는 본 rAAV 비리온의 유효량을 용이하게 결정할 수 있고, 하나 이상의 기능적 또는 해부학적 파라미터, 예를 들어, 근육 생검, 이어서 면역조직화학, 혈청 샘플링 이어서 ELISA 또는 효소 활성 분석, 보행 테스트, 피크 최대 산소 소비, 바이오마커 분석 좌심실 박출 분율, 좌심실 말단-수축기 부피의 변화, 핸드-헬드 동력 측정법, 최대 중량 리프트, 시간 기능 테스트, 해머스미스 운동 능력 점수, 바닥으로부터의 시한 오름, 또는 9홀 PEG 테스트의 변화를 시험함으로써 질병이 치료된다.

근육 기능 및 이들의 변화를 평가하기 위한 비제한적인 방법은 보행 테스트, 피크 최대 산소 소비, 바이오마커 분석, 좌심실 박출 분율, 좌심실 말단-수축기 부피, 비그노오스 스케일, 시간 기능 테스트, 해머스미스 운동 능력 점수, 바닥으로부터의 시한 오름, 운동 기능 측정 규모, 노스 스타 이동성 평가, 9홀 PEG 테스트 또는 필라델피아 아동 병원 신경근 장애의 유아 테스트를 평가하는 것을 포함한다.

일부 실시 양태에서, 유효량의 본 rAAV 비리온은 근육 기능, 해부학적 근육 완전성 또는 근육 질량의 손실률, 예를 들어, 손실률의 감소 및 이에 따른 질병의 진행의 감소를 2배, 3배, 4배 또는 5배 이상 줄이고, 예를 들어 손실률의 감소 및 이에 따른 질병의 진행 속도의 10배 이상 감소를 초래한다. 일부 실시 양태에서, 본 발명의 rAAV 비리온의 유효량은 근육 기능의 이득, 근육 강도의 이득, 근육 질량의 이득, 및/또는 해부학적 근육 완전성 또는 바이오마커의 개선, 예를 들어, 2배, 3배, 4배 또는 5배 이상 개선 또는 근육 기능, 근육 강도, 근육 질량, 및/또는 해부학적 근육 완전성 또는 바이오마커의 개선에서 10배 이상 개선을 초래한다. 당업자가 용이하게 이해할 수 있는 바와 같이, 요망하는 치료 효과를 달성하기 위해 요구되는 투여량은 전형적으로 당업자가 1 x 10⁸ 내지 약 1 x 10¹⁶ "벡터 게놈"으로 지칭하는, 전형적으로 1 x 10⁸ 내지 약 1 x 10¹⁶ 재조합 비리온의 범위일 것이며, 바람직하게는 약 1 x 10¹¹ 내지 약 1 x 10¹⁵ 재조합 비리온의 범위일 것이다.

본 발명의 RAAV 비리온은 혈관 내(정맥 내 또는 동맥 내)투여, 복강 내 투여, 사지 관류 및/또는 직접 근육 내 주사에 의해 또는 rAAV 비리온이 골격 근육에 전달되게 하는 임의의 다른 편리한 모드 또는 투여 경로에 의해 골격 근육에 전달될 수 있다. RAAV 비리온은 혈관 내(정맥 내 또는 동맥 내) 투여, 직접적인 심장 주입(좌심방, 우심방, 우심실 및/또는 격막), 관상동맥(좌측 전방 강하 또는 좌측 굴곡 관상동맥을 통해)으로의 앞 방향 또는 역행 주입, 재순환, 복강 내 주사, 심내막(transendocardial)을 통한 주사 또는 rAAV 비리온을 심장 근육에 전달할 수 있는 임의의 다른 편리한 모드 또는 투여 경로에 의해 심장 근육에 전달될 수 있다, 바람직한 실시 양태에서, 본 rAAV 비리온은 전신 정맥 내 투여에 의해 골격 및/또는 심장 근육에 전달된다. 정맥 내 주사를 통해 투여될 때, 야생형 AAV 비리온 또는 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온의 능력과 비교하여, 본 rAAV 비리온은 순환계를 통해 이동할 수 있고, 근육 세포를 보다 효율적으로 형질 도입할 수 있다.

본원에 개시된 변이체 캡시드 단백질은 단리, 예를 들어 정제된다. 일부 실시 양태에서, 본원에 개시된 변이체 캡시드 단백질은 AAV 벡터 또는 재조합 AAV(rAAV) 비리온에 포함된다. 다른 실시 양태에서, 이러한 AAV 변이체 벡터 및/또는 AAV 변이체 비리온은 영장류 심장 또는 골격 근육에서 근육 질병을 치료하는 생체 내 또는 생체 외 방법에 사용된다.

본원의 개시는 추가로, 제한 없이, 대상 핵산을 포함하는 단리된(유 전적으로 변형된) 숙주 세포와 같은 숙주 세포를 제공한다. 본원에 개시된 본 발명에 따른 숙주 세포는 시험관 내 세포 배양으로부터의 세포와 같은 단리된 세포일 수 있다. 이러한 숙주 세포는 본원에 기재된 바와 같이 본 발명의 rAAV 변이체 비리온을 생산하는데 유용하다. 일 실시 양태에서, 이러한 숙주 세포는 핵산으로 안정적으로 유전적으로 변형된다. 다른 실시 양태에서, 숙주 세포는 핵산으로 일시적으로 유전자 변형된다. 이러한 핵산은 전기 천공법, 칼슘 포스페이트 침전법, 리포솜 매개 형질 전환 등을 포함하는, 그러나 이에 제한되지 않는 입증된 기술을 사용하여 숙주 세포 내로 안정적으로 또는 일시적으로 도입된다. 안정한 형질 전환을 위해, 핵산은 일반적으로 선별 마커, 예를 들어 네오마이신 내성 등과 같은 여러 가지 잘 알려진 선별 마커 중 임의의 것을 더 포함할 것이다. 이러한 숙주 세포는 임의의 다양한 세포, 예를 들어, 쥐 세포 및 영장류 세포(예를 들어, 인간 세포)를 비롯한 포유류 세포 중 임의의 세포에 핵산을 도입함으로써 생성된다. 예시적인 포유동물 세포는, 제한적이지 않지만, 1차 세포 및 세포주를 포함하고, 예시적 세포주는 HEK293 세포, HEK293T 세포, COS 세포, HeLa 세포, Vero 세포, 3T3 생쥐 섬유 모세포, C3H10T1/2 섬유 모세포, CHO 세포 등을 포함하지만 이에 한정되지는 않는다. 예시적인 숙주 세포로는 제한적이지 않지만 HeLa 세포(예를 들어, American Type Culture Collection (ATCC) No. CCL-2), CHO 세포(예를 들어, ATCC Nos. CRL9618, CCL61, CRL9096), 293 세포(예를 들어, ATCC No. CRL-1573), Vero 세포, NIH 3T3 세포(예를 들어, ATCC No. CRL-1658), Huh-7 세포, BHK 세포(예를 들어, ATCC No. CCL10), PC12 세포(ATCC No. CRL1721), COS 세포, COS-7 세포(ATCC No. CRL1651), RAT1 세포, 생쥐 L 세포(ATCC No. CCLI.3), 인간 배아 신장(HEK) 세포(ATCC No. CRL1573), HLHepG2 세포 등을 포함한다. 숙주 세포는 또한 AAV를 생성하는 Sf9 세포와 같은 곤충 세포를 감염시키기 위해 바큘로 바이러스(baculovirus)를 사용하여 제조될 수 있다(예를 들어, 미국 특허 제7,271,002호; 미국 특허 출원 번호 제12/297,958호를 참조한다). 일부 실시 양태에서, 유전자 변형된 숙주 세포는 전술한 바와 같은 변이체 AAV 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산 이외에, 하나 이상의 AAV rep 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산을 포함한다. 다른 실시 양태에서, 숙주 세포는 rAAV 변이체 벡터를 더 포함한다. 이러한 숙주 세포를 사용하여 rAAV 변이체 비리온을 생성할 수 있다. rAAV 비리온을 생성하는 방법은 예를 들어, 미국 특허 공개 번호 제2005/0053922호 및 미국 특허 공개 번호 제2009/0202490호에 기재되어 있다.

본원의 개시는 추가로 a) 본원에 개시 및 상기에서 기재된 바와 같은 rAAV 변이체 비리온; 및 b) 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는 역학적 조성물을 제공한다. 일부 실시 양태에서, 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제는 인간 또는 비인간 환자에서의 사용에 적합하다. 이러한 부형제, 담체, 희석제 및 완충제는 과도한 독성 없이 투여될 수 있는 임의의 약제를 포함한다. 약학적으로 허용 가능한 부형제는 물, 식염수, 글리세롤 및 에탄올과 같은 액체를 포함하지만 이에 한정되지 않는다. 약학적으로 허용 가능한 염, 예를 들어 염산염, 브롬산염, 인산염, 황산염 등과 같은 광물산염; 및 아세트산염, 프로피오산염, 말론산염, 벤조산염 등과 같은 유기산 염이 포함될 수 있다. 부가적으로, 습윤제 또는 유화제, 계면 활성제, pH 완충 물질 등과 같은 보조 물질이 이러한 비히클에 존재할 수 있다. 매우 다양한 약학적으로 허용 가능한 부형제가 당업계에 공지되어 있으며 여기에서 상세히 논의할 필요는 없다. 약학적으로 허용 가능한 부형제는 예를 들어, A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy," 20th edition, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel et al., eds., 7^thed., Lippincott, Williams, & Wilkins; and Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe et al., eds., 3^rded. Amer. Pharmaceutical Assoc.를 포함하는 다양한 출판물에 충분하게 기술되어 있다. 본 발명의 일부 양태에서, 본 발명은 약 1 x 10⁸ 내지 약 1 x 10¹⁶ 재조합 바이러스 또는 1 x 10⁸ 내지 약 1 x 10¹⁶벡터 게놈을 포함하는 약학적 조성물을 제공하고, 각각의 상기 재조합 바이러스는 하나 이상의 유전자 산물을 인코딩하는 게놈을 포함한다.

본 발명의 일부 실시 양태는 하기 항목 1 내지 54 에 예시되어 있다:

1. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV)이며, 그 삽입은 AAV2 또는 AAV2 또는 AAV 변이체 이외의 야생형 AAV 혈청형의 캡시드 부분 내의 상응하는 위치에 있으며, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.

2. 항목 1의 변이체 AAV에 있어서, 상기 캡시드 단백질은 AAV2에 대해 하나 이상의 점돌연변이 또는 다른 야생형 AAV 혈청형 또는 AAV 변이체에 대해 하나 이상의 상응하는 점돌연변이를 포함한다.

3. 항목 2의 변이체 AAV에 있어서, 상기 하나 이상의 점돌연변이는 A35P, S109T, P195L, D213N, G222S, V229I, N312K, A319T, T330A, A333S, E347K, P363L, A427D, V447F, N449D, N449K?, G453R, A490T, K527Q, N551S, A581T, Y585S, R588M, A593E, W606C, K649E, R651H, W694C, I698V, V708I, 및 L735Q로 이루어진 군으로부터 선택되고, 바람직하게는 V708I, V708I + A593E, V708I + S109T, V708I + T330A, A35P, V708I + R588M, V708I + W606C, V708I + W694C, I698V, N312K + N449D + N551S + I698V + L735Q, N312K + N449D + N551S + I698V + V708I + L735Q, V708I + N449K 및 V708I+G222S로 이루어진 군으로부터 선택된다.

4. 항목 1의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 AAV2의 VP1에서 위치 570-671의 또는 다른 야생형 AAV 혈청형 또는 AAV 변이체에서 상응하는 위치의 아미노산 중 임의의 것에 후속하여 삽입된다.

5. 항목 4의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 AAV2의 VP1에서 아미노산 587 또는 다른 AAV 혈청형의 상응하는 위치에 후속하여 삽입된다.

6. (a) 항목 1-5 중 어느 하나에 따른 변이체 AAV 캡시드 단백질, 및 이종성 핵산을 포함하는 감염성 재조합 아데노-관련 바이러스(rAAV) 비리온.

7. 항목 6의 rAAV에 있어서, 상기 이종성 핵산은 RNA 간섭제 또는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함한다.

8. 표적 세포를 항목 7의 RAAV 비리온과 접촉시키는 것을 포함하는, 표적 세포에 이종성 핵산을 전달하는 방법.

9. 항목 8의 방법에 있어서, 상기 표적 세포가 심장 및/또는 골격 근육 세포인 방법.

10. 항목 8의 방법에 있어서, 상기 표적 세포가 시험관 내에 존재하는 방법.

11. 항목 8의 방법에 있어서, 상기 표적 세포가 생체 내에 존재하는 방법.

12. 캡시드 단백질의 GH-루프 내에 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 단리된 핵산이며, 상기 삽입은 AAV2 내에 또는 AAV 변이체 이외의 야생형 AAV 혈청형 또는 AAV 변이체의 캡시드 부분 내의 상응하는 위치에 있으며, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41) 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.

13. 항목 12의 핵산을 포함하는 단리된 숙주 세포.

14. AAV2의 VP1의 아미노산 570 및 611 사이의 위치에서 2개의 인접한 아미노산에 상응하는 모 AAV 캡시드 단백질에 대해 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 삽입은 아미노산 서열 Y₁Y₂X₁X₂X₃X₄X₅X₆X₇Y₃을 포함하며, X₁은 T 및 N으로부터 선택되고; X₂는 N 및 K 로부터 선택되고; X₃은 K, I 및 T로부터 선택되고; X₄는 I, Q 및 T로부터 선택되고; X₅는 G, R 및 N으로부터 선택되고; X₆은 V, T 및 K로부터 선택되고; X₇은 T 및 D로부터 선택된다.

15. 항목 14의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)로 이루어진 군으로부터 선택된다.

16. 항목 15의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 N-말단 아미노산 LA 및 C-말단 아미노산 A 측면에 위치한다(flanked).

17. 항목 15의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 AAV2의 VP1의 아미노산 587과 588 사이 또는 다른 야생형 AAV 혈청형 또는 AAV 변이체의 상응하는 위치 사이에 있다.

18. (a) 항목 14 내지 17 중 어느 하나에 따른 변이체 AAV 캡시드 단백질, 및 이종성 핵산을 포함하는 감염성 재조합 아데노-관련 바이러스(RAAV) 비리온.

19. 항목 18의 rAAV에 있어서, 상기 이종성 핵산은 RNA 간섭제 또는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함한다.

20. 표적 세포를 항목 18의 RAAV 비리온과 접촉시키는 것을 포함하는, 표적 세포에 이종성 핵산을 전달하는 방법.

21. 항목 20에 있어서, 상기 표적 세포가 심장 및/또는 골격 세포인 방법.

22. 항목 21에 있어서, 상기 표적 세포가 시험관 내 또는 생체 내에서 존재하는 방법.

23. i) 서열 식별 번호 1-10 및 11로 이루어진 군으로부터 선택된 야생형 AAV 와 적어도 90% 동일한 AAV 아미노산 서열; 및 ii) P363L, P363L + V708I, P363L + E347K, V708I + A593E, V708I + A333S, V708I + S721L, V708I + A593E + N551S, V708I + A593E + K649E, V708I + A593E + S109T, V708I + A593E + S109T + K527Q, A593E + S109T로 이루어진 군으로부터 선택된 하나 이상의 아미노산 치환을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 하나 이상의 치환은 AAV2에 대해 또는 다른 AAV 혈청형에 대해 하나 이상의 상응하는 치환이다.

24. 항목 23의 변이체 AAV에 있어서, 상기 캡시드 단백질은 펩타이드 삽입을 포함한다.

25. 항목 24의 변이체 AAV에 있어서, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14), TNKIGVT(서열 식별 번호 15), GNLTKGN(서열 식별 번호 16), NTVKLST(서열 식별 번호 17), SNTVKAI(서열 식별 번호 18), ASNITKA(서열 식별 번호 19), DNTVTRS(서열 식별 번호 20), NKISAKD(서열 식별 번호 21), NQDYTKT(서열 식별 번호 22), QADTTKN(서열 식별 번호 23), TNRTSPD(서열 식별 번호 24), SNTTQKT(서열 식별 번호 25), ASDSTKA(서열 식별 번호 26), LANKIQRTDA(서열 식별 번호 27), LANKTTNKDA(서열 식별 번호 28), LATNKIGVTA(서열 식별 번호 29), LAGNLTKGNA(서열 식별 번호 30), LANTVKLSTA(서열 식별 번호 31), LASNTVKAIA(서열 식별 번호 32), LAASNITKAA(서열 식별 번호 33), LADNTVTRSA(서열 식별 번호 34), LANKISAKDA(서열 식별 번호 35), LANQDYTKTA(서열 식별 번호 36), LATNKIGVTS(서열 식별 번호 37), LATNKIGVTA(서열 식별 번호 38), LAQADTTKNA(서열 식별 번호 39), LATNRTSPDA(서열 식별 번호 40), LASNTTQKTA(서열 식별 번호 41), 및 LAASDSTKAA(서열 식별 번호 42)로 이루어진 군으로부터 선택된다.

26. 항목 23의 변이체 AAV에 있어서, AAV 아미노산 서열은 야생형 AAV와 적어도 95% 동일하다.

27. 항목 23의 변이체 AAV에 있어서, AAV 아미노산 서열은 야생형 AAV와 적어도 99% 동일하다.

28. 항목 23의 변이체 AAV에 있어서, 상기 캡시드 단백질은 키메라 캡시드 단백질이거나 조상 캡시드 단백질이다.

29. (a) 항목 23-28 중 어느 하나에 따른 변이체 AAV 캡시드 단백질, 및 이종성 핵산을 포함하는 감염성 재조합 아데노-관련 바이러스(rAAV) 비리온.

30. 항목 29의 rRAAV에 있어서, 상기 이종성 핵산은 RNA 간섭제 또는 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함한다.

31. 표적 세포를 항목 29의 rAAV 비리온과 접촉시키는 것을 포함하는, 표적 세포에 이종성 핵산을 전달하는 방법.

32. 항목 31에 있어서, 상기 표적 세포가 심장 및/또는 골격 근육 세포인 방법.

33. 항목 32에 있어서, 심장 세포가 심장 근육 세포, 심장 근육 모세포, 심장 섬유 모세포, 및 심장 전구 세포로 이루어진 군으로부터 선택되는 방법.

34. 항목 31에 있어서, 상기 표적 세포가 시험관 내에 존재하는 방법.

35. 항목 31에 있어서, 상기 표적 세포가 생체 내에 존재하는 방법.

36. 서열 식별 번호 1-12로 이루어진 군으로부터 선택된 야생형 AAV 또는 AAV 변이체와 적어도 90% 동일한 아미노산 서열을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열; 및 ii) P363L, P363L + V708I, P363L + E347K, V708I + A593E, V708I + A333S, V708I + S721L, V708I + A593E + N551S, V708I + A593E + K649E, V708I + A593E + S109T, V708I + A593E + S109T + K527Q, A593E + S109T로 이루어진 군으로부터 선택된 하나 이상의 아미노산 치환을 포함하는 단리된 핵산.

37. 항목 36의 핵산을 포함하는 단리된 숙주 세포.

38. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하고, 임의로 하나 이상의 점돌연변이를 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 펩타이드 삽입은 NKIQRTD(서열 식별 번호 13) 및 LANKIQRTDA(서열 식별 번호 26)로 이루어진 군으로부터 선택된다.

39. 항목 38에 따른 변이체 AAV 캡시드 단백질은 V708I 아미노산 치환을 포함한다.

40. 항목 39에 따른 변이체 AAV 캡시드 단백질은 V708I + A593E, V708I + S109T, V708I + T330A, V708I + R588M 또는 V708I + N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.

41. 항목 38에 따른 변이체 AAV 캡시드 단백질은 A35P 아미노산 치환을 포함한다.

42. 항목 38에 따른 변이체 AAV 캡시드 단백질은 N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.

43. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하고, 임의로 하나 이상의 점돌연변이를 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 펩타이드 삽입은 NKTTNKD(서열 식별 번호 14) 및 LANKTTNKDA(서열 식별 번호 27)로 이루어진 군으로부터 선택된다.

44. 항목 43에 따른 변이체 AAV 캡시드 단백질은 V708I 아미노산 치환을 포함한다.

45. 항목 44에 따른 변이체 AAV 캡시드 단백질은 V708I + S109T, V708I + W694C, V708I + W606C, 또는 V708I + N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.

46. 항목 43에 따른 변이체 AAV 캡시드 단백질은 I698V 아미노산 치환을 포함한다.

47. 항목 46에 따른 변이체 AAV 캡시드 단백질은 N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.

48. 캡시드 단백질의 GH-루프에서 펩타이드 삽입을 포함하고, 임의로 하나 이상의 점돌연변이를 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 펩타이드 삽입은 TNKIGVT(서열 식별 번호 15), LATNKIGVTA(서열 식별 번호 28) 및 LATNKIGVTS(서열 식별 번호 36)로 이루어진 군으로부터 선택된다.

49. 항목 48에 따른 변이체 AAV 캡시드 단백질은 V708I 아미노산 치환을 포함한다.

50. 항목 49에 따른 변이체 AAV 캡시드 단백질은 V708I + N449K, V708I + G222S, 또는 V708I + N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.

51. 항목 48에 따른 변이체 AAV 캡시드 단백질은 N312K + N449D + N551S + I698V + L735Q 아미노산 치환을 포함한다.

52. 서열 식별 번호 62의 서열 또는 그것과 적어도 90% 동일한 서열을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 변이체 AAV 캡시드 단백질은 AAV5 캡시드에 대해 하기 아미노산 치환을 포함한다: V229I + A490T + A581T.

53. 항목 52에 따른 변이체 AAV 캡시드 단백질은 AA5 캡시드에 대해 Y585S 또는 V447F 아미노산 치환을 더 포함한다.

54. 서열 식별 번호 63의 서열 또는 그것과 적어도 90% 동일한 서열을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며, 상기 변이체 AAV 캡시드 단백질은 AAV5 캡시드에 대해 하기 아미노산 치환을 포함한다: V229I + A427D + A490T + A581T.

실시예

하기 실시예는 본 발명을 구성하고 이용하는 방법에 대한 완전한 개시 및 설명을 당업자에게 제공하기 위해 제시되며, 본 발명자가 이러한 발명으로 간주하는 범위를 제한하기 위한 것이 아니며, 하기 실험이 전부이거나 수행된 유일한 실험임을 나타내기 위한 것도 아니다. 사용된 숫자(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하려고 하였지만, 일부 실험적 오류 및 편차는 고려되어야 한다. 달리 언급되지 않는 한, 부(part)는 중량부이고, 분자량은 중량 평균 분자량이고, 온도는 섭씨 온도이고, 압력은 대략적인 대기압이다.

분자 및 세포 생화학의 일반적인 방법은 문헌[Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999); Protein Methods (Bollag et al., John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997); and Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)]과 같은 표준 교제에서 찾아볼 수 있으며, 이의 전문은 본원에 참고로 포함된다. 본 개시에서 언급된 유전자 조작을 위한 시약, 클로닝 벡터 및 키트는 BioRad, Stratagene, Invitrogen, Sigma-Aldrich 및 ClonTech와 같은 상업적 공급자로부터 입수 가능하다.

실시예 1

정맥 내 주사 및 조직 수확. 체중이 적어도 3kg 이상인 연령 3 내지 10 세의 단일 수컷 시노몰구스 마카크(cynomolgus macaque)(macaca fascicularis)를 각 선택 라운드에 대해 복재(saphenous) 정맥을 통해 정맥 내 주사를 통해 투여하였다. 동물은 마취시키고 라이브러리의 1-5mL(제 1 라운드에서, 라이브러리는 도 1A에 기재된 모든 돌연변이유발 기술을 사용하여 생성된 변이체로 구성된다; 각각의 후속 라운드에서, 변이체는 이전 라운드로부터 분리되었다), 일부 경우에는 37℃에서 30분 동안 인간 IVIG와 사전-인큐베이션하였다.

안락사는 선택에 따라 14±3 또는 21±3일째에 100mg/kg 펜토바르비탈 나트륨을 정맥 내 주사를 사용하여 숙련된 수의사에 의해 수행되었다. 사두근으로부터 심장 및/또는 골격 근육 조직을 제거하고, DNA를 그 조직으로부터 분리하였다. 일부 경우에, 심장 조직을 여러 영역: 심방, 심실 격벽, 좌측 유두 근육, 우측 유두 근육, 좌심실 및 우심실로 분할하였다.

유도 진화. 유도 진화 과정은 도 1A 내지 도 1E에 나타나 있다. 간단히 말해, DNA 돌연변이 기법과 cap 유전자의 20개 이상(20+)의 독점적인 조합을 포함하는 바이러스성 캡시드 라이브러리가 생성된다(도 1A). 이어서, 이 같은 입자가 이러한 캡시드를 인코딩하는 cap 유전자를 둘러싸고 있는 돌연변이 캡시드로 구성되도록 바이러스를 패키징하고(도 1B) 정제한다. 캡시드 라이브러리는 생체 내에서 선택압을 받게 한다. 관심있는 조직 또는 세포 물질을 그 표적을 성공적으로 감염시켰던 AAV 변이체를 단리하기 위해 수확하고, 바이러스를 성공적으로 회수한다. 성공적인 클론은 반복된 선택을 통해 농축된다(단계 1 - 도 1D). 이어서, 선택된 cap 유전자는 독점적인 재다양화를 거치게 되고, 바이러스 적합성을 반복적으로 증가시키기 위해 추가의 선택 단계를 통해 농축된다(단계 2 - 도 1D). 벡터 선택 단계 1 및 2 동안 확인된 변이체는 영장류 근육 세포를 형질 도입시키는 능력을 입증한다(도 1E).

AAV 캡시드 게놈의 성공적인 회수. 각 선택 라운드에서 회수된 캡시드를 사용하여 후속적인 선택 라운드를 개시하기 위해 주입되는 라이브러리를 패키징하였다. 조직으로부터의 캡시드 유전자의 회수는 관심있는 조직 내로의 라이브러리 벡터의 성공적인 내재화를 나타낸다. 대표적인 선택 라운드에서 심장 및 골격 근육 조직으로부터 바이러스 게놈을 회수하는 것은 도 2에 나타나 있다. 박스 내의 밴드는 바이러스 게놈의 성공적인 회수를 나타낸다.

서열 분석. 심장 조직 또는 골격 근육 조직에 대한 정맥 내 전달의 선택압 을 포함하는 선택 라운드 3-4 및 심장 조직에 대해 중화 항체의 존재 하에서의 정맥 내 전달의 선택압을 포함하는 선택 1-2 라운드 동안, 집단 내의 변이체의 빈도를 결정하기 위해 라이브러리 내의 개별 클론 상에서 서열화를 수행하였다. 서열화 데이터 내에서 모티프의 존재에 대해 변이체를 평가하였다. 변이체는 다중 서열에서 발생하는 통합 변이(unifying variation)(예를 들어, 캡시드 내의 일정한 위치에 있는 특정 점돌연변이 또는 특정 펩타이드 삽입 서열)의 존재에 기초하여 모티프로 분류되었다. 1회 이상의 선택 라운드에서 서열화된 집단의 적어도 5%를 또는 1회 이상의 선택 라운드에서 서열화된 집단의 적어도 10%를 나타내는 모티프는 도 3A(심장 조직에 대해 정맥 내 전달의 선택력에 대한 라운드 4 서열 분석), 도 3B(심장 조직에 대해 중화 항체의 존재 하에서의 정맥 내 전달의 선택압에 대한 라운드 2 서열 분석), 도면 3B(심장 조직에 대해 중화 항체의 존재하에 정맥 내 전달의 선택압에 대한 라운드 2 서열 분석) 및 도 3C(골격 근육 조직에 대해 정맥 내 전달의 선택압에 대한 라운드 3 서열 분석)에 나타나 있다.

심장 및/또는 골격 근육 세포의 증가된 감염성을 부여하는 것으로 확인된 몇몇 대표적인 클론은 하기 표 1 에 열거되어 있다(각각의 클론은 확인된 치환(들) 및/또는 펩타이드 삽입을 포함하고, 달리 서열 식별 번호 2와 동일하다; 선택 라운드, 서열 및 빈도(괄호 내)의 수는 각 클론에 대해 열거되어 있다):

표 1. 심장 및/또는 골격 근육 세포의 증가된 감염성을 부여하는 AAV VP1 캡시드 단백질에 대한 아미노산 서열 변형. 컬럼 2에 열거된 치환은 야생형 AAV2에 대한 아미노산 서열, 즉 삽입된 펩타이드의 부재하에 기초한다. 컬럼 5의 "심장 + NAb"는 아미노산 서열 변형이 심장 근육 세포의 증가된 감염성에 더하여 항-AAV 항체에 의한 중화에 대해 증가된 내성을 부여해야 한다는 것을 나타낸다.

삽입	치환	심장	심장 + NAb	골격 근육
588~LANKIQRTDA~ (서열 식별 번호 27)	없음	라운드 3: 6 (9.68%) 라운드 4: 11 (26.83%)	라운드 1: 2 (1.41%) 라운드 2: 1 (0.81%)	라운드 3: 1 (1.23%)
588~LANKIQRTDA~ (서열 식별 번호 27)	+A35P	라운드 4: 1 (2.44%)	--	--
588~LANKIQRTDA~ (서열 식별 번호 27)	+S109T+V708I	라운드 3: 1 (1.61%) 라운드 4: 2 (4.88%)	--	--
588~LANKIQRTDA~ (서열 식별 번호 27)	+R588M+V708I	--	라운드 1: 1 (0.70%)	--
588~LANKIQRTDA~ (서열 식별 번호 27)	+A593E+V708I	라운드 3: 1 (1.61%)	--	--
588~LANKIQRTDA~ (서열 식별 번호 27)	+V708I	라운드 3: 13 (20.97%) 라운드 4: 10 (23.26%)	라운드 1: 1 (0.70%)	--
588~LANKTTNKDA~ (서열 식별 번호 28)	없음	라운드 4: 2 (4.88%)	라운드 1: 10 (7.04%) 라운드 2: 8 (6.50%)	--
588~LANKTTNKDA~ (서열 식별 번호 28)	+S109T+V708I	라운드 4: 1 (2.44%)	--	--
588~LANKTTNKDA~ (서열 식별 번호 28)	+W694C+V708I	라운드 4: 1 (2.44%)	--	--
588~LANKTTNKDA~ (서열 식별 번호 28)	+I698V	--	라운드 1: 1 (0.70%)	--
588~LANKTTNKDA~ (서열 식별 번호 28)	+W606C+V708I	--	라운드 2: 1 (0.81%)	--
588~LANKTTNKDA~ (서열 식별 번호 28)	+V708I	라운드 3: 6 (9.68%) 라운드 4: 3 (7.32%)	라운드 1: 4 (2.82%) 라운드 2: 10 (8.13%)	--
588~LATNKIGVTA~ (서열 식별 번호 29)	+V708I	라운드 4: 1 (2.44%)	--	--
588~LAQADTTKNA~ (서열 식별 번호 39)	없음	--	라운드 1: 23 (16.02%) 라운드 2: 21 (17.07%)	--
588~LAQADTTKNA~ (서열 식별 번호 39)	+D213N	--	라운드 2: 1 (0.81%)	--
588~LAQADTTKNA~ (서열 식별 번호 39)	+G453R	--	라운드 1: 1 (0.70%)	--
588~LAQADTTKNA~ (서열 식별 번호 39)	+V708I	라운드 4: 1 (2.44%)	라운드 1: 3 (2.11%) 라운드 2: 3 (2.44%)	--
588~LAQADTTKNA~ (서열 식별 번호 39)	+P363L	--	라운드 1: 1 (0.70%)	--
588~LANQDYTKTA~ (서열 식별 번호 36)	없음	--	라운드 1: 1 (0.70%)	--
588~LANQDYTKTA~ (서열 식별 번호 36)	+I698V	--	라운드 2: 2 (1.63%)	--
588~LANQDYTKTA~ (서열 식별 번호 36)	+V708I	--	라운드 1: 1 (0.70%)	--
588~LATNRTSPDA~ (서열 식별 번호 40)	+V708I	--	라운드 2: 1 (0.81%)	--
588~LAASDSTKAA~ (서열 식별 번호 42)	없음	--	--	라운드 3: 1 (1.23%)
588~LAASDSTKAA~ (서열 식별 번호 42)	+V708I	라운드 3: 2 (3.23%)	--	--
588~LAASNITKAA~ (서열 식별 번호 33)	없음	--	라운드 1: 2 (1.41%) 라운드 2: 8 (6.50%)	--
588~LAASNITKAA~ (서열 식별 번호 33)	+V708I	--	라운드 1: 6 (4.23%) 라운드 2: 11 (8.94%)	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	없음	라운드 3: 4 (6.44%)	라운드 1: 6 (4.23%) 라운드 2: 3 (2.44%)	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	+S109T+V708I	라운드 3: 2 (3.23%)	--	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	+A139T+P195L	--	라운드 1: 1 (0.70%)	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	+P363L+V708I	--	라운드 1: 1 (0.70%)	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	+R651H	--	라운드 2: 1 (0.81%)	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	+V708I	라운드 3: 2 (3.23%)	라운드 1: 1 (0.70%) 라운드 2: 2 (1.63%)	--
588~LAGNLTKGNA~ (서열 식별 번호 30)	+P363L	--	라운드 1: 1 (0.70%)	--
588~LADNTVTRSA~ (서열 식별 번호 34)	없음	--	라운드 1: 9 (6.34%) 라운드 2: 6 (4.88%)	--
588~LADNTVTRSA~ (서열 식별 번호 34)	+I698V	--	라운드 2: 1 (0.81%)	--
588~LADNTVTRSA~ (서열 식별 번호 34)	+V708I	--	라운드 1: 1 (0.70%) 라운드 2: 2 (1.63%)	--
588~LANTVKLSTA~ (서열 식별 번호 31)	없음	--	라운드 1: 3 (2.11%) 라운드 2: 7 (5.69%)	--
588~LANTVKLSTA~ (서열 식별 번호 31)	+V708I	--	라운드 2: 8 (6.50%)	--
588~LASNTVKAIA~ (서열 식별 번호 32)	없음	라운드 3: 2 (3.23%) 라운드 4: 1 (2.44%)	--	--
588~LASNTVKAIA~ (서열 식별 번호 32)	+V708I	라운드 4: 1 (2.44%)	--	--
588~LATNKIGVTS~ (서열 식별 번호 37)	없음	라운드 4: 1 (2.44%)	--	--
588~LASNTTQKTA~ (서열 식별 번호 41)	없음	--	--	라운드 3: 2 (2.46%)
588~LANKISAKDA~ (서열 식별 번호 35)	없음	--	라운드 2: 3 (2.44%)	--
588~LANKISAKDA~ (서열 식별 번호 35)	+V708I	--	라운드 2: 2 (1.63%)	--

없음	P34A	--	--	라운드 4: 2 (10%)
없음	P34S	--	라운드 1: 1 (0.70%)	--
없음	P64S	--	--	라운드 4: 1 (5.00%)
없음	S109T+P235S	--	--	라운드 4: 1 (5.00%)
없음	Q120R	--	--	라운드 4: 1 (5.00%)
없음	A193V	--	--	라운드 3: 1 (1.23%)
없음	T277N	--	--	라운드 4: 1 (5.00%)
없음	P351L	--	--	라운드 4: 1 (5.00%)
없음	P363L	--	라운드 1: 13 (9.15%)	라운드 3: 34 (41.98%) 라운드 4: 4 (20.00%)
없음	P363L+E347K	--	--	라운드 3: 1 (1.23%)
없음	P363L+V708I	--	라운드 1: 2 (1.41%)	--
없음	S427T+I698V	--	라운드 1: 1 (0.70%)	--
없음	Q440K	--	--	라운드 3: 1 (1.23%)
없음	Y444F	--	--	라운드 4: 1 (5.00%)
없음	N449D	--	--	라운드 4: 1 (5.00%)
없음	T568N	--	--	라운드 3: 1 (1.23%)
없음	A593E	라운드 4: 3 (7.32%)	라운드 1: 1 (0.70%)	라운드 3: 31 (38.27%) 라운드 4: 2 (10%)
없음	S109T+A593E	--	--	라운드 3: 2 (2.47%)
없음	S109T+K527Q+A593E+V708I	라운드 3: 1 (1.61%)	--	--
없음	S109T+A593E+V708I	라운드 3: 1 (1.61%)	--	--
없음	A593E+N551S+V708I	--	--	라운드 3: 1 (1.23%)
없음	A593E+K649E+V708I	라운드 3: 1 (1.61%)	--	--
없음	A593E+V708I	라운드 3: 12 (19.35%)	라운드 1: 5 (3.52%)	라운드 3: 1 (1.23%)
없음	I698V	--	--	라운드 4: 1 (5.00%)
없음	V708I	라운드 3: 6 (9.68%) 라운드 4: 2 (4.88%)	라운드 1: 10 (7.04%)	라운드 3: 1 (1.23%) 라운드 4: 1 (5.00%)
없음	V708I+A333S	--	--	라운드 3: 1 (1.23%)
없음	V708I+S721L	라운드 3: 1 (1.61%)	--	--
없음	V708I+L735V	--	--	라운드 3: 1 (1.23%)

또한, 항-AAV 항체에 의한 중화에 대한 증가된 내성 및 심장 근육 세포의 증가된 감염성을 부여하는 캡시드로 확인되었다.(i) AAV6의 아미노산 1-129 및 (ii) AAV5의 아미노산 130-725를 갖고 AAV5 에 대해 하기 아미노산 치환을 갖는 키메라: V229I + A490T + A581T(서열 식별 번호 62의 서열).

(i) AAV2의 아미노산 1-61 및 (ii) AAV6의 아미노산 62-129, 및 (iii) AAV5 의 아미노산 130-725를 갖고 AAV5에 대해 하기 아미노산 치환을 갖는 키메라: V229I + A490T + A581T(서열 식별 번호 63의 서열).

(i) AAV6의 아미노산 1-129 및 (ii) AAV5의 아미노산 130-725를 갖고 AAV5 에 대해 다음의 아미노산 치환을 갖는 키메라: V229I + A490T + A581T + Y585S

(i) AAV6의 아미노산 1-129 및 (ii) AAV5의 아미노산 130-725를 갖고 AAV5에 대해 다음의 아미노산 치환을 갖는 키메라: V229I + A447F + A490T + A581T

본원에 개시된 AAV 변이체 비리온은 유전 공학적 AAV 바이러스 벡터 분야에서 당업자에게 매우 자명한, 이성적이고 합리적인 설계 파라미터, 특징, 변형, 이점 및 변이를 포함할 수 있다.

실시예 2

심장 근육 세포에 대한 신규한 AAV 변이체 LANKIQRTDA + V708I(서열 식별 번호 43), LANKTTNKDA + V708I(서열 식별 번호 48) 및 LATNKIGVTA + V708I (서열 식별 번호 46)을 포함하는 재조합 AAV 비리온의 세포 주성을 인간 배아 줄기세포(ESC)로부터 생성된 심장 근육 세포를 사용하여 시험관 내에서 평가하였다.

AAV1 캡시드, AAV2 캡시드, AAV9 캡시드, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 또는 신규한 변이체 캡시드LATNKIGVTA + V708I의 어느 하나 및 CAG 프로모터(AAV1.CAG.EGFP, AAV2.CAG.EGFP, AAV9.CAG.EGFP, LANKIQRTDA + V708I.CAG.EGFP, LANKTTNKDA + V708I.CAG.EGFP 및 LATNKIGVTA + V708I.CAG.GFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 심장 근육 세포는 작은 분자를 사용하여 Wnt 시그널링의 조절에 의해 인간 배아 줄기 세포주, ESI-017로부터 생성되었다. 심장 중배엽 유도 14일 후, 배양물을 글루코스 박탈에 의해 심장 근육 세포에 대해 추가로 농축시켰다. 분화 약 24일 후에, 대부분의 세포는 심장 근육 세포 마커, 심장 트로포닌 T(cTnT), 및 심실-특이적 마커, MLC-2V를 발현하였다. 생성된 심장 근육 세포를 갭 접합 단백질 콘넥신 43, 막 전위 변동, 칼슘 취급, 및 수축 기능의 발현에 대해 평가하여 생성된 심장 근육 세포가 벡터 특성화 이전에 성숙한 상태에 도달했다는 것을 확인한다.

AAV1, AAV2, AAV9에 대해, LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 LATNKIGVTA + V708I 변이체는 면역 형광(도 6A), 유동 세포 분석법(도 6B) 및 웨스턴 블랏 분석(도 6C-D)에 의해 결정된 바와 같이 감염 6일 후 인간 심장 근육 세포 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 또한, AAV1, AAV2 및 AAV9에 대해, LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 LATNKIGVTA + V708I는 면역 형광(도 6E)에 의해 결정된 바와 같이, 인간 심장 근육 세포 배양물에서 유전자 발현의 보다 빠른 개시를 위해 제공된다. 근육 및 골격 근육 세포 주성을 나타내는 AAV8 및 AAV9에 대해, 투여된 바이러스 게놈당 감염성 단위의 수는 LANKIQRTDA + V708I 및 LANKTTNKDA + V708I(도 10A)에 대해 수배의 더 높은 규모였다. 이 연구는 유전자를 심장 세포에 전달하는데 AAV 캡시드 변이체를 포함하는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 TNKIGVT(서열 식별 번호 15)의 우수한 능력을 예시한다.

실시예 3

인간 배아 줄기 세포(ESC)로부터 생성된 심장 근육 세포를 사용하여 시험관내에서 심장 근육 세포에 대한 신규한 AAV 변이체 AAV6/AAV5 키메라를 포함하는 재조합 AAV 비리온의 세포 주성을 평가하였다.

AAV1 캡시드, AAV8 캡시드, AAV9 캡시드, 또는 신규한 변이체 캡시드 AAV6/AA5 키메라의(서열 식별 번호 62의) 어느 하나 및 CAG 프로모터(AAV1.CAG.EGFP, AAV8.CAG.EGFP, AAV9.CAG.EGFP, AAV6/AAV5 키메라.CAG.EGFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 심장 근육 세포는 작은 분자를 사용하여 Wnt 시그널링의 조절에 의해 인간 배아 줄기 세포주, ESI-017로부터 생성되었다. 심장 중배엽 유도 14일 후, 배양물을 글루코스 박탈에 의해 심장 근육 세포에 대해 추가로 농축시켰다. 분화 약 24일 후에, 대부분의 세포는 심장 근육 세포 마커, 심장 트로포닌 T(cTnT), 및 심실-특이적 마커, MLC-2V를 발현하였다. 생성된 심장 근육 세포를 갭 접합 단백질 콘넥신 43, 막 전위 변동, 칼슘 취급, 및 수축 기능의 발현에 대해 평가하여 생성된 심장 근육 세포가 벡터 특성화 이전에 성숙한 상태에 도달했다는 것을 확인한다.

AAV1, AAV8, AAV9에 대해, AAV6/AAV5 키메라는 면역 형광(도 7A), 유동 세포 분석법(도 7B) 및 웨스턴 블랏 분석(도 7C-D)에 의해 결정된 바와 같이 감염 6일 후 인간 심장 근육 세포 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 또한, AAV8에 대해, AAV6/AAV5 키메라는 면역 형광(도 7E)에 의해 결정된 바와 같이, 인간 심장 근육 세포 배양물에서 유전자 발현의 보다 빠른 개시를 위해 제공된다. AAV8 및 AAV9에 대해, 투여된 바이러스 게놈당 감염성 단위의 수는 AAV6/AAV5 키메라(도 10A)에 대해 수배의 더 높은 규모였다. 이 연구는 유전자를 심장 세포에 전달하는데 AAV 캡시드 변이체를 포함하는 서열 식별 번호 62-의 우수한 능력을 예시한다.

실시예 4

1차 인간 근육 모세포로부터 생성된 골격 근육 섬유를 사용하여 시험관 내에서 골격 근육 섬유에 대한 신규한 AAV 변이체 LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 AAV6/AAV5 키메라를 포함하는 재조합 AAV 비리온의 세포 주성을 평가하였다.

AAV8 캡시드, AAV9 캡시드, 신규한 변이체 캡시드 LANKIQRTDA + V708I, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 또는 신규한 변이체 캡시드 AAV6/AAV5 키메라의 어느 하나 및 CAG 프로모터(AAV8.CAG.EGFP, AAV9.CAG.EGFP, LANKIQRTDA + V708I.CAG.EGFP, LANKTTNKDA + V708I.CAG.EGFP 및 AAV6/AAV5 키메라.CAG.GFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 건강한 51세 남성(Cook Myosites)으로부터 얻은 1차 인간 골격 근육 모세포로부터 골격 근육 섬유를 생성하였다. 근육 모세포를 30일 동안 분화시켜 성숙한 다핵 골격 근육 섬유를 형성하였다. 생성된 골격 근육 섬유들을 미오신 중쇄(MHC) 및 디스트로핀의 발현에 대해 평가하여, 생성된 골격 근육 섬유들의 대부분이 벡터 특성화 이전에 성숙한 상태에 도달했다는 것을 확인한다.

AAV8 및 AAV9에 대해, AAV6/AAV5 키메라는 면역 형광(도 8A) 및 유동 세포 분석법(도 8B)에 의해 결정된 바와 같이 감염 7일 후 인간 골격 근육 섬유 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 또한, AAV8 및 AAV9에 대해, LANKIQRTDA + V708I 및 LANKTTNKDA + V708I는 면역 형광(도 8C)에 의해 결정된 바와 같이, 인간 골격 근육 섬유 배양물에서 유전자 발현의 보다 빠른 개시를 위해 제공된다. AAV8 및 AAV9에 대해, 투여된 바이러스 게놈당 감염성 단위의 수는 LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 AAV6/5 ㅋ키메라(도 10B)에 대해 수배의 더 높은 규모였다. 이 연구는 유전자를 골격 근육 섬유에 전달하는데 변이체를 포함하는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 서열 식별 번호 62의 우수한 능력을 예시한다.

실시예 5

섬유 모세포 유래 인간 유도 만능 줄기 세포(FB-iPSC) 또는 인간 배아 줄기 세포(ESC)로부터 생성된 골격 근육 전구 세포를 사용하여 시험관 내에서 신규한 AAV 변이체 LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 골격 근육 전구 세포에 대한 AAV6/AAV5 키메라를 포함하는 재조합 AAV 비리온의 세포 주성을 평가하였다.

AAV9 캡시드, 신규한 변이체 캡시드 LANKIQRTDA + V708I, 신규한 변이체 캡시드 LANKTTNKDA + V708I, 또는 신규한 변이체 캡시드 AAV6/AAV5 키메라의 어느 하나 및 CAG 프로모터(AAV8.CAG.EGFP, AAV9.CAG.EGFP, LANKIQRTDA + V708I.CAG.EGFP, LANKTTNKDA + V708I.CAG.EGFP 및 AAV6/AAV5 키메라.CAG.GFP, 각각)에 작동 가능하게 연결된 녹색 형광 단백질(EGFP) 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 골격 근육 전구 세포는 문헌[Shelton et al. Methods, 2016 with minor modifications]에 기재된 분화 전략에 따라 인간 배아 줄기 세포주, ESI-017(ESI-BIO)로부터 생성하였다. 분화 약 40일 후에, 골격 근육 전구체에 대한 계통 제한(lineage restriction)은 벡터 특성화를 위해 배양물을 사용하기 전에 대부분의 세포에서 PAX7 및 MyoD의 발현에 의해 확인되었다.

AAV9에 대해, LANKIQRTDA + V708I, LANKTTNKDA + V708I 및 AAV6/AAV5 키메라는 면역 형광(도 9A) 및 유동 세포 분석법(도 9B)에 의해 결정된 바와 같이 감염 6일 후 인간 골격 근육 전구체 배양물에서 이식 유전자 발현 및 그의 유의하게 더 높은 형질 도입 효율을 위해 제공된다. 이 연구는 유전자를 골격 근육 전구체에 전달하는데 AAV 캡시드 변이체를 포함하는 NKIQRTD(서열 식별 번호 13), NKTTNKD(서열 식별 번호 14) 및 서열 식별 번호 62의 우수한 능력을 예시한다.

실시예 6

유도 진화는 인간 심장 및 골격 근육에 대한 유전자 전달의 다른 방법에 비해 상당한 이점을 갖는 투여 경로, 정맥 내(IV) 투여 후 심장 및 골격 근육 세포로의 우수한 유전자 전달을 갖는 신규한 아데노-관련 바이러스(AAV) 변이체를 발견하기 위해 사용되었다(실시예 1). V708I 치환 및 아미노산 587 및 588(LANKIQRTDA + V708I; 서열 식별 번호 43) 사이에 삽입된 펩타이드 LANKIQRTDA(서열 식별 번호 27)를 포함하는 신규한 AAV 변이체를 포함하는 재조합 AAV 비리온을 근육 내 투여한 후 세포 주성을 생쥐의 생체 내에서 근육 세포를 형질 도입하는 AAV 캡시드 변이체를 함유하는 NKIQRTD(서열 식별 번호 13)을 포함하는 rAAV 비리온의 능력의 대표적인 예로서 평가하였다.

신규한 변이체 캡시드 LANKIQRTDA + V708I 및 CAG 프로모터(LANKIQRTDA + V708I.CAG.luciferase)에 작동 가능하게 연결된 루시페라제 이식 유전자를 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. B6 알비노(C57BL/6) 생쥐를 2 x 10¹² vg로 꼬리정맥 정맥 내 주사를 통해 주사하고, 형질 도입을 루시페라제 이미징에 의한 생전에 그리고 조직 루시페라제 활성에 의한 사후에 평가하였다. 14일(좌측) 및 28일(우측) 투여 후 루시페라제의 생전 이미징은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 세포를 형질 도입시킬 수 있다는 것을 입증한다(도 11A). 심장, 횡경막 및 사두근에 56일 투여 후루시페라제 활성은 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 생쥐 심장 및 골격 근육을 형질 도입할 수 있다는 것을 입증한다(도 11B).

이 연구는 몇몇 임상적으로 허용되는 투여 경로 중 하나를 따르는 변이체를 포함하는 NKIQRTD(서열 식별 번호 13)에 의한 유전자 전달을 예시한다. 유사한 효능이 이 펩타이드 삽입 모티프를 포함하는 다른 변이체로 달성될 수 있다. 마찬가지로, 유사한 효능이 동일한 유도 진화 접근법을 사용하여 확인된 본원에 개시된 다른 변이체로 달성될 수 있다.

실시예 7

유도 진화는 인간 심장 및 골격 근육에 대한 유전자 전달의 다른 방법에 비해 상당한 이점을 갖는 투여 경로, 정맥 내(IV) 투여 후 심장 및 골격 근육 세포로의 우수한 유전자 전달을 갖는 신규한 아데노-관련 바이러스(AAV) 변이체를 발견하기 위해 사용되었다(실시예 1). V708I 치환 및 아미노산 587 및 588(LANKIQRTDA + V708I; 서열 식별 번호 43) 사이에 삽입된 펩타이드 LANKIQRTDA(서열 식별 번호 27)를 포함하는 신규한 AAV 변이체를 포함하는 재조합 AAV 비리온을 근육 내 투여한 후 세포 주성을 비-인간 영장류(NHP)의 생체 내에서 근육 세포를 형질 도입하는 AAV 캡시드 변이체를 함유하는 NKIQRTD(서열 식별 번호 13)을 포함하는 rAAV 비리온의 능력의 대표적인 예로서 평가하였다. 신규한 변이체 캡시드 LANKIQRTDA + V708I 및 CAG 프로모터(LANKIQRTDA + V708I.CAG.GFP)에 작동 가능하게 연결된 녹색 형광 단백질(GFP)을 포함하는 게놈을 포함하는 재조합 AAV 비리온을 표준 방법을 사용하여 제조하였다. 시노몰구스 마카크를 1 x 1O¹¹ vg의 외측광근 내의 부위에 3회 투여량의 벡터로 근육 내를 통해 주사하고, 골격 근육 세포의 형질 도입을 면역형광 이미징에 의해 사후에 평가하였다. 2x, 4x 및 20x 배율에서 근위 생검 부위의 단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격근 세포를 형질 도입할 수 있다는 것을 입증한다(도 12A). 2x, 4x 및 20x 배율에서 말단 생검 부위의 종단면의 헤마톡실린 및 에오신(H&E) 및 항-GFP 항체 염색색의 대표적인 이미지는 신규한 AAV 변이체 LANKIQRTDA + V708I 캡시드가 생체 내에서 영장류 골격 근육 세포를 형질 도입할 수 있다는 것을 입증한다(도 12B). 이 연구는 몇몇 임상적으로 허용되는 투여 경로 중 하나를 따르는 변이체를 포함하는 NKIQRTD(서열 식별 번호 13)에 의한 유전자 전달을 예시한다. 유사한 효능이 이 펩타이드 삽입 모티프를 포함하는 다른 변이체로 달성될 수 있다. 마찬가지로, 유사한 효능이 동일한 유도 진화 접근법을 사용하여 확인된 본원에 개시된 다른 변이체로 달성될 수 있다.

전술한 내용은 단지 본 발명의 원리를 예시한다. 당업자는 본 명세서에 명시적으로 기술되거나 도시되지 않았지만, 본 발명의 원리를 구현하고 본 발명의 사상 및 범위 내에 포함되는 다양한 배치를 고안할 수 있다는 것을 이해할 것이다. 또한, 본 명세서에 인용된 모든 실시예 및 조건 언어는 원칙적으로 본 발명의 원리 및 본 발명자에 의해 제공된 개념을 이해하는데 있어서 독자에게 도움을 주도록 의도되며, 이러한 구체적으로 인용된 실시예 및 조건에 제한되지 않는 것으로 해석되어야 한다.

또한, 본 발명의 원리, 양태 및 실시 양태뿐만 아니라 그의 구체적인 실시예를 언급하는 모든 설명은 이의 구조적 및 기능적 등가물을 포함하는 것으로 의도된다. 또한, 이러한 등가물은 현재 공지된 등가물 및 미래에 개발되는 등가물, 즉 구조에 관계없이 동일한 기능을 수행하는 개발된 임의의 요소 모두를 포함하는 것으로 의도된다. 따라서, 본 발명의 범위는 본 명세서에 도시되고 설명된 예시적인 실시예들로 제한되도록 의도되지 않는다. 오히려, 본 발명의 범위 및 사상은 첨부된 청구범위에 의해 구현된다.

SEQUENCE LISTING <110> 4D Molecular Therapeutics Inc. <120> Adeno-Associated Virus Variant Capsids and Methods of Use Thereof <130> 090400-5009 WO <150> US 62/560,901 <151> 2017-09-20 <160> 69 <170> PatentIn version 3.5 <210> 1 <211> 736 <212> PRT <213> Adeno-associated virus 1 <400> 1 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 2 <211> 735 <212> PRT <213> adeno-associated virus 2 <400> 2 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr 580 585 590 Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp 595 600 605 Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr 610 615 620 Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys 625 630 635 640 His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn 645 650 655 Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln 660 665 670 Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys 675 680 685 Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr 690 695 700 Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr 705 710 715 720 Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 3 <211> 736 <212> PRT <213> Adeno-associated virus 3A <400> 3 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly 130 135 140 Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly 145 150 155 160 Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr 435 440 445 Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser 450 455 460 Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn 485 490 495 Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly 530 535 540 Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln 565 570 575 Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr 580 585 590 Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 4 <211> 736 <212> PRT <213> Adeno-associated virus 3B <400> 4 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly 145 150 155 160 Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr 435 440 445 Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser 450 455 460 Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn 485 490 495 Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn 500 505 510 Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly 530 535 540 Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln 565 570 575 Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr 580 585 590 Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 5 <211> 734 <212> PRT <213> Adeno-associated virus 4 <400> 5 Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu 1 5 10 15 Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys 20 25 30 Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val 50 55 60 Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln 65 70 75 80 Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu 115 120 125 Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro 130 135 140 Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys 145 150 155 160 Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr 165 170 175 Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser 180 185 190 Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly 195 200 205 Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys 210 215 220 Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr 225 230 235 240 Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu 245 250 255 Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu 305 310 315 320 Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp 325 330 335 Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser 340 345 350 Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr 355 360 365 Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn 370 375 380 Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly 385 390 395 400 Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser 405 410 415 Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile 420 425 430 Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu 435 440 445 Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn 450 455 460 Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln 465 470 475 480 Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr 485 490 495 Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly 500 505 510 Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro 515 520 525 Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys 530 535 540 Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser 545 550 555 560 Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly 565 570 575 Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp 580 585 590 Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg 595 600 605 Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp 610 615 620 Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His 625 630 635 640 Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro 645 650 655 Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr 660 665 670 Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu 675 680 685 Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly 690 695 700 Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr 705 710 715 720 Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu 725 730 <210> 6 <211> 724 <212> PRT <213> Adeno-associated virus 5 <400> 6 Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu 1 5 10 15 Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys 20 25 30 Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly 35 40 45 Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val 50 55 60 Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu 65 70 75 80 Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp 85 90 95 Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn 100 105 110 Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe 115 120 125 Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile 130 135 140 Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser 145 150 155 160 Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln 165 170 175 Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr 180 185 190 Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala 195 200 205 Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp 210 215 220 Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro 225 230 235 240 Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp 245 250 255 Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 260 265 270 Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln 275 280 285 Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val 290 295 300 Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr 305 310 315 320 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp 325 330 335 Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys 340 345 350 Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr 355 360 365 Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser 370 375 380 Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn 385 390 395 400 Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser 405 410 415 Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp 420 425 430 Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln 435 440 445 Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp 450 455 460 Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly 465 470 475 480 Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu 485 490 495 Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr 500 505 510 Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile 515 520 525 Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu 530 535 540 Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg 545 550 555 560 Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser 565 570 575 Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro 580 585 590 Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp 595 600 605 Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met 610 615 620 Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn 625 630 635 640 Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser 645 650 655 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu 660 665 670 Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 675 680 685 Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp 690 695 700 Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu 705 710 715 720 Thr Arg Pro Leu <210> 7 <211> 736 <212> PRT <213> Adeno-associated virus 6 <400> 7 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 8 <211> 737 <212> PRT <213> Adeno-associated virus 7 <400> 8 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn 210 215 220 Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn 260 265 270 Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn 370 375 380 Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser 405 410 415 Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala 435 440 445 Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln 450 455 460 Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile 530 535 540 Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu 545 550 555 560 Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu 565 570 575 Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala 580 585 590 Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp 595 600 605 Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro 610 615 620 His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly 625 630 635 640 Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro 645 650 655 Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile 660 665 670 Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu 675 680 685 Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser 690 695 700 Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly 705 710 715 720 Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn 725 730 735 Leu <210> 9 <211> 738 <212> PRT <213> Adeno-associated virus 8 <400> 9 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 10 <211> 736 <212> PRT <213> Adeno-associated virus 9 <400> 10 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 11 <211> 738 <212> PRT <213> Adeno-associated virus 10 <400> 11 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Glu Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Ala Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 12 <211> 738 <212> PRT <213> Adeno-associated virus rh10 <400> 12 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Gly Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Ser Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asp Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 13 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 13 Asn Lys Ile Gln Arg Thr Asp 1 5 <210> 14 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 14 Asn Lys Thr Thr Asn Lys Asp 1 5 <210> 15 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 15 Thr Asn Lys Ile Gly Val Thr 1 5 <210> 16 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 16 Gly Asn Leu Thr Lys Gly Asn 1 5 <210> 17 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 17 Asn Thr Val Lys Leu Ser Thr 1 5 <210> 18 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 18 Ser Asn Thr Val Lys Ala Ile 1 5 <210> 19 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 19 Ala Ser Asn Ile Thr Lys Ala 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 20 Asp Asn Thr Val Thr Arg Ser 1 5 <210> 21 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 21 Asn Lys Ile Ser Ala Lys Asp 1 5 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 22 Asn Gln Asp Tyr Thr Lys Thr 1 5 <210> 23 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 23 Gln Ala Asp Thr Thr Lys Asn 1 5 <210> 24 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 24 Thr Asn Arg Thr Ser Pro Asp 1 5 <210> 25 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 25 Ser Asn Thr Thr Gln Lys Thr 1 5 <210> 26 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 26 Ala Ser Asp Ser Thr Lys Ala 1 5 <210> 27 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 27 Leu Ala Asn Lys Ile Gln Arg Thr Asp Ala 1 5 10 <210> 28 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 28 Leu Ala Asn Lys Thr Thr Asn Lys Asp Ala 1 5 10 <210> 29 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 29 Leu Ala Thr Asn Lys Ile Gly Val Thr Ala 1 5 10 <210> 30 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 30 Leu Ala Gly Asn Leu Thr Lys Gly Asn Ala 1 5 10 <210> 31 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 31 Leu Ala Asn Thr Val Lys Leu Ser Thr Ala 1 5 10 <210> 32 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 32 Leu Ala Ser Asn Thr Val Lys Ala Ile Ala 1 5 10 <210> 33 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 33 Leu Ala Ala Ser Asn Ile Thr Lys Ala Ala 1 5 10 <210> 34 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 34 Leu Ala Asp Asn Thr Val Thr Arg Ser Ala 1 5 10 <210> 35 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 35 Leu Ala Asn Lys Ile Ser Ala Lys Asp Ala 1 5 10 <210> 36 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 36 Leu Ala Asn Gln Asp Tyr Thr Lys Thr Ala 1 5 10 <210> 37 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 37 Leu Ala Thr Asn Lys Ile Gly Val Thr Ser 1 5 10 <210> 38 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 38 Leu Ala Thr Asn Lys Ile Gly Val Thr Ala 1 5 10 <210> 39 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 39 Leu Ala Gln Ala Asp Thr Thr Lys Asn Ala 1 5 10 <210> 40 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 40 Leu Ala Thr Asn Arg Thr Ser Pro Asp Ala 1 5 10 <210> 41 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 41 Leu Ala Ser Asn Thr Thr Gln Lys Thr Ala 1 5 10 <210> 42 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> heterologous peptide insertion <400> 42 Leu Ala Ala Ser Asp Ser Thr Lys Ala Ala 1 5 10 <210> 43 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 43 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile 580 585 590 Gln Arg Thr Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 44 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 44 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile 580 585 590 Gln Arg Thr Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Gln 740 745 <210> 45 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 45 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile 580 585 590 Gln Arg Thr Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 46 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 46 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Thr Asn Lys 580 585 590 Ile Gly Val Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 47 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 47 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Thr Asn Lys 580 585 590 Ile Gly Val Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 48 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 48 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Thr 580 585 590 Thr Asn Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 49 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 49 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Lys Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asp Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Ser Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Thr 580 585 590 Thr Asn Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Gln 740 745 <210> 50 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 50 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Thr 580 585 590 Thr Asn Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 51 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 51 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Gly Asn Leu 580 585 590 Thr Lys Gly Asn Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 52 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 52 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Thr Val 580 585 590 Lys Leu Ser Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 53 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 53 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ser Asn Thr 580 585 590 Val Lys Ala Ile Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 54 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 54 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ala Ser Asn 580 585 590 Ile Thr Lys Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 55 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 55 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asp Asn Thr 580 585 590 Val Thr Arg Ser Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 56 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 56 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Lys Ile 580 585 590 Ser Ala Lys Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 57 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 57 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Asn Gln Asp 580 585 590 Tyr Thr Lys Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 58 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 58 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Gln Ala Asp 580 585 590 Thr Thr Lys Asn Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 59 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 59 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Thr Asn Arg 580 585 590 Thr Ser Pro Asp Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 60 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 60 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ser Asn Thr 580 585 590 Thr Gln Lys Thr Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 61 <211> 745 <212> PRT <213> Artificial Sequence <220> <223> variant AAV capsid <400> 61 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly 145 150 155 160 Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro 180 185 190 Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr 260 265 270 Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His 275 280 285 Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp 290 295 300 Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val 305 310 315 320 Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu 325 330 335 Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr 340 345 350 Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp 355 360 365 Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser 370 375 380 Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser 385 390 395 400 Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu 405 410 415 Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg 420 425 430 Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr 435 440 445 Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln 450 455 460 Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly 465 470 475 480 Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn 485 490 495 Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly 500 505 510 Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp 515 520 525 Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys 530 535 540 Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr 545 550 555 560 Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr 565 570 575 Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Ala Ser Asp 580 585 590 Ser Thr Lys Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln 595 600 605 Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln 610 615 620 Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro 625 630 635 640 Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile 645 650 655 Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser 660 665 670 Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val 675 680 685 Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp 690 695 700 Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val 705 710 715 720 Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile 725 730 735 Gly Thr Arg Tyr Leu Thr Arg Asn Leu 740 745 <210> 62 <211> 725 <212> PRT <213> Artificial Sequence <220> <223> Variant AAV capsid chimera <400> 62 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg 130 135 140 Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp 145 150 155 160 Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser 165 170 175 Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp 180 185 190 Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly 195 200 205 Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr 210 215 220 Trp Met Gly Asp Arg Ile Val Thr Lys Ser Thr Arg Thr Trp Val Leu 225 230 235 240 Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val 245 250 255 Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly 260 265 270 Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp 275 280 285 Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg 290 295 300 Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser 305 310 315 320 Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr 325 330 335 Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly 340 345 350 Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly 355 360 365 Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser 370 375 380 Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly 385 390 395 400 Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser 405 410 415 Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val 420 425 430 Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val 435 440 445 Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn 450 455 460 Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser 465 470 475 480 Gly Val Asn Arg Ala Ser Val Ser Ala Phe Thr Thr Thr Asn Arg Met 485 490 495 Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met 500 505 510 Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met 515 520 525 Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu 530 535 540 Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn 545 550 555 560 Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser 565 570 575 Ser Thr Thr Ala Pro Thr Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val 580 585 590 Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile 595 600 605 Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala 610 615 620 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys 625 630 635 640 Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val 645 650 655 Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met 660 665 670 Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 675 680 685 Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro 690 695 700 Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr 705 710 715 720 Leu Thr Arg Pro Leu 725 <210> 63 <211> 725 <212> PRT <213> Artificial Sequence <220> <223> Variant AAV capsid chimera <400> 63 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg 130 135 140 Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp 145 150 155 160 Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser 165 170 175 Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp 180 185 190 Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly 195 200 205 Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr 210 215 220 Trp Met Gly Asp Arg Ile Val Thr Lys Ser Thr Arg Thr Trp Val Leu 225 230 235 240 Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val 245 250 255 Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly 260 265 270 Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp 275 280 285 Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg 290 295 300 Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser 305 310 315 320 Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr 325 330 335 Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly 340 345 350 Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly 355 360 365 Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser 370 375 380 Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly 385 390 395 400 Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser 405 410 415 Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val 420 425 430 Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val 435 440 445 Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn 450 455 460 Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser 465 470 475 480 Gly Val Asn Arg Ala Ser Val Ser Ala Phe Thr Thr Thr Asn Arg Met 485 490 495 Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met 500 505 510 Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met 515 520 525 Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu 530 535 540 Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn 545 550 555 560 Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser 565 570 575 Ser Thr Thr Ala Pro Thr Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val 580 585 590 Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile 595 600 605 Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala 610 615 620 Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys 625 630 635 640 Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val 645 650 655 Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met 660 665 670 Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile 675 680 685 Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro 690 695 700 Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr 705 710 715 720 Leu Thr Arg Pro Leu 725 <210> 64 <211> 3685 <212> PRT <213> Homo sapiens <400> 64 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys 545 550 555 560 Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser 565 570 575 Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp 580 585 590 Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala 595 600 605 Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys 610 615 620 Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr 625 630 635 640 Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln 645 650 655 Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Ala Val Thr Thr Thr 660 665 670 Gln Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val 675 680 685 Thr Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro 690 695 700 Pro Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp Ser Glu Ile 705 710 715 720 Arg Lys Arg Leu Asp Val Asp Ile Thr Glu Leu His Ser Trp Ile Thr 725 730 735 Arg Ser Glu Ala Val Leu Gln Ser Pro Glu Phe Ala Ile Phe Arg Lys 740 745 750 Glu Gly Asn Phe Ser Asp Leu Lys Glu Lys Val Asn Ala Ile Glu Arg 755 760 765 Glu Lys Ala Glu Lys Phe Arg Lys Leu Gln Asp Ala Ser Arg Ser Ala 770 775 780 Gln Ala Leu Val Glu Gln Met Val Asn Glu Gly Val Asn Ala Asp Ser 785 790 795 800 Ile Lys Gln Ala Ser Glu Gln Leu Asn Ser Arg Trp Ile Glu Phe Cys 805 810 815 Gln Leu Leu Ser Glu Arg Leu Asn Trp Leu Glu Tyr Gln Asn Asn Ile 820 825 830 Ile Ala Phe Tyr Asn Gln Leu Gln Gln Leu Glu Gln Met Thr Thr Thr 835 840 845 Ala Glu Asn Trp Leu Lys Ile Gln Pro Thr Thr Pro Ser Glu Pro Thr 850 855 860 Ala Ile Lys Ser Gln Leu Lys Ile Cys Lys Asp Glu Val Asn Arg Leu 865 870 875 880 Ser Gly Leu Gln Pro Gln Ile Glu Arg Leu Lys Ile Gln Ser Ile Ala 885 890 895 Leu Lys Glu Lys Gly Gln Gly Pro Met Phe Leu Asp Ala Asp Phe Val 900 905 910 Ala Phe Thr Asn His Phe Lys Gln Val Phe Ser Asp Val Gln Ala Arg 915 920 925 Glu Lys Glu Leu Gln Thr Ile Phe Asp Thr Leu Pro Pro Met Arg Tyr 930 935 940 Gln Glu Thr Met Ser Ala Ile Arg Thr Trp Val Gln Gln Ser Glu Thr 945 950 955 960 Lys Leu Ser Ile Pro Gln Leu Ser Val Thr Asp Tyr Glu Ile Met Glu 965 970 975 Gln Arg Leu Gly Glu Leu Gln Ala Leu Gln Ser Ser Leu Gln Glu Gln 980 985 990 Gln Ser Gly Leu Tyr Tyr Leu Ser Thr Thr Val Lys Glu Met Ser Lys 995 1000 1005 Lys Ala Pro Ser Glu Ile Ser Arg Lys Tyr Gln Ser Glu Phe Glu 1010 1015 1020 Glu Ile Glu Gly Arg Trp Lys Lys Leu Ser Ser Gln Leu Val Glu 1025 1030 1035 His Cys Gln Lys Leu Glu Glu Gln Met Asn Lys Leu Arg Lys Ile 1040 1045 1050 Gln Asn His Ile Gln Thr Leu Lys Lys Trp Met Ala Glu Val Asp 1055 1060 1065 Val Phe Leu Lys Glu Glu Trp Pro Ala Leu Gly Asp Ser Glu Ile 1070 1075 1080 Leu Lys Lys Gln Leu Lys Gln Cys Arg Leu Leu Val Ser Asp Ile 1085 1090 1095 Gln Thr Ile Gln Pro Ser Leu Asn Ser Val Asn Glu Gly Gly Gln 1100 1105 1110 Lys Ile Lys Asn Glu Ala Glu Pro Glu Phe Ala Ser Arg Leu Glu 1115 1120 1125 Thr Glu Leu Lys Glu Leu Asn Thr Gln Trp Asp His Met Cys Gln 1130 1135 1140 Gln Val Tyr Ala Arg Lys Glu Ala Leu Lys Gly Gly Leu Glu Lys 1145 1150 1155 Thr Val Ser Leu Gln Lys Asp Leu Ser Glu Met His Glu Trp Met 1160 1165 1170 Thr Gln Ala Glu Glu Glu Tyr Leu Glu Arg Asp Phe Glu Tyr Lys 1175 1180 1185 Thr Pro Asp Glu Leu Gln Lys Ala Val Glu Glu Met Lys Arg Ala 1190 1195 1200 Lys Glu Glu Ala Gln Gln Lys Glu Ala Lys Val Lys Leu Leu Thr 1205 1210 1215 Glu Ser Val Asn Ser Val Ile Ala Gln Ala Pro Pro Val Ala Gln 1220 1225 1230 Glu Ala Leu Lys Lys Glu Leu Glu Thr Leu Thr Thr Asn Tyr Gln 1235 1240 1245 Trp Leu Cys Thr Arg Leu Asn Gly Lys Cys Lys Thr Leu Glu Glu 1250 1255 1260 Val Trp Ala Cys Trp His Glu Leu Leu Ser Tyr Leu Glu Lys Ala 1265 1270 1275 Asn Lys Trp Leu Asn Glu Val Glu Phe Lys Leu Lys Thr Thr Glu 1280 1285 1290 Asn Ile Pro Gly Gly Ala Glu Glu Ile Ser Glu Val Leu Asp Ser 1295 1300 1305 Leu Glu Asn Leu Met Arg His Ser Glu Asp Asn Pro Asn Gln Ile 1310 1315 1320 Arg Ile Leu Ala Gln Thr Leu Thr Asp Gly Gly Val Met Asp Glu 1325 1330 1335 Leu Ile Asn Glu Glu Leu Glu Thr Phe Asn Ser Arg Trp Arg Glu 1340 1345 1350 Leu His Glu Glu Ala Val Arg Arg Gln Lys Leu Leu Glu Gln Ser 1355 1360 1365 Ile Gln Ser Ala Gln Glu Thr Glu Lys Ser Leu His Leu Ile Gln 1370 1375 1380 Glu Ser Leu Thr Phe Ile Asp Lys Gln Leu Ala Ala Tyr Ile Ala 1385 1390 1395 Asp Lys Val Asp Ala Ala Gln Met Pro Gln Glu Ala Gln Lys Ile 1400 1405 1410 Gln Ser Asp Leu Thr Ser His Glu Ile Ser Leu Glu Glu Met Lys 1415 1420 1425 Lys His Asn Gln Gly Lys Glu Ala Ala Gln Arg Val Leu Ser Gln 1430 1435 1440 Ile Asp Val Ala Gln Lys Lys Leu Gln Asp Val Ser Met Lys Phe 1445 1450 1455 Arg Leu Phe Gln Lys Pro Ala Asn Phe Glu Gln Arg Leu Gln Glu 1460 1465 1470 Ser Lys Met Ile Leu Asp Glu Val Lys Met His Leu Pro Ala Leu 1475 1480 1485 Glu Thr Lys Ser Val Glu Gln Glu Val Val Gln Ser Gln Leu Asn 1490 1495 1500 His Cys Val Asn Leu Tyr Lys Ser Leu Ser Glu Val Lys Ser Glu 1505 1510 1515 Val Glu Met Val Ile Lys Thr Gly Arg Gln Ile Val Gln Lys Lys 1520 1525 1530 Gln Thr Glu Asn Pro Lys Glu Leu Asp Glu Arg Val Thr Ala Leu 1535 1540 1545 Lys Leu His Tyr Asn Glu Leu Gly Ala Lys Val Thr Glu Arg Lys 1550 1555 1560 Gln Gln Leu Glu Lys Cys Leu Lys Leu Ser Arg Lys Met Arg Lys 1565 1570 1575 Glu Met Asn Val Leu Thr Glu Trp Leu Ala Ala Thr Asp Met Glu 1580 1585 1590 Leu Thr Lys Arg Ser Ala Val Glu Gly Met Pro Ser Asn Leu Asp 1595 1600 1605 Ser Glu Val Ala Trp Gly Lys Ala Thr Gln Lys Glu Ile Glu Lys 1610 1615 1620 Gln Lys Val His Leu Lys Ser Ile Thr Glu Val Gly Glu Ala Leu 1625 1630 1635 Lys Thr Val Leu Gly Lys Lys Glu Thr Leu Val Glu Asp Lys Leu 1640 1645 1650 Ser Leu Leu Asn Ser Asn Trp Ile Ala Val Thr Ser Arg Ala Glu 1655 1660 1665 Glu Trp Leu Asn Leu Leu Leu Glu Tyr Gln Lys His Met Glu Thr 1670 1675 1680 Phe Asp Gln Asn Val Asp His Ile Thr Lys Trp Ile Ile Gln Ala 1685 1690 1695 Asp Thr Leu Leu Asp Glu Ser Glu Lys Lys Lys Pro Gln Gln Lys 1700 1705 1710 Glu Asp Val Leu Lys Arg Leu Lys Ala Glu Leu Asn Asp Ile Arg 1715 1720 1725 Pro Lys Val Asp Ser Thr Arg Asp Gln Ala Ala Asn Leu Met Ala 1730 1735 1740 Asn Arg Gly Asp His Cys Arg Lys Leu Val Glu Pro Gln Ile Ser 1745 1750 1755 Glu Leu Asn His Arg Phe Ala Ala Ile Ser His Arg Ile Lys Thr 1760 1765 1770 Gly Lys Ala Ser Ile Pro Leu Lys Glu Leu Glu Gln Phe Asn Ser 1775 1780 1785 Asp Ile Gln Lys Leu Leu Glu Pro Leu Glu Ala Glu Ile Gln Gln 1790 1795 1800 Gly Val Asn Leu Lys Glu Glu Asp Phe Asn Lys Asp Met Asn Glu 1805 1810 1815 Asp Asn Glu Gly Thr Val Lys Glu Leu Leu Gln Arg Gly Asp Asn 1820 1825 1830 Leu Gln Gln Arg Ile Thr Asp Glu Arg Lys Arg Glu Glu Ile Lys 1835 1840 1845 Ile Lys Gln Gln Leu Leu Gln Thr Lys His Asn Ala Leu Lys Asp 1850 1855 1860 Leu Arg Ser Gln Arg Arg Lys Lys Ala Leu Glu Ile Ser His Gln 1865 1870 1875 Trp Tyr Gln Tyr Lys Arg Gln Ala Asp Asp Leu Leu Lys Cys Leu 1880 1885 1890 Asp Asp Ile Glu Lys Lys Leu Ala Ser Leu Pro Glu Pro Arg Asp 1895 1900 1905 Glu Arg Lys Ile Lys Glu Ile Asp Arg Glu Leu Gln Lys Lys Lys 1910 1915 1920 Glu Glu Leu Asn Ala Val Arg Arg Gln Ala Glu Gly Leu Ser Glu 1925 1930 1935 Asp Gly Ala Ala Met Ala Val Glu Pro Thr Gln Ile Gln Leu Ser 1940 1945 1950 Lys Arg Trp Arg Glu Ile Glu Ser Lys Phe Ala Gln Phe Arg Arg 1955 1960 1965 Leu Asn Phe Ala Gln Ile His Thr Val Arg Glu Glu Thr Met Met 1970 1975 1980 Val Met Thr Glu Asp Met Pro Leu Glu Ile Ser Tyr Val Pro Ser 1985 1990 1995 Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln Ala Leu Leu Glu 2000 2005 2010 Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala Lys Asp Phe 2015 2020 2025 Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile Lys Asp 2030 2035 2040 Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser Lys 2045 2050 2055 Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys 2060 2065 2070 Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val 2075 2080 2085 Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val 2090 2095 2100 Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln 2105 2110 2115 Trp Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro 2120 2125 2130 Glu Asn Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu 2135 2140 2145 Gln Asp Gly Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn 2150 2155 2160 Ala Thr Gly Glu Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala 2165 2170 2175 Ser Ile Leu Gln Glu Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln 2180 2185 2190 Glu Val Cys Lys Gln Leu Ser Asp Arg Lys Lys Arg Leu Glu Glu 2195 2200 2205 Gln Lys Asn Ile Leu Ser Glu Phe Gln Arg Asp Leu Asn Glu Phe 2210 2215 2220 Val Leu Trp Leu Glu Glu Ala Asp Asn Ile Ala Ser Ile Pro Leu 2225 2230 2235 Glu Pro Gly Lys Glu Gln Gln Leu Lys Glu Lys Leu Glu Gln Val 2240 2245 2250 Lys Leu Leu Val Glu Glu Leu Pro Leu Arg Gln Gly Ile Leu Lys 2255 2260 2265 Gln Leu Asn Glu Thr Gly Gly Pro Val Leu Val Ser Ala Pro Ile 2270 2275 2280 Ser Pro Glu Glu Gln Asp Lys Leu Glu Asn Lys Leu Lys Gln Thr 2285 2290 2295 Asn Leu Gln Trp Ile Lys Val Ser Arg Ala Leu Pro Glu Lys Gln 2300 2305 2310 Gly Glu Ile Glu Ala Gln Ile Lys Asp Leu Gly Gln Leu Glu Lys 2315 2320 2325 Lys Leu Glu Asp Leu Glu Glu Gln Leu Asn His Leu Leu Leu Trp 2330 2335 2340 Leu Ser Pro Ile Arg Asn Gln Leu Glu Ile Tyr Asn Gln Pro Asn 2345 2350 2355 Gln Glu Gly Pro Phe Asp Val Gln Glu Thr Glu Ile Ala Val Gln 2360 2365 2370 Ala Lys Gln Pro Asp Val Glu Glu Ile Leu Ser Lys Gly Gln His 2375 2380 2385 Leu Tyr Lys Glu Lys Pro Ala Thr Gln Pro Val Lys Arg Lys Leu 2390 2395 2400 Glu Asp Leu Ser Ser Glu Trp Lys Ala Val Asn Arg Leu Leu Gln 2405 2410 2415 Glu Leu Arg Ala Lys Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr 2420 2425 2430 Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu Val Thr Gln Pro 2435 2440 2445 Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu Met Pro Ser 2450 2455 2460 Ser Leu Met Leu Glu Val Pro Ala Leu Ala Asp Phe Asn Arg Ala 2465 2470 2475 Trp Thr Glu Leu Thr Asp Trp Leu Ser Leu Leu Asp Gln Val Ile 2480 2485 2490 Lys Ser Gln Arg Val Met Val Gly Asp Leu Glu Asp Ile Asn Glu 2495 2500 2505 Met Ile Ile Lys Gln Lys Ala Thr Met Gln Asp Leu Glu Gln Arg 2510 2515 2520 Arg Pro Gln Leu Glu Glu Leu Ile Thr Ala Ala Gln Asn Leu Lys 2525 2530 2535 Asn Lys Thr Ser Asn Gln Glu Ala Arg Thr Ile Ile Thr Asp Arg 2540 2545 2550 Ile Glu Arg Ile Gln Asn Gln Trp Asp Glu Val Gln Glu His Leu 2555 2560 2565 Gln Asn Arg Arg Gln Gln Leu Asn Glu Met Leu Lys Asp Ser Thr 2570 2575 2580 Gln Trp Leu Glu Ala Lys Glu Glu Ala Glu Gln Val Leu Gly Gln 2585 2590 2595 Ala Arg Ala Lys Leu Glu Ser Trp Lys Glu Gly Pro Tyr Thr Val 2600 2605 2610 Asp Ala Ile Gln Lys Lys Ile Thr Glu Thr Lys Gln Leu Ala Lys 2615 2620 2625 Asp Leu Arg Gln Trp Gln Thr Asn Val Asp Val Ala Asn Asp Leu 2630 2635 2640 Ala Leu Lys Leu Leu Arg Asp Tyr Ser Ala Asp Asp Thr Arg Lys 2645 2650 2655 Val His Met Ile Thr Glu Asn Ile Asn Ala Ser Trp Arg Ser Ile 2660 2665 2670 His Lys Arg Val Ser Glu Arg Glu Ala Ala Leu Glu Glu Thr His 2675 2680 2685 Arg Leu Leu Gln Gln Phe Pro Leu Asp Leu Glu Lys Phe Leu Ala 2690 2695 2700 Trp Leu Thr Glu Ala Glu Thr Thr Ala Asn Val Leu Gln Asp Ala 2705 2710 2715 Thr Arg Lys Glu Arg Leu Leu Glu Asp Ser Lys Gly Val Lys Glu 2720 2725 2730 Leu Met Lys Gln Trp Gln Asp Leu Gln Gly Glu Ile Glu Ala His 2735 2740 2745 Thr Asp Val Tyr His Asn Leu Asp Glu Asn Ser Gln Lys Ile Leu 2750 2755 2760 Arg Ser Leu Glu Gly Ser Asp Asp Ala Val Leu Leu Gln Arg Arg 2765 2770 2775 Leu Asp Asn Met Asn Phe Lys Trp Ser Glu Leu Arg Lys Lys Ser 2780 2785 2790 Leu Asn Ile Arg Ser His Leu Glu Ala Ser Ser Asp Gln Trp Lys 2795 2800 2805 Arg Leu His Leu Ser Leu Gln Glu Leu Leu Val Trp Leu Gln Leu 2810 2815 2820 Lys Asp Asp Glu Leu Ser Arg Gln Ala Pro Ile Gly Gly Asp Phe 2825 2830 2835 Pro Ala Val Gln Lys Gln Asn Asp Val His Arg Ala Phe Lys Arg 2840 2845 2850 Glu Leu Lys Thr Lys Glu Pro Val Ile Met Ser Thr Leu Glu Thr 2855 2860 2865 Val Arg Ile Phe Leu Thr Glu Gln Pro Leu Glu Gly Leu Glu Lys 2870 2875 2880 Leu Tyr Gln Glu Pro Arg Glu Leu Pro Pro Glu Glu Arg Ala Gln 2885 2890 2895 Asn Val Thr Arg Leu Leu Arg Lys Gln Ala Glu Glu Val Asn Thr 2900 2905 2910 Glu Trp Glu Lys Leu Asn Leu His Ser Ala Asp Trp Gln Arg Lys 2915 2920 2925 Ile Asp Glu Thr Leu Glu Arg Leu Gln Glu Leu Gln Glu Ala Thr 2930 2935 2940 Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val Ile Lys Gly 2945 2950 2955 Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu Gln Asp 2960 2965 2970 His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro Leu 2975 2980 2985 Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr 2990 2995 3000 Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu 3005 3010 3015 Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp 3020 3025 3030 Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala 3035 3040 3045 Ser Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg 3050 3055 3060 Ala Ile Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr 3065 3070 3075 Gln Thr Thr Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln 3080 3085 3090 Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr 3095 3100 3105 Ala Met Lys Leu Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu 3110 3115 3120 Leu Ser Leu Ser Ala Ala Cys Asp Ala Leu Asp Gln His Asn Leu 3125 3130 3135 Lys Gln Asn Asp Gln Pro Met Asp Ile Leu Gln Ile Ile Asn Cys 3140 3145 3150 Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln Glu His Asn Asn Leu 3155 3160 3165 Val Asn Val Pro Leu Cys Val Asp Met Cys Leu Asn Trp Leu Leu 3170 3175 3180 Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg Val Leu Ser 3185 3190 3195 Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu Glu Asp 3200 3205 3210 Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly Phe 3215 3220 3225 Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln 3230 3235 3240 Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn 3245 3250 3255 Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys 3260 3265 3270 Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu 3275 3280 3285 Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala 3290 3295 3300 Ala Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu 3305 3310 3315 Cys Pro Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn 3320 3325 3330 Tyr Asp Ile Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys 3335 3340 3345 Gly His Lys Met His Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr 3350 3355 3360 Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu Lys Asn 3365 3370 3375 Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met Gly 3380 3385 3390 Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr 3395 3400 3405 Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala 3410 3415 3420 Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu 3425 3430 3435 His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser 3440 3445 3450 Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu 3455 3460 3465 His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser 3470 3475 3480 Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu 3485 3490 3495 Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu 3500 3505 3510 Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys 3515 3520 3525 Gln Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro 3530 3535 3540 Glu Met Met Pro Thr Ser Pro Gln Ser Pro Arg Asp Ala Glu Leu 3545 3550 3555 Ile Ala Glu Ala Lys Leu Leu Arg Gln His Lys Gly Arg Leu Glu 3560 3565 3570 Ala Arg Met Gln Ile Leu Glu Asp His Asn Lys Gln Leu Glu Ser 3575 3580 3585 Gln Leu His Arg Leu Arg Gln Leu Leu Glu Gln Pro Gln Ala Glu 3590 3595 3600 Ala Lys Val Asn Gly Thr Thr Val Ser Ser Pro Ser Thr Ser Leu 3605 3610 3615 Gln Arg Ser Asp Ser Ser Gln Pro Met Leu Leu Arg Val Val Gly 3620 3625 3630 Ser Gln Thr Ser Asp Ser Met Gly Glu Glu Asp Leu Leu Ser Pro 3635 3640 3645 Pro Gln Asp Thr Ser Thr Gly Leu Glu Glu Val Met Glu Gln Leu 3650 3655 3660 Asn Asn Ser Phe Pro Ser Ser Arg Gly Arg Asn Thr Pro Gly Lys 3665 3670 3675 Pro Met Arg Glu Asp Thr Met 3680 3685 <210> 65 <211> 19841 <212> DNA <213> Homo sapiens <400> 65 tttcctactt gaagcctgac gtagtaaaga tcgggggagg gttagacaga tacagtggtc 60 cccaaccatt ttggcaccag ggactggtct tatggaagac agtttttcca cagactgttg 120 gggggatggt tttgggatga aaccgttctg cctctgatca tcaggtgtta gattctaata 180 aggagcgcac acctagatcc ctcgcatgca tagttcatgg tggggttcgc actcttacga 240 ggattgaatg gtgcgctgct ccggtaggag gctgggctca ggctgtaatg cctgctcgcc 300 caccactcac ctcctgctgc atggcctggt tcctaacagg ccacggacca ctactgttcc 360 atggcccgga ggttgaggac cccgagatac aggacaattc tgtggcaagc aggactgtcc 420 cctcgccaaa gatgggacat cgaggctcct tggagcaccc tgtggccacc ttgcagcagc 480 ctctgtttcc ccatgtttcc atgacctggt gtccatctgt cttccccagt ttgggagctt 540 ctctccgagg aggacctggg cctggtgtgg cacctgctgt gtgagcgggg ccatgtccaa 600 cggccttctt ggggactttg ggtcggggag aagttctgcc tgggttttac tgccttctcc 660 caaccccaca ctgtctcccc tggcagcggt tgatcgacaa gaccaaggtg acatatctga 720 agtggctgcc tgagtcggag agcctgttcc tggcatcaca cgccagtggc cacctgtacc 780 tgtacaacgt cagccacccc tgcgcctcgg ccccgcccca gtacagcctg ctgaagcagg 840 gcgagggctt ctctgtctat gctgccaaga gcaaggcacc ccgcaacccg ctggccaagt 900 gggcggtggg tgaggggccc ctcaacgagt tcgccttctc gcccgatggc cggcacctgg 960 cctgtgtgag ccaggatggc tgcctgcgcg tcttccactt cgactccatg ctcctgcgtg 1020 ggctcatgaa gagctacttt gggggcctgc tgtgtgtgtg ctggagccct gacggccgct 1080 acgtggtgac gggtggcgaa gatgacctgg tcaccgtgtg gtccttcacc gagggccgcg 1140 tggtggctcg aggccatggc cacaagtcct gggtcaacgc tgtggccttt gacccctaca 1200 ccacaagggc agaggaggcg gcgacagcag ccggtgctga tggggagcgg agcggcgaag 1260 aggaggagga ggagcccgag gctgcgggca caggctcggc cgggggcgcc ccgctctctc 1320 cactgcccaa ggctggctcc attacttacc gctttggctc ggcgggccag gacacgcagt 1380 tctgcctgtg ggacctcact gaagacgtgc tctacccgca cccccccctg gcccgcaccc 1440 gcaccctccc tggcacacct ggcaccacgc caccggccgc cagcagctcg aggggtggcg 1500 agcctggccc aggccccctg cctcgctcgc tgtcccgctc caacagtctc ccgcacccag 1560 ctggcggggg caaggcgggc ggcccgggtg tggcggcaga gcctggcaca ccattcagca 1620 ttggccgctt cgccacgctc acactgcagg agcggcggga ccggggggca gagaaggagc 1680 acaagcgcta ccacagcctg ggcaacatca gccggggtgg cagtggcggc agtggcagtg 1740 gtggggagaa gcccagcggc cctgttcccc gcagccgcct ggaccccgcc aaggtgctgg 1800 gcactgcgct gtgcccgcgc atccacgagg tgcccctgct ggagcccctt gtgtgcaaga 1860 agatcgccca ggagcggctc acagtcctcc tgttcctgga ggactgcatc atcactgcct 1920 gccaggaggg cctcatctgc acctgggccc ggccgggcaa ggcggtgagt ggccccacac 1980 cagcctgccg gggacctggc aggacctttc gtgggaagag gcaggcattg gcagagagag 2040 ggctttgttg ctgtcacagc ctctggctcc gtggggtgag gggaagccag ggaaatctta 2100 gtgtctcagt acaagacctc tcagatcctt agagtgaggg ggtctagccc taggcagcag 2160 gcagcagaaa gaggggtggg tgtgagagcc agctaggaat tggggcatcc aaggctggcc 2220 gtctgaaggg cagcagatgg gccccacatg gccaggtctt actgcctgtc actcgaacca 2280 gaatctattt ctgttgaaca tctgtttttt aaatcgtgaa acttttttga gtacttcagg 2340 ccaaaactag gggcgagctc aagcctgtgg gcatggctgc cagcctgggt ctgggactca 2400 ggatctgagc ctcctgctga aggcacaggc tgggaatccc aggcctgggt tccagtccca 2460 ctccctctgt gaccctggac aagtcactgc cccctctgac ctccaactca tcacctctta 2520 gaacagagcc tgtaggatgg gcagtgggtg gatgtgcttg cctcctgggt gggctgtggc 2580 gttgggaagg tcatagtagg cgaatcaggc ctggcatctt gtaagttcgg agctcgtctt 2640 gggtgtctca gcttcttagg gcttggactc agttgcccag ggtcctggag gccgtggctt 2700 ggttcctcag atcctcagtt ttggaatcgt agagtcctga gtccctagaa cttgagagca 2760 cagtctgagt gactcagagg caagagtggt gggatttggg gagtctggtt gagtcctaaa 2820 agagacccct ctgtctccgt agttcacaga cgaggagacc gaggcccaga caggggaagg 2880 aagttggccc aggtcaccca gcaagtcagt ggtagaggta ggactgtccc tgagttcttt 2940 ccccagcacc tcagggtccc tcccaagtta gaagggagct ccagtttccc cctcccctcc 3000 cacccttacc cttaccccat ggtctcactc aggatccgcc aaggactttg attattgcgt 3060 gaaagtgctg actgccagga caggaagcta gctaagatgc aagttcccag cctagagcag 3120 tggcctctgg ggggtctagg gcggacccaa gggcaaggcc agggtggcag cagctttggg 3180 gactctgggc tggctccctc cccttgacac tggctgaagc ccaggtggtc tctaacccct 3240 cccatctctc cctctcatct tccccagggc atctcctccc aaccaggcaa ctccccgagt 3300 ggcacagtgg tgtgaagcca tggatatcgg gcccccccaa ccccatgccc ccagcctcct 3360 agccataacc ctccctgctg acctcacaga tcaacgtatt aacaagacta accatgatgg 3420 atggactgct ccagtccccc cacctgcaca aaatttgggg gccccccaga ctggcccgga 3480 cacgggcgat gtaatagccc ttgtggcctc agccttgtcc cccacccact gccaagtaca 3540 atgacctctt cctctgaaac atcagtgtta ccctcatccc tgtccccagc atgtgactgg 3600 tcactcctgg ggagagactc cccgcccctg ccacaagagc cccaggtctg cagtgtgccc 3660 ctcagttgag tgggcagggc cgggggtggt ccagccctcg cccggccccc accccagctg 3720 cccttgctat tgtctgtgct tttgaagagt gttaaattat ggaagcccct caggttcctc 3780 cctgtcccgc aggacctctt atttatacta aagttccctg ttttctcagc gggtctgtcc 3840 ccttcggagg agatgatgta gaggacctgt gtgtgtactc tgtggttcta ggcagtccgc 3900 tttccccaga ggaggagtgc aggcctgctc ccagcccagc gcctcccacc ccttttcata 3960 gcaggaaaag ccggagccca gggagggaac ggacctgcga gtcacacaac tggtgaccca 4020 caccagcggc tggagcagga ccctcttggg gagaagagca tcctgcccgc agccagggcc 4080 cctcatcaaa gtcctcggtg ttttttaaat tatcagaact gcccaggacc acgtttccca 4140 ggccctgccc agctgggact cctcggtcct tgcctcctag tttctcaggc ctggccctct 4200 caaggcccag gcaccccagg ccggttggag gccccgactt ccactctgga gaaccgtcca 4260 ccctggaaag aagagctcag attcctcttg gctctcggag ccgcagggag tgtgtcttcc 4320 cgcgccaccc tccacccccc gaaatgtttc tgtttctaat cccagcctgg gcaggaatgt 4380 ggctccccgg ccaggggcca aggagctatt ttggggtctc gtttgcccag ggagggcttg 4440 gctccaccac tttcctcccc cagcctttgg gcagcaggtc acccctgttc aggctctgag 4500 ggtgccccct cctggtcctg tcctcaccac cccttcccca cctcctggga aaaaaaaaaa 4560 aaaaaaaaaa aaaagctggt ataaagcaga gagcctgagg gctaaattta actgtccgag 4620 tcggaatcca tctctgagtc acccaagaag ctgccctggc ctcccgtccc cttcccaggc 4680 ctcaacccct ttctcccacc cagccccaac ccccagccct caccccctag cccccagttc 4740 tggagcttgt cgggagcaag ggggtggttg ctactgggtc actcagcctc aattggccct 4800 gtttcagcaa tgggcaggtt cttcttgaaa ttcatcacac ctgtggcttc ctctgtgctc 4860 taccttttta ttggggtgac agtgtgacag ctgagattct ccatgcattc cccctactct 4920 agcactgaag ggttctgaag ggccctggaa ggagggagct tggggggctg gcttgtgagg 4980 ggttaaggct gggaggcggg aggggggctg gaccaagggg tggggagaag gggaggaggc 5040 ctcggccggc cgcagagaga agtggccaga gaggcccagg ggacagccag ggacaggcag 5100 acatgcagcc agggctccag ggcctggaca ggggctgcca ggccctgtga caggaggacc 5160 ccgagccccc ggcccgggga ggggccatgg tgctgcctgt ccaacatgtc agccgaggtg 5220 cggctgaggc ggctccagca gctggtgttg gacccgggct tcctggggct ggagcccctg 5280 ctcgaccttc tcctgggcgt ccaccaggag ctgggcgcct ccgaactggc ccaggacaag 5340 tacgtggccg acttcttgca gtggggtgag tgcctaccct cggggctcct gcagatgggg 5400 tgggggtggg gcaggagaca ggtctgggca cagaggcctg gctgttgggg gggcaggatg 5460 gcaggatggg catggggaga tcctcccatc ctggggctca gagtgtggac ctgggccctg 5520 gggcaacatt tctctgtcct atgccaccac tctggagggg cagagtaagg tcagcagagg 5580 ctagggtggc tgtgactcag agccatggct taggagtcac agcaggctag gctgccaaca 5640 gcctcccatg gcctctctgc accccgcctc agggtcaggg tcagggtcat gctgggagct 5700 ccctctccta ggaccctccc cccaaaagtg ggctctatgg ccctctcccc tggtttcctg 5760 tggcctgggg caagccagga gggccagcat ggggcagctg ccaggggcgc agccgacagg 5820 caggtgttcg gcgccagcct ctccagctgc cccaacaggt gcccaggcac tgggagggcg 5880 gtgactcacg cgggccctgt gggagaacca gctttgcaga caggcgccac cagtgccccc 5940 tcctctgcga tccaggaggg acaactttgg gttcttctgg gtgtgtctcc ttcttttgta 6000 ggttctgcac ccacccccac ccccagcccc aaagtctcgg ttcctatgag ccgtgtgggt 6060 cagccaccat tcccgccacc ccgggtccct gcgtccttta gttctcctgg cccagggcct 6120 ccaaccttcc agctgtccca caaaacccct tcttgcaagg gctttccagg gcctggggcc 6180 agggctggaa ggaggatgct tccgcttctg ccagctgcct tgtctgccca cctcctcccc 6240 aagcccagga ctcgggctca ctggtcactg gtttctttca ttcccagcac cctgcccctc 6300 tggccctcat atgtctggcc ctcagtgact ggtgtttggt ttttggcctg tgtgtaacaa 6360 actgtgtgtg acacttgttt cctgtttctc cgccttcccc tgcttcctct tgtgtccatc 6420 tctttctgac ccaggcctgg ttcctttccc tcctcctccc atttcacaga tgggaaggtg 6480 gaggccaaga agggccaggc cattcagcct ctggaaaaac cttctcccaa cctcccacag 6540 cccctaatga ctctcctggc ctccctttag tagaggatga agttgggttg gcagggtaaa 6600 ctgagaccgg gtggggtagg ggtctggcgc tcccgggagg agcactcctt ttgtggcccg 6660 agctgcatct cgcggcccct cccctgccag gcctggggcg ggggaggggg ccagggttcc 6720 tgctgcctta aaagggctca atgtcttggc tctctcctcc ctcccccgtc ctcagccctg 6780 gctggttcgt ccctgctggc ccactctccc ggaacccccc ggaacccctc tctttcctcc 6840 agaacccact gtctcctctc cttccctccc ctcccatacc catccctctc tccatcctgc 6900 ctccacttct tccacccccg ggagtccagg cctccctgtc cccacagtcc ctgagccaca 6960 agcctccacc ccagctggtc ccccacccag gctgcccagt ttaacattcc tagtcatagg 7020 accttgactt ctgagaggcc tgattgtcat ctgtaaataa ggggtaggac taaagcactc 7080 ctcctggagg actgagagat gggctggacc ggagcacttg agtctgggat atgtgaccat 7140 gctacctttg tctccctgtc ctgttccttc ccccagcccc aaatccaggg ttttccaaag 7200 tgtggttcaa gaaccacctg catctgaatc tagaggtact ggatacaacc ccacgtctgg 7260 gccgttaccc aggacattct acatgagaac gtgggggtgg ggccctggct gcacctgaac 7320 tgtcacctgg agtcagggtg gaaggtggaa gaactgggtc ttatttcctt ctccccttgt 7380 tctttagggt ctgtccttct gcagactccg ttaccccacc ctaaccatcc tgcacaccct 7440 tggagccctc tgggccaatg ccctgtcccg caaagggctt ctcaggcatc tcacctctat 7500 gggagggcat ttttggcccc cagaacctta cacggtgttt atgtggggaa gcccctggga 7560 agcagacagt cctagggtga agctgagagg cagagagaag gggagacaga cagagggtgg 7620 ggctttcccc cttgtctcca gtgccctttc tggtgaccct cggttctttt cccccaccac 7680 ccccccagcg gagcccatcg tggtgaggct taaggaggtc cgactgcaga gggacgactt 7740 cgagattctg aaggtgatcg gacgcggggc gttcagcgag gtaagccgaa ccgggcggga 7800 gcctgacttg actcgtggtg ggcggggcat aggggttggg gcggggcctt agaaattgat 7860 gaatgaccga gccttagaac ctagggctgg gctggaggcg gggcttggga ccaatgggcg 7920 tggtgtggca ggtggggcgg ggccacggct gggtgcagaa gcgggtggag ttgggtctgg 7980 gcgagccctt ttgttttccc gccgtctcca ctctgtctca ctatctcgac ctcaggtagc 8040 ggtagtgaag atgaagcaga cgggccaggt gtatgccatg aagatcatga acaagtggga 8100 catgctgaag aggggcgagg tgaggggctg ggcggacgtg gggggctttg aggatccgcg 8160 ccccgtctcc ggctgcagct cctccgggtg ccctgcaggt gtcgtgcttc cgtgaggaga 8220 gggacgtgtt ggtgaatggg gaccggcggt ggatcacgca gctgcacttc gccttccagg 8280 atgagaacta cctggtgagc tccgggccgg ggtgactagg aagagggaca agagcccgtg 8340 ctgtcactgg acgaggaggt ggggagagga agctctagga ttgggggtgc tgcccggaaa 8400 cgtctgtggg aaagtctgtg tgcggtaaga gggtgtgtca ggtggatgag gggccttccc 8460 tatctgagac ggggatggtg tccttcactg cccgtttctg gggtgatctg ggggactctt 8520 ataaagatgt ctctgttgcg gggggtctct tacctggaat gggataggtc ttcaggaatt 8580 ctaacggggc cactgcctag ggaaggagtg tctgggacct attctctggg tgttgggtgg 8640 cctctgggtt ctctttccca gaacatctca gggggagtga atctgcccag tgacatccca 8700 ggaaagtttt tttgtttgtg tttttttttg aggggcgggg gcgggggccg caggtggtct 8760 ctgatttggc ccggcagatc tctatggtta tctctgggct ggggctgcag gtctctgccc 8820 aaggatgggg tgtctctggg aggggttgtc ccagccatcc gtgatggatc agggcctcag 8880 gggactacca accacccatg acgaacccct tctcagtacc tggtcatgga gtattacgtg 8940 ggcggggacc tgctgacact gctgagcaag tttggggagc ggattccggc cgagatggcg 9000 cgcttctacc tggcggagat tgtcatggcc atagactcgg tgcaccggct tggctacgtg 9060 cacaggtggg tgcagcatgg ccgaggggat agcaagcttg ttccctggcc gggttcttgg 9120 aaggtcagag cccagagagg ccagggcctg gagagggacc ttcttggttg gggcccaccg 9180 gggggtgcct gggagtaggg gtcagaactg tagaagccct acaggggcgg aacccgagga 9240 agtggggtcc caggtggcac tgcccggagg ggcggagcct ggtgggacca cagaagggag 9300 gttcatttat cccacccttc tcttttcctc cgtgcaggga catcaaaccc gacaacatcc 9360 tgctggaccg ctgtggccac atccgcctgg ccgacttcgg ctcttgcctc aagctgcggg 9420 cagatggaac ggtgagccag tgccctggcc acagagcaac tggggctgct gatgagggat 9480 ggaaggcaca gagtgtggga gcgggactgg atttggaggg gaaaagaggt ggtgtgaccc 9540 aggcttaagt gtgcatctgt gtggcggagt attagaccag gcagagggag gggctaagca 9600 tttggggagt ggttggaagg agggcccaga gctggtgggc ccagaggggt gggcccaagc 9660 ctcgctctgc tccttttggt ccaggtgcgg tcgctggtgg ctgtgggcac cccagactac 9720 ctgtcccccg agatcctgca ggctgtgggc ggtgggcctg ggacaggcag ctacgggccc 9780 gagtgtgact ggtgggcgct gggtgtattc gcctatgaaa tgttctatgg gcagacgccc 9840 ttctacgcgg attccacggc ggagacctat ggcaagatcg tccactacaa ggtgagcacg 9900 gccgcaggga gacctggcct ctcccggtag gcgctcccag gctatcgcct cctctccctc 9960 tgagcaggag cacctctctc tgccgctggt ggacgaaggg gtccctgagg aggctcgaga 10020 cttcattcag cggttgctgt gtcccccgga gacacggctg ggccggggtg gagcaggcga 10080 cttccggaca catcccttct tctttggcct cgactgggat ggtctccggg acagcgtgcc 10140 cccctttaca ccggatttcg aaggtgccac cgacacatgc aacttcgact tggtggagga 10200 cgggctcact gccatggtga gcgggggcgg ggtaggtacc tgtggcccct gctcggctgc 10260 gggaacctcc ccatgctccc tccataaagt tggagtaagg acagtgccta ccttctgggg 10320 tcctgaatca ctcattcccc agagcacctg ctctgtgccc atctactact gaggacccag 10380 cagtgaccta gacttacagt ccagtggggg aacacagagc agtcttcaga cagtaaggcc 10440 ccagagtgat cagggctgag acaatggagt gcagggggtg ggggactcct gactcagcaa 10500 ggaaggtcct ggagggcttt ctggagtggg gagctatctg agctgagact tggagggatg 10560 agaagcagga gaggactcct cctcccttag gccgtctctc ttcaccgtgt aacaagctgt 10620 catggcatgc ttgctcggct ctgggtgccc ttttgctgaa caatactggg gatccagcac 10680 ggaccagatg agctctggtc cctgccctca tccagttgca gtctagagaa ttagagaatt 10740 atggagagtg tggcaggtgc cctgaaggga agcaacagga tacaagaaaa aatgatgggg 10800 ccaggcacgg tggctcacgc ctgtaacccc agcaatttgg caggccgaag tgggtggatt 10860 gcttgagccc aggagttcga gaccagcctg ggcaatgtgg tgagaccccc gtctctacaa 10920 aaatgtttta aaaattggtt gggcgtggtg gcgcatgcct gtatactcag ctactagggt 10980 ggccgacgtg ggcttgagcc caggaggtca aggctgcagt gagctgtgat tgtgccactg 11040 cactccagcc tgggcaacgg agagagactc tgtctcaaaa ataagataaa ctgaaattaa 11100 aaaataggct gggctggccg ggcgtggtgg ctcacgcctg taatctcagc actttgggag 11160 gccgaggcgg gtggatcacg aggtcaggag atcgagacca tcttggctaa cacggtgaaa 11220 ccccatctct cctaaaaata caaaaaatta gccaggcgtg gtggcgggcg cctgtagtcc 11280 cagctactca ggaggctgag gcaggagaat ggcgtgaacc cgggaggcag agtttgcagt 11340 gagccgagat cgtgccactg cactccagcc tgggcgacag agcgagactc tgtctcagaa 11400 aaaaaaaaaa aaaaaaaaaa aaataggctg gaccgcggcc gggcgctgtg gctcatgcct 11460 gtaatcccag cactttggga gtccaaggcc ggtgggtcat gagatcagga gttttgagac 11520 taggctggcc aacacggtga aaccccgtct ctactaaaaa tacaagaaaa ttagctgggt 11580 gtggtctcgg gtgcctgtaa ttccagttac tggggaagct gaggcaggag aattgcttga 11640 acctgggagg cagagtttgc agtgagccaa gatcatgcca ctacactcca gtctgggtga 11700 cagagtgaga ctctgtctca aaaaaaaaaa aaaaaaaaag ggttgggcaa ggtggttcac 11760 gcctgtaatc ccagaacttt gggaggctga ggcaggcaga tcactggaag tcaggagttc 11820 aagaccagcc tggccaacat ggtgaaaccc tgtgtctact aaaaatacaa aatttagcca 11880 ggcttggtgg cgtatgcctg taatgccagc tactcaggag gctgaggcag gagaatcgct 11940 tgattgaacc tgggaggcag agtttgcagt gggctggggt tgtgccactg cactctaggc 12000 tgggagacag caagactcca tctaaaaaaa aaaaacagaa ctgggctggg cacagtggct 12060 tatatttgta atcccagcac tttgggaggc tgaggttgga ggactgcttg agcccagagt 12120 ttgggactac aacagctgag gtaggcggat cacttgaggt cagaagatgg agaccagcct 12180 ggccagcgtg gcgaaacccc gtctctacca aaaatataaa aaattagcca ggcgtggtag 12240 agggcgcctg taatctcagc tactcaggac gctgaggcag gagaatcgcc tgaacctggg 12300 aggcggaggt tgcagtgagc tgagattgca ccactgcact ccagcctggg taacagagcg 12360 agactccgta tcaaagaaaa agaaaaaaga aaaaatgctg gaggggccac tttagataag 12420 ccctgagttg gggctggttt ggggggaaca tgtaagccaa gatcaaaaag cagtgagggg 12480 cccgccctga cgactgctgc tcacatctgt gtgtcttgcg caggagacac tgtcggacat 12540 tcgggaaggt gcgccgctag gggtccacct gccttttgtg ggctactcct actcctgcat 12600 ggccctcagg taagcactgc cctggacggc ctccaggggc cacgaggctg cttgagcttc 12660 ctgggtcctg ctccttggca gccaatggag ttgcaggatc agtcttggaa ccttactgtt 12720 ttgggcccaa agactcctaa gaggccagag ttggaggacc ttaaattttc agatctatgt 12780 acttcaaaat gttagattga attttaaaac ctcagagtca cagactgggc ttcccagaat 12840 cttgtaacca ttaactttta cgtctgtagt acacagagcc acaggacttc agaacttgga 12900 aaatatgaag tttagacttt tacaatcagt tgtaaaagaa tgcaaattct ttgaatcagc 12960 catataacaa taaggccatt taaaagtatt aatttaggcg ggccgcggtg gctcacgcct 13020 gtaatcctag cactttggga ggccaaggca ggtggatcat gaggtcagga gatcgagacc 13080 atcctggcta acacggtgaa accccgtctc tactaaaaat acaaaaaaat tagccgggca 13140 tggtggcggg cgcttgcggt cccagctact tgggaggcga ggcaggagaa tggcatgaac 13200 ccgggaggcg gagcttgcag tgagccgaga tcatgccact gcactccagc ctgggcgaca 13260 gagcaagact ccgtctcaaa aaaaaaaaaa aaaaagtatt tatttaggcc gggtgtggtg 13320 gctcacgcct gtaattccag tgctttggga ggatgaggtg ggtggatcac ctgaggtcag 13380 gagttcgaga ccagcctgac caacgtggag aaacctcatc tctactaaaa aacaaaatta 13440 gccaggcgtg gtggcatata cctgtaatcc cagctactca ggaggctgag gcaggagaat 13500 cagaacccag gagggggagg ttgtggtgag ctgagatcgt gccattgcat tccagcctgg 13560 gcaacaagag tgaaacttca tctcaaaaaa aaaaaaaaaa aagtactaat ttacaggctg 13620 ggcatggtgg ctcacgcttg gaatcccagc actttgggag gctgaagtgg acggattgct 13680 tcagcccagg agttcaagac cagcctgagc aacataatga gaccctgtct ctacaaaaaa 13740 ttgaaaaaat cgtgccaggc atggtggtct gtgcctgcag tcctagctac tcaggagtct 13800 gaagtaggag aatcacttga gcctggagtt tgaggcttca gtgagccatg atagattcca 13860 gcctaggcaa caaagtgaga cctggtctca acaaaagtat taattacaca aataatgcat 13920 tgcttatcac aagtaaatta gaaaatacag ataaggaaaa ggaagttgat atctcgtgag 13980 ctcaccagat ggcagtggtc cctggctcac acgtgtactg acacatgttt aaatagtgga 14040 gaacaggtgt ttttttggtt tgtttttttc cccttcctca tgctactttg tctaagagaa 14100 cagttggttt tctagtcagc ttttattact ggacaacatt acacatacta taccttatca 14160 ttaatgaact ccagcttgat tctgaaccgc tgcggggcct gaacggtggg tcaggattga 14220 acccatcctc tattagaacc caggcgcatg tccaggatag ctaggtcctg agccgtgttc 14280 ccacaggagg gactgctggg ttggagggga cagccacttc ataccccagg gaggagctgt 14340 ccccttccca cagctgagtg gggtgtgctg acctcaagtt gccatcttgg ggtcccatgc 14400 ccagtcttag gaccacatct gtggaggtgg ccagagccaa gcagtctccc catcaggtcg 14460 gcctccctgt cctgaggccc tgagaagagg ggtctgcagc ggtcacatgt caagggagga 14520 gatgagctga ccctagaaca tgggggtctg gaccccaagt ccctgcagaa ggtttagaaa 14580 gagcagctcc caggggccca aggccaggag aggggcaggg cttttcctaa gcagaggagg 14640 ggctattggc ctacctggga ctctgttctc ttcgctctgc tgctcccctt cctcaaatca 14700 ggaggtcttg gaagcagctg cccctaccca caggccagaa gttctggttc tccaccagag 14760 aatcagcatt ctgtctccct ccccactccc tcctcctctc cccagggaca gtgaggtccc 14820 aggccccaca cccatggaac tggaggccga gcagctgctt gagccacacg tgcaagcgcc 14880 cagcctggag ccctcggtgt ccccacagga tgaaacagta agttggtgga ggggaggggg 14940 tccgtcaggg acaattggga gagaaaaggt gagggcttcc cgggtggcgt gcactgtaga 15000 gccctctagg gacttcctga acagaagcag acagaaacca cggagagacg aggttacttc 15060 agacatggga cggtctctgt agttacagtg gggcattaag taagggtgtg tgtgttgctg 15120 gggatctgag aagtcgatct ttgagctgag cgctggtgaa ggagaaacaa gccatggaag 15180 gaaaggtgcc aagtggtcag gcgagagcct ccagggcaaa ggccttgggc aggtgggaat 15240 cctgatttgt tcctgaaagg tagtttggct gaatcattcc tgagaaggct ggagaggcca 15300 gcaggaaaca aaacccagca aggccttttg tcgtgagggc attagggagc tggagggatt 15360 ttgagcagca gagggacata ggttgtgtta gtgtttgagc accagccctc tggtccctgt 15420 gtagatttag aggaccagac tcagggatgg ggctgaggga ggtagggaag ggagggggct 15480 tggatcattg caggagctat ggggattcca gaaatgttga ggggacggag gagtagggga 15540 taaacaagga ttcctagcct ggaaccagtg cccaagtcct gagtcttcca ggagccacag 15600 gcagccttaa gcctggtccc catacacagg ctgaagtggc agttccagcg gctgtccctg 15660 cggcagaggc tgaggccgag gtgacgctgc gggagctcca ggaagccctg gaggaggagg 15720 tgctcacccg gcagagcctg agccgggaga tggaggccat ccgcacggac aaccagaact 15780 tcgccaggtc gggatcgggg ccggggccgg ggccgggatg cgggccggtg gcaacccttg 15840 gcatcccctc tcgtccggcc cggacggact caccgtcctt acctccccac agtcaactac 15900 gcgaggcaga ggctcggaac cgggacctag aggcacacgt ccggcagttg caggagcgga 15960 tggagttgct gcaggcagag ggagccacag gtgagtccct catgtgtccc cttccccgga 16020 ggaccgggag gaggtgggcc gtctgctccg cggggcgtgt atagacacct ggaggaggga 16080 agggacccac gctggggcac gccgcgccac cgccctcctt cgcccctcca cgcgccctat 16140 gcctctttct tctccttcca gctgtcacgg gggtccccag tccccgggcc acggatccac 16200 cttcccatgt aagacccctc tctttcccct gcctcagacc tgctgcccat tctgcagatc 16260 ccctccctgg ctcctggtct ccccgtccag atatagggct caccctacgt ctttgcgact 16320 ttagagggca gaagcccttt attcagcccc agatctccct ccgttcaggc ctcaccagat 16380 tccctccggg atctccctag ataacctccc caacctcgat tcccctcgct gtctctcgcc 16440 ccaccgctga gggctgggct gggctccgat cgggtcacct gtcccttctc tctccagcta 16500 gatggccccc cggccgtggc tgtgggccag tgcccgctgg tggggccagg ccccatgcac 16560 cgccgccacc tgctgctccc tgccagggta cgtccggctg cccacgcccc cctccgccgt 16620 cgcgccccgc gctccacccg ccccttgcca cccgcttagc tgcgcatttg cggggctggg 16680 cccacggcag gagggcggat cttcgggcag ccaatcaaca caggccgcta ggaagcagcc 16740 aatgacgagt tcggacggga ttcgaggcgt gcgagtggac taacaacagc tgtaggctgt 16800 tggggcgggg gcggggcgca gggaagagtg cgggcccacc tatgggcgta ggcggggcga 16860 gtcccaggag ccaatcagag gcccatgccg ggtgttgacc tcgccctctc cccgcaggtc 16920 cctaggcctg gcctatcgga ggcgctttcc ctgctcctgt tcgccgttgt tctgtctcgt 16980 gccgccgccc tgggctgcat tgggttggtg gcccacgccg gccaactcac cgcagtctgg 17040 cgccgcccag gagccgcccg cgctccctga accctagaac tgtcttcgac tccggggccc 17100 cgttggaaga ctgagtgccc ggggcacggc acagaagccg cgcccaccgc ctgccagttc 17160 acaaccgctc cgagcgtggg tctccgccca gctccagtcc tgtgatccgg gcccgccccc 17220 tagcggccgg ggagggaggg gccgggtccg cggccggcga acggggctcg aagggtcctt 17280 gtagccggga atgctgctgc tgctgctgct gctgctgctg ctgctgctgc tgctgctgct 17340 gctgctgctg ctggggggat cacagaccat ttctttcttt cggccaggct gaggccctga 17400 cgtggatggg caaactgcag gcctgggaag gcagcaagcc gggccgtccg tgttccatcc 17460 tccacgcacc cccacctatc gttggttcgc aaagtgcaaa gctttcttgt gcatgacgcc 17520 ctgctctggg gagcgtctgg cgcgatctct gcctgcttac tcgggaaatt tgcttttgcc 17580 aaacccgctt tttcggggat cccgcgcccc cctcctcact tgcgctgctc tcggagcccc 17640 agccggctcc gcccgcttcg gcggtttgga tatttattga cctcgtcctc cgactcgctg 17700 acaggctaca ggacccccaa caaccccaat ccacgttttg gatgcactga gaccccgaca 17760 ttcctcggta tttattgtct gtccccacct aggaccccca cccccgaccc tcgcgaataa 17820 aaggccctcc atctgcccaa agctctggac tccacagtgt ccgcggtttg cgttgtgggc 17880 cggaggctcc gcagcgggcc aatccggagg cgtgtggagg cggccgaagg tctgggagga 17940 gctagcggga tgcgaagcgg ccgaatcagg gttgggggag gaaaagccac ggggcggggc 18000 tttggcgtcc ggccaatagg agggcgagcg ggccacccgg aggcaccgcc cccgcccagc 18060 tgtggcccag ctgtgccacc gagcgtcgag aagagggggc tgggctggca gcgcgcgcgg 18120 ccatcctcct tccactgcgc ctgcgcacgc cacgcgcatc cgctcctggg acgcaagctc 18180 gagaaaagtt gctgcaaact ttctagcccg ttccccgccc ctcctcccgg ccagacccgc 18240 cccccctgcg gagccgggaa ttccgagggg cggagcgcag gccgagatgg ggaatgtggg 18300 ggcctgcaga ggaccctgga gacggaggcg tgcagaagct cagtctcggg gcggaggctt 18360 cgcgccctta gtcctcctgg acggcccgtt accttctgcg ttgtcccgat ggggaaactg 18420 aggccctgag ccagaagcac acgctggggg gaggcagaaa gcgcggccag aggcggaggg 18480 aaaacaaagg gagaatcaca gacagacggg agggggacgg acacacacaa ggggacagag 18540 acccgagtgg agagctggat ctcgccttcc cggcgtgggg cgcagggtcg gccagaaaga 18600 agatcgagaa gagcggggag tgggggcgaa aaggggggac aggtggggga ggaggctggg 18660 gaaagcccga gggaggaaga gagggaggga ggaacttccc aaagttgcaa aacatggcta 18720 ccttgcctgc ggagccgagc gcggggccgg cggctggggg ggaggcggtg gcggcggcgg 18780 cggcgaccga agaggaggag gaggaagcgc gccagctctt gcagactttg caggcggccg 18840 agggtgaggc ggcggcggcg gccggggccg gggcgggcgc agcggctgcg ggagctgagg 18900 gcccgggatc cccgggcgtc cccgggtcgc cccccgaggc cgcttccgaa ccgcccacgg 18960 gcctccgctt ctcgcccgag caggtggcgt gcgtctgcga ggcgctgctc caggcgggcc 19020 acgccggccg cttgagccgc ttcctgggcg cactgccccc ggccgagcgc ctacgtggca 19080 gcgacccggt gttgcgcgcg cgggccctgg tggccttcca gcggggcgag tacgccgagc 19140 tctaccggct actcgagagc cgccccttcc ccgccgccca ccacgccttc ctgcaggacc 19200 tctacctgcg cgcgcgctac catgaggccg agcgggcccg cggccgcgcg cttggcgcag 19260 tggacaagta tcgactgcgc aagaagttcc cgctgcccaa gaccatctgg gacggcgagg 19320 agacagtcta ctgcttcaag gagcgctccc gcgcagcgct caaggcctgc taccgcggca 19380 accgctaccc cacgccggac gagaagcgcc gcctggccac actcaccggc ctgtcgctca 19440 cgcaggtcag caactggttc aagaaccggc gacagcgcga ccggaccggg gccggaggcg 19500 gcgcgccctg caagaggtga ggggcctcgg gcggcgcaag tccagctctc ccggggacat 19560 cccgtccacc agccctcttc ccccgtgccc actgctgggg ccggcgcgcc gaggtcctcg 19620 gacatctccc gggaccagct cacaatctca ggcgcccgcg gggcgcgggg actaagtgtg 19680 gacgggacag gcacccgccc gggccctctc cccgcacgcg tctcctcttc cagcggctcc 19740 attccgagct ccttcccaaa tcccatcggt gttggggaat cacactgcgg ggggcactag 19800 agggactgag gaaaaaggac agggcctgtg gccactccac t 19841 <210> 66 <211> 842 <212> PRT <213> Homo sapiens <400> 66 Met Ser Arg Pro Leu Ser Asp Gln Glu Lys Arg Lys Gln Ile Ser Val 1 5 10 15 Arg Gly Leu Ala Gly Val Glu Asn Val Thr Glu Leu Lys Lys Asn Phe 20 25 30 Asn Arg His Leu His Phe Thr Leu Val Lys Asp Arg Asn Val Ala Thr 35 40 45 Pro Arg Asp Tyr Tyr Phe Ala Leu Ala His Thr Val Arg Asp His Leu 50 55 60 Val Gly Arg Trp Ile Arg Thr Gln Gln His Tyr Tyr Glu Lys Asp Pro 65 70 75 80 Lys Arg Ile Tyr Tyr Leu Ser Leu Glu Phe Tyr Met Gly Arg Thr Leu 85 90 95 Gln Asn Thr Met Val Asn Leu Ala Leu Glu Asn Ala Cys Asp Glu Ala 100 105 110 Thr Tyr Gln Leu Gly Leu Asp Met Glu Glu Leu Glu Glu Ile Glu Glu 115 120 125 Asp Ala Gly Leu Gly Asn Gly Gly Leu Gly Arg Leu Ala Ala Cys Phe 130 135 140 Leu Asp Ser Met Ala Thr Leu Gly Leu Ala Ala Tyr Gly Tyr Gly Ile 145 150 155 160 Arg Tyr Glu Phe Gly Ile Phe Asn Gln Lys Ile Ser Gly Gly Trp Gln 165 170 175 Met Glu Glu Ala Asp Asp Trp Leu Arg Tyr Gly Asn Pro Trp Glu Lys 180 185 190 Ala Arg Pro Glu Phe Thr Leu Pro Val His Phe Tyr Gly His Val Glu 195 200 205 His Thr Ser Gln Gly Ala Lys Trp Val Asp Thr Gln Val Val Leu Ala 210 215 220 Met Pro Tyr Asp Thr Pro Val Pro Gly Tyr Arg Asn Asn Val Val Asn 225 230 235 240 Thr Met Arg Leu Trp Ser Ala Lys Ala Pro Asn Asp Phe Asn Leu Lys 245 250 255 Asp Phe Asn Val Gly Gly Tyr Ile Gln Ala Val Leu Asp Arg Asn Leu 260 265 270 Ala Glu Asn Ile Ser Arg Val Leu Tyr Pro Asn Asp Asn Phe Phe Glu 275 280 285 Gly Lys Glu Leu Arg Leu Lys Gln Glu Tyr Phe Val Val Ala Ala Thr 290 295 300 Leu Gln Asp Ile Ile Arg Arg Phe Lys Ser Ser Lys Phe Gly Cys Arg 305 310 315 320 Asp Pro Val Arg Thr Asn Phe Asp Ala Phe Pro Asp Lys Val Ala Ile 325 330 335 Gln Leu Asn Asp Thr His Pro Ser Leu Ala Ile Pro Glu Leu Met Arg 340 345 350 Ile Leu Val Asp Leu Glu Arg Met Asp Trp Asp Lys Ala Trp Asp Val 355 360 365 Thr Val Arg Thr Cys Ala Tyr Thr Asn His Thr Val Leu Pro Glu Ala 370 375 380 Leu Glu Arg Trp Pro Val His Leu Leu Glu Thr Leu Leu Pro Arg His 385 390 395 400 Leu Gln Ile Ile Tyr Glu Ile Asn Gln Arg Phe Leu Asn Arg Val Ala 405 410 415 Ala Ala Phe Pro Gly Asp Val Asp Arg Leu Arg Arg Met Ser Leu Val 420 425 430 Glu Glu Gly Ala Val Lys Arg Ile Asn Met Ala His Leu Cys Ile Ala 435 440 445 Gly Ser His Ala Val Asn Gly Val Ala Arg Ile His Ser Glu Ile Leu 450 455 460 Lys Lys Thr Ile Phe Lys Asp Phe Tyr Glu Leu Glu Pro His Lys Phe 465 470 475 480 Gln Asn Lys Thr Asn Gly Ile Thr Pro Arg Arg Trp Leu Val Leu Cys 485 490 495 Asn Pro Gly Leu Ala Glu Val Ile Ala Glu Arg Ile Gly Glu Asp Phe 500 505 510 Ile Ser Asp Leu Asp Gln Leu Arg Lys Leu Leu Ser Phe Val Asp Asp 515 520 525 Glu Ala Phe Ile Arg Asp Val Ala Lys Val Lys Gln Glu Asn Lys Leu 530 535 540 Lys Phe Ala Ala Tyr Leu Glu Arg Glu Tyr Lys Val His Ile Asn Pro 545 550 555 560 Asn Ser Leu Phe Asp Ile Gln Val Lys Arg Ile His Glu Tyr Lys Arg 565 570 575 Gln Leu Leu Asn Cys Leu His Val Ile Thr Leu Tyr Asn Arg Ile Lys 580 585 590 Arg Glu Pro Asn Lys Phe Phe Val Pro Arg Thr Val Met Ile Gly Gly 595 600 605 Lys Ala Ala Pro Gly Tyr His Met Ala Lys Met Ile Ile Arg Leu Val 610 615 620 Thr Ala Ile Gly Asp Val Val Asn His Asp Pro Ala Val Gly Asp Arg 625 630 635 640 Leu Arg Val Ile Phe Leu Glu Asn Tyr Arg Val Ser Leu Ala Glu Lys 645 650 655 Val Ile Pro Ala Ala Asp Leu Ser Glu Gln Ile Ser Thr Ala Gly Thr 660 665 670 Glu Ala Ser Gly Thr Gly Asn Met Lys Phe Met Leu Asn Gly Ala Leu 675 680 685 Thr Ile Gly Thr Met Asp Gly Ala Asn Val Glu Met Ala Glu Glu Ala 690 695 700 Gly Glu Glu Asn Phe Phe Ile Phe Gly Met Arg Val Glu Asp Val Asp 705 710 715 720 Lys Leu Asp Gln Arg Gly Tyr Asn Ala Gln Glu Tyr Tyr Asp Arg Ile 725 730 735 Pro Glu Leu Arg Gln Val Ile Glu Gln Leu Ser Ser Gly Phe Phe Ser 740 745 750 Pro Lys Gln Pro Asp Leu Phe Lys Asp Ile Val Asn Met Leu Met His 755 760 765 His Asp Arg Phe Lys Val Phe Ala Asp Tyr Glu Asp Tyr Ile Lys Cys 770 775 780 Gln Glu Lys Val Ser Ala Leu Tyr Lys Asn Pro Arg Glu Trp Thr Arg 785 790 795 800 Met Val Ile Arg Asn Ile Ala Thr Ser Gly Lys Phe Ser Ser Asp Arg 805 810 815 Thr Ile Ala Gln Tyr Ala Arg Glu Ile Trp Gly Val Glu Pro Ser Arg 820 825 830 Gln Arg Leu Pro Ala Pro Asp Glu Ala Ile 835 840 <210> 67 <211> 429 <212> PRT <213> Homo sapiens <400> 67 Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu 1 5 10 15 Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu 20 25 30 Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu 35 40 45 Arg Phe Met Cys Asn Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile 50 55 60 Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly 65 70 75 80 Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met 85 90 95 Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg 100 105 110 Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly 115 120 125 Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly 130 135 140 Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala 145 150 155 160 Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser 165 170 175 Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn 180 185 190 Arg Thr Gly Arg Ser Ile Val Tyr Ser Cys Glu Trp Pro Leu Tyr Met 195 200 205 Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn 210 215 220 His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys 225 230 235 240 Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val 245 250 255 Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn 260 265 270 Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala 275 280 285 Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser 290 295 300 Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn 305 310 315 320 Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn 325 330 335 Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala 340 345 350 Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala 355 360 365 Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile 370 375 380 Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr 385 390 395 400 Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln 405 410 415 Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu 420 425 <210> 68 <211> 952 <212> PRT <213> Homo sapiens <400> 68 Met Gly Val Arg His Pro Pro Cys Ser His Arg Leu Leu Ala Val Cys 1 5 10 15 Ala Leu Val Ser Leu Ala Thr Ala Ala Leu Leu Gly His Ile Leu Leu 20 25 30 His Asp Phe Leu Leu Val Pro Arg Glu Leu Ser Gly Ser Ser Pro Val 35 40 45 Leu Glu Glu Thr His Pro Ala His Gln Gln Gly Ala Ser Arg Pro Gly 50 55 60 Pro Arg Asp Ala Gln Ala His Pro Gly Arg Pro Arg Ala Val Pro Thr 65 70 75 80 Gln Cys Asp Val Pro Pro Asn Ser Arg Phe Asp Cys Ala Pro Asp Lys 85 90 95 Ala Ile Thr Gln Glu Gln Cys Glu Ala Arg Gly Cys Cys Tyr Ile Pro 100 105 110 Ala Lys Gln Gly Leu Gln Gly Ala Gln Met Gly Gln Pro Trp Cys Phe 115 120 125 Phe Pro Pro Ser Tyr Pro Ser Tyr Lys Leu Glu Asn Leu Ser Ser Ser 130 135 140 Glu Met Gly Tyr Thr Ala Thr Leu Thr Arg Thr Thr Pro Thr Phe Phe 145 150 155 160 Pro Lys Asp Ile Leu Thr Leu Arg Leu Asp Val Met Met Glu Thr Glu 165 170 175 Asn Arg Leu His Phe Thr Ile Lys Asp Pro Ala Asn Arg Arg Tyr Glu 180 185 190 Val Pro Leu Glu Thr Pro His Val His Ser Arg Ala Pro Ser Pro Leu 195 200 205 Tyr Ser Val Glu Phe Ser Glu Glu Pro Phe Gly Val Ile Val Arg Arg 210 215 220 Gln Leu Asp Gly Arg Val Leu Leu Asn Thr Thr Val Ala Pro Leu Phe 225 230 235 240 Phe Ala Asp Gln Phe Leu Gln Leu Ser Thr Ser Leu Pro Ser Gln Tyr 245 250 255 Ile Thr Gly Leu Ala Glu His Leu Ser Pro Leu Met Leu Ser Thr Ser 260 265 270 Trp Thr Arg Ile Thr Leu Trp Asn Arg Asp Leu Ala Pro Thr Pro Gly 275 280 285 Ala Asn Leu Tyr Gly Ser His Pro Phe Tyr Leu Ala Leu Glu Asp Gly 290 295 300 Gly Ser Ala His Gly Val Phe Leu Leu Asn Ser Asn Ala Met Asp Val 305 310 315 320 Val Leu Gln Pro Ser Pro Ala Leu Ser Trp Arg Ser Thr Gly Gly Ile 325 330 335 Leu Asp Val Tyr Ile Phe Leu Gly Pro Glu Pro Lys Ser Val Val Gln 340 345 350 Gln Tyr Leu Asp Val Val Gly Tyr Pro Phe Met Pro Pro Tyr Trp Gly 355 360 365 Leu Gly Phe His Leu Cys Arg Trp Gly Tyr Ser Ser Thr Ala Ile Thr 370 375 380 Arg Gln Val Val Glu Asn Met Thr Arg Ala His Phe Pro Leu Asp Val 385 390 395 400 Gln Trp Asn Asp Leu Asp Tyr Met Asp Ser Arg Arg Asp Phe Thr Phe 405 410 415 Asn Lys Asp Gly Phe Arg Asp Phe Pro Ala Met Val Gln Glu Leu His 420 425 430 Gln Gly Gly Arg Arg Tyr Met Met Ile Val Asp Pro Ala Ile Ser Ser 435 440 445 Ser Gly Pro Ala Gly Ser Tyr Arg Pro Tyr Asp Glu Gly Leu Arg Arg 450 455 460 Gly Val Phe Ile Thr Asn Glu Thr Gly Gln Pro Leu Ile Gly Lys Val 465 470 475 480 Trp Pro Gly Ser Thr Ala Phe Pro Asp Phe Thr Asn Pro Thr Ala Leu 485 490 495 Ala Trp Trp Glu Asp Met Val Ala Glu Phe His Asp Gln Val Pro Phe 500 505 510 Asp Gly Met Trp Ile Asp Met Asn Glu Pro Ser Asn Phe Ile Arg Gly 515 520 525 Ser Glu Asp Gly Cys Pro Asn Asn Glu Leu Glu Asn Pro Pro Tyr Val 530 535 540 Pro Gly Val Val Gly Gly Thr Leu Gln Ala Ala Thr Ile Cys Ala Ser 545 550 555 560 Ser His Gln Phe Leu Ser Thr His Tyr Asn Leu His Asn Leu Tyr Gly 565 570 575 Leu Thr Glu Ala Ile Ala Ser His Arg Ala Leu Val Lys Ala Arg Gly 580 585 590 Thr Arg Pro Phe Val Ile Ser Arg Ser Thr Phe Ala Gly His Gly Arg 595 600 605 Tyr Ala Gly His Trp Thr Gly Asp Val Trp Ser Ser Trp Glu Gln Leu 610 615 620 Ala Ser Ser Val Pro Glu Ile Leu Gln Phe Asn Leu Leu Gly Val Pro 625 630 635 640 Leu Val Gly Ala Asp Val Cys Gly Phe Leu Gly Asn Thr Ser Glu Glu 645 650 655 Leu Cys Val Arg Trp Thr Gln Leu Gly Ala Phe Tyr Pro Phe Met Arg 660 665 670 Asn His Asn Ser Leu Leu Ser Leu Pro Gln Glu Pro Tyr Ser Phe Ser 675 680 685 Glu Pro Ala Gln Gln Ala Met Arg Lys Ala Leu Thr Leu Arg Tyr Ala 690 695 700 Leu Leu Pro His Leu Tyr Thr Leu Phe His Gln Ala His Val Ala Gly 705 710 715 720 Glu Thr Val Ala Arg Pro Leu Phe Leu Glu Phe Pro Lys Asp Ser Ser 725 730 735 Thr Trp Thr Val Asp His Gln Leu Leu Trp Gly Glu Ala Leu Leu Ile 740 745 750 Thr Pro Val Leu Gln Ala Gly Lys Ala Glu Val Thr Gly Tyr Phe Pro 755 760 765 Leu Gly Thr Trp Tyr Asp Leu Gln Thr Val Pro Val Glu Ala Leu Gly 770 775 780 Ser Leu Pro Pro Pro Pro Ala Ala Pro Arg Glu Pro Ala Ile His Ser 785 790 795 800 Glu Gly Gln Trp Val Thr Leu Pro Ala Pro Leu Asp Thr Ile Asn Val 805 810 815 His Leu Arg Ala Gly Tyr Ile Ile Pro Leu Gln Gly Pro Gly Leu Thr 820 825 830 Thr Thr Glu Ser Arg Gln Gln Pro Met Ala Leu Ala Val Ala Leu Thr 835 840 845 Lys Gly Gly Glu Ala Arg Gly Glu Leu Phe Trp Asp Asp Gly Glu Ser 850 855 860 Leu Glu Val Leu Glu Arg Gly Ala Tyr Thr Gln Val Ile Phe Leu Ala 865 870 875 880 Arg Asn Asn Thr Ile Val Asn Glu Leu Val Arg Val Thr Ser Glu Gly 885 890 895 Ala Gly Leu Gln Leu Gln Lys Val Thr Val Leu Gly Val Ala Thr Ala 900 905 910 Pro Gln Gln Val Leu Ser Asn Gly Val Pro Val Ser Asn Phe Thr Tyr 915 920 925 Ser Pro Asp Thr Lys Val Leu Asp Ile Cys Val Ser Leu Leu Met Gly 930 935 940 Glu Gln Phe Leu Val Ser Trp Cys 945 950 <210> 69 <211> 210 <212> PRT <213> Homo sapiens <400> 69 Met Trp Thr Leu Gly Arg Arg Ala Val Ala Gly Leu Leu Ala Ser Pro 1 5 10 15 Ser Pro Ala Gln Ala Gln Thr Leu Thr Arg Val Pro Arg Pro Ala Glu 20 25 30 Leu Ala Pro Leu Cys Gly Arg Arg Gly Leu Arg Thr Asp Ile Asp Ala 35 40 45 Thr Cys Thr Pro Arg Arg Ala Ser Ser Asn Gln Arg Gly Leu Asn Gln 50 55 60 Ile Trp Asn Val Lys Lys Gln Ser Val Tyr Leu Met Asn Leu Arg Lys 65 70 75 80 Ser Gly Thr Leu Gly His Pro Gly Ser Leu Asp Glu Thr Thr Tyr Glu 85 90 95 Arg Leu Ala Glu Glu Thr Leu Asp Ser Leu Ala Glu Phe Phe Glu Asp 100 105 110 Leu Ala Asp Lys Pro Tyr Thr Phe Glu Asp Tyr Asp Val Ser Phe Gly 115 120 125 Ser Gly Val Leu Thr Val Lys Leu Gly Gly Asp Leu Gly Thr Tyr Val 130 135 140 Ile Asn Lys Gln Thr Pro Asn Lys Gln Ile Trp Leu Ser Ser Pro Ser 145 150 155 160 Ser Gly Pro Lys Arg Tyr Asp Trp Thr Gly Lys Asn Trp Val Tyr Ser 165 170 175 His Asp Gly Val Ser Leu His Glu Leu Leu Ala Ala Glu Leu Thr Lys 180 185 190 Ala Leu Lys Thr Lys Leu Asp Leu Ser Ser Leu Ala Tyr Ser Gly Lys 195 200 205 Asp Ala 210

Claims

변이체 AAV 캡시드 단백질과 동일한 야생형 AAV 혈청형의 동일한 AAV 캡시드 단백질이지만 변이체 AAV 캡시드 단백질의 펩타이드 삽입을 포함하지 않는 상응하는 모 AAV 캡시드 단백질에 대해 캡시드 단백질의 GH-루프에 5개 아미노산 내지 20개 아미노산의 펩타이드 삽입을 포함하는 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질이며,
펩타이드 삽입은 아미노산 서열 NKTTNKD(서열 식별 번호 14) 또는 NKIQRTD(서열 식별 번호 13)를 포함하고,
삽입 부위는 AAV2(서열 식별 번호 2)의 VP1의 아미노산 570과 611 사이의 위치 또는 다른 AAV 혈청형의 캡시드 단백질에서 삽입 부위가
(i) AAV1 VP1의 아미노산 571-612,
(ii) AAV3A VP1의 아미노산 571-612,
(iii) AAV3B VP1의 아미노산 571-612,
(iv) AAV4 VP1의 아미노산 569-610,
(v) AAV5 VP1의 아미노산 560-601,
(vi) AAV6 VP1의 아미노산 571-612,
(vii) AAV7 VP1의 아미노산 572-613,
(viii) AAV8 VP1의 아미노산 573-614,
(ix) AAV9 VP1의 아미노산 571-612, 또는
(x) AAVIO VP1의 아미노산 573-614; 내에 위치하는 상응하는 위치에서 2개의 인접한 아미노산 사이에 위치하고,
변이체 캡시드 단백질은 AAV 비리온에 존재할 때 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성을 부여하는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질.
제 1항에 있어서,
(a) 펩타이드 삽입은 LANKTTNKDA(서열 식별 번호 27) 또는 LANKIQRTDA(서열 식별 번호 26)이고;
(b) 삽입 부위는 AAV2(서열 식별 번호 2)의 VP1의 아미노산 587 과 588에 상응하는 아미노산 사이에 위치하며;
(c) 펩타이드 삽입 길이가 7 내지 10개 아미노산이고; 및/또는
(d) 펩타이드 삽입은 아미노 및/또는 카르복실 말단에 1 내지 4개의 스페이서 아미노산을 갖는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질.
제 1항에 있어서,
펩티드 삽입이 아미노산 서열 NKTTNKD(서열 식별 번호 14)를 포함하고, AAV 캡시드 단백질이 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 V708I 아미노산 치환을 포함하며, 임의로 AAV 캡시드 단백질이 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 S109T 아미노산 치환, W694C 아미노산 치환 및 W606C 아미노 치환 중 하나 이상을 추가로 포함하는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질.
제 3항에 있어서,
AAV 캡시드 단백질은 서열 식별 번호 48로 표시되는 아미노산 서열의 전체 길이와 적어도 90% 동일, 적어도 95% 동일, 적어도 98% 동일 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 변이체 AAV 캡시드 단백질은 서열 식별 번호 48로 표시되는 아미노산 서열로 이루어지는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질.
제 1항에 있어서,
펩티드 삽입은 아미노산 서열 NKIQRTD(서열 식별 번호 13)를 포함하고, AAV 캡시드 단백질은 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 V708I 아미노산 치환을 포함하고, 임의로 AAV2(서열 식별 번호 2)의 VP1 또는 다른 AAV 혈청형의 캡시드 단백질의 상응하는 위치에 대해 S109T 아미노산 치환, RS88M 아미노산 치환 및 A593E 아미노 치환 중 하나 이상을 추가로 포함하며, 임의로
AAV 캡시드 단백질은 서열 식별 번호 43으로 표시된 아미노산 서열의 전체 길이와 적어도 90% 동일, 적어도 95% 동일, 적어도 98% 동일 또는 100% 동일한 아미노산 서열을 포함하고, 바람직하게는 AAV 캡시드 단백질은 서열 식별 번호 43으로 표시된 아미노산 서열로 이루어지는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질.
제 1항에 있어서,
캡시드 단백질은 야생형 AAV 캡시드 단백질을 포함하는 AAV 비리온에 의한 근육 세포의 감염성과 비교하여 근육 세포의 증가된 감염성, 바람직하게는 적어도 2배 또는 적어도 5배 증가된 감염성을 감염성 rAAV 비리온에 부여하며/또는 캡시드 단백질은 상응하는 모 AAV 캡시드 단백질을 포함하는 AAV와 비교하여 중화 항체에 의한 중화에 대한 증가된 내성, 바람직하게는 적어도 2배 또는 적어도 5배 증가된 내성을 감염성 rAAV 비리온에 부여하는, 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질.
제 1항 내지 제 6항 중 어느 한 항의 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는, 단리된 핵산.
제 1항 내지 제 6항 중 어느 한 항의 변이체 아데노-관련 바이러스(AAV) 캡시드 단백질을 포함하는, 감염성 재조합 아데노-관련 바이러스(rAAV) 비리온.
제 8항에 있어서,
유전자 산물을 인코딩하는 뉴클레오타이드 서열을 포함하는 이종성 핵산을 추가로 포함하며, 바람직하게는 유전자 산물이 단백질, 작은 간섭 RNA(small interfering RNA), 안티센스 RNA(antisense RNA), 마이크로 RNA(micro RNA), 또는 짧은 헤어핀 RNA(short hairpin RNA)인, 감염성 재조합 AAV(rAAV) 비리온.
제 9항에 있어서,
rAAV 비리온이 알파-갈락토시다제 A(alpha galactosidase A)(GLA), 프랙탁신(fractaxin)(FXN), 디스트로핀(dystrophin)(DMD) 또는 이의 기능적 단편, 산 알파 글루코시다아제(acid alpha glucosidase)(GAA), 및 근육 글리코겐 인산화효소(glycogen phosphorylase, muscle)(PYGM)로부터 선택되는 단백질을 인코딩하는 이종성 핵산을 포함하는, 감염성 재조합 AAV(rAAV) 비리온.
제 10항에 있어서,
변이체 AAV 캡시드 단백질이 서열 식별 번호 48로 표시되는 아미노산 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 아미노산 서열 동일성을 갖거나 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하며, 이종성 핵산이 알파-갈락토시다제 A(GLA) 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하고, 바람직하게는 GLA를 인코딩하는 뉴클레오타이드 서열은 CAG 프로모터에 작동 가능하게 연결되는, 감염성 재조합 AAV(rAAV) 비리온.
제 10항에 있어서,
변이체 AAV 캡시드 단백질이 서열 식별 번호 48로 표시되는 아미노산 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 아미노산 서열 동일성을 갖거나 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하며, 이종성 핵산이 프랙탁신(frataxin) 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하고, 바람직하게는 프랙탁신을 인코딩하는 뉴클레오타이드 서열은 CAG 프로모터에 작동 가능하게 연결되는, 감염성 재조합 AAV(rAAV) 비리온.
제 10항에 있어서,
변이체 AAV 캡시드 단백질이 서열 식별 번호 48로 표시되는 아미노산 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 아미노산 서열 동일성을 갖거나 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하며, 이종성 핵산이 GAA 단백질을 인코딩하는을 인코딩하는 뉴클레오타이드 서열을 포함하고, 바람직하게는 GAA 단백질을 인코딩하는 뉴클레오타이드 서열은 CBA 프로모터에 작동 가능하게 연결되는, 감염성 재조합 AAV(rAAV) 비리온.
제 9항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
제 10항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
제 11항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
제 12항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
제 13항의 rAAV 비리온 및 약학적으로 허용 가능한 담체, 희석제, 부형제 또는 완충제를 포함하는, 약학적 조성물.
제 9항에 있어서,
근육 세포, 바람직하게는 심장 및/또는 골격근 세포에, 바람직하게는 정맥 내 및/또는 근육 내 주사에 의해 이종성 핵산을 전달하는 방법의 용도인, 감염성 재조합 AAV(rAAV) 비리온.
제 9항에 있어서,
약물(medicament)로서의 용도인, 감염성 재조합 AAV(rAAV) 비리온.
제 11항에 있어서,
파브리병(Fabry disease)을 치료하는 용도이며, 바람직하게는 rAAV가 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 감염성 재조합 AAV(rAAV) 비리온.
제 12항에 있어서,
프리드리히 운동실조(Friedreich's ataxia)을 치료하는 용도이며, 바람직하게는 rAAV가 정맥 내 주사에 의해 투여되는, 감염성 재조합 AAV(rAAV) 비리온.
제 13항에 있어서,
폼페병(Pompe disease)을 치료하는 용도이며, 바람직하게는 rAAV가 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 감염성 재조합 AAV(rAAV) 비리온.
제 14항에 있어서,
근육 세포, 바람직하게는 심장 및/또는 골격근 세포에, 바람직하게는 정맥 내 및/또는 근육 내 주사에 의해 이종성 핵산을 전달하는 방법의 용도인, 약학적 조성물.
제 14항에 있어서,
약물(medicament)로서의 용도인, 약학적 조성물.
제 16항에 있어서,
파브리병(Fabry disease)을 치료하는 용도이며, 바람직하게는 조성물이 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 약학적 조성물.
제 17항에 있어서,
프리드리히 운동실조(Friedreich's ataxia)를 치료하는 용도이며, 바람직하게는 조성물이 정맥 내 주사에 의해 투여되는, 약학적 조성물.
제 18항에 있어서,
폼페병(Pompe disease)을 치료하는 용도이며, 바람직하게는 조성물이 정맥 내 및/또는 근육 내 주사에 의해 투여되는, 약학적 조성물.