Nothing Special   »   [go: up one dir, main page]

KR20200091400A - 신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도 - Google Patents

신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도 Download PDF

Info

Publication number
KR20200091400A
KR20200091400A KR1020207013860A KR20207013860A KR20200091400A KR 20200091400 A KR20200091400 A KR 20200091400A KR 1020207013860 A KR1020207013860 A KR 1020207013860A KR 20207013860 A KR20207013860 A KR 20207013860A KR 20200091400 A KR20200091400 A KR 20200091400A
Authority
KR
South Korea
Prior art keywords
antigen
protein
binding
domain
scaffold
Prior art date
Application number
KR1020207013860A
Other languages
English (en)
Inventor
얀 스테예르트
엘스 파르돈
토마시 우한스키
빔 브란컨
Original Assignee
브이아이비 브이지더블유
브리제 유니버시타이트 브루셀
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브이아이비 브이지더블유, 브리제 유니버시타이트 브루셀 filed Critical 브이아이비 브이지더블유
Publication of KR20200091400A publication Critical patent/KR20200091400A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/461Igs containing Ig-regions, -domains or -residues form different species
    • C07K16/464Igs containing CDR-residues from one specie grafted between FR-residues from another
    • C07K16/465Igs containing CDR-residues from one specie grafted between FR-residues from another with additional modified FR-residues
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/468Immunoglobulins having two or more different antigen binding sites, e.g. multifunctional antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2299/00Coordinates from 3D structures of peptides, e.g. proteins or enzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/22Immunoglobulins specific features characterized by taxonomic origin from camelids, e.g. camel, llama or dromedary
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/00022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/00023Virus like particles [VLP]

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biotechnology (AREA)
  • Virology (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

본 발명은 구조 생물학 분야에 관한 것이다. 보다 특히, 본 발명은 신규한 항원-결합 키메라 단백질, 거대분자의 3-차원 구조 분석, 예컨대 X-선 결정학 및 고분해능 Cryo-EM에서 그들 용도 및 방법, 및 치료, 진단 또는 영상화 도구로서 그들 용도에 관한 것이다. 보다 더 특히, 본 발명은 스캐폴드 단백질 및 항원-결합 도메인의 융합체에 관한 것으로서, 상기 융합체의 스캐폴드 단백질은 면역글로불린 도메인 토폴로지를 방해하여 강성 키메라를 형성시킨다.

Description

신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도
본 발명은 구조 생물학 분야에 관한 것이다. 보다 특히, 본 발명은 신규 항원-결합 키메라 단백질, 거대분자의 3차원 구조 분석, 예컨대 X-선 결정학 및 고분해능 Cryo-EM에서 그들의 용도 및 방법, 및 치료, 진단 또는 영상화 도구로서 그들 용도에 관한 것이다. 보다 더 특히, 본 발명은 스캐폴드 단백질 및 항원-결합 도메인의 융합체에 관한 것으로서, 상기 융합체의 스캐폴드 단백질은 면역글로불린 도메인 토폴로지를 방해하여 이의 항원-결합 능력을 보유하는 강성 키메라를 형성시킨다.
단백질 및 그들 복합체는 삶의 모든 양상에서 핵심적인 역할을 가지지만, 많은 이들 거대분자 성분의 3D-구조 분석은 여전히 어려운 채로 남아 있다. 회절 품질 결정의 제조도 거대분자 X-선 결정학에서 중대한 장애로 남아있다. 장래성을 갖는 접근법은 결정화 샤페론의 사용이다 (Hunte & Michel, 2002). 이들 결정화 샤페론은 소정 거대분자 표적에 특이적으로 결합하도록 조작된 항체 단편 또는 다른 단백질의 형태로 참여한다. 전략의 기반은 첫째로, 특이적 입체구조에 결합하여 표적 내 배좌 이질성을 최소화시키고, 두번째로 결정 격자 내 분자들 간 1차 접촉을 용이하게 할 수 있는 단백질 표면의 양을 보충하여 정렬된 결정을 수득할 확률을 증가시키는 것이다. 결정화 샤페론 접근법에 내재하는 추가의 속성은 샤페론이 초기 모델-기반 위상 조정 정보를 제공할 수 있다는 것이다 (Koide, 2009). Nanobodies®는 그들이 특이적 입체구조를 안정화시키므로 특히 그들 표적의 결정학을 위한, 구조 분석의 촉진자로서 광범위하게 사용되어 왔다 (Pardon et al., 2014; Rostislavleva et al., 2015). 일례로는 이들 도구가 어떻게 구조 연구를 추진할 수 있는 가를 입증하는 GPCR 결정화의 상황에서 강력한 Nanobody® 기술의 사용이다 (Manglick et al., 2017; Staus et al., 2016).
여전히, X-선 결정학은 본질적으로 고품질 정제 단백질에 대한 전제조건, 필요한 비교적 대량의 단백질, 및 많은 단백질의 회절 품질 결정을 수득하는 어려움과 같은, 몇가지 단점을 갖는다. 단일 입자 전자 저온현미경 (cryo-EM)이 최근에 원자 분해능으로 거대분자 복합체의 구조 분석을 위한 대안의 다재다능한 기술로 개발되었다 (Nogales, 2016). 데이터 분석을 위한 장비 및 방법이 꾸준히 개선되고 있지만, 소형 크기, 낮은 대칭성, 및 고도의 가요성 입자를 높은 분해능으로 분석하기 위한 도구는 없다. 소정 샘플의 균질성에 대한 전제조건이외에도, 3D 재구성의 최고로 달성가능한 분해능은 높은 정밀도로 각각의 개별 입자의 배향 변수를 반복적으로 정제하는 능력에 상당히 의존적이다. 특별한 영역이 우선적으로 공기-물 계면 또는 기재 지지체에 부착되게 하는 거대분자의 표면 성질에 기인한 바람직한 입자 배향은 cryo-EM에서 되풀이되는 문제를 대표한다. 따라서, 대형 분자는 노이즈 있는 냉동 수화 샘플의 저용량 이미지에서 비교적 인식되기 쉽고, 이들 입자는 그들 배향 변수의 정확한 결정을 용이하게 하는 충분한 구조적 특성을 갖지만 (Henderson, 1995), 소형 입자의 이미지를 수집하고 처리하는 방법은 훨씬 더 어렵다. 한가지 근본적인 한계는 유리화 얼음에 포매된 소형 단백질 또는 복합체의 이미지가 주로 이미지의 신호 대 노이즈 비율이 입자의 크기에 따라 감소되므로, 정확한 이미지 정렬을 위한 적절한 특성을 함유하지 않는다는 것이다. 이들 단백질에 화학 링커를 첨가하거나 또는 융합 단백질을 생성시켜서 이러한 한계들을 극복하려는 노력들이 이루어져 왔다. 예를 들어, 표적 단백질 및 다량체-형성 글루타민 신써타제 사이의 최적화된 접합부가 동종-올리고머로서 사용되어 대칭성이 획득되었고, 그리하여 cryo-EM에서 이들 소형 표적 단백질의 나노미터 분해능을 가능하게 하였다 (Coscia et al., 2016). 이러한 융합체를 사용하는 문제는 그들이 가요성 링커를 통해 만들어지므로, 그 결과 강성의 결여와 제한적인 배좌 균질성이 초래된다는 것이다. Zhang 등 (2015)은 인간화 효현제를 생성시키기 위해 사이토카인과 인간화 항체의 보다 강성인 융합체를 보고하였다. 이 강성 융합체는 소 Fab 구조 모티프를 기반으로 하는, 올바른 폴딩을 위한 코일드-코일 '줄기부' (coiled-coil stalk) 모티프를 사용하여 만들어졌다. 항체의 상보성 결정 영역 (CDR)이 존재하는 융합체의 이러한 줄기부 모티프에 커플링된 사이토카인은 사이토카인의 폴딩 및 생물학적 활성을 유지하는 것으로 보이지만, 항체의 항원 결합 능력은 상실하는 것으로 보인다. Fab (∼50 kDa)와 같은 항체 단편이 Cryo-EM을 통해서 소형 단백질의 구조를 규명하는데 적용되었다 (Wu et al., 2012; Lin et al., 2013). Fab 사용의 한가지 단점은 그들이 또한 선형 에피토프에 결합한다는 것인데, 이것은 낮은 강성을 초래하는 것으로 알려져 있어서, 강성 결합 및 구조적 용이함을 수득하는데 필요한 Fab의 적절한 선택을 요구한다. 게다가, Fab는 (그들의 가변 및 불변 도메인 사이에) 내부 가요성을 가지며, 여전히 크기가 비교적 작고, 나노바디와 비교하여 생산하기가 더 어렵다. 나노바디가 구조 분석을 위해 배좌 이질성을 감소시키는데 탁월한 도구이긴 하지만, Nb (15 kDa)도 역시 소형 단백질이고 결정 격자 내 분자 간 1차 접촉을 용이하게 하기 위한 대량의 단백질 표면을 공급하지 못한다. 그들이 너무 작기 때문에, 역시 소형 단백질의 고분해능 Cryo-EM을 위한 크기-관련 요건을 가능하게 맞추는 것이 신통치 않다.
X-선 결정학 또는 cryo-EM에 의한 정확한 구조 분석을 위해서, 강성 샤페론의 일반 프로토타입 용액이 요구된다. 그래서, 가요성 링커 대신에 강성 방법으로 융합된, 신규 키메라의 디자인은 거대한 입체구조적으로 안정한 단백질 구조를 구축하는데 유리할 수 있다. 종합해 보면, 결정화 또는 단일 입자 분석, 특히 cryo-EM을 통한 소형 단백질 또는 단백질 복합체, 또는 심지어 단백질-단백질 상호작용의 구조 분석을 가능하게 하는 차세대 사페론에 대한 분명한 요구가 존재한다. 표적의 감소된 입체구조적 가요성을 야기시키기 위해서 일반 방법을 통해 이러한 샤페론을 디자인하고 생성시키는 것이 유리할 것이다. 첫째로, 고분해능 구조를 수득하는 방식으로 분해능을 개선시키기 위해 표적에 정의된 특성을 부가하고/하거나 질량을 부가하기 위한 보조 도구로서이다. 따라서, 이것은 구조-기반 약물 디자인에 유리할 것이고 신규 화합물의 발굴 및 개발을 보조할 것이다. 두번째로, 또한 증가된 강성으로 이득을 얻는 진단 또는 치료 제품을 포함하여, 생물리, 의학을 비롯한 작물 보호 용도를 위한 새로운 유형의 작용제를 제공하는 것이다.
본 발명은 신규 기능성 항원-결합 키메라 단백질의 디자인 및 생성 및 이의 용도, 예컨대 구조 분석에서 차세대 샤페론으로서 그들 역할을 비롯하여, 치료 및 진단 분자로서 그들 용도에 관한 것이다. 특히, 면역글로불린 또는 면역글로불린-유사 도메인 및 스캐폴드 단백질을 포함하는 항원-결합 키메라 단백질은 항원-결합 성질을 포함하고 표적 상의 결합 입체구조 에피토프에 특이적인 면역글로불린 또는 면역글로불린-유사 도메인의 유리한 기능적 특성을, 이의 폴딩 또는 기능성을 간섭하지 않고 면역글로불린 도메인의 토폴로지를 방해하는 방식으로 면역글로불린 도메인에 다재다능한 방식으로 스캐폴드 단백질이 융합할 수 있게 하는 면역글로불린 도메인의 유리한 구조적 특성을 조합하여 디자인되었다. 최종 항원-결합 키메라 단백질은 스캐폴드, 또는 이의 단편이 항원-결합 도메인의 토폴로지 내에 삽입되도록 디자인된, 스캐폴드 단백질 및 상기 항원-결합 도메인 간 유전자 융합체의 발현을 통해 수득된다. 놀랍게도 최종 신규 항원-결합 키메라 단백질은 그들 융합 영역에서 높은 강성을 특징으로 하고 놀랍게도 그들의 전형적인 폴딩 및 기능성을 유지하며, 다시 말해서 그들이 그들 항원 또는 표적 단백질에 결합하는 높은 친화성을 유지한다는 것을 보여준다. 사실, 항원-결합 도메인 및 스캐폴드 단백질 간에 만들어진 유전자 융합체는 항원 결합을 위한 상보성 결정 영역 (CDR) 구조를 파괴하거나 또는 변경시키지 않는다. 따라서 본 발명은 디자인하는 것이 쉽지 않은, 스캐폴드 단백질과의 강성 비가요성 융합체를 가능하게 하기 위해, 항원-결합 도메인 내 노출된 영역(들)에 빈틈없이 선택된 부위를 가짐으로써 신규하고 독특한 유형의 항원-결합 키메라 단백질을 제공한다. 그리하여 항원-결합 키메라 단백질은 질량을 부가하고 구조적 특성을 공급하여 소형 단백질의 고분해능 cryo-EM 및 X-선 결정학 구조 분석을 용이하게 하기 위한 신규 도구를 제공한다. 실제로, 균질 샘플의 주로 대형 및 중간형-크기의 거대분자 조립체는 아직은 cryo-EM에서 원자 수준으로 특징규명할 수 있다. 그래서 본 발명의 항원-결합 키메라 단백질은 바람직한 입자 배향 (역시 스캐폴드에 의존적)을 다루는데서, 입자 크기를 증가시키는 것을 보조하게 될 것이고, 크기 제한 감소 및 분해능 증가를 야기시키도록 단편의 더 나은 정렬을 가능하게 할 것이다. 그리하여 임의의 가능한 항원 또는 표적의 구조 분석을 위한 이들 차세대 샤페론의 디자인 및 생성은 고분해능 구조를 수득하게 하는 방식으로 분해능을 개선시키기 위해 관심 표적에 질량을 부가하고/하거나 정의된 특성을 부가하기 위한 지지 도구로서 항원-결합 키메라 단백질을 적용할 수 있게 한다. 사실, 항원-결합 키메라 단백질이 구조 분석뿐만 아니라 구조-기반 약물 디자인 및 스크리닝에서의 도구로서 유리할뿐만 아니라, 신규 생물제제 및 소형 분자 작용제의 발굴 및 개발을 위한 부가가치가 된다. 뿐만 아니라, 이러한 강성 융합체를 만들고, 스캐폴드의 유형, 예를 들어 항원-결합 또는 IgG 도메인 그 자체를 포함하는 스캐폴드에 의존적일 때, 의학 분야의 활성 구성성분으로서 항원-결합 키메라를 적용하기 위한 새로운 적용분야는 예를 들어 신규 강성 융합 치료 분자로서, 또는 보호제를 제공하는 작물 보호 분야에서 생기게 된다. 항원-결합 키메라가 표지된 스캐폴드, 또는 심지어 표지된 항원-결합 도메인으로 만들어질 때, 예를 들어 표적의 비공유 프로빙을 통해, 예를 들어 생체내-영상화에서 기술적 개선을 가속시키는 새로운 진단 도구도 역시 본 발명에 포함된다.
본 발명의 제1 양상은 스캐폴드 또는 융합 파트너 단백질에 연결되는, 항원-결합 도메인을 포함하는 항원-결합 키메라 또는 융합 단백질에 관한 것으로서, 상기 스캐폴드 단백질은 상기 도메인의 표면에서 접근가능하거나 또는 노출되는 하나 이상의 아미노산 부위에서 상기 항원-결합 도메인에 커플링되어, 그 결과 상기 항원-결합 도메인의 토폴로지의 파괴가 초래된다. 상기 항원-결합 키메라 단백질은 상기 스캐폴드 단백질에 융합되지 않은 항원-결합 도메인과 비교하여 이의 항원-결합 기능성을 보유하는 것을 더욱 특징으로 한다. 다른 실시형태는 본 발명의 항원-결합 키메라 단백질을 개시하고, 여기서 스캐폴드 단백질 및 항원-결합 도메인의 융합은 항원-결합 도메인의 주요 토폴로지 파괴를 초래하여, 다른 단백지로가 융합되지 않은 항원-결합 단백질의 폴딩과 비교하여, 상기 항원-결합 도메인의 폴딩을 유지할 수 있게 한다.
본 발명의 특정 실시형태에서, 융합체는 직접 융합체일 수 있거나, 또는 링커 또는 링커 펩티드에 의해 만들어지는 융합체일 수 있으며, 상기 융합 부위는 강성, 비가요성 융합 단백질이 생성되도록 빈틈없이 디자인된다. 바람직하게, 링커는 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 또는 보다 바람직하게 2개, 보다 더 바람직하게 1개의 아미노산 잔기를 포함하거나, 또는 직접 융합체 (링커없음)이다. 다른 실시형태에서, 상기 항원-결합 키메라 단백질은 바람직하게 항원-결합 도메인의 베타 턴 (β-턴) 또는 루프인, 노출된 영역에 존재하는 적어도 하나 이상의 접근가능한 부위에서 융합된다. 항원-결합 도메인의 표면에서 하나 이상의 접근가능하거나 또는 노출된 부위에서 항원-결합 도메인에 커플링된 스캐폴드 단백질이 존재하는 상기 항원-결합 키메라 단백질은 상기 접근가능하거나 또는 노출된 부위가 이의 항원 결합 기능성을 보유한다는 것에 관해서, 항원-결합 루프 또는 CDR 루프와 상이하다는 것을 더욱 특징으로 한다. 일 실시형태에서, 상기 항원-결합 키메라 단백질은 IMGT® 국제 기준 명명법 (Lefranc, 2014; 도 25)에 따라 정의된 바와 같이, 적어도 7개의 역평행 β-스트랜드 (strand)와 상기 상기 β-스트랜드를 연결하는, 적어도 3개 β-턴 (turn)을 갖는 항원-결합 도메인을 포함한다. 특정 실시형태에서, 상기 항원-결합 키메라 단백질의 상기 항원-결합 도메인은 면역글로불린 (Ig) 도메인 또는 Ig 폴드를 포함한다. 특별한 실시형태에서, 항원-결합 키메라 단백질의 Ig 도메인은 VHH로부터 유래되거나, 또는 보다 바람직하게 면역글로불린 단일 가변 도메인 (ISVD)으로부터 유래되거나 또는 나노바디로부터 유래된다.
특정 실시형태에서, 항원-결합 키메라 단백질의 상기 항원-결합 도메인의 노출된 영역은 특히 IMGT 명명법 (도 25, [Lefranc, 2014]로부터 개조)에 따른, β-턴 AB, CC', C''D, DE, 또는 EF에 관한 것이다. 그래서, 스캐폴드 단백질은 다음과 같이 항원-결합 도메인 내에 삽입된다: 상기 항원-결합 도메인의 β-스트랜드 A 및 β-스트랜드 B를 연결하는 제1 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 C 및 β-스트랜드 C'을 연결하는 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 C'' 및 β-스트랜드 D를 연결하는 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 D 및 β-스트랜드 E를 연결하는 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 E 및 β-스트랜드 F를 연결하는 β-턴 (상기 β-턴은 [IMGT, LeFranc 2014]에 따라 정의됨). 특별한 실시형태에서, 항원-결합 키메라 단백질은 상기 항원-결합 도메인의 β-스트랜드 A 및 β-스트랜드 B를 연결하는, β-턴 AB를 포함하는 상기 도메인의 노출 영역 내 접근가능한 부위에 스캐폴드 단백질의 융합을 통해 생성된다.
본 발명의 다른 실시형태에서, 항원-결합 키메라 단백질을 생성시키는데 사용되는 스캐폴드 단백질은 원형으로 배열된 단백질이고, 보다 특히, 원형 배열은 상기 스캐폴드 단백질의 N-말단과 C-말단 사이에서 만들어질 수 있다. 일정 실시형태에서, 원형으로 배열된 스캐폴드 단백질은 Ig 도메인의 접근가능한 부위(들)에서의 융합을 위한 부위를 제공하기 위해, 상기 스캐폴드 단백질의 다른 접근가능한 부위에서 절단된다.
다른 실시형태는 항원-결합 키메라 단백질에 관한 것이고, 여기서 스캐폴드 단백질은 단량체 단백질이다. 대안적인 실시형태에서, 스캐폴드 단백질은 대칭 구조, 예컨대 다량체 또는 올리고머-형성 단백질 또는 바이러스-유사 입자 (VLP)와 같은 20면체 구조의 일부이거나 또는 그를 형성하는 단백질을 갖는다. 특정 실시형태에서, 스캐폴드가 다량체인, 상기 항원-결합 키메라 단백질은 상기 다량체 스캐폴드의 각각의 단량체를 통해 이의 접근가능한 부위(들)에서 Ig 도메인과 연결되거나 또는 융합된다. 다른 실시형태에서, 항원-결합 키메라 단백질의 항원-결합 도메인 및 스캐폴드 단백질은 항원-결합 도메인 및 스캐폴드 단백질 중 하나에 존재하는 2개 시스테인 잔기 사이에 공유적으로 형성된, 디술피드 결합을 통해 추가적으로 연결된다. 본 발명의 다른 실시형태는 스캐폴드 단백질(들)의 총 분자 질량이 적어도 30 kDa인, 항원-결합 키메라 단백질에 관한 것이다.
본 발명의 특정한 실시형태는 항원-결합 키메라 단백질에 관한 것으로서, 여기서 스캐폴드 단백질은 항원-결합을 포함한다. 특히, 상기 스캐폴드 단백질은 면역글로불린 도메인, 또는 보다 특히 VHH, ISVD, 또는 나노바디를 포함한다. 대안적으로, 상기 스캐폴드 단백질은 면역글로불린-유사 도메인, 보다 특히, 모노바디를 포함한다. 보다 특히, 항원-결합 키메라 단백질이 제공되고, 여기서 항원-결합 도메인을 비롯하여 항원-결합 도메인-함유 스캐폴드는 그들 항원 표적에 특이적으로 결합하는 기능성을 보유한다. 특별한 실시형태에서, 상기 항원-결합 도메인-함유 스캐폴드는 스캐폴드 단백질에 융합된 항원-결합 도메인과 상이한 표적에 결합된다. 대안적인 일 실시형태에서, 스캐폴드 단백질의 항원-결합 도메인의 항원 표적은 상기 스캐폴드 단백질과 융합된 항원-결합 단백질 도메인의 항원 표적과 동일하다. 보다 더 특히, 항원 표적은 항원-결합 키메라 단백질의 양쪽 항원-결합 도메인에 대해 동일한 단백질에 관한 것이지만, 항원 표적 상의 그들 에피토프는 상이하다.
다른 실시형태에서, 항원-결합 키메라 단백질의 스캐폴드 단백질은 표지된 단백질이다. 특별한 실시형태에서, 표지는 검출가능한 표지이다. 다른 실시형태에서, 항원-결합 키메라 단백질의 항원-결합 도메인은 표지된 항원-결합 도메인이다. 보다 특히, 항원-결합 도메인 또는 스캐폴드 단백질에 의해 융합 또는 연결 및/또는 제공되는 상기 표지는 신규 항원-결합 키메라 단백질의 항원-결합 도메인의 항원 표지의 생체 내 및/또는 비공유 검출 또는 표지화를 가능하게 한다. 특정 실시형태에서, 상기 표지된 항원-결합 키메라 단백질은 독성 표지를 포함할 수 있고, 치료 용도로 적용가능하다.
본 발명의 추가 양상은 상기 기술된 바와 같은 임의의 항원-결합 키메라 단백질을 코딩하는 핵산 분자에 관한 것이다. 대안적으로, 일 실시형태에서, 키메라 유전자는 적어도 프로모터, 항원-결합 키메라 단백질을 코딩하는 상기 핵산 분자, 및 전사 종결 신호를 함유하는 3' 말단 영역을 제공한다. 다른 실시형태는 상기 항원-결합 키메라 단백질을 코딩하거나, 또는 상기 항원-결합 키메라 단백질을 코딩하는 핵산 분자 또는 키메라 유전자를 포함하는 발현 카세트에 관한 것이다. 추가 실시형태는 본 발명의 항원-결합 키메라 단백질을 코딩하는 상기 발현 카세트 또는 핵산 분자를 포함하는 벡터에 관한 것이다. 특정 실시형태에서, 상기 벡터는 이. 콜라이, 또는 효모, 파지, 박테리아 또는 바이러스 (표면) 디스플레이에서 발현에 적합하다. 다른 실시형태에서, 본 발명의 항원-결합 키메라 단백질을 포함하는 숙주 세포를 개시한다. 대안적으로, 숙주 세포는 상기 항원-결합 키메라 단백질 및 이의 표적 항원을 공발현한다.
본 발명의 다른 양상은 상기 항원-결합 키메라 단백질, 및 이의 표적 단백질을 포함하는 복합체에 관한 것으로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합된다. 보다 특히, 상기 표적 단백질은 상기 항원-결합 키메라 단백질의 항원-결합 도메인, 보다 특히 Ig 도메인, 보다 더 특히 상기 항원-결합 키메라 단백질의 Ig 도메인의 CDR에 결합된다.
다른 실시형태는 상기 항원-결합 키메라 단백질을 포함하는 조성물, 보다 특히 상기 항원-결합 키메라 단백질의 약학 조성물을 제공한다.
본 발명의 다른 실시형태는 본 발명에 따른 제1 및 제2 항원-결합 키메라 단백질 간에 형성된 복합체를 포함하는 조성물에 관한 것으로서, 상기 제2 항원-결합 키메라 단백질의 항원-결합 도메인은 제1 항원-결합 키메라 단백질의 스캐폴드 단백질에 특이적으로 결합하거나 또는 그를 인식한다.
다른 양상은 표적 또는 항원 단백질의 구조 분석을 위한, 본 발명의 항원-결합 키메라 단백질의 용도, 또는 핵산 분자, 키메라 유전자, 발현 카세트, 벡터, 복합체, 또는 조성물의 용도에 관한 것이다. 특히, 항원-결합 키메라 단백질의 용도에 관한 것으로서, 여기서 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 결합되는 단백질이다. 특히 실시형태는 단일 입자 cryo-EM를 포함하거나 또는 결정학을 포함하는 구조 분석에서 항원-결합 키메라 단백질의 용도에 관한 것이다.
다른 실시형태는 진단 도구, 또는 보다 특히 생체내 영상화를 위한, 상기 항원-결합 키메라 단백질의 용도를 제공하고, 여기서 스캐폴드 단백질 또는 심지어 항원-결합 도메인은 표지된다.
대안적인 실시형태는 의약으로서 사용을 위한, 상기 기술된 바와 같은 상기 항원-결합 키메라 단백질, 또는 본 발명에서 제공되는 핵산 분자, 발현 카세트, 벡터, 복합체 또는 조성물의 용도를 제공한다.
특별한 실시형태는 본 발명의 항원-결합 키메라 단백질을 포함하는 바이러스-유사 입자 (VLP)에 관한 것이다.
본 발명의 제1 양상은 표적 또는 항원 단백질 또는 관심 단백질의 3-차원 구조를 결정하는 단계에 관한 것으로서, 하기 단계를 포함한다:
(i) 복합체를 형성하기 위해 본 발명의 항원-결합 키메라 단백질, 또는 본 발명의 항원-결합 키메라 단백질의 복합체를 포함하는 조성물, 및 표적 단백질을 제공하는 단계로서, 상기 표적 단백질은 항원-결합 키메라 단백질의 조성물에 특이적으로 결합하는 것인 단계,
또는 대안적으로, 본 발명의 복합체를 제공하는 단계; 및
(ii) 구조 분석을 위해, 적합한 조건 하에서 상기 믹스 또는 복합체를 디스플레이하는 단계,
여기서 상기 항원 또는 표적 단백질의 3D 구조는 고분해능으로 결정된다.
기술된 도면은 단지 개략적이며 제한되지 않는다. 도면에서, 일부 구성요소의 크기는 과장될 수 있으며 예시 목적을 위해 비율에 맞게 도시되지 않는다.
도 1. 강성 항원-결합 키메라 단백질과 비교한 가요성 융합 단백질
(A) 오직 하나의 직접 융합 또는 링커를 사용하는 스캐폴드 단백질 및 항원-결합 도메인의 N-말단 또는 C-말단에서의 가요성 융합체 또는 링커. (B) 항원-결합 도메인이 적어도 2개의 직접 융합 또는 항원-결합 도메인을 스캐폴드에 연결시키는 링커를 통해서 스캐폴드 단백질과 융합된 것인, 항원-결합 도메인 및 스캐폴드 단백질의 강성 융합체.
도 2. 나노바디의 β-스트랜드 A 및 B를 연결시키는 제1 β-턴에 삽입된 스캐폴드 단백질의 원형 배열 변이체로부터 구축된 항원-결합 키메라 단백질의 조작 원리.
이러한 계획은 나노바디 (Nb)가 항원-결합 도메인을 스캐폴드에 연결시키는 2개의 짧은 링커 또는 2개의 펩티드 결합을 통해 거대한 스캐폴드 단백질 상에 그라프트될 수 있는 방법을 도시한다. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출 턴이 절단되어야 하는가를 표시한다. 파선은 스캐폴드 및 Nb의 나머지 부분이 항원-결합 키메라 단백질을 구축하기 위해서 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT (도 25, [Lefranc, 2014]으로부터 개조)에 따라 정의된다.
도 3. GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결시키는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델
(A) 스캐폴드에 나노바디를 연결시키는 2개의 펩티드 결합 또는 링커를 통해서 에이치. 피로리 (H. pylori) (아래)의 HopQ의 어드헤신 도메인의 원형 배열 변이체 및 GFP-특이적 나노바디 (위)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 모델. (B) 헬리코박터 피로리 (Helicobacter pylori) 균주 G27의 1형 HopQ의 어드헤신 도메인을 코딩하는 원형 배열 유전자 (아래, PDB 5LP2, SEQ ID NO:19, cHOPQ)는 β-스트랜드 A를 β-스트랜드 B에 연결시키는 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 제1 β-턴 (β-턴 AB)에 삽입되었다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (MbNb207 cHopQ, SEQ ID NO:20). 나노바디로부터 기원된 서열은 굵게 도시된다. HopQ로부터 기원된 서열은 밑줄표시되어 있다. 원형 배열체를 만들기 위해 HopQ의 N-말단 및 C-말단을 연결시키는 펩티드는 이탤릭체로 도시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 4. EBY100 효모 세포 표면 상의 항원-결합 키메라 단백질 Mb Nb207 cHopQ 디스플레이의 유세포측정 분석
단일 매개변수 히스토그램은 비형질전환된 EBY100 효모 세포 (아래)와 비교한 Aga2p 및 ACP (SEQ ID NO:22)에 융합된 항원-결합 키메라 단백질 MbNb207 cHopQ 를 코딩하는 pCTCON2 유도체로 형질전환된 EBY100 효모 세포 (위)의 상대적 형광 강도를 도시한다. 형질전환 및 비형질전환 효모 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색되었다.
도 5. EBY100 효모 세포 표면 상에 디스플레이된 항원-결합 키메라 단백질 Mb Nb207 cHopQ 의 기능성의 유세포측정 분석
비형질전환된 EBY100 효모 세포 (아래)와 비교하여 Aga2p 및 ACP에 융합된 MbNb207 cHopQ 를 코딩하는 pCTCON2 유도체 (SEQ ID NO:22)로 형질전환된 개별 EBY100 효모 세포 (위)의 상대적 형광 강도를 나타내는 점 그래프. 형질전환 및 비형질전환 효모 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색되었고 100 nM GFP와 인큐베이션되었다.
도 6. 크기 배제 크로마토그래피 및 SDS-PAGE에 의한 항원-결합 키메라 단백질 Mb Nb207 cHopQ 및 GFP 간 복합체의 형성의 분석 분석
MbNb207 cHopQ (SEQ ID NO:20) 및 녹색 형광 단백질 (GFP) 간 안정한 복합체의 형성을 확인하기 위한 Superdex 75 PG 컬럼 (16/90, GE Healthcare) 상에서의 분석적 겔 여과 실험 (Scholz et al., 2000). (A) SEC에 의한 복합체 형성의 분석. 회색선: UV 280 nm 흡광도를 통해 측정된 GFP를 단독으로 함유하는 샘플의 겔 여과 패턴. 검은색 파선: UV 280 nm 흡광도를 통해 측정된 1:4 몰비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플의 겔 여과 패턴. 검은색선: UV 488 nm 흡광도로 측정된 1:4 비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플의 겔 여과 패턴. (B) SDS-PAGE를 통한 항원-결합 키메라 단백질 MbNb207 cHopQ 및 GFP 간 안정한 복합체 형성의 확인. 1:4 몰비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플을 Superdex 75 PG 컬럼에 도포하였고 상대적 분획을 SDS-PAGE를 통해 분석하였다.
도 7. GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 X-선 결정 구조.
(A) 비대칭 유닛으로 10 GFP-결합 키메라 단백질의 정렬 (만화 도면). 비대칭 유닛으로 10개 분자를 갖는 공간군 P1에서 결정화된 58 kD 항원-결합 키메라 단백질 MbNb207 cHopQ (SEQ ID NO:20). 스캐폴드로서 사용된 HopQ (PDB 5LP2)의 어드헤신 도메인은 붉은색으로 도시되고, GFP-특이적 Nb는 녹색으로 도시된다. (B) 나노바디를 스캐폴드에 연결시키는 펩티드 (분자 A)는 1.0σ에서 등고선이 그려진 2Fo-Fc 전자 밀도 지도에서 분명하게 정의된다. (C) 비대칭 유닛으로 함유된 모든 항원-결합 키메라 단백질 MbNb207 cHopQ 의 구조적 정렬. 비대칭 유닛의 상이한 분자 간 RMSD는 0.3 내지 2.7Å 범위이다.
도 8. 스캐폴드 단백질 HopQ를 나노바디에 연결하는 링커 펩티드의 조성 및 길이의 최적화를 위한 효모 디스플레이 벡터
(A) 디스플레이 벡터의 개략도. LS: 효모에서 세포외 분비를 유도하는 효모 α-인자의 조작된 분비 신호, appS4 (Rakestraw et al. 2009). N: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13),
Figure pct00001
: 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), Aga2: Aga1p 단백질에 대한 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛 (Chao et al., 2006), ACP: 그 발현 수준을 모니터링하기 위해 디스플레이된 항원-결합 키메라 단백질의 직교적 표지화를 위한 아실 캐리어 단백질 (Johnsson et al., 2005). (B) 디스플레이된 항원-결합 키메라 단백질의 서열 다양성 (SEQ ID NO:34-37): 보통체의 AppS4 리더 서열, 굵은체로 표시된 무작위 링커를 갖는 메가바디 cHopQNb GFP 207, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 이탤릭체의 가요성 (GGGS) n 폴리펩티드 링커, 밑줄표시된 Aga2p 단백질 서열,
Figure pct00002
, cMyc 태그. (C) 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커를 도입시키기 위해 2종의 전방향 (SEQ ID NO:126, SEQ ID NO:127) 및 2종의 역방향 PCR 프라이머 (SEQ ID NO:128, SEQ ID NO:129)의 등몰량 혼합물을 사용하여, 총 184.000 AA-서열 변이체를 코딩하는, 항원-결합 키메라 단백질 서열의 4개 풀을 생성시켰다 (각각 라이브러리의 25%를 나타냄).
도 9. 시험관내 선택을 통한 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 YgjK의 원형 배열 변이체로부터 구축된 100 kDa 항원-결합 키메라 단백질의 모델.
(A) GFP-특이적 나노바디 (위) 및 에스케리치아 콜라이 (Escherichia coli) K12 YgjK (아래)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. (B) 에스케리치아 콜라이 K12 YgjK를 코딩하는 원형 배열 유전자 (PDB 3W7S, SEQ ID NO:38)는 YgjK 단백질이 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커를 사용하여 β-스트랜드 A를 β-스트랜드 B에 연결하는 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 제1 β-턴 (β-턴 AB)에 삽입되어 융합되었다. (C) 100 kDa 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:39-42). 굵은체는 Nb GFP 207 서열, 이탤릭체는 원형 배열 링커, 밑줄표시된 Ygjk 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. C-말단 태그는 6xhis 및 EPEA를 포함한다.
도 10. 스캐폴드에 나노바디를 연결하는 조작된 디술피드 결합에 의해 더욱 강성화된, GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD 항원-결합 키메라 단백질.
β-스트랜드 A를 β-스트랜드 B에 연결하는 GFP-특이적 나노바디 (SEQ ID NO:1)의 제1 β-턴 (AB β-턴)에 삽입된 헬리코박터 피로리 균주 G27 (아래, PDB 5LP2, SEQ ID NO:19)의 1형 HopQ의 어드헤신 도메인으로부터 구축된 항원-결합 키메라 단백질의 강성을 더욱 증가시키기 위해서, 나노바디를 스캐폴드에 연결시키는 추가 디술피드 결합을 조작하기 위해 부위-지정 돌연변이유발법을 사용하였다. (A) C357 및 C425 사이에 조작된 디술피드 브릿지를 함유하는 항원-결합 키메라 단백질 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:48). (B) C358 및 C488 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ의 돌연변이체의 모델 (SEQ ID NO:49). (C) C359 및 C490 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:50). (D) C15 및 C534 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:51).
도 11. 면역글로불린을 스캐폴드에 연결시키는 3개 펩티드 결합 또는 짧은 링커를 통한 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 스캐폴드 단백질로부터 구축된 항원-결합 키메라 단백질의 조작 원리
항원-결합 도메인은 3개의 직접 융합 또는 링커를 통해 만들어진 3개 융합을 통해서, 노출 영역 또는 β-턴 내 하나 이상의 접근가능한 부위, 및/또는 단백질 말단의 접근가능한 부위에서 스캐폴드 단백질에 융합될 수 있다. 이러한 계획에서, 3개 펩티드 결합 또는 짧은 링커를 통해서 스캐폴드에 Ig 도메인을 연결시키기 위해 나노바디의 C-말단부 및 β-턴 AB를 사용하였다. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출된 턴을 절단시켜야 하는가를 의미한다. 파선은 이러한 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 스캐폴드 및 Nb의 나머지 부분이 어떻게 쇄상화되어야 하는가를 보여준다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조).
도 12. 면역글로불린을 스캐폴드에 연결시키는 3개의 펩티드 결합 또는 짧은 링커를 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 Cu ++ -결합 단백질 아주린으로부터 구축된 항원-결합 키메라 단백질의 모델.
(A) 3개 펩티드 링커를 통해서 슈도모나스 애루지노사 (Pseudomonas aeruginosa)의 아주린 (아래, PDB 2TSA, SEQ ID NO:52)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 모델. 구리 이온은 파란색으로 도시된다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 스캐폴드 단백질 (아주린)의 N-말단부가 후속되고, 그 다음으로 면역글로불린의 C-말단부가 후속되고, 이후에 스캐폴드 (아주린)의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:53-60): 굵은체는 Nb GFP 207 서열, 밑줄표시된 아주린 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 13. 면역글로불린을 스캐폴드에 연결하는 3개 펩티드 결합 또는 링커를 통해서 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 전화성 글리코시드 히드롤라제 스캐폴드 단백질 SusB로부터 구축된 이중 대칭성의 이량체 항원-결합 키메라 단백질의 모델.
(A) 3개 펩티드 링커를 통해서 박테로이데스 테타이오타오미크론 (Bacteroides thetaiotaomicron) SusB의 전화성 글리코시드 히드롤라제 (아래, PDB 3WFA, SEQ ID NO:69)에 연결되는 GFP-특이적 나노바디 (위 좌측 및 우측, SEQ ID NO:1)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. SusB는 이중 대칭성을 갖는 절대 이량체이다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 스캐폴드 단백질 (SusB)의 N-말단부가 후속되고, 그 다음으로 면역글로불린의 C-말단부가 후속된 다음에, 스캐폴드의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. 굵은체는 Nb GFP 207 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 밑줄표시된 susB 서열. C-말단 태그는 6xhis 및 EPEA를 포함한다.
도 14. 박테리오파지 PP7로부터 유래된 20면체 VLP 상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 (VLP) (내부 분자)의 개략도. 야생형 20면체 PP7 바이러스는 180개의 동일한 카피의 PP7 외피 단백질로 구성된 T=3 쉘을 갖지만, 2개 외피 단백질은 N을 C에 융합시킬 수 있어서 90개의 공유 외피 단백질 이량체로 구성된 VLP를 생성시킬 수 있다 (O'Rourke et al., 2015). (B) 슈도모나스 애루지노사 (아래, PDB 1DWN)의 박테리오파지 PP7의 공유 외피 단백질 이량체의 원형 배열 변이체에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 항원-결합 키메라 단백질의 모델. (C) PP7의 배열된 외피 단백질 이량체와 나노바디의 연결 개략도. PP7의 이러한 공유 외피 단백질 이량체를 코딩하는 원형 배열 유전자는 β-스트랜드 A를 β-스트랜드 B에 연결하는 나노바디의 제1 β-턴에 삽입되었다 (SEQ ID NO:3-6). (D) 항원-결합 키메라 외피 단백질의 아미노산 서열. 나노바디로부터 기원된 잔기는 굵은체로 도시된다. (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. PP7 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 15. 박테리오파지 MS2로부터 유래된 20면체 VLP 상의 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 VLP (내부 분자)의 개략도. 야생형 MS2 바이러스는 180개의 동일한 카피의 MS2 외피 단백질로 구성된 20면체 쉘을 형성하지만, 2개 외피 단백질은 N을 C에 융합시킬 수 있어서 90개 공유 외피 단백질 이량체로 구성된 VLP를 생성시킬 수 있다 (O'Rourke et al., 2015). (B) 에스케리치아 콜라이의 박테리오파지 MS2의 공유 외피 단백질 이량체의 원형 배열 변이체 (아래, PDB 2MS2)에 연결된 리소자임-특이적 나노바디 (위, SEQ ID NO:7)를 포함하는 항원-결합 키메라 단백질의 모델. (C) MS2의 배열된 외피 단백질 이량체와 나노바디의 연결 개략도. MS2의 이러한 공유 외피 단백질 이량체를 코딩하는 원형 배열 유전자는 β-스트랜드 A를 β-스트랜드 B에 연결하는 나노바디의 제1 β-턴에 삽입되었다 (SEQ ID NO:9). (D) 항원-결합 키메라 외피 단백질의 아미노산 서열. 나노바디로부터 기원된 잔기는 굵은체로 도시된다. (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. MS2 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 16. 항원-결합 도메인을 ACP에 연결하는 2개 펩티드 결합 또는 짧은 링커를 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입되는 아실 캐리어 단백질로부터 구축된 항원-결합 키메라 단백질의 모델
(A) 2개 펩티드 링커를 통해서 이. 콜라이 유래 아실 캐리어 단백질 (아래, PDB 1T8K, SEQ ID NO:86)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. 이러한 특정한 항원-결합 키메라 단백질에서, 야생형 ACP의 N-말단 및 C-말단이 서로 가깝게 있고 나노바디를 ACP에 연결하는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되어 있기 때문에 스캐폴드 단백질의 원형 배열을 필요로 하지 않았다. 반응성 세린은 좌측 아래에 표시되어 있다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 ACP가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, ACP 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 17. 양쪽 면역글로불린 도메인을 연결하는 3개 펩티드 결합 또는 짧은 링커를 통해 다른 나노바디에 삽입되는 나노바디로부터 구축된 항원-결합 키메라 단백질의 조작 원리.
이러한 개략도는 나노바디 (Nb)가 하나의 항원-결합 도메인을 다른 것에 연결시키는 3개 펩티드 결합 또는 3개 짧은 링커를 통해서 다른 나노바디와 어떻게 융합될 수 있는가를 도시한다. 가위표는 어떠한 노출 턴이 연결하려는 나노바디에서 절단되어야 하는가를 표시한다. 파선은 이들 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 양쪽 나노바디의 나머지 부분이 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조).
도 18:나노2바디 항원-결합 키메라 단백질의 모델
(A) 도 17에 따른 3개 펩티드 링커를 통해서, 리소자임-결합 나노바디 (나노바디 A, SEQ ID NO:7)에 연결시킨 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A와 나노바디 B의 연결 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:14).
Figure pct00003
, Nb GFP 207 서열은 굵은체이고, 리소자임-결합 나노바디 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 19: 나노2바디 항원-결합 키메라 단백질의 모델
(A) 도 17에 따른 3개 펩티드 링커를 통해서, FedF-결합 나노바디 (나노바디 A, SEQ ID NO:17)에 연결된 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A와 나노바디 B의 연결 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:18).
Figure pct00004
, Nb GFP 207 서열은 굵은체이고, FedF-결합 나노바디 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 20. 파지 디스플레이 또는 효모 디스플레이를 통한 나노바디 면역 라이브러리로부터 유래된 항원-결합 키메라 단백질의 생성 및 선택을 위한 대표 벡터.
여기 도시된 벡터는 나노바디가 항원-결합 도메인을 스캐폴드에 연결시키는 2개 펩티드 결합 또는 2개 짧은 링커를 통해서 거대한 (임의로, 원형 배열) 스캐폴드 단백질과 융합된 항원-결합 키메라 단백질을 코딩한다. LS: 리터 서열. pIII: 사상 파지 M13의 부착 단백질. Aga2: 효모 세포 표면으로부터 돌출되는 Aga2p 메이팅 단백질. ACP: 그 발현 수준을 모니터링하기 위해 디스플레이된 항원-결합 키메라 단백질의 직교적 표지화를 위한 아실 캐리어 단백질. 거대 항원-결합 키메라 단백질 디스플레이 라이브러리는 예를 들어 나노바디의 경우에 면역화된 라마로부터 클로닝되거나 또는 합성 라이브러리로부터 수집될 수 있는 항원-결합 도메인-코딩 유전자의 컬렉션으로부터 C-말단부 (β-스트랜드 B 내지 G 포함)를 클로닝하여 구축될 수 있다.
도 21. 나노바디 면역 라이브러리로부터 유래되고 효모 디스플레이를 통해 선택된 후 FACS에 의한 GFP-특이적 항원-결합 키메라 단백질의 서열 분석
GFP로 면역화시킨 라마의 혈액 샘플로부터 클로닝시키고 그 다음에 HopQ와 융합된 나노바디로부터 출발하여 구축된 항원-결합 키메라 단백질로부터 효모 디스플레이를 통해 선택한 후에 FACS를 수행한 9종의 GFP-특이적 항원-결합 키메라 단백질 (SEQ ID NO:95-103)의 다중 아미노산 서열 정렬. β-스트랜드 B 내지 β-스트랜드 G를 포함하는 나노바디의 C-말단부만이 도시된다.
도 22. GFP-특이적 나노바디의 β-스트랜드 C 및 C'을 연결하는 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델.
(A) β-스트랜드 C 및 C'을 연결하는 β-턴을 통해 나노바디 상에 스캐폴드를 그라프트시키기 위한 조작 원리. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출 턴이 절단되어야 하는가를 표시한다. 파선은 이들 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 스캐폴드 및 나노바디의 나머지 부분이 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조). (B) 2개 펩티드 링커를 통해서 HopQ (아래)에 연결된 GFP-특이적 나노바디 (위)의 융합으로 만들어진 항원-결합 키메라 단백질의 3D 모델. (C) 나노바디의 제3 β-스트랜드 (β-스트랜드 C)는 스캐폴드의 원형화 변이체가 후속되고, 그 다음으로 GFP-특이적 나노바디의 β-스트랜드 C' 내지 G가 후속된다. (D) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, 원형 배열 링커는 이탤릭체이며, HopQ 서열은 밑줄표시된다.
도 23. 모노바디 NS1의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델.
(A) 나노바디를 스캐폴드에 연결시키는 2개 펩티드 결합 또는 링커를 통해서 K-Ras 특이적 모노바디 NS1 (위) 및 에이치. 피로리 HopQ의 어드헤신 도메인의 원형 배열 변이체 (아래)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. (B) 헬리코박터 피로리 균주 G27의 1형 HopQ의 어드헤신 도메인을 코딩하는 원형 배열 유전자 (아래, PDB 5LP2, SEQ ID NO:19)는 β-스트랜드 A를 β-스트랜드 B에 연결시키는 K-RAS 특이적 모노바디 (위, SEQ ID NO:112)의 제1 β-턴 (β-턴 AB)에 삽입되었다. (C) NS1 및 HopQ로부터 구축된 항원-결합 키메라 단백질의 아미노산 서열. 나노바디로부터 기원된 서열은 굵은체로 도시된다. HopQ로부터 기원되는 서열은 밑줄표시되어 있다. 원형 배열체를 만들기 위해 HopQ의 N-말단 및 C-말단을 연결하는 펩티드는 이탤릭체로 도시되어 있으며, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성물의 짧은 펩티드 링커이다.
도 24. Octet 상에서 분석된 GFP와 항원-결합 키메라 단백질 Mb Nb207 cHopQ 및 Mb Nb207 cYgjkE2 의 상호작용의 운동학적 특징규명 .
생물층 간섭계를 통한 GFP와 GFP-결합 나노바디 NbGFP207 (SEQ ID NO:1), 항원-결합 키메라 단백질 MbNb207 cHopQ (SEQ ID NO:20) 및 MbNb207 cYgjkE2 (SEQ ID NO:141)의 실시간 운동학적 분석. 스트렙타비딘-코팅된 Octet ® 바이오센서는 바이오틴화된 GFP (0.75 ㎍/mL)를 포획하는데 사용하였고 몇몇 농도 (60 - 2.22 nM 범위)의 NbGFP207 (A), MbNb207 cHopQ (B) 및 MbNb207 cYgjkE2 (C)와 연관시켰다. 측정된 반응 (검은색선)은 단상성 1:1 결합 모델 (붉은색선)에 적합화시켰다. 어세이는 10 mM Tris-HCl, 140 mM NaCl, pH 7.3, 0.05% Tween20 및 1 mg/mL BSA에서 실시하였다. (D) 계산된 운동학적 값은 n = 3회의 독립 실험으로부터의 평균의 평균 표준 오차 (s.e.m)로서 표시된다.
도 25. [LeFranc (2014)]로부터 개조된 바와 같은, IMGT에 따른 면역글로불린 가변 도메인 구조 및 토폴로지
(A) IMGT 스트랜드 및 루프 한계의 3D 구조 리본 도면 (LFranc et al., 2003). (B) 수소 결합을 갖는 2개 층 상의 IMGT 콜리어 드 페를레 (Collier de Perles). 2개 층 상의 IMGT 콜리어 드 페를레는 최선두에, GFCC'C" 스트랜드 (IG의 계면 VH/VL에 위치된 시트를 형성), 및 뒷쪽에 ABED 스트랜드를 보여준다. 수소 결합을 갖는 IMGT 콜리어 드 페를레 (선 중에서 녹색선, 여기서는 오직 GFCC0C00 시트만을 도시)는 실험 3D 구조 데이터로부터, IMGT/3Dstructure-DB에 통합된 IMGT/Collier-de-Perles 도구를 통해 생성된다 (Kaas et al., 2004; Ehrenmann et al., 2010, Ehrenmann and LeFranc, 2011).
도 26. 다른 항원-결합 키메라 단백질에 결합하여 확장된 항원-결합 키메라 단백질의 개략도.
(A) MbNb60 c7HopQmut2 (SEQ ID NO:134) 또는 MbNb60 c7HopQmut3 (SEQ ID NO:134)은 다른 MbNb207 cHopQ (SEQ ID NO:20)에 결합하여 확장되어 116 kDa의 확장된 항원-결합 키메라 단백질을 생성한다. (B) MbNb60 cYgjK(SEQ ID NO:135)는 MbNb207 cHopQ (SEQ ID NO:20)에 결합 및 확장되어, 168 kDa 분자량의 확장된 항원-결합 키메라 단백질을 생성시킨다.
27. Mb Nb207 cHopQ 와 복합체의 Nb60의 결정 구조는 Mb Nb207 cHopQ 의 cHopQ에 함유된 스캐폴드 단백질 상의 Nb60의 에피토프를 밝혀준다.
도 28. 통합된 화학 링커 유닛을 사용해 스캐포로드 단백질에 연결된 항원-결합 도메인을 갖는, 항원-결합 키메라 단백질의 개략도.
도 29. Octet 상에서 분석된 Mb Nb207 cHopQ 와 폴리바디라고 하는 항원-결합 키메라 단백질의 상호작용의 운동학적 특징규명 .
생물층 간섭계에 의한 HopQ-특이적 나노바디 Nb60 (SEQ ID NO:132), HopQ-특이적 MbNb60 cHopQmut2 (SEQ ID NO:133), HopQ-특이적 MbNb60 cHopQmut3 (SEQ ID NO:134) 및 HopQ-특이적 MbNb60 cYgjkE2 (SEQ ID NO:135)와 MbNb207 cHopQ (SEQ ID NO:20)의 결합에 대한 실시간 운동적학 분석. 스트렙타비딘-코팅된 Octet ® 바이오센서가 바이오틴화된 MbNb207 cHopQ (0.25 ㎍/mL)를 포획하는데 사용되었다. 몇몇 농도 (1.67 내지 500 nM 범위)에서 결합 및 해리 등온선을 Nb60 (A), MbNb60 cHopQmut2 (B), MbNb60 cHopQmut3 (C) and MbNb60 cYgjkE2 (D)에 대해 모니터링하였다. 모든 어세이는 10 mM Tris-HCl, 140 mM NaCl, pH 7.3, 0.05% Tween20 및 1 mg/mL BSA에서 실시하였다.
도 30. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 cHopQ 변이체의 기능성의 유세포측정 분석.
MbNb207 cHopQ (SEQ ID NO:22) 및 대표적인 효모-디스플레이 선택된 MbNb207 cHopQ 변이체 (표 2)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이하였다. 개별 효모 클론을 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색시키고 100 nM GFP와 인큐베이션시켰다. MP1331_A9 메가 바디 변이체 (A) MbNb207 cHopQ (B)를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 광도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용하여 각각의 개별 효모 클론에 대해 계산하였다. (C) MbNb207 cHopQ (SEQ ID NO:22) 및 각각의 개별 MbNb207 cHopQ 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 2).
도 31. 이. 콜라이 발현 및 니켈 친화성 크로마토그래피 정제 이후 Mb Nb207 c7HopQ 및 4종의 효모-디스플레이 선택된 Mb Nb207 c7HopQ 변이체의 크기 배제 크로마토그래피 특징규명.
효모 디스플레이에 의해 선택된 1-1 아미노산 펩티드 링커를 갖는 이. 콜라이 발현된 MbNb207 c7HopQ 변이체의 Superdex 200 PG 컬럼 (10/300, GE Healthcare) 상에서의 분취형 겔 여과 실험. MbNb207 c7HopQ (SEQ ID NO: 136) 클론은 야생형 연결 변이체를 나타내고 MbNb207 c7HopQ A5 (SEQ ID NO: 137), MbNb207 c7HopQ A12 (SEQ ID NO: 138), MbNb207 c7HopQ B7 (SEQ ID NO: 139), MbNb207 c7HopQ G10 (SEQ ID NO: 140)은 각각 표 2의 MP1331_A5, MP1331_A12, MP1331_B7, MP1331_G10 클론을 나타낸다.
도 32. ELISA에 의한 Mb Nb207 c7HopQ 및 4종의 효모-디스플레이 선택된 변이체의 GFP 결합 분석.
크기 배제 정제된 MbNb207 c7HopQ (SEQ ID NO: 136), 4종의 효모-디스플레이 선택된 MbNb207 c7HopQ A5, MbNb207 c7HopQ A12, MbNb207 c7HopQ B7, MbNb207 c7HopQ G10 변이체 (SEQ ID NO: 137-140) 및 MbNb38 cHopQ (SEQ ID NO: 131)는 고정된 GFP를 함유하는 웰 또는 비코팅된 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-태그) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)와 인큐베이션 후에 측정하였다. 데이타는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m)로서 표시된다.
도 33. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 cYgjk 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 cYgjk 변이체 (표 3)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션하였다. (A) MP1333_A2 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각각의 개별 효모 클론에 대해 계산하였다. (B) 각각의 개별 MbNb207 cYgjk 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 3).
도 34. ELISA로 분석된, 4종의 효모-디스플레이 선택된 Mb Nb207 cYgjk 변이체의 GFP 결합.
상이한 Mb Nb207 cYgjk 변이체 (SEQ ID NO:141-144)를 함유하는 주변세포질 추출물: MbNb207 cYgjkE2, MbNb207 cYgjkA2, MbNb207 cYgjkC4, MbNb207 cYgjkF5 변이체를 MbNb38 cHopQ (SEQ ID NO: 131)와 비교하였다. 모든 샘플은 고정된 GFP를 함유하는 웰 또는 비코팅된 웰에서 인큐베이션하였다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션한 후에 측정하였다.
도 35. 크기 배제 크로마토그래피에 의한 이. 콜라이에서 발현되고 니켈 친화성 크로마토그래피로 정제된 Mb Nb207 cYgjk E2 변이체의 특징규명.
(A) 이. 콜라이의 주변세포질에서 발현시키고 분취형 Superdex 200 PG 겔 여과 컬럼 (16/26, GE Healthcare) 상에서 니켈 친화성 크로마토그래피로 정제된 MbNb207 cYgjkE2 (SEQ ID NO:141)의 분석. (B) (A)에 기술된 크기 배제 실험으로부터의 '피크 1' 분획 중 MbNb207 cYgjkE2 메가바디 순도의 SDS-PAGE 분석. 정제된 MbNb207 cYgjkE2의 샘플 (좌측 라인: '피크 1)을 8% SDS-PAGE 겔에 적용하였고 약 100 kDa의 분자 질량을 분자 질량 마커 (우측 라인: M)와 비교하여 확인하였다.
도 36. 나노바디를 스캐폴드에 연결하는 조작된 디술피드 결합에 의해 더욱 강성화된 Mb Nb207 cHopQ 변이체의 기능성 및 생물리적 특징규명.
10종 MbNb207 cHopQ 변이체의 GfP 결합 분석은 ELISA를 통해 분석하였다. (A) 크기-배제 정제된 MbNb207 cHopQ (SEQ ID NO:20) 및 4종 MbNb207 cHopQ Cys1-4 변이체 (SEQ ID NO:48-51, 도 10 참조)는 고정된 GFP 함유 웰 또는 비코팅된 웰에서 인큐베이션시켰다. (B) 크기-배제 정제된 MbNb207 c7HopQ (SEQ ID NO:136) 및 4종의 MbNb207 c7HopQ Cys5-10 변이체 (SEQ ID NO:145-150)는 고정된 GFP 함유 웰 또는 비코팅된 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m.)로서 표시된다. (C) MbNb207 cHopQ 변이체의 열안정성 분석은 열 이동 어세이 (TSA)를 통해 수행하였다. MbNb207 c7HopQ (SEQ ID NO: 136), MbNb207 cHopQ Cys4 (SEQ ID NO: 51), MbNb207 c7HopQCys5 (SEQ ID NO:145), MbNb207 c7HopQ Cys6 (SEQ ID NO:146) 및 MbNb207 c7HopQ Cys10 (SEQ ID NO:150) 변이체에 대한 정규화된 용융 프로파일 그래프. 계산된 용융 온도 (Tm) 값은 표 4에 열거되어 있다.
도 37. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 아주린 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 아주린 변이체 (표 5)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션시켰다. (A) MP1304_B2 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도는 Prism 7 소프트웨어 (GraphPad)를 가용해 각 개별 효모 클론에 대해 계산되었다. (B) 각각의 개별 MbNb207 아주린 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 5).
도 38. ELISA에 의한 8종 효모-디스플레이 선택된 Mb Nb207 아주린 변이체의 GFP 결합 분석.
상이한 MbNb207 아주린 변이체 (SEQ ID NO:151-158)를 함유하는 8종의 주변세포질 추출물 및 MbNb38 cHopQ (SEQ ID NO: 131)를 함유하는 하나의 추출물을 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m.)로서 표시된다.
도 39. ELISA에 의한 GFP 결합 분석
상이한 MbNb207 cPP7x2L 키메라 단백질 (SEQ ID NO: NO:3-6)을 함유하는 주변세포질 추출물은 고정된 GFP (0,1 ㎍/웰)를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 키메라 cPP7 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정하였다.
도 40: 박테리오파지 AP205로부터 유래된 20면체 VLP상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90 카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 VLP (내부 분자)의 개략도. (B) 아시네토박터 박테리아의 20면체 RNA 박테리오파지, AP205의 공유 외피 단백질 이량체 (아래, PDB 5FS4)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 항원-결합 키메라 단백질의 모델. (C) AP205의 외피 단백질에 나노바디를 연결하는 개략도. (D) 항원-결합 키메라 외피 단백질의 아미노산 서열 (SEQ ID NO: 167). 나노바디로부터 기원된 잔기는 굵은체로 표시된다. X는 1개 아미노산의 짧은 무작위 펩티드 링커이다. AP205 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 41. ELISA에 의한 372 클론의 GFP 결합 분석
MbNb207 AP205x2XX 이량체 (SEQ ID NO: 167)를 함유하는 주변세포질 추출물 (MP 번호로서 표시)은 고정된 GFP (0,1 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. 키메라 AP205 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후에 측정하였다.
도 42: 이량체 항원-결합 키메라 단백질 상에서 나노바디의 강성 디스플레이. 
(A) β-스트랜드 A 교환이 존재하는 이량체 항원 결합 키메라 단백질의 모델. AP205 단량체는 이량체로 조립된다. 기능성 항원 결합 키메라를 수득하기 위해서, 이량체 항원-결합 키메라 단백질로 조립되도록 제1 단량체의 GFP-결합 나노바디의 β-스트랜드 A는 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G와 조합될 필요가 있고, 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G는 제1 단량체의 GFP-결합 나노바디의 β-스트랜드 A와 조합될 필요가 있다. (B) 그들 각각이 AP205의 외피 단백질 단량체에 연결된 2종의 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 동일한 이량체 항원-결합 키메라 단백질 (90°회전)의 모델. (C) AP205의 외피 단백질에 나노바디를 연결하는 개략도. (D) 항원-결합 키메라 외피 단백질의 아미노산 서열 (SEQ ID NO: 173). 나노바디로부터 기원된 잔기는 굵은체로 표시된다. X는 1개 아미노산의 짧은 무작위 펩티드 링커이다. AP205 외피 단백질에 상응하는 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.   
도 43. ELISA에 의한 372 클론의 GFP 결합 분석
MbNb207 AP205XX (SEQ ID NO: 173)의 이량체를 함유하는 주변세포질 추출물 (MP 번호로서 표시)은 고정된 GFP (0,1 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. AP205 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA 항체 (Capture select C-tag)를 사용해 수행되었다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정되었다.
도 44. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 ACP 나노툴 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 ACP 나노툴 (NanoTool) 변이체 (표 9)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도되었고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색되었고 100 nM GFP와 인큐베이션되었다. (A) MP1302_D10 나노툴 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (나노툴 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각 개별 효모에 대해 계산되었다. (B) 각각의 개별 MbNb207 ACP 나노툴 변이체 (표 9)에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프.
도 45. ELISA에 의한 6종의 효모-디스플레이 선택된 Mb Nb207 ACP 나노툴 변이체의 GFP 결합 분석.
6종 MbNb207 ACP (SEQ ID NO:178-183) 변이체 및 MbNb38 cHopQ (SEQ ID NO: 131)를 함유하는 주변세포질 추출물을 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터 평균의 평균 표준 오차 (s.e.m.)로서 표시된다.
도 46. 나노2바디 항원-결합 키메라 단백질의 모델.  
(A) 도 17에 다른 3개 펩티드 링커를 통해서, FedF-결합 나노바디 (나노바디 A, SEQ ID NO:17)에 연결된 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합을 통해 만들어진 에너지적으로 더 양호한 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A를 나노바디 B에 연결하는 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:184-185).
Figure pct00005
, Nb GFP 207 서열은 굵은체이고, FedF-결합 나노바디 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 47. ELISA에 의한 대표적 클론의 GFP 및 FedF 결합 분석
반정제된 N2body 샘플 (SEQ ID NO: 186-191)은 고정된 GFP (0,5 ㎍/웰), 고정된 FedF (0,5 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. 나노2바디의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA 항체 (Capture select C-tag)를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후에 측정하였다.
도 48. EBY100 효모 세포 표면 상에 디스플레이된 cHopQNb GFP 207 CC' 메가바디 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 cHopQNbGFP207X CC' 메가바디 변이체 (표 11)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션시켰다. (A) MP1327_D5 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각각의 개별 효모에 대해 계산하였다. (B) 각각의 개별cHopQNbGFP207CC' 메가바디 변이체 (표 11)에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프.
도 49. EBY100 효모 세포 표면 상에 디스플레이된 Mb NS1 cHopQ 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNS1 cHopQ 변이체 (표 12)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-488 (2 μM)로 염색하였고 100 nM의 Dylight-647-표지된 K-RAS와 인큐베이션시켰다. (A) MP1326_A11 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-488 형광도 (메가바디 디스플레이 수준) 및 상대적 Dylight-647 형광도 (K-Ras 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)을 사용하여 각 개별 효모 클론에 대해 계산하였다. (B) 각각의 개별 MbNS1 cHopQ 변이체 (표 12)에 대한 상대적 CoA-488 및 Dylight-647 형광도의 계산된 형광 강도 (MFI)의 그래프.
도 50. 엠. 튜버큘로시스 ( M. tuberculosis ) 유래 도데신 Rv1498A 상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 12 카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 도데신 Rv1498A (내부 분자)의 개략도. (B) 2개 펩티드 링커를 통해서 Rv1498A 단량체 (아래, SEQ ID NO:192)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. 이러한 특정 항원-결합 키메라 단백질에서, 야생형 Rv1498A의 N-말단 및 C-말단이 서로 가깝게 있고 나노바디를 Rv1498A에 연결시키는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되어 있기 때문에 스캐폴드 단백질의 원형 배열을 필요로 하지 않는다. (C) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 Rv1498A가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (D) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1 은 1개 아미노산 길이 및 혼합 조성물의 짧은 펩티드 링커이고, Rv1498A 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 51. ELISA를 통한 6종의 선택된 Mb Nb207 도데신 변이체의 GFP 결합 분석.
6종의 MbNb207 도데신 변이체 (표 13) 및 NbGFP207 나노바디 (SEQ ID NO:1)를 함유하는 주변세포질 추출물은 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후에 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터 평균의 평균 표준 편차 (s.e.m.)로서 표시된다.
도 52. 비. 세노세파시아 ( B. cenocepacia ) 유래 디술피드-브릿지된 동종이량체 상에서 나노바디의 강성 디스플레이 .
(A) 2개 펩티드 링커를 통해서 GFP-특이적 나노바디 (외부 분자, SEQ ID NO:1)에 강성으로 융합된 4QYB의 동종이량체 (내부 분자, SEQ ID NO:200)의 개략도. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 4QYB가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, 4QYB 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 53. Mb Nb80 cHopQ 존재 또는 부재 하에서 β2AR-wt의 리간드 결합 성질
Nb80 (검은색 사각형)의 존재 하에서, β2AR-wt 단독 (회색 원형)에서 또는 미관련 MbNb207 cHopQ (회색 삼각형)의 존재 하에서, β2AR-wt과 비교된 MbNb80 cHopQ (검은색 상향 삼각형)의 존재 하에서 β2AR-wt과의 결합에 대해 [3H]-디히드로알프레놀롤 ([3H]-DHA)과 경쟁하는 상이한 리간드의 방사리간드 치환 어세이. 경쟁 어세이는 각각 경쟁 리간드로서 천연 효현제 에피네프린 (A) 및 효현제 (-)-이소프로테레놀 (B)을 사용하여 β2AR-wt 수용체에 대해 수행하였다. 그래프는 Graphpad Prism의 표준 설정을 사용하여 경쟁적 결합에 대한 모델에 대해 비선형 회귀를 통해 적합화시켰다.
본 발명은 특정 실시형태 및 일정 도면을 참조하여 설명될 것이지만 본 발명은 이에 제한되는 것이 아니라 오직 청구항에 의해서만 제한된다. 청구항의 임의의 참조 부호는 범위를 제한하는 것으로 해석되어서는 않된다. 물론, 반드시 모든 양상 또는 장점이 본 발명의 임의 특정 실시형태에 따라 획득되지 않을 수 있다는 것을 이해해야 한다. 따라서, 예를 들어 당업자는 본 발명이 본 명세서에서 교시되거나 또는 제안할 수 있는 바와 같은 다른 양상 또는 장점을 반드시 획득하지 않고도 본 명세서에 교시된 바와 같은 한가지 장점 또는 장점군을 획득하거나 또는 최적화하는 방식으로 구체화될 수 있거나 또는 수행될 수 있다는 것을 인식하게 될 것이다.
그 특성 및 장점과 함께, 구성 및 실시 방법에 관한 본 발명은 첨부된 도면과 함께 읽을 때 하기 구체적인 설명을 참조하여 최선으로 이해될 수 있다. 본 발명의 양상 및 장점은 이하 기술된 실시형태(들)를 참조하여 자명해질 것이고 명확해질 것이다. "하나의 실시형태" 또는 "일 실시형태"에 대한 본 명세서 전반에서의 언급은 실시형태와 함께 기술된 특정한 특성, 구조 또는 특징이 본 발명의 적어도 하나의 실시형태에 포함된다는 것을 의미한다. 따라서, 이 명세서 전반의 다양한 위치에서 "하나의 실시형태에서" 또는 "일 실시형태에서"라는 어구의 출현은 그럴수도 있지만, 반드시 모두 동일한 실시형태를 언급하는 것이 아니다. 유사하게, 본 발명의 예시적인 실시형태의 설명에서, 본 발명의 다양한 특성은 때때로 본 개시를 간소화하고 하나 이상의 다양한 본 발명의 양상의 이해를 돕기 위한 목적으로 단일 실시형태, 도면, 또는 이의 설명으로 함께 그룹화된다는 것을 이해해야 한다. 그러나, 본 개시의 방법은 청구된 발명이 각 청구항에서 명확하게 명시한 것 이상의 특성을 요구한다는 의도를 반영하는 것으로 해석되어서는 안된다. 대신에, 하기 청구항이 반영하는 대로, 본 발명의 양상들은 단일한 앞서 개시된 실시형태의 모든 특성보다 적다.
정의
단수 명사를 언급할때 사용되는 부정 관사 또는 정관사, 예를 들어 "한" 또는 "하나", "그" 등이 언급되는 경우에, 이것은 특별히 다른 것을 명시하지 않으면 그 명사의 복수를 포함한다. 본 명세서 및 청구항에서 용어 "포함하는"이 사용되는 경우에, 다른 구성요소 또는 단계들을 배제하는 것이 아니다. 뿐만 아니라, 명세서 및 청구항에서 용어 제1, 제2, 제3 등은 유사한 구성요소를 구별하기 위해 사용되며, 반드시 순차 또는 연대기 순서를 설명하기 위해 사용되는 것은 아니다. 이렇게 사용되는 용어들은 적절한 상황 하에서 상호교환가능하고 본 명세서에 기술된 본 발명의 실시형태가 본 명세서에 기술되거나 또는 예시된 것 이외의 다른 순서로 작동될 수 있다는 것을 이해해야 할 것이다. 하기 용어 또는 정의는 오로지 본 발명의 이해를 돕기위해 제공된다. 본 명세서에서 특별히 정의하지 않으면, 본 명세서에서 사용되는 모든 용어는 본 발명의 당업자에게 동일한 의미를 갖는다. 당분야의 정의 및 용어에 관해 실시자는 특히 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]; 및 [Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)]에 따른다. 본 명세서에서 제공하는 정의는 당업자가 이해하는 것 이하의 범위를 갖는 것으로 해석되어서는 안된다.
양, 시간 지속기간 등과 같은 측정가능한 수치에 대해 언급시 본 명세서에서 사용되는 "약"은 명시된 값으로부터 ± 20% 또는 ± 10%, 보다 바람직하게 ± 5%, 보다 더 바람직하게 ± 1%, 여전히 더 바람직하게 ± 0.1%의 변동을 포함하려는 의미로서, 그러한 변동이 개시된 방법을 수행하는데 적절하기 때문이다. 본 명세서에서 사용되는 '유사한'은 서로같은, 비슷한, 비교할만한, 상응하는 등과 상호교환적으로 사용되고, 같거나 또는 공통의 특징를 갖고/갖거나, 정량가능한 방식으로 최대 20%, 10%, 보다 바람직하게 5%, 또는 보다 더 바람직하게 1%, 또는 그 이하의 변동으로, 비슷한 결과를 보여주는 것을 의미한다.
본 명세서에서 사용되는 "뉴클레오티드 서열", "DNA 서열" 또는 "핵산 분자(들)"은 임의 길이의 뉴클레오티드의 중합체 형태, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 의미한다. 이 용어는 오직 분자의 1차 구조를 의미한다. 따라서, 이 용어는 이중 가닥 및 단일 가닥 DNA, 및 RNA를 포함한다. 또한 기지 유형의 변형, 예를 들어 메틸화, 하나 이상의 천연 발생 뉴클레오티드의 유사체에 의한 "캡" 치환을 포함한다. "핵산 구성체"란, 자연계에서 함께 존재하지 않는 하나 이상의 기능성 유닛을 포함하도록 구축된 핵산을 의미하는 것이다. 이러한 예는 원형, 선형, 이중 가닥, 염색체외 DNA 분자 (플라스미드), 코스미드 (람다 파지 유래 COS 서열 함유 플라스미드), 비천연 핵산 서열을 포함하는 바이러스 게놈 등을 포함한다.
"코딩 서열"은 적절한 조절 서열의 제어 하에 위치될 때 mRNA로 전사되고/되거나 폴리펩티드로 번역되는 뉴클레오티드 서열이다. 코딩 서열의 경계는 5'-말단에 번역 출발 코돈 및 3'-말단에 번역 중지 코돈으로 결정된다. 코딩 서열을 제한없이 mRNA, cDNA, 재조합 뉴클레오티드 서열 또는 게놈 DNA를 포함할 수 있는 한편, 인트론이 일정 상황 하에서 역시 존재할 수도 있다.
본 명세서에서 사용되는 "유전자의 프로모터 영역"은 코딩 서열에 작동적으로 연결되고 적절한 유도 조건 하에 가능하게 위치될 때, 상기 코딩 서열의 전사를 촉진하기에 충분한 기능성 DNA 서열 유닛을 의미한다. "작동적으로 연결된"은 그렇게 기술된 성분들이 그들의 의도하는 방식으로 기능하도록 허용하는 관계로 위치된 병치를 의미한다. 코딩 서열에 "작동적으로 연결된" 프로모터 서열은 코딩 서열의 발현이 프로모터 서열과 호환되는 조건 하에서 획득되는 방식으로 결찰된다. 본 명세서에서 사용되는 "유전자"는 유전자의 프로모터 영역뿐만 아니라 코딩 서열을 포함한다. 이것은 프로모터 서열에 작동적으로 연결된, 게놈 서열 (가능한 인트론 포함)을 비롯하여, 스플라이싱 메신저로부터 유래된 cDNA 둘 모두를 의미한다. 용어 "종결인자" 또는 "전사 종결 신호"는 1차 전사물의 3' 프로세싱 및 폴리아데닐화 및 전사 종결에 신호를 전달하는 전사 유닛의 말단에 있는 DNA 서열인 제어 서열을 포괄한다. 종결인자는 천연 유전자 유래, 다양한 다른 식물 유전자 유래, 또는 T-DNA 유래일 수 있다. 부가하려는 종결인자는 예를 들어, 노팔린 신타제 또는 옥토핀 신타제 유전자로부터 유래될 수 있거나, 또는 대안적으로 다른 식물 유전자로부터 유래될 수 있거나, 또는 덜 바람직하게는 임의의 다른 진핵생물 유전자로부터 유래될 수 있다.
"키메라 유전자" 또는 "키메라 구성체" 또는 "키메라 유전자 구성체"는 프로모터 또는 조절 핵산 서열이 mRNA를 코딩하는 핵산 서열에 작동적으로 연결되거나, 또는 그와 회합되어서, 조절 핵산 서열이 회합된 핵산 코딩 서열의 전사 또는 발현을 조절할 수 있는, 재조합 핵산 서열을 의미한다. 키메라 유전자의 조절 핵산 서열은 자연계에 존재하는 대로의 회합된 핵산 서열에 작동적으로 연결되지 않는다.
"발현 카세트"는 이 발현 카세트의 프로모터에 작동적으로 연결되는, 관심 유전자/코딩 서열의 발현을 유도할 수 있는 임의의 핵산 구성체를 포함한다. 발현 카세트는 일반적으로 바람직하게 (5' 내지 3'의 전사 방향으로) 프로모터 영역, 전사 개시 영역에 작동적으로 연결된 폴리뉴클레오티드 서열, 이의 상동체, 변이체 또는 단편, 및 RNA 중합효소를 위한 중지 신호 및 폴리아데닐화 종결 신호를 포함하는 서열을 포함하는 DNA 구성체이다. 이들 모든 영역은 형질전환시키려는, 생물학적 세포, 예컨대 원핵생물 또는 진핵생물 세포에서 작동할 수 있어야 한다는 것을 이해한다. 바람직하게 RNA 중합효소 결합 부위, 및 폴리아데닐화 신호를 포함하는, 전사 개시 영역을 포함하는 프로모터 영역은 형질전환시키려는 생물학적 세포에서 천연적인 것일 수 있거나 또는 대체 공급원으로부터 유래될 수 있고, 여기서 영역은 생물학적 세포에서 기능성이다. 이러한 카세트는 "벡터"로 구축될 수 있다.
본 명세서에서 사용되는 용어 "벡터", "벡터 구성체", "발현 벡터", 또는 "유전자 전달 벡터"는 연결된 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미하고자 하고, 제한없이, 플라스미드 벡터, 코스미드 벡터, 파지 벡터, 예컨대 람다 파지, 바이러스 벡터, 예컨대 아데노바이러스, AAV 또는 배큘로바이러스 벡터, 또는 인공 염색체 벡터 예컨대 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 또는 P1 인공 염색체 (PAC)를 포함하여, 임의의 적합한 유형을 포함하는, 당업자에게 공지된 임의 벡터를 포함한다. 발현 벡터는 플라스미드를 비롯하여 바이러스 벡터를 포함하고, 일반적으로 바람직한 코딩 서열 및 특정 숙주 유기체 (예를 들어, 박테리아, 효모, 식물, 곤충 또는 포유동물) 또는 시험관내 발현 시스템에서 작동적으로 연결된 코딩 서열의 발현에 필요한 적절한 DNA 서열을 함유한다. 발현 벡터는 그들이 도입되는 숙주 세포에서 자율 복제할 수 있다 (예를 들어, 숙주 세포에서 기능하는 복제 기원을 갖는 벡터). 다른 벡터는 숙주 세포에 도입 시 숙주 세포의 게놈에 통합될 수 있고, 그리하여 숙주 세놈과 함께 복제된다. 적합한 벡터는 특정 숙주 유기체 (예를 들어, 박테리아 세포, 효모 세포)에 따라서 바람직하게 조절 서열, 예컨대 프로모터, 인핸서, 종결인자 서열 등을 포함한다. 클로닝 벡터는 일반적으로 소정의 바람직한 DNA 단편을 조작하고 증폭시키는데 사용되고 바람직한 DNA 단편의 발현에 필요한 기능적 서열이 결여될 수 있다. 원핵생물 세포를 형질감염시키는데 사용을 위한 발현 벡터의 구축은 당분야에서 역시 충분히 공지되어 있으므로, 표준 기술을 퉁해 수행할 수 있다 (예를 들어, 당분야의 정의 및 용어의 경우 [Sambrook, et al. Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]; 및 [Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)] 참조).
'숙주 세포'는 원핵생물일 수 있거나 또는 진핵생물일 수 있다. 세포는 일시적으로 또는 안정적으로 형질감염될 수 있다. 원핵생물 및 진핵생물 세포로 발현 벡터의 이러한 형질감염은 제한없이 표준 박테리아 형질전환, 칼슘 포스페이트 공침전법, 전기천공, 또는 리포솜 매개-, DEAE 덱스트란 매개-, 다가양이온 매개-, 또는 바이러스 매개 형질감염을 포함한, 당분야에 공지된 임의 기술을 통해 수행될 수 있다. 모든 표준 기술의 경우, 예를 들어, [Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]; 및 [Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)]를 참조한다. 본 명세서에서, 재조합 숙주 세포는 본 발명의 단리된 DNA 분자, 핵산 분자 또는 발현 구성체 또는 벡터를 함유하도록 유전자 변형된 것들이다. DNA는 제한없이, 형질전환, 리포펙션, 전기천공 또는 바이러스 매개 형질도입을 포함하여, 특정 세포 유형에 적절한 당분야에 공지된 임의 수단을 통해 도입될 수 있다. 본 발명의 키메라 단백질의 발현을 할 수 있게 하는 DNA 구성체는 클로닝, 하이브리드화 스크리닝 및 중합효소 연쇄 반응 (PCR)과 같이, 당분야에 공지된 기술을 통해 쉽게 제조될 수 있다. 클로닝, DNA 단리, 증폭 및 정제, DNA 리가제, DNA 중합효소, 제한 엔도뉴클레아제 등을 포함한 효소 반응, 및 다양한 분리 기술에 대한 표준 기술은 당업자에게 공지되어 있고 일반적으로 적용되는 것들이다. 다수의 표준 기술이 [Sambrook et al. (2012)], [Wu (ed.) (1993)] 및 [Ausubel et al. (2016)]에 기술되어 있다. 본 발명에서 사용할 수 있는 대표적인 숙주 세포는 제한없이 박테리아 세포, 효모 세포, 식물 세포 및 동물 세포를 포함한다. 본 발명에서 사용에 적합한 박테리아 숙주 세포는 에스케리치아 (Escherichia) spp. 세포, 바실러스 (Bacillus) spp. 세포, 스트렙토마이세스 (Streptomyces) spp. 세포, 어위니아 (Erwinia) spp. 세포, 클렙시엘라 (Klebsiella) spp. 세포, 세라티아 (Serratia) spp. 세포, 슈도모나스 (Pseudomonas) spp. 세포 및 살모넬라 (Salmonella) spp. 세포를 포함한다. 본 발명에 따라 사용에 적합한 동물 숙주 세포는 곤충 세포 및 포유동물 세포 (가장 특히, 중국 햄스터 유래 (예를 들어, CHO), 및 인간 세포주, 예컨대 HeLa를 포함한다. 본 발명에서 사용에 적합한 효모 숙주 세포는 사카로마이세스 (Saccharomyces), 스키조사카로마이세스 (Schizosaccharomyces), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia) (예를 들어, 피키아 파스토리스 (Pichia pastoris)), 한세눌라 (Hansenula) (예를 들어, 한세눌라 폴리몰파 (Hansenula polymorpha)), 야로위아 (Yarowia), 슈와니오마이세스 (Schwaniomyces), 스키조사카로마이세스 (Schizosaccharomyces), 자이고사카로마이세스 (Zygosaccharomyces) 등에서의 종을 포함한다. 사카로마이세스 세레비지아 (Saccharomyces cerevisiae), 에스. 칼스베르젠시스 (S. carlsbergensis) 및 케이. 락티스 (K. lactis)가 가장 일반적으로 사용되는 효모 숙주이고, 편리한 진균 숙주이다. 숙주 세포는 현탁액 또는 플라스크 배양, 조직 배양, 장기 배양 등으로 제공될 수 있다. 대안적으로, 숙주 세포는 또한 유전자이식 동물일 수도 있다.
용어 "단백질", "폴리펩티드", "펩티드"는 아미노산 잔기의 중합체 및 이의 변이체 및 합성 유사체를 의미하기 위해서 본 명세서에서 상호교환적으로 사용된다. 따라서, 이들 용어는 하나 이상의 아미노산 잔기가 합성 비천연 발생 아미노산, 예컨대 상응하는 천연 발생 아미노산의 화학 유사체를 비롯하여, 천연 발생 아미노산 중합체인 아미노산 중합체에 적용된다. 이 용어는 또한 폴리펩티드의 번역후 변형, 예컨대 글리코실화, 인산화 및 아세틸화를 포함한다. 아미노산 서열 및 변형을 기반으로, 폴리펩티드의 원자 또는 분자 질량 또는 중량은 (킬로)달톤 (kDa)으로 표시된다. "재조합 폴리펩티드"란, 재조합 기술을 사용하여, 즉 재조합 또는 합성 폴리뉴클레오티드의 발현을 통해 만들어진 폴리펩티드를 의미한다. 키메라 폴리펩티드 또는 이의 생물학적 활성 부분이 재조합적으로 생산될 때, 이것은 또한 바람직하게 배양 배지가 실질적으로 없으며, 다시 말해서, 배양 배지는 단백질 제조 부피의 약 20% 미만, 보다 바람직하게 약 10% 미만, 가장 바람직하게 약 5% 미만을 나타낸다. "단리된"이란, 그의 천연 상태에서 정상적으로는 동반되는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 예를 들어, "단리된 폴리펩티드"는 천연 발생 상태에서 그에 측접되는 분자로부터 정제시킨 폴리펩티드를 의미하고, 예를 들어, 상기 폴리펩티드에 인접하는 생산 숙주에 존재하는 분자로부터 제거된 항원-결합 키메라 단백질을 의미한다. 단리된 키메라는 아미노산 화학 합성을 통해 생성시킬 수 있거나 또는 재조합 생산을 통해 생성될 수 있다. "이종성 단백질"이라는 표현은 단백질이 이 단백질을 디스플레이하거나 또는 발현시키는데 사용되는 동일 종 또는 균주로부터 유래되지 않는다는 것을 의미할 수 있다.
단백질의 "상동체", "상동체들"은 대상 비변형 단백질에 비해서 아미노산 치환, 결실 및/또는 삽입을 갖고 그들이 유래되는 비변형 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포괄한다. 본 명세서에서 사용되는 용어 "아미노산 동일성"은 서열이 비교창 상에서 아미노산 대 아미노산 기반으로 동일한 정도를 의미한다. 따라서, "서열 동일성 백분율"은 비교창 상에서 2개의 최적으로 정렬된 서열을 비교하는 단계, 동일한 아미노산 잔기 (예를 들어, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met, 또한 본 명세서에서 1글자 코드로도 표시됨)가 양쪽 서열에 존재하는 위치의 개수를 결정하여 일치되는 위치의 수를 산출하는 단계, 비교창의 전체 위치 개수 (즉, 창 크기)로 일치되는 위치의 개수를 나누는 단계, 그 결과에 100을 곱해서 서열 동일성 백분율을 산출하는 단계에 의해 계산된다. 본 명세서에서 사용되는 "치환" 또는 "돌연변이"는 부모 단백질 또는 이의 단편의 아미노산 서열 또는 뉴클레오티드 서열과 각각 비교하여, 상이한 아미노산 또는 뉴클레오티드로 하나 이상의 아미노산 또는 뉴클레오티드의 치환에 의해 야기된다. 단백질 또는 이의 단편은 단백질의 활성에 실질적으로 효과를 갖지 않는 보존성 아미노산 치환을 가질 수 있다는 것을 이해한다.
용어 "야생형"은 천연 발생 공급원으로부터 단리된 유전자 또는 유전자 생성물을 의미한다. 야생형 유전자는 개체군에서 가장 빈번하게 관찰되고 따라서 유전자의 "정상" 또는 "야생형" 형태를 임의적으로 디자인하는 것이다. 대조적으로, 용어 "변형된", "돌연변이체" 또는 "변이체"는 야생형 유전자 또는 유전자 생성물과 비교했을 때 서열 내 변형, 번역후 변형 및/또는 기능적 성질의 변형 (즉, 변경된 특징)을 나타내는 유전자 또는 유전자 생성물이다. 천연 발생 돌연변이를 단리할 수 있다는 것을 유의하며, 이것은 그들이 야생형 유전자 또는 유전자 생성물과 비교했을 때 변경된 특징을 갖는다는 사실을 통해 확인된다.
"단백질 도메인"은 단백질 내 구별되는 기능 및/또는 구조 유닛이다. 일반적으로 단백질 도메인은 단백질의 전반적인 역할에 기여하는, 특정 기능 또는 상호작용을 담당한다. 도메인은 유사한 도메인이 상이한 기능을 갖는 단백질에 존재할 수 있는, 다양한 생물학적 상황에서 존재할 수 있다.
단백질 2차 구조 구성요소 (SSE)는 전형적으로 단백질이 이의 3차원적 3차 구조로 폴딩되기 전에 중간체로서 자발적으로 형성된다. 단백질의 2가지 가장 일반적인 2차 구조 구성요소는 알파 헬릭스 및 베타 (β) 시트이지만, β-턴 및 오메가 루프도 역시 존재한다. 베타 시트는 일반적으로 꼬이고, 주름잡힌 시트를 형성하는, 적어도 2개 또는 3개의 골격 수소 결합에 의해 측면으로 연결된 베타 스트랜드 (또한, β-스트랜드)로 이루어진다. β-스트랜드는 연장된 입체구조로 골격을 갖는 전형적으로 3개 내지 10개 아미노산 길이의 폴리펩티드 사슬 스트레치이다. β-턴은 폴리펩티드 사슬의 방향에 변화를 야기시키는 단백질의 비규칙적 2차 구조 유형이다. 베타 턴 (β 턴, β-턴, β-벤드, 타이트 턴, 리버스 턴)은 주로 β-스트랜드를 연결시키도록 제공되는 단백질 및 폴리펩티드 내 매우 일반적인 모티프이다. 가변 도메인에 존재하는 β-턴의 IMGT 정의의 경우, [LeFranc (2014)], 및 도 25를 또한 참조한다. β-턴은 전형적으로 4개 아미노산 잔기 (i, i+1, i+2 및 i+3로 표지)로 이루어지고, 2가지 방식으로 정의되거나: 또는 잔기 i의 CO 및 잔기 i+3의 NH 사이에 주쇄내 수소 결합의 보유에 의해; 또는 대안적으로, 잔기 i 및 i+3의 Cα 원자 사이에 7Å 미만의 거리를 가져서 정의된다. 수소 결합 기준은 부분적으로 4개의 별개 범주를 발생시키기 때문에, 매일 사용을 위해 가장 적절한 것이다.
용어 "단백질의 원형 배열 (circular permutation)" 또는 원형 배열 (circularly permutated) 단백질"은 야생형 단백질 서열과 비교하여, 이의 아미노산 서열에서 변화된 아미노산 순서를 갖는 단백질을 의미하며, 그 결과로서 단백질 구조는 상이한 연결성을 갖지만, 전반적으로는 유사한 3차원 (3D) 형상을 갖는다. 단백질의 원형 배열은 예를 들어, [Bliven and Prlic (2012)]에 기술된 바와 같이, 야생형 단백질의 제1 부분의 서열 (N-말단에 인접)이 최종 원형 배열 단백질의 제2 부분의 서열 (이의 C-말단 근처)과 관련된다는 의미에서, 환형 배열의 수학적 개념과 유사하다. 이의 야생형 단백질과 비교하여 단백질의 원형 배열은 단백질의 유전자 또는 인공 조작을 통해 수득되고, 그리하여 야생형 단백질의 N-말단 및 C-말단은 '연결되'고, 단백질 서열이 다른 부위에서 중단되어, 상기 단백질의 신규 N-말단 및 C-말단이 생성된다. 본 발명의 원형 배열 스캐폴드 단백질은 야생형 단백질 서열의 연결된 N-말단 및 C-말단, 및 상기 스캐폴드 단백질의 접근가능하거나 또는 노출된 부위 (우선적으로 β-턴 또는 루프)에서의 절단 또는 중단 서열의 결과이고, 그리하여 원형 배열 스캐폴드 단백질의 폴딩은 야생형 단백질의 폴딩과 비교하여 비슷하거나 또는 유지된다. 상기 원형 배열 스캐폴드 단백질에서 N-말단 및 C-말단의 상기 연결은 야생형 단백질이 펩티드 결합 또는 나머지 아미노산이 후속된다면 본래 N-말단 및 C-말단 근처 펩티드 스트레치의 결실 또는 펩티드 링커의 도입, 또는 펩티드 결합 연결의 결과일 수 있다.
본 명세서에서 사용되고, 본 명세서에서 "연결된", "접합된", "결찰된"과 상호교환적으로 사용되는 용어 "융합된"은 특히, 예를 들어 재조합 DNA 기술에 의한 "유전자 융합"을 비롯하여, 안정한 공유 연결을 야기하는 "화학적 및/또는 효소적 접합"을 의미한다.
용어 "키메라 폴리펩티드", "키메라 단백질", "키메라", "융합 폴리펩티드", "융합 단백질", 또는 "비천연 발생 단백질"은 본 명세서에서 상호교환적으로 사용되고 동일한 단백질로부터 기원할 수 있거나 또는 그렇지 않을 수 있는 적어도 2종의 개별 및 별개 폴리펩티드 성분을 포함하는 단백질을 의미한다. 이 용어는 또한 인간이 만든 것을 의미하는 비천연 발생 분자를 의미한다. (본 명세서에 정의된 바와 같은) 키메라 폴리펩티드를 언급할 때 용어 "융합된", 및 다른 문법적 동등어, 예컨대 "공유적으로 연결된", "연결된", "부착된", "결찰된", 접합된"은 둘 이상의 폴리펩티드 성분을 연결하기 위한 임의의 화학적 또는 재조합적 기전을 의미한다. 둘 이상의 폴리펩티드 성분의 융합은 서열의 직접 융합일 수 있거나 또는 예를 들어 개재 아미노산 서열 또는 링커 서열, 또는 화학적 링커에 의한 간접 융합일 수 있다. 본 명세서에 기술된 바와 같이, 2개 폴리펩티드 또는 항원-결합 도메인 및 스캐폴드 단백질의 융합은 또한 화학적 연결을 통해 수득되는 비공유 융합을 의미할 수도 있다. 예를 들어, 항원-결합 도메인의 A-스트랜드의 C-말단 및 B-스트랜드의 N-말단은 둘 모두가 이의 노출 또는 접근가능한 부위에서, 부분 또는 전체 길이 (원형 배열) 스캐폴드 단백질에 연결되거나 또는 융합된 상보적 화학 유닛 또는 결합 포켓에 결합할 수 있는, 화학 유닛에 연결될 수 있다 (도 28에 도시된 바와 같음).
본 명세서에서 사용되는 용어 "단백질 복합체" 또는 "복합체" 또는 "조립된 단백질(들)"은 둘 이상의 회합된 거대분자의 그룹을 의미하고, 거대분자의 적어도 하나는 단백질이다. 본 명세서에서 사용되는 단백질 복합체는 전형적으로 생리학적 조건 하에서 형성될 수 있는 거대분자의 회합체를 의미한다. 단백질 복합체의 개별 구성원은 비공유 상호작용을 통해 연결된다. 단백질 복합체는 오직 단백질의 비공유 상호작용일 수 있고, 그렇다면 단백질-단백질 복합체; 예를 들어, 2개 단백질, 3개 단백질, 4개 단백질의 비공유 상호작용 등일 수 있다. 보다 특히, 항원-결합 키메라 단백질 및 항원 자체의 복합체이다. 본 명세서에서 사용되는, 단백질 복합체는 또한 적어도 하나의 단백질 및 적어도 다른 거대분자, 예컨대 핵산의 비공유 상호작용일 수 있고, 그렇다면 단백질-핵산 복합체; 예를 들어, 하나의 단백질과 하나의 핵산, 2개의 단백질과 하나의 핵산, 2개 단백질과 2개 핵산의 비공유 상호작용이라고 한다. 단백질 복합체는 다량체일 수 있다는 것을 이해해야 한다. 단백질 복합체 조립은 동종-다량체 또는 이종-다량체 복합체의 형성을 일으킬 수 있다. 게다가, 상호작용은 안정할 수 있거나 또는 일시적일 수 있다. 용어 "다량체(들)", "다량체 복합체", 또는 "다량체 단백질(들)"은 다수의 동일하거나 또는 이종성인 폴리펩티드 다량체를 포함한다. 폴리펩티드는 다수의 단일 폴리펩티드 단량체의 자가 조립 (즉, "동동-다량체 조립")으로 형성된 다량체 조립 (즉, 이량체, 삼량체, 육량체, 오량체, 팔량체 등)으로 자가-조립될 수 있다. 본 명세서에서 사용되는 "다수"는 2 이상을 의미한다. 다량체 조립은 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 또는 그 이상의 폴리펩티드 단량체를 포함한다. 다량체 조립은 임의 목적으로 사용될 수 있고, 단백질 "나노재료"의 광범위 어레이를 개발하는 방법을 제공한다. 유한의, 케이지-유사 또는 쉘-유사 단백질 조립 이외에도, 그들은 적절한 표적 대칭 아키텍쳐를 선택하여 디자인될 수 있다. 본 발명의 단량체 및/또는 다량체 조립은 계층적 조립의 장점이 수반되는 고차원 조립의 디자인에서 사용될 수 있다. 최종 다량체 조립은 우수한 강성 및 단분산성을 갖는 고차원적 물질이고, 광범위한 적용성을 갖는 고급 기능성 물질 및 맞춤-디자인 분자 기계의 기초를 형성할 수 있다.
본 명세서에서 사용되는 용어 "결정하는", "측정하는", "평가하는" 및 "어세이하는"은 상호교환적으로 사용되고 정성 및 정량 결정 둘 모두를 포함한다.
용어 "적합한 조건"은 환경 인자, 예컨대 온도, 이동, 다른 성분, 및/또는 특히 "완충 조건(들)"을 의미하고, 여기서 "완충 조건"은 특히 어세이가 수행되는 용액의 조성물을 의미한다. 상기 조성은 완충된 용액 및/또는 용질, 예컨대 pH 완충 물질, 물, 염수, 생리학적 염 용액, 글리세롤, 보존제 등을 포함하고, 이에 대해서는 당업자가 최적 어세이 성능을 수득하는 적합성에 대해 알고있다.
"결합"은 간접적이거나 또는 직접적인 임의의 상호작용을 의미한다. 직접 상호작용은 결합 파트너 간 접촉을 의미한다. 간접 상호작용은 상호작용 파트너가 2개 초과 분자의 복합체로 상호작용하는 임의의 상호작용을 의미한다. 상호작용은 하나 이상의 브릿지 분자의 도움으로 완전히 간접적일 수 있거나, 또는 하나 이상의 분자의 추가적인 상호작용에 의해 안정화되는, 파트너간 직접 접촉이 여전히 존재하여, 부분적으로 간접적일 수 있다. 일반적으로, 결합 도메인은 면역글로불린-기반 또는 면역글로불린-유사일 수 있거나 또는 제한없이 미생물 단백질, 프로테아제 억제제, 독소, 피브로넥틴, 리포칼린, 단쇄 역평형 코일드 코일 단백질 또는 반복 모티프 단백질을 포함하는, 단백질에 존재하는 도메인을 기반으로 할 수 있다. 항원-결합, 면역글로불린, 면역글로불린-유사 도메인 또는 항체 도메인에 대해서 본 명세서에서 사용하는 용어 "특이적으로 결합하다"란, 특이적 항원을 인식하지만, 샘플 중 다른 분자는 실질적으로 인식하거나 또는 결합하지 않고, 또한 "항원-결합 도메인" 또는 "항원-결합 단백질"이라고도 하는 결합 도메인을 의미한다. 예를 들어, 하나의 종에서 유래된 항원에 특이적으로 결합하는 항체는 또한 하나 이상의 종에서 유래하는 항원에도 결합할 수 있다. 그러나, 이러한 교차-종 반응성은 특이적인 항체의 분류 자체를 변경하지는 않는다. 일부 예에서, 용어 "특이적 결합" 또는 "특이적으로 결합하다"는 상호작용이 화학종에서 특정 구조 (예를 들어, 항원성 결정부 또는 에피토프)의 존재에 의존적이고, 예를 들어, 항원-결합 단백질이 일반적으로 단백질 보다는 특이적 단백질 구조를 인식하여 결합한다는 것을 의미하기 위해서, 항체, 단백질, 또는 펩티드와 제2의 화학종의 상호작용을 참조하여 사용될 수 있다. 항원-결합 단백질이 에피토프 "A"에 특이적이라면, 표지된 "A" 및 항원-결합 단백질을 함유하는 반응에서, 에피토프 A (또는 유리, 미표지 A)를 함유하는 분자의 존재는 항원-결합 단백질에 결합된 표지된 A의 양을 감소시키게 될 것이다. 본 명세서에서 사용되는 용어 "특이성"은 다른 항원 대비 한 항원에 우선적으로 결합하는 결합 도메인, 특히 항원-결합 도메인, 면역글로불린, 또는 면역글로불린-유사 도메인, 또는 면역글로불린 단편, 예컨대 VHH 또는 나노바디의 능력을 의미하고, 반드시 고친화성을 의미하는 것은 아니다. 항원-결합 단백질의 추가 예는 또한 합성 결합 단백질, 항체 모방체, 또는 보다 특히 또는 모노바디를 포함한다 (예를 들어, 리뷰는 [Sha et al., 2017] 참조). 이러한 모노바디는 면역글로불린 폴드와 비교하여 그들의 유사한 구형 폴드때문에, 낙타과 단일 도메인 항체 (VHH)와 유사한 방식으로 표적 단백질에 특이적으로 결합하는 결합 단백질을 포함하는 피브로넥틴 III형 도메인으로서 정의된다. 모노바디는 이의 피브로넥틴 III형 도메인에 기인하여, 항체의 CDR과 유사한, 항원-결합 영역을 대표하는 FN3 루프 또는 β 턴이 도메인의 한면 상에서, 그리고 본 발명의 항원-결합 키메라 단백질을 형성하기 위해서, 스캐폴드 단백질을 융합시키기 위한 접근가능한 부위로서 제공될 수 있는 β 턴이 다른 면 상에서 연결되는, 항체의 가변 도메인과 같은, 7개의 β-스트랜드를 포함하는, 면역글로불린-유사 폴드를 의미하는 가장 광범위하게 사용된 비-항체 스캐폴드이다. 본 명세서에서 사용되는 "에피토프"는 폴리펩티드의 항원성 결정부를 의미한다. 에피토프는 에피토프에 고유한 공간적 입체구조로 3개 아미노산을 포함할 수 있다. 일반적으로, 에피토프는 적어도 4개, 5개, 6개, 7개의 이러한 아미노산으로 이루어지고, 보다 일반적으로, 적어도 8개, 9개, 10개의 이러한 아미노산으로 이루어진다. 아미노산의 공간적 입체구조를 결정하는 방법은 당분야에 공지되어 있고, 예를 들어, X-선 결정학 및 다차원 핵 자기 공명법을 포함한다. 본 명세서에서 사용되는 "입체구조적 에피토프"는 폴리펩티드의 폴딩된 3차원 입체구조에 고유한 공간적 입체구조로 아미노산을 포함하는 에피토프를 의미한다. 일반적으로, 입체구조적 에피토프는 선형 서열의 비연속적 아미노산으로 이루어지지만 단백질의 폴딩된 구조에서 함께 있게 된다. 그러나, 입체구조적 에피토프는 또한 폴리펩티드의 폴딩된 3-차원 입체구조에 고유한 (변성 상태에서는 존재하지 않는) 입체구조를 채택하는 아미노산의 선형 서열로 이루어질 수 있다. 단백질 복합체에서, 입체구조 에피토프는 상이한 폴딩된 폴리펩티드의 폴딩 및 고유한 4차원 구조로 그들 회합 시 함께 오게 되는 하나 이상의 폴리펩티드의 선형 서열에서 불연속적인 아미노산으로 이루어진다. 유사하게, 입체구조 에피토프는 함께 모여서 또한 4차원 구조에 고유한 입체구조를 채택하는 하나 이상의 폴리펩티드의 선형 서열로 이루어질 수 있다. 용어 단백질의 "입체구조" 또는 "입체구조적 상태"는 일반적으로 단백질이 임의 시점에 채택할 수 있는 다양한 구조를 의미한다. 당업자는 입체구조 또는 입체구조적 상태의 결정원이 단백질 주변 환경 및 단백질의 아미노산 서열 (변형 아미노산 포함)로 반영되는 단백질의 1차 구조를 포함한다는 것을 인식하게 될 것이다. 단백질의 입체구조 또는 입체구조적 상태는 또한 구조적 특성 예컨대 단백질 2차 구조 (예를 들어, 특히 α-헬릭스, β-시트), 3차 구조 (예를 들어, 폴리펩티드 사슬의 3차원 폴딩), 및 4차 구조 (예를 들어, 다른 단백질 서브유닛과 폴리펩티드 사슬의 상호작용)에 관한 것이다. 폴리펩티드 사슬에 대한 번역후 및 다른 변형 예컨대 리간드 결합, 인산화, 술페이트화, 글리소킬화 또는 특히 소수성 기의 부착은 단백질의 입체구조에 영향을 미칠 수 있다. 뿐만 아니라, 환경 인자, 예컨대 주변 용액의 pH, 염 농도, 이온 강도 및 삼투성, 및 특히 다른 단백질 및 보조인자와의 상호작용은 단백질 입체구조에 영향을 미칠 수 있다. 단백질의 입체구조적 상태는 다른 분자에 대한 결합 또는 활성에 대한 기능적 어세이 또는 특히 다른 방법 중에서도, X-선 결정학, NMR 또는 스핀 표지화와 같은 물리적 방법을 통해서 결정할 수 있다. 단백질 입체구조 및 입체구조적 상태에 관한 일반적인 고찰의 경우에, [Cantor and Schimmel, Biophysical Chemistry, Part I: The Conformation of Biological. Macromolecules,.W.H. Freeman and Company, 1980], 및 [Creighton, Proteins: Structures and Molecular Properties, W.H. Freeman and Company, 1993]를 참조한다.
본 명세서에서 사용되는 용어 "친화성"은 일반적으로 표적 단백질 및 리간드의 평형상태를 그들 결합에 의해 형성되는 복합체의 존재쪽으로 이동시키도록 표적 단백질에 (본 명세서에서 추가로 정의되는 바와 같은) 리간드가 결합하는 정도를 의미한다. 따라서, 예를 들어, 항원-결합 키메라 폴리펩티드 및 리간드가 비교적 동일한 농도로 배합되는 경우에, 고친화성 리간드는 형상태가 고농도의 최종 복합체쪽으로 이동하도록 항원-결합 키메라 폴리펩티드에 결합할 것이다. 해리 상수 Kd는 리간드와 표적 단백질 간 친화성을 설명하는데 일반적으로 사용된다. 전형적으로, 해리 상수는 10-5 M 미만의 값을 갖는다. 바람직하게, 해리 상수는 10-6 M 미만, 보다 바람직하게, 10-7 M 미만이다. 가장 바람직하게, 해리 상수는 10-8 M 미만이다. 리간드와 이의 표적 단백질 간 친화성을 설명하는 다른 방식은 결합 상수 (Ka), 억제 상수 (Ki), 또는 간접적으로 절반의 최대 억제 농도 (IC50) 또는 절단의 최대 유효 농도 (EC50)를 측정하여 리간드의 역가를 평가하는 것에 의한다. 본 발명의 범주 내에서, 용어 "친화성"은 표적 단백질의 (입체구조적) 에피토프에 결합하는 Ig 도메인을 포함하는 항원-결합 키메라 단백질, 보다 특히 상기 Ig 도메인의 CDR 영역을 통해 이의 표적에 결합하는 이의 "기능성"을 보유하는 항원-결합 키메라 단백질 Ig 도메인의 경우에 사용된다는 것을 이해하게 될 것이다.
따라서, 본 명세서에서 사용시, 본 발명의 상황에서, 용어 "기능성 항원-결합 단백질" 또는 "입체구조-선택적 항원-결합 도메인"은 임의로는 입체구조-선택적 방식으로, 이의 표적 단백질과의 결합에서 기능성인 상기 키메라 항원-결합 단백질의 Ig 도메인을 의미한다. 표적 단백질의 특정 입체구조에 선택적으로 결합하는 결합 도메인은 표적이 취할 수 있는 다른 입체구조이외의 입체구조 서브세트의 표적에 더 높은 친화성으로 결합하는 결합 도메인을 의미한다. 당업자는 표적의 특정 입체구조에 선택적으로 결합하는 결합 도메인은 이러한 특정 입체구조로 표적을 안정화시키거나 또는 유지시키게 된다는 것을 인식할 것이다. 예를 들어, 활성 상태의 입체구조-선택적 결합 도메인은 활성 입체구조적 상태의 표적에 우선적으로 결합하게 될 것이고 불활성 입체구조적 상태의 표적에는 적은 정도로 결합하거나 또는 전혀 결합하지 않을 것이고, 따라서 상기 활성 입체구조적 상태에 대해 더 높은 친화성을 가지게 될 것이거나, 또는 그 반대일 수도 있다. 용어 "특이적으로 결합하다", "선택적으로 결합하다", "우선적으로 결합하다", 및 이의 문법적 동등어는 본 명세서에서 상호교환적으로 사용된다. 용어 "입체구조적 특이적" 또는 "입체구조적 선택적"도 역시 본 명세서에서 상호교환적으로 사용된다.
본 명세서에서 사용되는 용어 "항체"는 항원과 특이적으로 결합하는, 면역글로불린 (Ig) 분자 또는 면역글로불린 (Ig) 도메인을 포함하는 분자를 의미한다. 항체는 천연 공급원으로부터 유래되거나 또는 재조합 공급원으로부터 유래되는 온전한 면역글로불린일 수 있고, 온전한 면역글로불린의 면역반응성 부분일 수도 있다. 항체는 전형적으로 면역글로불린 분자의 사량체이다. 본 명세서에서 사용되는 용어 "면역글로불린 (Ig) 도메인"은 항체 사슬의 구형 영역, 또는 이러한 구형 영역으로 본질적으로 이루어진 폴리펩티드를 의미한다. 면역글로불린 도메인은 그들이 임의로는 보존된 디술피드 결합에 의해 안정화되는, 2개 β-시트로 배열된 약 7개 내지 9개의 역평행 β-스트랜드의 2층 샌드위치로 이루어지는, 항체 분자를 특징으로 하는 면역글로불린 폴드 (본 명세서에서 Ig 폴드라고 명명)를 보유하는 것을 특징으로 한다. 용어 "면역글로불린 (Ig) 도메인"은 "면역글로불린 불변 도메인", 및 "면역글로불린 가변 도메인" ("IVD"로 축약)을 포함하고, 후자는 각각 "프레임워크 영역 1" 또는 "FR1"; "프레임워크 영역 2" 또는 "FR2"; "프레임워크 영역 3" 또는 "FR3"; 및 "프레임워크 영역 4" 또는 "FR4"라고 당분야 및 하기 본 명세서에서 언급하는 4개의 "프레임워크 영역"으로 본질적으로 이루어진 면역글로불린 도메인을 의미하고, 프레임워크 영역은 각각 "상보성 결정 영역 1" 또는 "CDR1"; "상보성 결정 영역 2" 또는 "CDR2"; 및 "상보성 결정 영역 3" 또는 "CDR3"으로서 당분야 및 이하 본 명세서에서 언급되는, 3개의 "상보성 결정 영역" 또는 "CDR"이 개재된다. 따라서, 면역글로불린 가변 도메인의 일반 구조 또는 서열은 다음과 같이 표시될 수 있다: FR1 - CDR1 - FR2 - CDR2 - FR3 - CDR3 - FR4. 항원-결합 부위를 보유하여 항원에 대한 항체의 특이성을 부여하는 것은 면역글로불린 가변 도메인(들) (IVD)이다. IMGT 분류에 따라서, 면역글로불린 가변 도메인 또는 V-도메인은 약 100 AA을 포함하고 β-턴 (AB,CC', C"D, DE, 및 EF)에 의해 연결된 9개 역평행 베타-스트랜드 (A,B,C,C', C", D, E, F, 및 G), 및 3개 루프 (또는 CDR) (BC, C'C", 및 FG)로 만들어져서, 2개 시트의 샌드위치 [ABED] [GFCC'C"]를 형성한다 (도 25, [Lefranc, 2014]로부터 개조). 시트는 소수성 코어를 제공하는 소수성 상호작용을 통해 서로에 대해 밀접하게 팩킹되고, β-스트랜드 B (제1 시트) 내 제1의 고도로 보존된 시스테인 (제1-Cys) 및 β-스트랜드 F (제2 시트) 내 제2의 동일하게 보존된 시스테인 (제2-Cys) 간 디술피드 브릿지에 의해 함께 연결된다. 본 명세서에서 사용되는 IMGT® 정의 시스템의 고유 번호매김은 문헌에 기술된 CDR과 대조적으로 정확하고 명확하게 한정한 CDR-IMGT를 제공한다. 대안적인 변호매김은 예를 들어, Kabat (Kabat et al., 1991) 또는 Chothia (Chothia and Lesk, 1987)를 참조한다. V-도메인의 경우에, CDR1-IMGT는 위치 27-38, CDR2-IMGT는 위치 56-65, 그리고 CDR3-IMGT는 위치 105-117을 포괄한다 (Lefranc, 2014). 본 발명의 Ig 도메인의 "노출된 영역" 또는 "노출된 루프"는 단백질의 표면에 노출된 영역 또는 폴리펩티드 사슬을 의미한다. Ig 도메인의 경우에, 상기 노출된 영역 또는 루프는 바람직하게는 β-턴, 가장 바람직하게는 Lefranc (2014)가 정의한 바와 같은 β-턴이다. CDR가 또한 IMGT 정의에 따라 "루프"로 간주되지만, 이것은 아마도 항원-결합의 파괴를 초래할 가능성이 높으므로, 기능성 항원-결합 키메라 단백질을 수득할 수 없게 하기 때문에, 스캐폴드의 융합을 위한 접근가능한 부위를 갖는, 본 발명의 "노출된 영역"에 대한 바람직한 후보로서 간주되지 않는다.
본 발명의 "면역글로불린 도메인"은 또한 용어 "단일 가변 도메인"과 동등한 "면역글로불린 단일 가변 도메인" ("ISVD"로 축약)을 포함하고, 항원 결합 부위가 존재하고, 단일 면역글로불린 도메인에 의해 형성되는 분자를 정의한다. 이것은 이것은 "통상의" 면역글로불린 또는 그들 단편을 제외하고 면역글로불린 단일 가변 도메인을 설정하며, 2개 면역글로불린 도메인, 특히 2개 가변 도메인은 상호작용하여 항원 결합 부위를 형성한다. 전형적으로, 통상의 면역글로불린에서, 중쇄 가변 도메인 (VH) 및 경쇄 가변 도메인 (VL)은 상호작용하여 항원 결합 부위를 형성한다. 이러한 경우에서, VH 및 VL 둘 모두의 상보성 결정 영역 (CDR)은 항원 결합 부위에 기여하게 될 것이고, 다시 말해 총 6개 CDR이 항원 결합 부위 형성에 관여하게 될 것이다. 상기 정의의 관점에서, 통상의 4개-사슬 항체 (예컨대 IgG, IgM, IgA, IgD 또는 IgE 분자; 당분야에 공지) 또는 Fab 단편, F(ab')2 단편, Fv 단편 예컨대 디술피드 연결된 Fv 또는 scFv 단편, 또는 이러한 통상의 4-사슬 항체 유래 디아바디 (모두 당분야에 공지됨)의 항원-결합 도메인은, 이들 경우에, 항원의 개별 에피토프의 결합이 보통은 하나 (단일)의 면역글로불린 도메인에 의해서가 아니라 (회합된) 면역글로불린 도메인 예컨대 경쇄 및 중쇄 가변 도메인의 쌍에 의해서, 즉 개별 항원의 에피토프에 함께 결합하는 면역글로불린 도메인의 VH-VL 쌍에 의해 일어나므로, 일반적으로 면역글로불린 단일 가변 도메인으로서 간주되지 않을 것이다. 대조적으로, 면역글로불린 단일 가변 도메인은 추가의 면역글로불린 가변 도메인과의 쌍형성없이 항원의 에피토프에 특이적으로 결합할 수 있다. 면역글로불린 단일 가변 도메인의 결합 부위는 단일 VH/VHH 또는 VL 도메인에 의해 형성된다. 그런 이유로, 면역글로불린 단일 가변 도메인의 항원 결합 부위는 3개 이하의 CDR에 의해 형성된다. 이와 같이, 단일 가변 도메인은 단일 항원 결합 유닛 (즉, 단일 항원 결합 도메인이 기능성 항원 결합 유닛을 형성하기 위해 다른 가변 도메인과 상호작용할 필요가 없도록, 단일 가변 도메인으로 본질적으로 이루어진 기능성 항원 결합 유닛)을 형성할 수 있는 한, 경쇄 가변 도메인 서열 (예를 들어, VL-서열) 또는 이의 적합한 단편일 수 있거나; 또는 중쇄 가변 도메인 서열 (예를 들어, VH-서열, 또는 VHH 서열) 또는 이의 적합한 단편일 수 있다. 본 발명의 일 실시형태에서, 면역글로불린 단일 가변 도메인은 중쇄 가변 도메인 서열 (예를 들어, VH-서열)이고; 보다 특히, 면역글로불린 단일 가변 도메인은 통상의 4-사슬 항체로부터 유래된 중쇄 가변 도메인 서열일 수 있거나 또는 중쇄 항체로부터 유래된 중쇄 가변 도메인 서열일 수 있다. 예를 들어, 면역글로불린 단일 가변 도메인은 (단일) 도메인 항체 (또는 (단일) 도메인 항체로서 사용에 적합한 아미노산 서열), "dAb" 또는 dAb (또는 dAb로서 사용에 적합한 아미노산 서열) 또는 나노바디 (본 명세서에 정의된 바와 같고, 제한없이 VHH를 포함); 다른 단일 가변 도메인, 또는 이의 어느 하나의 임의의 적합한 단편일 수 있다. 특히, 면역글로불린 단일 가변 도메인은 나노바디 (본 명세서에 정의된 바와 같음) 또는 이의 적합한 단편일 수 있다. 주: Nanobody®, Nanobodies® 및 Nanoclone® 은 Ablynx N.V의 등록 상표명이다. 나노바디의 일반적인 설명의 경우에, 하기 추가 설명을 비롯하여, 예컨대, 예를 들어 WO2008/020079에 기술된 바와 같은, 본 명세서에 인용된 종래 기술을 참조한다.
본 명세서의 면역글로불린 도메인은 또한 VHH, VHH 도메인, VHH 항체 단편, 및 VHH 항체로도 알려진, "VHH 도메인"을 포함하고, 본래는 "중쇄" 항체 (즉, "경쇄가 없는 항체"; Hamers-Casterman et al (1993) Nature 363: 446-448)의 항원-결합 면역글로불린 (Ig) (가변) 도메인으로서 기술되었었다. 용어 "VHH 도메인"은 이들 가변 도메인을 통상의 4-사슬 항체에 존재하는 중쇄 가변 도메인 (본 명세서에서 "VH 도메인"이라고 함) 및 통상의 4-사슬 항체에 존재하는 경쇄 가변 도메인 (본 명세서에서 "VL 도메인"이라고 함)과 구별하기 위해 선택되었다. VHH 및 나노바디의 추가 설명을 위해서, Muyldermans의 리뷰 논문 (Reviews in Molecular Biotechnology 74: 277-302, 2001)을 비롯하여, 일반 배경 기술로서 언급된 하기 특허 출원을 참조한다: Vrije Universiteit Brussel의 WO 94/04678, WO 95/04079 및 WO 96/34103; Unilever의 WO 94/25591, WO 99/37681, WO 00/40968, WO 00/43507, WO 00/65057, WO 01/40310, WO 01/44301, EP 1134231 및 WO 02/48193; Vlaams Instituut voor Biotechnologie (VIB)의 WO 97/49805, WO 01/21817, WO 03/035694, WO 03/054016 및 WO 03/055527; Algonomics N.V. 및 Ablynx N.V.의 WO 03/050531; National Research Council of Canada의 WO 01/90190; Institute of Antibodies의 WO 03/025020 (= EP 1433793)를 비롯하여; Ablynx N.V.의 WO 04/041867, WO 04/041862, WO 04/041865, WO 04/041863, WO 04/062551, WO 05/044858, WO 06/40153, WO 06/079372, WO 06/122786, WO 06/122787 및 WO 06/122825, 및 Ablynx N.V의 추가의 공개 특허 출원. 이들 참조에 기술된 바와 같이, 나노바디 (특히 VHH 서열 및 부분적으로 인간화된 나노바디)는 특히 하나 이상의 프레임워크 서열 내 하나 이상의 "홀마크 잔기"의 존재를 특징으로 할 수 있다. 나노바디의 인간화 및/또는 낙타화를 비롯하여, 나노바디의 반감기를 증가시키기 위한 다른 변형, 부분 또는 단편, 유도체 또는 "나노바디 융합체", 다가 구성체 (링커 서열의 일부 비제한적인 예 포함) 및 상이한 변형 및 그들 제조를 포함한 나노바디의 추가 설명은 예를 들어 WO 08/101985 및 WO 08/142164에서 확인할 수 있다.
"Dab", "도메인 항체", 및 "dAb"로도 공지된 "도메인 항체" (용어 "도메인 항체" 및 "dAb"는 GlaxoSmithKline group of companies의 상표명으로서 사용됨)는 예를 들어 EP 0368684, Ward 등 (Nature 341: 544-546, 1989), Holt 등 (Tends in Biotechnology 21: 484-490, 2003) 및 WO 03/002609를 비롯하여 예를 들어 WO 04/068820, WO 06/030220, WO 06/003388 및 Domantis Ltd의 다른 공개 특허 출원에 기술되어 있다. 도메인 항체는 본질적으로 비낙타과 포유동물, 특히 인간 4-사슬 항체의 VH 또는 VL 도메인에 상응한다. 단일 항원 결합 도메인으로서, 즉 각각 VL 또는 VH 도메인과의 쌍형성없이 에피토프에 결합시키기 위해서, 이러한 항원 결합 성질을 위한 특이적 선택은 예를 들어 인간 단일 VH 또는 VL 도메인 서열의 라이브러리 사용을 요구한다. 도메인 항체는 VHH 처럼, 대략 13 kDa 내지 대략 16 kDa의 분자량을 가지며, 완전한 인간 서열로부터 유래된다면, 예를 들어 인간에서 치료적 용도를 위해 인간화를 요구하지 않는다. 단일 가변 도메인은 상어의 소정 종으로부터 유래될 수 있다는 것을 역시 유의해야 한다 (예를 들어, 소위 "IgNAR 도메인", 예를 들어 WO 05/18629 참조).
면역글로불린 단일 가변 도메인 예컨대 도메인 항체 및 나노바디 (VHH 도메인 및 인간화 VHH 도메인 포함)는 그들 생산 시 성숙한 거대분자를 의미하지만, 그 변경이 개별 부모 분자와 비교하여 이의 개별 항원에 대한 최종 면역글로불린 단일 가변 도메인의 개선된 친화성을 야기시키는, 하나 이상의 변경을 하나 이상의 CDR의 아미노산에 도입시켜서 친화성 성숙화를 더 수행시킬 수 있다. 본 발명의 친화성-성숙된 면역글로불린 단일 가변 도메인 분자는 예를 들어, Marks 등 (Biotechnology 10:779-783, 1992), Barbas 등 (Proc. Nat. Acad. Sci, USA 91: 3809-3813, 1994), Shier 등 (Gene 169: 147-155, 1995), Yelton 등 (Immunol. 155: 1994-2004, 1995), Jackson 등 (J. Immunol. 154: 3310-9, 1995), Hawkins 등 (J. MoI. Biol. 226: 889 896, 1992), Johnson 및 Hawkins (Affinity maturation of antibodies using phage display, Oxford University Press, 1996)이 기술한 바와 같이, 당분야에 공지된 방법으로 제조할 수 있다. 면역글로불린 단일 가변 도메인 예컨대 도메인 항체 또는 나노바디로부터 출발하여, 폴리펩티드의 디자인/선택 및/또는 제조 방법은 또한 본 명세서에서 상기 면역글로불린 단일 가변 도메인의 "포맷팅 (formatting)"이라고 하며; 폴리펩티드의 일부를 만드는 면역글로불린 단일 가변 도메인은 상기 폴리펩티드"의 포맷으로" 되거나 또는 포맷된다고 한다. 면역글로불린 단일 가변 도메인이 포맷될 수 있는 방법의 예 및 예를 들어 글리코실화를 피하기 위한 이러한 포맷의 예는 본 명세서의 개시를 기반으로 당업자에게 자명해 질 것이다.
면역글로불린 단일 가변 도메인 예컨대 도메인 항체 및 나노바디 (VHH 도메인 포함)는 인간화될 수 있고, 다시 말해서 가장 가까운 인간 배선 서열과의 서열 동일성 정도를 증가시킬 수 있다. 특히, 인간화 면역글로불린 단일 가변 도메인, 예컨대 나노바디 (VHH 도메인 포함)는 이전 단락에서 일반적으로 정의된 바와 같이, 그러나 인간화 치환 (본 명세서에 정의된 바와 같음)이고/이거나 그에 상응하는 적어도 하나의 아미노산 잔기 (및 특히, 적어도 하나의 프레임워크 잔기)가 존재하는 면역글로불린 단일 가변 도메인일 수 있다. 잠재적으로 유용한 인간화 치환은 천연 발생 VHH 서열의 프레임워크 영역의 서열을 하나 이상의 밀접하게 관련된 인간 VH 서열의 상응하는 프레임워크 서열과 비교하여 확인할 수 있고, 그 이후에 이렇게 결정된 하나 이상의 잠재적으로 유용한 인간화 치환 (또는 이의 조합)이 (본 명세서에 더욱 기술된 바와 같이, 그 자체로 공지된 임의 방식으로) 상기 VHH 서열에 도입될 수 있고 최종 인간화 VHH 서열은 표적에 대한 친화성, 안정성, 발현 수준 및 용이함, 및/또는 다른 바람직한 성질에 대해 시험될 수 있다. 이러한 방식으로, 제한된 정도의 시행착오를 통해서, 다른 적합한 인간화 치환 (또는 이의 적합한 조합)은 당업자가 결정할 수 있다. 또한, 이전에 기술된 것을 기반으로, 면역글로불린 단일 가변 도메인, 예컨대 나노바디 (VHH 도메인 포함)(의 프레임워크 영역)는 부분적으로 인간화될 수 있거나 또는 완전히 인간화될 수 있다. 그들의 가장 넓은 의미로, 면역글로불린 단일 가변 도메인을 비롯하여, 본 발명의 항원-결합 키메라 단백질은 특별한 생물학적 공급원 또는 특별한 제조 방법에 국한되지 않는다는 것을 유의해야 한다. 예를 들어, 면역글로불린 단일 가변 도메인, 특히 본 발명의 항원-결합 키메라 단백질은 일반적으로 다음에 의해 수득될 수 있다: (1) 천연 발생 중쇄 항체의 VHH 도메인의 단리, 및 항원-결합 키메라 단백질을 수득하기 위한 서열의 추가 조작; (2) 항원-결합 키메라 단백질의 상기 스캐폴드 단백질에 융합된 포맷으로, 천연 발생 VHH 도메인을 코딩하는 뉴클레오티드 서열의 발현; (3) 천연 발생 VHH 도메인 및/또는 스캐폴드 단백질의 "인간화" 또는 이러한 인간화 VHH 도메인 및/또는 스캐폴드 단백질, 및/또는 항원-결합 키메라 단백질을 코딩하는 핵산의 발현; (4) 이미 존재하는 항체와의 결합을 감소시키기 위해 천연 발생 VHH 도메인의 "돌연변이" 또는 천연 VHH와 비교하여 이미 존재하는 항체에 대해 감소된 결합을 갖는 본 발명의 항원-결합 키메라 단백질을 수득하기 위해 스캐폴드 단백질 융합 부위의 조작; (5) 상기 스캐폴드 단백질과의 후속 융합을 위해, 임의 동물 종, 특히 포유동물 종, 예컨대 인간 유래 천연 발생 VH 도메인의 "낙타화"; 또는 (6) 그 자체로 공지된 단백질, 폴리펩티드 또는 다른 아미노산 서열을 제조하기 위한 합성 또는 반합성 기술. 적합한 돌연변이, 특히 치환은 이미 존재하는 항체와의 결합이 감소된 폴리펩티드를 생성시키기 위해 인간화 동안 (예를 들어, WO 2012/175741 및 WO2015/173325 참조), 예를 들어 위치: 11, 13, 14, 15, 40, 41, 42, 82, 82a, 82b, 83, 84, 85, 87, 88, 89, 103, 또는 108 중 적어도 하나에 도입될 수 있다. 대안적으로, 이미 존재하는 항체 결합에 민감한 위치는 항원-결합 키메라 단백질과의 결합을 방해하도록 스캐폴드 단백질과의 융합체를 디자인하여 입체적으로 차폐될 수 있다.
면역글로불린 도메인, 또는 Ig 수퍼패밀리 또는 "Ig-유사 도메인"에 대한 대안은 사실 각각 면역글로불린-도메인 및 Ig 폴드와 매우 유사한 서열 및 구조 내에 존재하는 도메인으로 구성된, 많은 단백질에 존재하지만, 면역글로불린 항체의 도메인 그 자체와 구별하기 위해 Ig-유사 도메인이라고 한다. 항원 인식에 특별한 것이라기 보다는, Ig 폴드가 상호작용을 매개하는데 특히 좋았고 널리 사용된 것으로 확인되었다. 면역글로불린-유사 도메인은 서열 패턴에 따라서 V, C1, C2, 및 I로 분류될 수 있다. 예를 들어 모노바디는 면역글로불린-유사 도메인을 포함한다.
본 명세서에서 사용되는 용어 "검출가능한 표지", "표지화" 또는 "태그"는 본 명세서에 기술된 단리 또는 정제된 (폴리-)펩티드의 검출, 가시화, 및/또는 단리, 정제 및/또는 고정화를 가능하게 하는 검출가능한 표지 또는 태그를 의미하고, 이들 목적을 위해 당분야에 공지된 임의의 표지/태그를 포함하는 것을 의미한다. 특히 바람직한 것은 친화성 태그, 예컨대 키틴 결합 단백질 (CBP), 말토스 결합 단백질 (MBP), 글루타티온-S-트랜스퍼라제 (GST), 폴리(His) (예를 들어, 6x His 또는 His6), Strep-태그®, Strep-태그 II® 및 Twin-Strep-태그®; 가용화 태그, 예컨대 티오리독신 (TRX), 폴리(NANP) 및 SUMO; 크로마토그래피 태그, 예컨대 FLAG-태그; 에피토프 태그, 예컨대 V5-태그, myc-태그 및 HA-태그; 형광성 표지 또는 태그 (즉, 형광색소/형광단), 예컨대 형광성 단백질 (예를 들어, GFP, YFP, RFP 등) 및 형광성 염료 (예를 들어, FITC, TRITC, 쿠마린 및 시아닌); 발광성 표지 또는 태그, 예컨대 루시퍼라제; 및 (다른) 효소 표지 (예를 들어, 퍼옥시다제, 알칼리 포스파타제, 베타-갈락토시다제, 우레아제 또는 글루코스 옥시다제)이다. 또한 임의의 전술한 표지 또는 태그의 조합이 포함된다. 항원-결합 키메라 단백질은 예를 들어 반감기 연장 모듈에 융합될 수 있거나 또는 접합될 수 있거나, 또는 그 자체로 반감기 연장 모듈로서 기능할 수 있다. 이러한 모듈은 당업자에게 공지되어 있고 예를 들어 알부민, 알부민-결합 도메인, 면역글로불린의 Fc 영역/도메인, 면역글로불린-결합 도메인, FcRn-결합 모티프 및 중합체를 포함한다. 특히 바람직한 중합체는 폴리에틸렌 글리콜 (PEG), 히드록시에틸 전분 (HES), 히알루론산, 폴리시알산 및 PEG-모방체 펩티드 서열을 포함한다. 단리된 (폴리-)펩티드의 응집을 예방하는 변형이 또한 당업자에게 공지되어 있고 예를 들어 하나 이상의 친수성 아미노산으로 하나 이상의 소수성 아미노산, 바람직하게 표면-노출 소수성 아미노산의 치환을 포함한다. 일 실시형태에서, 단리된 (폴리-)펩티드 또는 이의 면역원성 변이체 또는 임의의 전술한 것의 면역원성 단편은 친수성 아미노산으로 최대 10, 9, 8, 7, 6, 5, 4, 3 또는 2, 바람직하게 5, 4, 3 또는 2개 소수성 아미노산, 바람직하게 표면-노출 소수성 아미노산의 치환을 포함한다. 바람직하게, 단리된 (폴리-)펩티드의 다른 성질, 예를 들어 이의 면역원성, 항원-결합 기능성은 이러한 치환에 의해 약화되지 않는다.
본 발명의 목적을 위해서 "환자" 또는 "대상체"는 인간 및 다른 포유동물, 예를 들어 동물 예컨대 설치류, 토끼, 소, 양, 말, 개, 고양이, 라마, 돼지 또는 인간이외의 영장류 (예를 들어, 원숭이)를 포함한, 임의의 유기체, 예컨대 척추동물, 특히 임의 포유동물에 관한 것이다. 설치류는 마우스, 래트, 햄스터, 기니 피크 또는 친칠라일 수 있다. 일 실시형태에서, 대상체는 인간, 래트 또는 인간이외의 영장류이다. 바람직하게, 대상체는 인간이다. 일 실시형태에서, 대상체는 본 명세서에서 "환자"라고도 지칭되는, 질환 또는 장애를 갖거나 또는 갖는 것으로 의심되는 대상체이다.
본 명세서에서 사용되는 용어 "예방하는"은 (예를 들어, 예방학적 처치를 통해서) 질환 또는 장애의 개시를 중지/억제하는 것을 의미할 수 있다. 또한 (예를 들어, 예방적 처치를 통해서) 개시의 지연, 증상 빈도의 감소, 또는 질환 또는 장애와 연관된 증상의 중증도 감소를 의미할 수도 있다. 용어 "치료" 또는 "치료하는" 또는 "치료하다"는 상호교환적으로 사용될 수 있고 징후, 증상, 장애, 병태 또는 질환의 진행 또는 중증도를 완화, 방해, 중지, 통제, 중단, 감소 또는 반전시키는 치료적 중재술로 정의되지만, 반드시 전체 질환-관련 징후, 증상, 병태 또는 장애의 완전한 제거를 포함하지는 않는다.
상세한 설명
강성 융합된 항원-결합 도메인-함유 키메라 단백질의 디자인을 위한 신규 개념이 본 명세서에서 제공된다. 신규 항원-결합 키메라는 항원-결합 도메인 및 스캐폴드 단백질 간에 융합체 생성을 통해 기원되고, 스캐폴드 단백질은 항원-결합 단백질의 토폴로지를 방해하고, 이것은 비융합된 항원-결합 도메인과 비교하여 유사한 방식으로 항원 또는 표적 단백질에 특이적으로 결합하도록 기능하고 이의 전형적인 폴드를 여전히 놀랍게도 나타낸다. 이러한 개념은 보다 강성의 비가요성 연결을 입증하는 신규의 고유한 항원-결합 키메라를 생성시키기 위해서, 스캐폴드 단백질에 융합되는 면역글로불린 또는 면역글로불린-유사 도메인의 고유한 특성을 적용하는 특정 예를 중심으로 구축된다. 전형적으로 그들 천연 상태에서 비결합되어 있는, 폴리펩티드 성분의 전형적인 접합은 하나의 연속적인 폴리펩티드를 형성하기 위해 펩티드 연결을 통해서 또는 직접적으로 그들 각각의 아미노 (N-) 및 카르복실 (C-) 말단을 연결하여 수행된다. 이들 융합은 종종 가요성 링커를 통해 만들어지거나 또는 적어도 가요성 방식으로 연결되며, 이것은 융합 파트너가 서로에 대해 안정한 위치 또는 입체구조로 존재하지 않는다는 것을 의미한다. 도 1에 표시된 바와 같이, N-말단 및 C-말단을 통해서 단백질을 연결시킴으로서, 단순한 선형 쇄상화, 융합이 용이하지만, 안정하지 않을 수 있어서, 분해되는 경향이 있고, 따라서 일부 경우에 치료 용도로 적합하지 않다. 다른 한편으로, 둘 이상의 단백질의 주요 토폴로지 내에서 하나 이상의 융합점 또는 연결점을 갖는, 본 명세서에 제시되는 강성 키메라/융합 단백질은 적어도 하나의 비가요성 융합점을 보유한다 (도 1). 본 발명은 고유하게 항원-결합 키메라 단백질을 포함하고, 여기서 이의 융합 파트너에 반대인 한 단백질의 회전 또는 휘어짐이 몇몇 융합의 생성을 통해 금지된다. 동일 키메라 내 몇몇 융합체의 존재를 통해서, 본 발명의 신규 키메라의 개선된 강성이 수득되고, 이의 항원-결합 도메인 폴딩을 비롯하여, 이의 표적과 결합하는 이의 기능을 여전히 보유할 수 있는 융합을 허용하는 융합 부위의 완벽한 디자인의 결과이다. 단백질의 강성은 사실 신규 키메라의 경우에, 사실 단백질의 (3차) 구조에 내재한다. 증가된 강성은 기지 단백질 폴드의 토폴로지를 변경시켜 얻을 수 있는 것으로 확인되었다 (King et al., 2015). 본 발명의 항원-결합 키메라 단백질에서 생성되는 융합의 강성은 그러한 이유로 표적을 "지향" 또는 "고정"시키도록 충분하게 강한 강성을 제공하지만, 대부분의 강성은 여전히 표적 또는 항원 그 자체의 강성보다는 낮을 것이다. 그러나, 본 발명의 강성 항원-결합 키메라 단백질이 여전히 이의 항원-결합 기능성을 유지한다는 사실은 주요 토폴로지의 파괴가 도메인 또는 단백질 폴딩의 변화를 초래할 수 있어서, 3차 토폴로지 및 항원-결합에 영향을 미치므로, 놀라운 관찰이다. 주요 토폴로지의 파괴가 항원-결합에 영향을 미치지 않고, 항체 및 그들 표적 단백질을 포함한 분야에서 새로운 방안을 열어주었다는 것을 본 명세서에서 입증하였다. 본 발명은 단백질의 비공유 표적화를 허용하기 위해, 고친화성 및/또는 입체구조-선택적 항원-결합 잠재성, 및 고유한 차세대 융합 기술의 제공의 신규한 조합에 관한 것이다. 이러한 신규 유형의 항원-결합 키메라 단백질은 키메라의 생성에서 사용되는 스캐폴드 단백질 유형에 따라서 몇몇 가치있는 적용분야에서 도움이 된다. 예를 들어, 소형 단백질에 대해 고분해능 구조를 수득하기 위해 방지되는, 단편의 제한된 정렬, 바람직한 배향, 및 입자 크기 제한의 반복된 문제들을 해결함으로써, Cryo-EM 및 X-선 결정학을 용이하게 하는, 구조 생물학에서의 간편한 사용이라는 많은 장점들이 존재한다. 이러한 차세대 융합 기술을 사용하여, 강성 샤페론 도구가 이제 이용가능하고 또한 예컨대 신규 화합물의 구조-기반 스크리닝 및 구조-기반 약물 디자인을 통해서 개선되고, 보다 확고한 치료 및 진단 분자를 개발하기 위해 도구를 사용하기 위한 완전한 제공이 되므로, 구조 생물학에서 빠른 진보를 예상할 수 있다. 사실, 항원 또는 표적의 입체구조-선택적 인식이 사용될 때, 이들 도구는 기능적 입체구조, 예컨대 활성 입체구조, 보다 특히 효현제, 부분 효현제 또는 편향 효현제 입체구조로 표적을 안정화시키는 결합 모드에서도 역시 적용가능하다. 뿐만 아니라, FDA가 승인한 Enbrel® (종양 괴사 인자/Fc-IgG1), 및 Nplate® (트롬보포이어틴/Fc-IgG1)를 포함한 융합 단백질 약물의 몇몇 예가 공지되어 있다. 단일 도메인 항체의 치료적 개발 관점에서, 이미 존재하는 항체와의 결합이 일반적으로 알려진 장애였고, 이를 위해서 본 발명의 항원-결합 키메라가 독특한 해결책을 제공할 수 있다. 또한, 본 발명의 항원-결합 키메라 단백질은 생물제제 분야에서 새로운 해결법 및 또한 작물 보호 산업에서 보호제를 제공한다. 해충 및 병원체 필수 분자에 대해 유도된 낙타과 결합 도메인의 개발은 야생동물, 벌, 재배자 및 소비자에 대한 효과 위험성을 최소화하는 조합된 매우 특이적인 작용 방식을 입증한다. 본 발명의 항원-결합 키메라로부터 개발된 이러한 보호제는 대규모 제조의 비용 효율적인 방식을 유지하면서, 추가 장점을 제공한다.
본 발명의 항원-결합 키메라 단백질의 추가 적용분야는 경로-특이적 효현제의 스크리닝을 가능하게 하는 약물가능한 신호전달 입체구조를 특이적으로 안정화시키는 것으로 기술된 Nb를 기반으로 하는 항원-결합 도메인에서 확인된다.
생명공학에서 이러한 이술의 빠른 진보로, 본 발명이 현행 단백질 약물의 개선된 성능 및 신규 단백질 치료제의 생성에 영향을 미칠 것이라는 것을 예측가능하다.
제1 양상에서, 본 발명은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 항원-결합 키메라 단백질에 관한 것으로서, 상기 스캐폴드 단백질은 상기 항원-결합 도메인에 결합되어서 상기-항원 결합 도메인 폴드에서 접근가능한 적어도 하나 이상의 아미노산 부위에서 융합을 통해 상기 항원-결합 도메인의 토폴로지를 방해한다. 상기 항원-결합 키메라 단백질은 이의 천연 또는 야생형 형태인, 상기 스캐폴드 단백질에 융합되지 않은 항원-결합 도메인과 비교하여 유사한 방식으로 이의 항원-결합 기능성을 보유한다는 것을 더욱 특징으로 한다. 그래서 일 실시형태에서, 상기 항원-결합 키메라 단백질은 입체구조-특이적 결합 도메인이다. 일 실시형태는 항원-결합 키메라 단백질을 제공하고 항원-결합 도메인은 스캐폴드 단백질이 항원-결합 도메인의 토폴로지를 "방해"하는 방식으로 스캐폴드 단백질과 융합된다. 일반적으로, 단백질의 "토폴로지 (topology)"는 3차원 공간에서 서로에 대한 규칙적인 2차 구조의 배향을 의미한다. 단백질 폴드는 폴리펩티드 사슬 토폴로지에 의해 주로 정의된다 (Orengo et al., 1994). 그래서 가장 기본적인 수준에서 '1차 토폴로지'는 단백질 폴드 인식 모티프, 및 그리하여 2차 및 3차 단백질/도메인 폴딩을 담당하는 2차 구조 구성요소 (SSE)의 서열로서 정의된다. 단백질 구조의 관점에서, 진짜 또는 1차 토폴로지는 SSE의 서열이고, 다시 말해서, 단백질 사슬의 N-말단부 및 C-말단부를 유지할 수 있고, 똑바로 당길 수 있다고 상상한다면, 토폴로지는 단백질이 어떻게 폴딩되었든지 변화되지 않는다. 단백질 폴드는 단백질의 1차 및 3차 구조와 유사하게, 3차 토폴로지로서 설명된다 (Martin, 2000). 그리하여, 본 발명의 항원-결합 키메라 단백질의 항원-결합 도메인은 스캐폴드 단백질 융합을 도입시켜, 이의 1차 토폴로지를 방해하지만, 예상치 않게도 상기 항원-결합 도메인은 이의 3차 구조를 유지하여 이의 기능성 항원-결합 능력을 보유할 수 있다.
"스캐폴드 단백질"은 본 명세서에 기술된 바와 같이, 다른 단백질, 특히 항원-결합 도메인과 융합을 허용하는 구조를 갖는 임의 유형의 단백질을 의미한다. 이러한 "스캐폴드", "접합" 또는 "융합 파트너" 단백질은 바람직하게 항원-결합 도메인에 대한 융합점으로서 절단하기 위한 적어도 하나의 접근가능한 부위를 제공하기 위해 이의 3차 구조에 적어도 하나의 노출 영역을 갖는다. 스캐폴드 폴리펩티드는 항원-결합 도메인과 조립하는데 사용되어서, 질량의 증가, 대칭성 제공, 및/또는 표지 제공, 및/또는 추가 항원-결합 부위 부가, 및/또는 반감기 증가, 및/또는 면역원성 감소, 및/또는 항원-결합 도메인에 대한 기능성 개성 또는 부가되도록 도킹된 구성의 항원-결합 키메라 단백질을 생성시킨다. 그래서, 사용되는 스캐폴드 단백질의 유형에 따라서, 최종 항원-결합 키메라 단백질의 상이한 목적이 예상된다. 스캐폴드 단백질의 유형 및 속성은 이것이 임의 단백질일 수 있다는 점에서 무관하고, 이의 구조, 크기, 기능 또는 존재에 따라서, 본 발명의 항원-결합 키메라 단백질에서처럼 상기 항원-결합 도메인과 융합된 스캐폴드 단백질은 상이한 적용 분야에서 사용될 것이다. 스캐폴드 단백질의 구조는 최종 키메라 구조에 영향을 미치게 되므로, 당업자는 스캐폴드 단백질에 대한 기지의 구조 정보를 제공해야 하고 스캐폴드 선택 시 합리적인 기대를 고려해야 한다. 스캐폴드 단백질의 본 출원의 실시에에 제공되고, 효소, 막 단백질, 수용체, 어댑터 단백질, 샤페론, 전사 인자, 핵 단백질, 항원-결합 단백질 자체, 예컨대 특히 나노바디인 비제한적인 수의 단백질이 본 발명의 항원-결합 키메라 단백질을 생성시키기 위한 스캐폴드 단백질로서 적용될 수 있다. 바람직한 실시형태에서, 상기 스캐폴드 단백질의 3D-구조는 당업자에게 공지되어 있거나 또는 예측할 수 있어서, 항원-결합 도메인과 융합시키기 위한 접근가능한 부위는 상기 당업자가 결정할 수 있다.
신규 키메라 단백질은 접합부가 키메라 단백질 구조 내 가요성의, 느슨하고 약한 연결/영역인 것을 피하는 독특한 방식으로 융합된다. 2개 폴리펩티드를 연결하거나 또는 융합시키는 편리한 방법은 고전적인 기지 방식으로, 제2 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드에 작동적으로 연결된 제1 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드를 포함하는, 재조합 핵산 분자로부터 융합 단백질로서 그들을 발현시키는 것에 의한다. 그러나, 본 발명의 재조합 핵산 분자에서, 상기 스캐폴드에 의한 항원-결합 도메인의 토폴로지의 방해가 또한 상기 항원-결합 키메라 단백질을 발현시키는 유전자 융합 디자인에 반영된다. 그래서, 일 실시형태에서, 항원-결합 키메라 단백질은 항원-결합 도메인을 코딩하는 유전자의 일부, 및 스캐폴드 단백질을 코딩하는 유전자의 일부를 조합하여 형성된 키메라 유전자에 의해 코딩되고, 상기 코딩된 스캐폴드 단백질은 코딩된 펩티드 링커에 의해 만들어진 융합 또는 적어도 둘 이상의 직접 융합을 통해 상기 도메인의 하나 이상의 접근가능한 부위에서 코딩된 항원-결합 도메인의 1차 토폴로지를 방해한다. 그래서, 융합시키려는 폴리펩티드를 코딩하는 폴리뉴클레오티드는 단편화되고 상기 단백질 간 강성의 비가요성 결합, 연결 또는 융합을 제공하는 항원-결합 키메라 단백질을 제공하는 방식으로 재조합된다. 신규 키메라는 항원-결합 도메인의 1차 토폴로지가 방해되는 방식으로 항원-결합 도메인과 스캐폴드 단백질을 융합시켜 만들어지고, 이것은 항원-결합 도메인의 아미노산 서열이 접근가능한 부위(들)에서 방해되고 스캐폴드 단백질의 접근가능한 아미노산(들)에 연결되어, 그 서열은 아마도 또한 방해된다. 접합은 분자내에서 만들어지는데, 달리 말해서 아미노산 서열 내에서 내부에서 만들어진다 (실시예 및 도면 참조). 본 발명의 재조합 융합은 그 결과로 오로지 N-말단 또는 C-말단에서 융합되지 않고, 적어도 하나의 내부 융합 부위를 포함하는 키메라가 생성되고, 여기서 그 부위는 직접적으로 융합되거나 또는 링커 펩티드를 통해 융합된다. 원형 배열 스캐폴드를 적용하여 항원-결합 키메라 단백질을 생산하는 경우에, 상기 스캐폴드 단백질의 아미노산 서열은 N-말단 및 C-말단을 연결한 후에, 항원-결합 도메인 부분의 아미노산 서열에 융합시키려는, 이의 3차 구조의 접근가능한 부위에 상응하는, 스캐폴드 단백질의 서열 내 다른 부위의 아미노산 서열의 절단 또는 분리를 후속하여 변화시키게 된다. 원형 배열을 수득하기 위한 상기 N-말단 및 C-말단 연결은 직접 융합, 링커 펩티드, 또는 심지어 N-말단 및 C-말단 근처 영역의 짧은 결실 후 말단의 펩티드 결합을 통할 수 있다.
용어 "접근가능한 부위(들)", "융합 부위(들)" 또는 "융합점" 또는 "연결 부위" 또는 "노출 부위"는 본 명세서에서 상호교환적으로 사용되고, 모두 구조적으로 접근가능한 단백질 서열의 아미노산 부위, 바람직하게 단백질의 표면 또는 표면에 노출된 위치를 의미한다. 당업자는 그들 부위를 결정할 수 있을 것이다. 항원-결합 도메인의 항원-결합 부위는 종종 예를 들어 Ig 도메인의 CDR과 같은 노출 영역을 고려한다. 그러나, 스캐폴드 단백질과 항원-결합 도메인의 융합을 위한 이들 부위의 방해는 본 발명의 항원-결합 키메라 단백질에 적합하지 않은, 항원-결합 능력의 손실을 초래할 수 있어서, 여기서는 접근가능한 융합 부위로서 적용하고자 하지 않는다. 그래서, 본 명세서에 기술된 바와 같은 '루프' 또는 '베타 턴'으로서 '접근가능한 부위' 및'노출 영역'은 항원-결합 부위 또는 영역이 아니고, 그러한 이유로 CDR이 아닌 부위 및 영역을 의미한다. 단백질의 N-말단 또는 C-말단은 대부분의 경우에 단백질 3D-구조의 "느슨한" 말단부이므로, 표면으로부터 접근가능하다. 이들은 항원-결합 도메인 내 적어도 하나의 다른 접근가능한 부위가 융합에 사용되어, 접근가능한 부위에서 방해/삽입, 토폴로지 방해를 초래한다는 조건에서, 이러한 후자의 접근가능한 부위 융합이 신규 키메라에 강성을 제공하게 될 것이므로, 본 발명의 키메라에서 접근가능한 부위로서 간주될 수 있다. 그러므로, 접근가능한 부위는 단백질의 아미노-말단 및/또는 카복시-말단 부위를 포함할 수 있지만, 키메라는 오로지 N-말단 또는 C-말단으로 만들어진 접근가능한 부위로부터의 융합을 기반으로 할 수 없다. 항원-결합 도메인의 적어도 하나 이상의 부위는 기지의 통상적인 도메인 폴드의 토포로지의 방해를 일으키도록 스캐폴드 단백질과의 융합에 사용된다. 일 실시형태에서 적어도 하나의 접근가능한 부위는 적어도 하나이고/이거나, 상기 도메인의 N-말단 또는 C-말단을 포함하지 않으면, 상기 도메인의 N-말단 및/또는 C-말단 부위가 아니다. 특정 실시형태에서, 적어도 하나의 부위는 상기 도메인의 N-말단 또는 C-말단 아미노산이 아니다. 다른 실시형태에서, 접근가능한 부위는 적어도 1개 초과의 부위가 스캐폴드 단백질과 융합되는데 사용될 때, 항원-결합 도메인의 N-말단 또는 C-말단 부위일 수 있다. 스캐폴드 단백질은 일 실시형태에서, 상기 적어도 하나의 부위가 스캐폴드 단백질의 N-말단부 또는 C-말단부가 아니고, 대안적인 실시형태에서, 적어도 하나의 부위가 상기 스캐폴드의 N-말단부 또는 C-말단부인, 역시 이의 3차 구조로부터 볼 수 있는 접근가능한 부위를 통해 융합된다.
일부 실시형태에서, 항원-결합 키메라는 상기 항원-결합 도메인의 노출 영역 내 방해시에 융합된 상기 스캐폴드 단백질의 N-말단 단편, 및 상기 항원-결합 도메인의 C-말단부에 융합된 상기 스캐폴드 단백질의 C-말단 단편을 포함한다.
본 발명의 일부 실시형태에서, 융합은 직접 융합일 수 있거나, 또는 링커 펩티드에 의해 만들어진 융합일 수 있고, 상기 융합 부위는 강성, 비가요성 융합 단백질을 생성시키도록 빈틈없이 디자인된다. 선택된 접근가능한 부위(들)의 위치이외에도, 링커 펩티드의 길이 및 유형은 최종 키메라 단백질의 강성에 기여한다. 본 발명의 상황 내에서, 항원-결합 키메라 단백질을 구성하는 폴리펩티드는 서로 직접적으로, 펩티드 결합을 통한 연결에 의해, 또는 간접적으로 융합되어서, 간접 커플링이 짧은 펩티드 링커를 통한 연결에 의해 2개 폴리펩티드를 조립시킨다. 바람직한 "링커 분자", "링커", 또는 "짧은 폴리펩티드 링커"는 최대 20개 아미노산 길이, 보다 좋게는 4개 아미노산 길이의 펩티드이고, 전형적으로는 오직 3개 아미노산 길이이지만, 바람직하게는 오직 2개 또는 더 바람직하게는 오직 1개 아미노산이어서, 접근가능한 부위에서 융합 접합에 대한 바람직한 강성을 제공한다. 적합한 링커 서열의 비제한적인 예는 무작위적일 수 있는 실시예 섹션에 기술되어 있으며, 여기서 링커는 구조 도메인 간 고정된 거리를 유지할 뿐만 아니라, 융합 파트너가 그들 독립 기능 (예를 들어, 항원-결합)을 유지하도록 성공적으로 선택되었다. 강성 링커의 사용과 관련된 실시형태에서, 이들은 일반적으로 α-헬릭스 구조를 채택하거나 또는 다수 프롤린 잔기를 함유하여 고유한 입체구조를 나타내는 것으로 알려져 있다. 많은 상황 하에서, 그들은 가요성 링커에 비해 보다 효율적으로 기능성 도메인을 분리시키고, 이것이 역시 적합할 수 있고, 바람직하게 오직 1-4개 아미노산의 짧은 길이일 수 있다.
일 실시형태에서, 항원-결합 도메인의 접근가능한 부위(들)는 도메인 폴드의 노출 영역 내에 있다. 상기 노출 영역은 주로 단백질의 표면, 및 구조의 모서리에 위치되는, 덜 고정된 아미노산 스트레치로서 확인된다. 바람직하게, 노출 영역은 단백질 구조의 루프 또는 β-턴으로서 존재한다.
특정 실시형태에서, 상기 항원-결합 키메라 단백질은 주로 β 시트(들)로 존재하는, 적어도 7개 역평행 β-스트랜드, 및 적어도 3개 β-턴을 갖는 항원-결합 도메인을 포함하고, 후자는 또한 노출 영역으로서 간주된다. 일 실시형태에서, 적어도 7 역평행 β-스트랜드, 및 적어도 3 β-턴의 상기 항원-결합 도메인은 면역글로불린-유사 도메인, 예컨대 특히 모노바디의 항원-결합 도메인을 포함한다. 모노바디는 분자 스캐폴드로서 피브로넥틴 III형 도메인 (FN3)을 사용하여 구축된 합성 결합 단백질이다. 천연 FN3 스캐폴드는 94개 아미노산으로 이루어졌고, 항체의 단일 가변 도메인의 크기와 비슷하게, 약 10 kDa의 분자량을 갖는다. 그들은 인간 피브로넥틴의 구조, 보다 특히 이의 10번째 세포외 III형 도메인을 기반으로 한다. 이 도메인은 항체 가변 도메인과 유사한 구조를 갖는데, 7개 β-스트랜드, 및 3개의 노출 루프가 각 측면 상에 존재한다. 다른 특정 실시형태에서, 상기 항원-결합 키메라 단백질은 면역글로불린 (Ig) 도메인인 항원-결합 도메인을 포함한다. 면역글로불린 (Ig) 도메인은 약 125개 아미노산으로 이루어진, 격자무늬 토폴로지를 갖는 2개 β-시트로 배열된 7-9개의 역평행 β-스트랜드의 2층 샌드위치로 이루어진 단백질 도메인 유형이다. 면역글로불린의 가변 (V) 및 불변 (C) 서브유닛은 2층을 형성하는 β 스트랜드의 개수 및 규칙성이 상이하고 C 도메인은 배열된 7개 β 스트랜드로부터 구축되어서 4개 스트랜드는 1개 β 시트를 형성하고 3개 스트랜드는 제2 시트를 형성하는 한편, V 도메인은 7개 대신에 9개 β 스트랜드를 함유한다. 하나의 β 시트의 모서리에 삽입된 V 도메인의 2개의 추가 스트랜드는 기능적으로 중요한데 그들이 항원-인식 부위의 형성에 직접적으로 관여하는 제2 초가변 영역을 한정하기 때문이다. 본 발명의 항원-결합 키메라 단백질을 수득하기 위해 항원-결합 도메인의 토폴로지를 방해함으로써, 놀랍게도, 표적 단백질 또는 항원에 결합하는 이의 기능성을 비롯하여, 면역글로불린 또는 면역글로불린-유사 폴드는 최종 키메라 단백질에서 유지되었다.
스캐폴드 단백질이 융합되는 항원-결합 도메인 또는 Ig 도메인-함유 단백질의 경우에, 항원-결합 또는 Ig 도메인의 항원 또는 표적의 속성은 임의 종류일 수 있다. 그러므로, 표적의 속성은 본 발명과 관련되지 않고, 각각 항원-결합 도메인, 또는 Ig 또는 Ig-유사 도메인의 CDR, 또는 항원-결합 부위에 특이적으로 결합하는 임의 에피토프가 타당한 표적 단백질로서 간주될 수 있다. 표적은 비제한적인 예로서, 단량체 단백질, 다른 거대분자 구조, 다량체, 단백질 복합체, 또는 일시적 단백질-단백질 상호작용일 수 있다. 표적은 또한 임의의 기능성을 가질 수 있으며, 예를 들어 제한없이 효소, 막단백질 예컨대 GPCR, 이온-채널로서의 기능을 가질 수 있을 분만 아니라, 특히, 핵 및 다른 수용체 단백질은 상기 항원-결합 도메인의 표적일 수 있다. 대안적으로, 표적의 공급원은 예를 들어 제한없이 특히 인간, 포유동물, 또는 동물뿐만 아니라, 박테리아, 바이러스, 곤충에 기원을 둔, 임의 기원의 것일 수 있다.
일 실시형태에서, 항원-결합 또는 Ig/ Ig-유사 도메인의 항원은 항원-결합 키메라 단백질을 야기시키기 위해 상기 항원-결합 또는 Ig/ Ig-유사 도메인에 융합된 스캐폴드 단백질이 아니다. 보다 바람직하게, 스캐폴드 단백질이 본 발명에서 기술된 바와 같이 항원-결합 또는 Ig 도메인에 융합 또는 연결되는데 사용될 때, 신규 항원-결합 키메라 단백질은 이의 단량체, 쳔연 또는 융합 형태로 존재하는 스캐폴드 단백질에 특이적으로 결합해서는 안된다. 대안적으로, 본 명세서에 기술된 바와 같은 제1 및 제2 항원-결합 키메라 단백질을 포함하는 항원-결합 키메라 단백질의 조성물이 본 명세서에서 개시되고, 상기 제2 항원-결합 키메라 단백질의 항원-결합 도메인은 제1 항원-결합 키메라 단백질의 스캐폴드 단백질에 특이적으로 결합한다. 그 자산의 스캐폴드에 결합하는 항원-결합 키메라 단백질의 사슬-반응 또는 응집을 피하기 위해서, 상기 제2 항원-결합 키메라 단백질의 스캐폴드는 상기 제1 항원-결합 키메라 단백질의 스캐폴드 단백질과 상이하다. 본 발명의 목적을 위해 본 명세서에서 '상이한'이란, 제2 항원-결합 키메라 단백질의 스캐폴드 단백질의 아미노산 돌연변이, 결실, 삽입 또는 치환 또는 변형이 제2 항원-결합 키메라 단백질의 상기 스캐폴드 단백질 부분에 대한 제2 항원-결합 키메라 단백질의 항원-결합 도메인의 비결합을 야기시키는 것을 의미한다. 다른 실시형태는 이의 항원 또는 표적 단백질과 결합된 복합체로, 항원-결합 키메라 단백질의 상기 조성물에 관한 것이다.
대안적인 실시형태에서, 항원-결합 키메라 단백질은 i) 면역글로불린 또는 Ig-유사 도메인의 보존된 N-말단 아미노산 서열, ii) 스캐폴드 단백질, 및 iii) i)의 상기 보존된 N-말단 아미노산 서열이 결여된 면역글로불린 도메인 서열을 포함하는 강성 융합 단백질로서 기술되고, 여기서 i) 및 iii)은 ii)의 상기 스캐폴드 단백질에 쇄상화된다. 바람직한 실시형태에서, 상기 강성 융합 단백질은 길이가 11 내지 15 잔기 (SEQ ID NO:1의 잔기 11 내지 15의 N-말단부의 끝, 즉 제1 베타턴 근처)인, SEQ ID NO:1에서의 잔기를 갖는 보존된 공통 서열을 포함하는, FR1 영역의 보존된 N-말단 도메인인 보존된 N-말단 아미노산 서열, 또는 이의 상동성 서열을 포함한다. 다른 실시형태에서, 항원-결합 키메라 단백질의 항원-결합 도메인은 헬릭스 2차 구조를 포함한다. 특히, 상기 항원-결합 도메인은 항체 모방체로서 항원-결합 도메인의 일부인 알파바디일 수 있거나, 또는 항원-결합 키메라 단백질을 생산하기 위해 본 명세서에 기술된 바와 같은 융합체에 적용가능한, 강성 헬릭스 링커의 디자인을 통해 역시 강성일 수 있는 디자인된 알파 헬릭스를 함유하므로 면역글로불린과 매우 상이한 구조를 갖는 항체 모방체인 DARPin일 수 있다. 그러나, 항체 모방체의 항원-결합 성질은 천연적으로 발생되지 않는, 합성적으로 생성 또는 예측된 결합 부위이고, 그러므로 예를 들어 단일 도메인 항체의 생체내 성숙된 항원-결합 부위와 비교하여 적용가능성이 덜할 수 있다. 게다가, 상기 헬릭스 구조 또는 코일드-코일을 사용해 강성 융합체를 생성하는 것은 토폴로지 간섭에 대해 β-턴을 포함하는 융합체와 비교하여 더 복잡할 수 있다.
Ig 도메인의 "노출 영역"의 가장 간단한 확인은 노출된 루프, 바람직하게 β 시트 샌드위치 3D-구조의 모서리에 위치하는 노출 루프인, β-턴이다.
추가 실시형태는 상기 항원-결합 도메인의 노출 영역이 IMGT (Lefranc, 2014)에 의해 정의된 바와 같은 β-턴을 포함한다는 것을 의미하고, 상기 스캐폴드 단백질은 a. 상기 항원-결합 도메인의 베타-스트랜드 A 및 B를 연결하는 제1 β-턴; 또는 b. 상기 항원-결합 도메인의 베타-스트랜드 C 및 C'을 연결하는 β-턴; 또는 c. 상기 항원-결합 도메인의 베타-스트랜드 C" 및 D를 연결하는 β-턴; 또는 d. 상기 항원-결합 도메인의 베타-스트랜드 D 및 E를 연결하는 β-턴; 또는 e. 상기 항원-결합 도메인의 베타-스트랜드 E 및 F를 연결하는 β-턴인, 면역글로불린 (가변) 도메인의 상기 노출 영역에 삽입되거나 또는 융합된다. 바람직한 실시형태에서, 접근가능한 부위(들)는 Ig 도메인의 A 및 B β-스트랜드를 연결하는 AB β-턴의 노출 영역에 존재한다. 대안적으로, 접근가능한 부위는 Ig 도메인의 C 및 C' β-스트랜드를 연결하는, CC' β-턴에 의해 한정되는 노출 영역에 위치된다. 다른 실시형태는 C"D β-턴, 또는 EF β-턴에 접근가능한 부위(들)를 갖는 노출 영역을 포함한다.
사실, 이들은 면역글로불린 폴드를 제공하기 위한 전형적인 샌드위치의 β시트를 구성하는, 각각 β-스트랜드 A 및 B, C 및 C', C" 및 D, 또는 E 및 F를 연결하는 표면 루프이다. 가장 바람직하게, 접근가능한 부위는 노출 영역, 루프 또는 β-턴에 존재하여서, Ig 도메인의 CDR은 표적 단백질의 에피토프에 결합하는 그들 능력을 보유한다. CDR 그 자체는 또한 노출 영역으로 간주될 수 있어서, 이론적으로 그들이 접근가능한 부위를 제공한다. 그러나, 항원-결합 키메라 단백질은 표적 단백질이 여전히 결합될 수 있을 때, 오직 기능적, 따라서 항원-결합하게 될 것이고, 이것은 아마도 CDR의 아미노산이 융합을 위한 접근가능한 부위로서 사용될 때는 그렇지 않을 것이다.
다른 실시형태에서, 항원-결합 도메인은 면역글로불린-유사 도메인, 예컨대 보다 특히 모노바디를 포함하고, 여기서 스캐폴드 단백질은 Ig 도메인에 대해, 보다 특히, [Koide et al. (2012)]에서 주석달린 구조에 따라 정의되는 바와 같은, 모노바디에 대해, 상기 제공된 선택안과 유사하게, 상기 Ig-유사 도메인의 β-스트랜드 A 및 B를 연결하는 제1 β-턴; 또는 상기 Ig-유사 도메인의 β-스트랜드 C 및 D를 연결하는 β-턴; 또는 상기 Ig-유사 도메인의 β-스트랜드 E 및 F를 연결하는 β-턴에, 삽입된다. 상기 명명법은 VHH Ig-폴드 주석을 기반으로 채택되었다.
다른 실시형태에서, 스캐폴드 단백질은 원형 배열을 갖는다. 바람직한 실시형태에서, 스캐폴드 단백질의 상기 원형 배열은 스캐폴드 단백질의 N-말단 및/또는 C-말단에 존재하거나, 또는 가장 바람직하게 스캐폴드 단백질의 N-말단과 C-말단 사이에 존재한다. 다른 실시형태는 적어도 2개의 역평행 β-스트랜드를 포함하는 스캐폴드 단백질을 제공한다.
일 실시형태에서, 융합 단백질 (2개 펩티드 결합 또는 2개의 짧은 링커)은 이의 구조의 노출 영역에 상응하는 서열에서 이의 절단된 접근가능한 부위에서 원형 배열 스캐폴드 단백질과의 융합을 통해서, AB 베타 턴에 상응하는 서열의 절단된 접근가능한 부위에서 Ig 또는 항원-결합 도메인 1차 토폴로지의 방해를 통해, 스캐폴드에 면역글로불린 또는 항원-결합 도메인을 연결시켜 수득된다 (상기 노출 또는 접근가능한 부위는 N-말단 또는 C-말단이 아님). 스캐폴드 단백질의 원형 배열이 N-말단 및 C-말단에 있는 특정 실시형태 (도 2)에서, 스캐폴드 단백질 서열은 전체로서 항원-결합 단백질 단편과 재조합적으로 융합될 수 있다 (도 8). 특정 실시형태에서, 상기 키메라는 항원-결합 또는 Ig 도메인 내, 바람직하게 β-스트랜드 A의 말단, 및 β-스트랜드 G의 말단에서, AB 베타 턴의 접근가능한 부위 근처에 위치하는 시스테인 잔기를 통해 형성된 강화 디술피드 브릿지의 추가 생성을 통해 증가된 강성을 갖는다. 일 실시형태에서, 항원-결합 도메인 및 스캐폴드는 항원-결합 키메라 단백질의 강성을 개선시키기 위해 디술피드 결합을 통해 더욱 연결된다. 가장 바람직하게 이들 부위는 β 스트랜드의 마지막 아미노산 (예를 들어 SEQ ID NO:1의 잔기 11-15 주변)이고, 상기 잔기는 시스테인으로 치환되고, Ig 도메인의 마지막 아미노산 중 하나가 역시 시스테인으로 돌연변이된다 (도 10 참조).
다른 실시형태에서, 스캐폴드에 면역글로불린을 연결시킨 상기 융합 단백질 (2개 펩티드 결합 또는 2개 짧은 링커 가짐)은 이의 서열 내 (N-말단 또는 C-말단이 아님) 위치된 이의 구조의 노출 영역 내 절단된 접근가능한 부위에서 원형 배열 스캐폴드 단백질과 융합을 통해, CC' 베타 턴 내 절단된 접근가능한 부위에서 Ig 도메인 토폴로지의 방해를 통해 수득된다. 그래서, 스캐폴드 단백질의 원형 배열이 N-말단 및 C-말단을 연결하여 만들어지는 특정 실시형태 (도 22)에서, 스캐폴드 단백질 서열은 전체로 Ig 단백질 단편과 재조합적으로 융합될 수 있다 (도 8).
다른 실시형태에서, 본 명세서에 기술된 바와 같은 스캐폴드 단백질은 동종- 또는 이종-올리고머, 및/또는 외피 단백질, 또는 바이러스-유사 입자 단백질, 또는 이의 단편일 수 있는, 절대 이량체 또는 다량체, 예컨대 12량체이다. 외피 단백질, 또는 바이러스-유사 입자 단백질는 다량체를 형성하고 대칭 구조로 자가 조립되어서, 상기 대칭 구조의 표면 상에 융합된 Ig 도메인의 디스플레이를 야기시킨다.
다른 실시형태에서, 면역글로불린을 스캐폴드에 연결하는 융합 또는 키메라 단백질 (3개 펩티드 결합 또는 3개 짧은 링커 가짐)은 이의 N-말단 아미노산에서 스캐폴드 단백질과의 융합을 통해, 이의 AB 베타 턴 내 절단된 접근가능한 부위에서 항원-결합 또는 Ig / Ig-유사 도메인 토폴로지의 방해를 통해 수득된다. 상기 스캐폴드 단백질은 또한 Ig 도메인의 β-스트랜드 B와 융합을 가능하게 하는 AB 베타 턴 부위로 다시 커플링되도록 절단되는, 이의 서열 내 구조적으로 접근가능한 부위를 요구한다. Ig 도메인의 제2 접근가능한 부위는 예를 들어 제한없이, 스캐폴드 단백질의 나머지 부분에 더욱 융합되는, 이의 C-말단 아미노산을 제공한다 (도 11 참조). 그래서, 스캐폴드 단백질이 항원-결합 또는 Ig/ Ig-유사 도메인의 2개의 상이한 접근가능한 부위에서 융합되는 특정 실시형태에서, 스캐폴드 단백질 서열은 2개 단편으로서 항원-결합 또는 Ig 도메인 단백질 단편에 재조합적으로 융합되는 것이 요구된다. 특정 실시형태에서, 면역글로불린을 스캐폴드에 연결하는 3개의 펩티드 결합 또는 짧은 링커를 갖는 상기 키메라 융합 단백질은 이의 강성이 Ig 도메인 내 위치되는 시스테인 잔기에 의해 형성되는 강화 디술피드 브릿지의 추가 생성을 통해 증가된다. 특정 실시형태에서, 상기 스캐폴드 단백질은 절대 이량체 또는 다량체이거나, 또는 외피 단백질 또는 바이러스-유사 입자, 또는 이의 단편일 수 있어서, 대칭성을 생성시킨다.
특별한 실시형태에서, 면역글로불린을 스캐폴드에 연결하는 융합 단백질 (3개 펩티드 결합 또는 짧은 링커 가짐)은 이종이량체를 형성하는 2개 스캐폴드 단백질을 포함한다. 상기 융합 단백질은 이후에 Ig 도메인으로 다시 β-스트랜드 B에 연결되게 하는 동일한 접근가능한 부위에 융합되는 이의 C-말단부에 존재하는, 이의 서열 (N-말단 또는 C-말단이 아님) 내에 위치하는 이의 구조의 노출 영역 내 이의 절단된 접근가능한 부위에서 제1의 원형 배열 스캐폴드 단백질과 융합을 통해, AB 베타 턴 내 절단된 접근가능한 부위에서 Ig 도메인 토폴로지의 방해를 통해 수득된다. Ig 도메인의 제2 접근가능한 부위는 제1 스캐폴드 단백질과 이량체화되어 증가된 강성을 생성시키는, 제2 스캐폴드 단백질의 N-말단과 최종적으로 융합되는, 이의 C-말단 아미노산에 의해 제공된다. 특정 실시형태에서, 스캐폴드 단백질의 원형 배열은 N-말단 및 C-말단에 있다. 그래서, 제1 스캐폴드 단백질의 원형 배열이 N-말단 및 C-말단에 존재하는 특정한 실시형태에서, 제1 스캐폴드 단백질의 원형 배열 서열은 Ig 서열의 N-말단 및 C-말단 부분 (AB 베타 턴 내에서 절단) 사이에 삽입되는 Ig 단백질 단편과 전체로서 재조합적으로 융합될 수 있고, 제2 스캐폴드 단백질은 Ig 도메인 서열의 C-말단과 N-말단에서 융합된다. 그리하여, 다량체 스캐폴드 단백질은 상기 다량체 스캐폴드의 단량체 각각을 통해서 이의 접근가능한 부위(들)에서 Ig 도메인과 연결 또는 융합된다.
특정 실시형태에서, 항원-결합 도메인을 스캐폴드에 연결하는 융합 단백질 (3개 펩티드 결합 또는 짧은 링커 가짐)의 스캐폴드는 제2 항원-결합 도메인을 포함한다. 상기 융합 단백질은 이의 N-말단 아미노산에서 (제2) 항원-결합 도메인-포함 스캐폴드 단백질과 융합을 통해, 이의 AB 베타 턴 내 절단된 접근가능한 부위에서 (제1) 항원-결합 도메인 토폴로지를 방해시켜 수득된다. 상기 (제2) 항원-결합 도메인-포함 스캐폴드 단백질은 특정 실시형태에서 Ig 도메인을 포함하고, 이의 서열 내에, 특히 (제1) 항원-결합 도메인의 β-스트랜드 B와 융합될 수 있게 하는 AB 베타 턴 부위로 다시 커플링되도록 절단되는, β-스트랜드 G의 C-말단부 근처에서, 구조적으로 접근가능한 부위를 제공한다. (제1) 항원-결합 도메인의 제2 접근가능한 부위는 스캐폴드 단백질을 포함하는 (제2) 항원-결합 Ig 도메인의 나머지 부분에 최종적으로 융합되는, 이의 C-말단 아미노산에 의해 제공된다 (도 17 참조). 그래서, 이러한 특정 실시형태에서, (제2) 항원-결합 도메인-포함 스캐폴드 단백질 서열은 2개 단편으로서 (제1) 항원-결합 단백질 단편에 재조합적으로 융합되는 것이 필요하다. 이 실시형태에 기술된 바와 같이, 서로 융합되는 2개 항원-결합 도메인은 특히 일 특정 실시형태에서 2개의 동일한 항원-결합 도메인으로서, 또는 동일 표적 단백질의 상이한 에피토프에 결합하는 상이한 항원-결합 도메인으로서, 또는 상이한 단백질을 표적화하는 2개 항원-결합 도메인으로서 개시된다. 그러나 Ig 도메인인 항원-결합 단백질의 CDR에 의해 결합되는 에피토프는 최종 항원-결합 키메라의 일부분인 다른 Ig 도메인에 존재해서는 안되거나, 또는 새롭게 형성된 항원 결합 키메라 그 자체에 존재해서는 안된다. 특정 실시형태에서, 상기 Ig 도메인은 2개 나노바디이고, 보다 특정한 실시형태에서, 2개의 동일한 Nb이거나, 또는 동일한 표적 단백질의 상이한 에피토프에 결합하는 상이한 Nb이거나, 또는 상이한 단백질을 표적화하는 2개 Nb이다. 그러나 Nb가 결합하는 에피토프는 최종 항원-결합 키메라의 일부분인 다른 Nb에 존재해서는 않되거나, 또는 새롭게 형성된 항원 결합 키메라 자체에 존재해서는 않된다.
일정 실시형태에서, 본 발명의 스캐폴드 단백질은 단량체 단백질이다. 다른 실시형태에서, 스캐폴드 단백질은 대칭성을 제공하는 단백질, 예컨대 다량체 스캐폴드 단백질, 또는 외피 단백질이거나 또는 바이러스-유사 입자로 자가 조립되는 단백질인 스캐폴드 단백질이다. 다량체 스캐폴드 단백질은 이종성- 또는 동종-올리고머화일 수 있는 올리고머화를 통해 대칭성을 제공하고, 절대적이거나 또는 영구적일 수 있고, 또한 일시적일 수 있다. 수득딘 대칭성은 임의 유형의 대칭성, 예컨대 예를 들어 제한없이, 환형, 입방체, 2면체, 6면체, 8면체, 20면체 등일 수 있다. 특히, 용어 "20면체"는 20개의 면을 갖는 다면체의 기하 형태를 의미하는, 20면체로부터 유래된 유형의 대칭성을 의미한다. 용어 "바이러스-유사 입자" (VLP), "20면체 VLP 단백질", "외피 단백질", 또는 "20면체 VLP를 형성하는 단백질"은 다량체 구조, VLP로 자가 조립될 수 있고, 바이러스로부터 유래되었지만, 비감염성이고, (20면체) 대칭성을 제공하는 단백질을 의미한다. 예를 들어 박테리오파지는 20면체 구조를 갖는 헤드를 갖는다. 뿐만 아니라, 이종성 단백질의 전부 또는 일부를 포함하는 키메라 표면 단백질의 디스플레이는 바이러스 입자를 생산하기 위한 역 유전자 시스템이 확립된 임의의 20면체 바이러스를 사용해 쉽게 가능하다. 키메라 표면 단백질은 본 발명에서 제공하는 바와 같이, 이종성 항원-결합 도메인에 융합되는 바이러스 표면 또는 외피 단백질을 포함한다. 바이러스 외피 단백질은 스캐폴드로서 제공되기 위해 펩티드 결합 또는 링커 서열을 통해 융합될 수 있다. 일부 예에서, 바이러스 외피 단백질의 일부분은 그에 융합되는 항원-결합 도메인 및/또는 링커를 더 잘 수행하기 위해 결실된다. 결실이 다시 코팅되는 바이러스 단백질의 능력에 영향을 미치는지 여부는 바이러스 입자의 존재 하에서 재조합적으로 발현된 바이러스 단백질을 인큐베이션시켜서 재코팅된 바이러스 입자의 형성을 관찰하여 평가할 수 있다.
본 발명의 추가 양상은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 신규 항원-결합 키메라 단백질에 관한 것이고, 여기서 상기 스캐폴드 단백질은 상기 도메인의 토폴로지를 방해하고, 스캐폴드 단백질(들)의 총 질량 또는 분자량이 적어도 30 kDa이어서, 항원-결합 도메인의 표적에 대한 키메라의 결합에 의한 질량 부가가 상기 키메라에 비공유적으로 결합될 때 표적의 3-차원 구조 분석을 허용하기에 충분하고 상당하게 될 것이다. 다른 실시형태에서, 스캐폴드 단백질(들)의 총 질량 또는 분자량은 적어도 10 kDa, 적어도 20 kDa, 적어도 35 kDa, 적어도 40 kDa, 적어도 45 kDa, 적어도 50 kDa, 또는 적어도 60 kDa이다. 특정 크기 또는 질량 증가는 이미지의 신호 대 노이즈 비율을 감소시키는데 영향을 미칠 것이다. 두번째로, 키메라는 cryo-EM 및 X-ray 결정학을 사용하여 충분히 고분해능에 도달하도록 결정화시키는 것이 어렵거나 또는 작은 단백질에 대해 정확한 이미지 정렬을 위한 적절한 특성을 제공하여 구조 가이드를 제공하게 될 것이다.
본 발명의 다른 양상은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 신규 항원-결합 키메라 단백질에 관한 것이고, 여기서 상기 스캐폴드 단백질은 상기 도메인의 토폴로지를 방해하고, 스캐폴드 단백질은 항원-결합 도메인을 더 포함하고, 특정 실시형태에서, 상기 스캐폴드 단백질은 Ig 도메인을 포함하고, VHH, 나노바디, 또는 항체 그 자체이다. 신규 항원-결합 키메라 단백질을 수득하기 위한 상기 융합은 적어도 2개의 항원-결합 부위를 갖는 항원-결합 키메라 단백질을 생성시키고, 여기서 항원-결합 모이어티는 융합되어 강성 키메라를 생성시키고, 그들 표적에 결합하는 그들 기능은 보유한다. 상기 적어도 2개의 항원-결합 부위는 한 표적의 동일한 에피토프 또는 상이한 에피토프를 표적으로 할 수 있어서, 친화성 및/또는 효능을 증가시킨다. 대안적으로, 본 발명에 따라 융합된 상기 2개의 항원-결합 도메인을 포함하는 상기 키메라의 2개 항원-결합 부위는 상이한 표적 단백질에 결합할 수 있고, 이것은 오직 하나의 강성 키메라를 사용하여 2개 단백질의 표적화를 허용한다. 키메라의 이러한 고유한 특성은 예를 들어 밀접하게 근접한 표적에 대해 강성 구조가 요구되고, 그렇지 않으면 도달하는 것이 어려운 이중특이성의 치료적 용도에 대한 해결안을 제공한다.
본 발명의 범주 내에는 또한 항원-결합 도메인을 포함하는 항원-결합 도메인 및/또는 스캐폴드 단백질이 포괄되고, 여기서 항원-결합 도메인은 "다가" 형태이고 둘 이상의 (1가) 항원-결합 도메인, 예컨대 Ig 도메인을 함께 재조합 DNA 기술에 의해서, 또는 화학적으로 결합시켜 형성된다. 다가 구성체의 비제한적인 예는 "2가" 구성체, "3가" 구성체, "4가" 구성체 등을 포함한다. 다가 구성체 내에 포함되는 면역글로불린 도메인은 동일할 수 있거나 또는 상이할 수 있다. 특히, 본 발명의 면역글로불린 도메인 또는 본 발명의 스캐폴드 단백질을 구성하는 Ig 도메인은 "다중특이적" 형태이고, 둘 이상의 면역글로불린 도메인을 연결시켜 형성되며, 이중에서 적어도 하나는 상이한 특이성을 갖는다. 다중특이적 구성체의 비제한적인 예는 "이중특이적" 구성체, "삼중특이적" 구성체, "사중특이적" 구성체 등을 포함한다. 이를 더욱 예시하기 위해서, 본 발명의 임의의 다가 또는 다중특이적 (본 명세서에 정의된 바와 같음) 면역글로불린 도메인은 동일 항원 상의 둘 이상의 상이한 에피토프에 대해서, 예를 들어 표적의 둘 이상의 상이한 에피토프에 대해서, 적합하게 유도될 수 있거나, 또는 둘 이상의 상이한 항원에 대해서, 예를 들어 표적의 에피토프 및 표적의 천연 결합 파트너의 에피토프에 대해 유도될 수 있다. 특히 본 발명의 1가 면역글로불린 도메인은 본 발명의 다가 또는 다중특이적 면역글로불린 단일 가변 도메인에 의해 부여되는 친화성보다 낮은 적은 친화성으로 표적에 결합하게 될 것이다. 특정 실시형태에서, 본 발명의 이러한 다가 또는 다중특이적 Ig 도메인은 Ig 도메인의 적어도 하나의 이의 토폴로지의 방해를 통해서, Ig 도메인 및 스캐폴드 단백질로서 서로 융합될 수 있다. 그렇지 않으면, 본 발명의 다가 또는 다중특이적 Ig 도메인은 그들 N-말단 및/또는 C-말단을 통해서 통상의 방식으로 융합될 수 있고, 또한 융합되는 Ig 도메인의 방해를 통해서, 또는 다가 또는 다중특이적 Ig 도메인 그 자체의 Ig 도메인의 방해를 통해서, 다른 Ig 도메인 및/또는 다른 스캐폴드에 융합되도록 전체로서 적용될 수 있다.
다른 실시형태는 비면역글로불린이지만, 다른 유형의 단백질에 결합하는 것으로 알려진 단백질인 스캐폴드 단백질을 제공하고, 그러므로 역시 치료적 표적화에 고려될 수 있다.
대안적인 양상에서, 본 발명의 항원-결합 키메라 단백질은 변형된 아미노산을 포함한다. 다른 실시형태는 변형된 형태로 존재하고/하거나, 다른 모이어티를 포함 (또는 그와 융합)하는 스캐폴드 단백질을 기술한다. 대안적인 실시형태는 변형된 형태로 존재하고/하거나, 다른 모이어티를 포함하는 항원-결합 키메라 단백질의 항원-결합 도메인을 기술한다. 변형의 예를 비롯하여, 변형할 수 있는 본 발명의 단백질 도메인 내 아미노산 잔기의 예 (즉, 단백질 골격, 바람직하게는 측쇄 상에 존재), 이러한 변형을 도입시키는데 사용될 수 있는 방법 및 기술 및 이러한 변형의 잠재적 용도 및 장점은 당업자에게 자명할 것이다. 예를 들어, 이러한 변형은 결합제 상에 또는 결합제에 하나 이상의 작용기, 잔기 또는 모이어티의 도입 (예를 들어, 공유 연결 또는 다른 적합한 방식에 의함)을 포함할 수 있다. 그들을 도입시키기 위한 이러한 작용기 및 기술의 예는 당업자에게 자명할 것이고, 일반적으로 당분야에서 언급하는 모든 작용기 및 기술을 비롯하여 약학 단백질의 변형, 특히 항체 또는 항체 단편 (ScFv 및 단일 도메인 항체 포함)의 변형을 위한 그 자체로 공지된 작용기 및 기술을 포함할 수 있고, 예를 들어 [Remington's Pharmaceutical Sciences, 16th ed., Mack Publishing Co., Easton, PA (1980)]를 참조한다. 이러한 작용기는 역시 당업자에게 자명한 바와 같이, 예를 들어 스캐폴드 단백질에 직접적으로 (예를 들어, 공유적으로), 또는 임의로는 적합한 링커 또는 스페이서를 통해 연결될 수 있다.
항원-결합 키메라 단백질이 잠재적으로 치료적 가치가 있는 경우에, 약학 단백질의 반감기 증가 및/또는 면역원성 감소를 위해 가장 광범위하게 사용되는 기술 중 하나는 적합한 약학적으로 허용가능한 중합체, 예컨대 폴리(에틸렌글리콜) (PEG) 또는 이의 유도체 (예컨대 메톡시폴리(에틸렌글리콜) 또는 mPEG)의 부착을 포함한다. 일반적으로, 임의의 적합한 형태의 PEG화, 예컨대 항체 및 항체 단편 (제한없이 (단일) 도메인 항체 및 scFv)에 대해 당분야에서 사용되는 PEG화를 사용할 수 있으며, 예를 들어 [Chapman, Nat. Biotechnol., 54, 531-545 (2002); by Veronese and Harris, Adv. Drug Deliv. Rev. 54, 453-456 (2003)], [Harris and Chess, Nat. Rev. Drug. Discov., 2, (2003)] 및 WO04060965를 참조한다. 단백질의 PEG화를 위한 다양한 시약은 또한 예를 들어 Nektar Therapeutics, USA에서 상업적으로 입수가능하다. 바람직하게, 부위-지정 PEG화는 특히, 시스테인-잔기를 통해서 사용된다 (예를 들어, [Yang et al., Protein Engineering, 16, 10, 761-770 (2003)] 참조). 예를 들어, 이러한 목적을 위해서, PEG는 스캐폴드에서 천연적으로 존재하는 시스테인 잔기에 부착될 수 있거나, 또는 스캐폴드 단백질은 PEG의 부착을 위한 하나 이상의 시스테인 잔기를 적합하게 도입시키도록 변형될 수 있거나, 또는 PEG의 부착을 위한 하나 이상의 시스테인 잔기를 포함하는 아미노산 잔기가 스캐폴드의 N-말단 및/또는 C-말단에 융합될 수 있으며, 단백질 조작의 모든 사용 기술은 그 자체로 당업자에게 공지되어 있다. 바람직하게, 본 발명의 신규 항원-결합 키메라 단백질의 스캐폴드 단백질의 경우에, 5000 초과, 예컨대 10,000 초과, 200,000 미만, 예컨대 100,000 미만; 예를 들어 20,000-80,000 범위의 분자량을 갖는 PEG가 사용된다. 일반적으로 덜 바람직한 다른 변형은 본 발명의 항원-결합 키메라 단백질을 발현시키는데 사용되는 숙주 세포에 따라서, 일반적으로 공번역 및/또는 번역후 변형의 일부로서, N-연결 또는 O-연결 글리코실화를 포함한다. 상기 항원-결합 키메라 단백질의 반감기를 증가시키기 위한 다른 기술은 펩티드 (예를 들어, 혈청 단백질 예컨대 알부민에 대한 펩티드)의 사용, 스캐폴드 단백질로서 또는 그를 통해서, 항원-결합 키메라 단백질의 추가 융합으로, 또는 이기능성 구성체 (예를 들어, 표적 1에 대한 하나의 항원-결합 도메인 및 혈청 단백질 예컨대 알부민에 대한 스캐폴드 단백질 내에 존재하는 하나의 항원-결합 도메인)로의 조작을 포함할 수 있다.
본 발명의 다른 측면은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 신규 항원-결합 키메라 단백질에 관한 것으로서, 상기 스캐폴드 단백질은 상기 도메인의 토폴로지를 방해하고, 상기 스캐폴드 단백질은 표지된 단백질인, 변형된 단백질이다. 대안적으로, 상기 항원-결합 도메인은 표지된 단백질이다. 또 다른 변형은 표지된 항원-결합 키메라 단백질의 의도하는 용도에 따라서, 하나 이상의 검출가능한 표지 또는 다른 신호-발생기의 도입을 포함할 수 있다. 그들을 부착, 사용 및 검출하기 위해 적합한 표지 및 기술은 당업자에게 자명할 것이고, 예를 들어, 제한없이 형광성 표지, (예컨대 IRDye800, VivoTag800, 플루오레세인, 이소티오시아네이트, 로다민, 피코에리쓰린, 피코시아닌, 알로피코시아닌, o-프탈데히드, 및 플루오레카민 및 형광성 금속 예컨대 Eu 또는 란탄계 다른 금속), 인광성 표지, 화학발광성 표지 생물발광성 표지 (예컨대 루미날, 이소루미놀, 테로마틱 아크리디늄 에스테르, 이미다졸, 아크리디늄 염, 옥사레이트 에스테르, 디옥세탄 또는 GFP 및 이의 유사체), 방사성 동위원소, 금속, 금속 킬레이트 또는 금속계 양이온 또는 생체내, 시험관내 또는 제자리 진단 및 영상화에 특히 적합한 다른 금속 또는 금속계 양이온을 비롯하여 발색단 및 효소 (예컨대 말레이트 디히드로게나제, 스타필로코커스 뉴클레아제, 델타-V-스테로이드 이소머라제, 효모 알콜 디히드로게나제, 알파-글리세로포스페이트 디히드로게나제, 트리오스 포스페이트 이소머라제, 바이오틴아비딘 퍼옥시다제, 홀스래디쉬 퍼옥시다제, 알칼리 포스파타제, 아스파라기나제, 글루코스 옥시다제, 베타-갈락토시다제, 리보뉴클레아제, 우레아제, 카탈라제, 글루코스-VI-포스페이트 디히드로게나제, 글루코아밀라제 및 아세틸콜린 에스터라제)를 포함한다. 다른 적합한 표지는 당업자에게 자명할 것이고, 예를 들어 NMR 또는 ESR 분광법을 사용해 검출할 수 있는 모이어티를 포함한다. 이러한 본 발명의 표지된 항원-결합 키메라 단백질은 예를 들어 특별한 표지의 선택에 따라서, 시험관내, 생체내 또는 제자리 어세이 (그 자체로 공지된 면역어세이 예컨대 ELISA, RIA, EIA 및 기타 "샌드위치 어세이" 등 포함)를 비롯하여 생체내 진단 및 영상화 목적에 사용될 수 있다. 당업자에게 자명한 바와 같이, 다른 변형은 예를 들어 상기 언급된 금속 또는 금속계 양이온 중 하나를 킬레이트하기 위해, 킬레이트화 기의 도입을 포함할 수 있다. 예를 들어 적합한 킬레이트화 기는 제한없이, 2,2',2"-(10-(2-((2,5-디옥소피롤리딘-1-일)옥시)-2-옥소에틸)-1,4,7,10-테트라아자시클로도데칸-1,4,7-트리일)트리아세트산 (DOTA), 2,2'-(7-(2-((2,5-디옥소피롤리딘-1-일)옥시)-2-옥소에틸)-1,4,7-트리아조난-1,4-디일)디아세트산 (NOTA), 디에틸렌트리아민펜타아세트산 (DTPA) 또는 에틸렌디아민테트라아세트산 (EDTA)을 포함한다. 역시 다른 변형은 바이오틴-(스트렙)타비딘 결합 쌍과 같이, 특별한 결합쌍의 한 부분인 작용기의 도입을 포함할 수 있다. 이러한 작용기는 항원-결합 키메라 단백질을, 즉 결합쌍의 형성을 통해서, 결합쌍의 다른 절반에 결합하는 다른 단백질, 폴리펩티드 또는 화학적 화합물에 연결시키는데 사용될 수 있다. 예를 들어, 본 발명의 항원-결합 키메라 단백질은 바이오틴에 접합될 수 있고, 아비딘 또는 스트렙타비딘에 접합된 다른 단백질, 폴리펩티드, 화합물 또는 캐리어에 연결될 수 있다. 예를 들어, 이러한 접합된 항원-결합 키메라 단백질은 예를 들어 검출가능한 신호-생산제가 아비딘 또는 스트렙타비딘에 접합되는 진단 시스템에서 리포터로서 사용될 수 있다. 이러한 결합쌍은 예를 들어 또한 약학 목적에 적합한 캐리어를 포함하는, 캐리어에 본 발명의 항원-결합 키메라 단백질을 결합시키는데 사용될 수 있다. 비제한적인 일례는 [Cao and Suresh, Journal of Drug Targetting, 8, 4, 257 (2000)]에 기술된 리포솜 제제이다. 이러한 결합쌍은 또한 본 발명의 항원-결합 키메라 단백질에 치료적 활성제를 연결시키는데 사용될 수 있다. 또한, 페이-로드로서 사용하기 위한 독성 표지, 또는 방사성핵종의 사용이 또한 상기 항원-결합 키메라 단백질의 범주 내에 속한다. 마지막으로, 스캐폴드 단백질에 연결 또는 융합되는 "표지" 또는 "태그"의 사용은 Ig 도메인의 표적 단백질이 비공유적으로 표지될 수 있다는 장점을 제공한다.
본 발명의 추가 양상은 본 발명의 상기 항원-결합 키메라 단백질을 코딩하는 핵산 분자에 관한 것이다. 상기 핵산 분자는 상기 항원-결합 도메인 및 상기 스캐폴드 단백질(들), 및/또는 이의 단편의 코딩 서열을 포함하고, 상기 도메인의 방해된 토폴로지는 상기 도메인 서열이 스캐폴드 단백질 서열(들) (또는 원형 배열 서열, 또는 이의 단편)의 삽입을 함유하게 되어서, N-말단 항원-결합 도메인 단편 및 C-말단 항원-결합 도메인 단편이 상기 핵산 분자 내에서 스캐폴드 단백질 서열 또는 이의 단편에 의해 분리된다는 사실을 반영한다.
다른 실시형태에서, 키메라 유전자는 적어도 프로모터, 항원-결합 키메라 단백질을 코딩하는 상기 핵산 분자, 및 전사 종결 신호를 함유하는 3' 말단 영역을 갖는다고 기술된다. 다른 실시형태는 본 발명의 상기 항원-결합 키메라 단백질을 코딩하거나, 또는 상기 항원-결합 키메라 단백질을 코딩하는 핵산 분자 또는 키메라 유전자를 포함하는 발현 카세트에 관한 것이다. 일정 실시형태에서 상기 발현 카세트는 표적의 가장 적합한 결합제에 대해 선택하기 위한 Ig 도메인의 거대 세트를 함유하는, 면역 라이브러리로서 일반 포맷에 적용된다.
추가 실시형태는 상기 발현 카세트 또는 본 발명의 항원-결합 키메라 단백질을 코딩하는 핵산 분자를 포함하는 벡터에 관한 것이다. 특정 실시형태에서, 이. 콜라이에서 발현을 위한 벡터는 항원-결합 키메라 단백질을 생산하고 그들 표적 존재 또는 부재 하에서 그들을 정제할 수 있게 한다.
대안적인 실시형태는 본 발명의 항원-결합 키메라 단백질, 또는 본 발명의 항원-결합 키메라 단백질을 코딩하는 핵산 분자 또는 발현 카세트 또는 벡터를 포함하는, 숙주 세포에 관한 것이다. 특정 실시형태에서, 상기 숙주 세포는 상기 항원-결합 키메라 단백질의 항원-결합 도메인에 특이적으로 결합하는 항원 또는 표적 단백질을 또한 공발현시킨다.
다른 실시형태는 리간드 스크리닝, 약물 스크리닝, 단백질 포획 및 정제, 또는 생물리학적 연구를 위한, 상기 숙주 세포, 또는 이의 단리된 막 조제물, 또는 이로부터 단리된 단백질의 용도를 개시한다.
상기 벡터를 제공하는 본 발명은 일반 융합 벡터로 고속대량 클로닝을 위한 선택안을 포괄한다. 상기 일반 벡터는 추가 실시형태에 기술되어 있고, 상기 벡터는 효모, 파지, 박테리아 또는 바이러스에서의 표면 디스플레이에 특히 적합하다. 뿐만 아니라, 상기 벡터는 상이한 Ig 도메인의 거대 세트를 갖는 이러한 일반 벡터 또는 발현 카세트를 포함하는 면역 라이브러리의 선택 및 스크리닝에서의 적용분야를 확인할 수 있고, 보존된 Ig 도메인의 동일한 N-말단부, 및 스캐폴드 단백질은 라이브러리에 의해 제공된 나머지 Ig 도메인 서열과 융합된다. 그래서, 특이적 표적에 대한 신규 항원-결합 키메라 단백질의 스크리닝을 위해 구축된 상기 라이브러리 내 차등적 서열은 Ig 도메인 서열, 보다 특히 상기 Ig 도메인 라이브러리의 CDR 영역 내 차이를 통해 제공된다.
본 발명의 다른 실시형태는 (a) 벡터, 발현 카세트, 키메라 유전자 또는 본 발명의 핵산 서열을 포함하는 숙주를 항원-결합 키메라 단백질의 발현에 좋은 조건 하에서, 배양시키는 단계, 및 (b) 임의로는, 발현된 폴리펩티드를 회수하는 단계를 포함하는, 본 발명에 따른 항원-결합 키메라 단백질을 제조하는 방법에 관한 것이다.
일 실시형태에서, 본 발명의 벡터는 항원-결합 키메라 단백질의 컬렉션, 바람직하게 면역 라이브러리를 세포 개체군의 세포외 표면에 디스플레이하는 단계를 포함하는 방법에서 사용에 적합하다. 표면 디스플레이 방법은 Hoogenboom (2005; Nature Biotechnol 23, 1105-16)가 고찰하였고, 박테리아 디스플레이, 효모 디스플레이, (박테리오)파지 디스플레이를 포함한다. 바람직하게, 세포 개체군은 효모 세포이다. 상이한 효모 표면 디스플레이 방법은 모두 단백질을 코딩하는 플라스미드를 보유하는 효모 세포의 세포외 표면에 라이브러리에 의해 코딩되는 각각의 항원-결합 키메라 단백질을 단단히 연결시키는 수단을 제공한다. 지금까지 기술된 대부분의 효모 디스플레이 방법은 효모 사카로마이세스 세레비지아를 사용하지만, 다른 효모 종, 예를 들어 피키아 파스토리스도 역시 사용될 수 있다. 보다 특히, 일부 실시형태에서, 효모 균주는 사카로마이세스, 피키아, 한세눌라, 스키조사카로마이세스, 클루이베로마이세스, 야로위아, 및 칸디다로 이루어진 군으로부터 선택되는 속 유래이다. 일부 실시형태에서, 효모 종은 에스. 세레비지아 (S. cerevisiae), 피. 파스토리스 (P. pastoris), 에이치. 폴리몰파 (H. polymorpha), 에스. 폼베 (S. pombe), 케이, 락티스 (K. lactis), 와이, 리폴리티카 (Y. lipolytica), 및 씨. 알비칸스 (C. albicans)로 이루어진 군으로부터 선택된다. 대부분의 효모 발현 융합 단백질은 세포-표면 단백질의 표면 발현에서 중요한 역할을 하고 효모의 생존능에 필수적인 GPI (글리코실-포스파티딜-이노시톨) 앵커 단백질을 기반으로 한다. 이러한 한 단백질, 알파-글루티닌은 AGA1에 의해 코딩되는 코어 서브유닛으로 이루어지고 AGA2에 의해 코딩되는 소형 결합 서브유닛에 디술피드 브릿지를 통해 연결된다. 핵산 라이브러리를 통해 코딩되는 단백질은 AGA1의 N-말단 영역 또는 AGA2의 C-말단 또는 N-말단에 도입될 수 있다. 양쪽 융합 패턴은 효모 세포 표면 상에서 폴리펩티드의 디스플레이를 야기시키게 될 것이다.
본 명세서에 개시된 벡터는 또한 단백질을 표면 디스플레이 하기 위한 원핵생물 숙주 세포에 적합할 수 있다. 이러한 목적에 적합한 원핵생물은 유박테리아, 예컨대 그람 음성 또는 그람 양성 유기체, 예를 들어 엔테로박테리아과 (Enterobacteriaceae) 예컨대 에스케리치아 (Escherichia), 예를 들어 이. 콜라이 (E. coli), 엔테로박터 (Enterobacter), 어위니아 (Erwinia), 클렙시엘라 (Klebsiella), 프로테우스 (Proteus), 살모넬라 (Salmonella) 예를 들어, 살모넬라 티피뮤리움 (Salmonella typhimurium), 세라티아 (Serratia), 예를 들어, 세라티아 마르세칸스 (Serratia marcescans), 및 시겔라 (Shigella)를 비롯하여, 바실러스 (Bacilli) 예컨대 비. 서브틸리스 (B. subtilis) 및 비. 리체니포르미스 (B. licheniformis) (예를 들어, [DD 266,710 published Apr. 12, 1989]에 개시된 비. 리체니포르미스 41 P), 슈도모나스 (Pseudomonas) 예컨대 피. 애루지노사 (P. aeruginosa), 및 스트렙토마이세스 (Streptomyces)를 포함한다. 바람직한 이. 콜라이 클로닝 숙주 하나는 이. 콜라이 294 (ATCC 31,446)이지만, 다른 균주 예컨대 이. 콜라이 B, 이. 콜라이 X1776 (ATCC 31,537), 및 이. 콜라이 W3110 (ATCC 27,325)이 적합하다. 이들 예는 제한적이라기 보다는 예시적이다. 숙주 세포가 원핵생물 세포일 때, 적합한 세포 표면 단백질의 예는 적합한 박테리아 외부 막 단백질을 포함한다. 이러한 외부 막 단백질은 필리 및 플라겔라, 리포단백질, 빙핵 단백질, 및 오토트랜스포터를 포함한다. 이종성 단백질 디스플레이에 사용되는 예시적인 박테리아 단백질은 LamB (Charbit et al., EMBO J, 5(11): 3029-37 (1986)), OmpA (Freudl, Gene, 82(2): 229-36 (1989)) 및 인티민 (Wentzel et al., J Biol Chem, 274(30): 21037-43, (1999))을 포함한다. 추가의 예시적인 외부 막 단백질은 제한없이 FliC, 풀룰루나제, OprF, OprI, PhoE, MisL, 및 시토리신을 포함한다. 표면 디스플레이에 사용되는 박테리아 막 단백질의 광범위한 목록은 [Lee et al., Trends Biotechnol, 21(1): 45-52 (2003)], [Jose, Appl Microbiol Biotechnol, 69(6): 607-14 (2006)], 및 [Daugherty, Curr Opin Struct Biol, 17(4): 474-80 (2007)]에 상술되어 있다.
뿐만 아니라, 심층 스크리닝 선택을 허용하기 위해서, 벡터는 효모 및/또는 파지 디스플레이에 적용된 후에, 각각 FACS 및 패닝이 후속될 수 있다. 예를 들어 형광-활성화 세포 분류법 (FACS)의 분해력과 조합하여 효모 세포 상에서 항원-결합 키메라의 디스플레이는 바람직한 선택 방법을 제공한다. 효모 디스플레이에서 각각의 항원-결합 단백질은 예를 들어 단일 세포 표면 상에 ∼50.000 카피수로 Aga2p 단백질과의 융합체로서 디스플레이된다. FACS에 의한 선택을 위해서, 상이한 형광성 염료에 의한 표지화는 선택 과정을 결정하게 될 것이다. 항원-결합 키메라-디스플레이 효모 라이브러리는 다음에 사용된 형광성 단백질의 혼합물로 염색될 수 있다. 그 다음으로 2-색 FACS는 개별 세포 개체군을 분해하기 위해 특별한 효모 세포 상에 디스플레이되는 각각의 항원-결합 키메라의 성질을 분석하는데 사용될 수 있다. 관심 단백질을 표적화하는데 매우 적합한 항원-결합 키메라를 디스플레이하는 효모 세포가 결합하게 되고 2-색 FACS에서 대각선을 따라 분류될 수 있다. 이러한 선택 방법에서 벡터의 사용은 예를 들어 일시적 단백질-단백질 상호작용 또는 입체구조-선택적 결합을 특이적으로 표적화하는 항원-결합 키메라 단백질의 스크리닝이 바람직할 때 가장 바람직하다. 유사하게, 파지 디스플레이용 벡터가 적용되고, 박테리오파지 상에서 항원-결합 키메라의 디스플레이에 사용된 후에, 패닝이 후속된다. 디스플레이는 예를 들어 상기 일반 벡터 내에, 파지 외피 단백질 III과 항원-결합 키메라의 융합을 통해 M13 입자 상에서 수행될 수 있다 (Hoogenboom, 2000; Immunology today. 5699:371-378). 예를 들어, 일정 입체구조 및/또는 일시적 단백질-단백질 상호작용에 특이적으로 결합하는 항원-결합 단백질의 선택을 위해서, 오직 하나의 상호작용 프로토머가 고체상에 고정된다. 파지-디스플레이된 항원-결합 키메라의 패닝에 의한 생물-선택은 과량의 나머지 가용성 프로토머의 존재 하에서 수행된다. 임의로는, 고체상에 고정된 가교된 복합체 또는 단백질 상에서의 패닝 라운드로 시작될 수 있다.
본 발명의 다른 양상은 상기 항원-결합 키메라 단백질을 포함하거나, 또는 항원-결합 키메라 단백질, 및 항원 또는 표적 단백질(들)의 조성물을 포함하는 복합체에 관한 것이고, 상기 표적 단백질은 항원-결합 키메라 단백질 또는 항원-결합 키메라 단백질의 조성물에 특이적으로 결합한다. 보다 특히, 상기 표적 단백질은 상기 항원-결합 키메라 단백질의 항원-결합 도메인에 결합되고, 보다 더 특히, 일 실시형태에서, 상기 항원-결합 도메인은 Ig 도메인, 상기 항원-결합 키메라 단백질의 Ig 도메인의 CDR이다. 일 실시형태는 본 명세서에 기술된 바와 같은 복합체를 개시하고, 여기서 항원-결합 도메인은 입체구조 선택적 결합 도메인이다. 보다 특히, 복합체는 항원-결합 도메인이 기능적 입체구조의 표적 단백질을 안정화시키는 것이 개시된다. 보다 특히 상기 기능적 입체구조는 효현제 입체구조를 포함할 수 있거나, 부분 효현제 입체구조를 포함할 수 있거나, 특히 편향 효현제 입체구조를 포함할 수 있다. 대안적으로, 본 발명의 복합체는 항원-결합 도메인이 기능적 입체구조인 표적 단백질을 안정화시키는 것이 개시되고, 상기 기능적 입체구조는 불활성 입체구조이거나, 또는 상기 구조적 입체구조는 역 효현제 입체구조를 포함한다.
본 발명의 추가 양상은 상기 항원-결합 키메라 단백질을 포함하는 조성물에 관한 것이다. 본 발명의 "조성물"은 동결건조된 항원-결합 키메라 단백질을 포함하는 제1 용기 및 동결건조된 단백질의 재현탁을 위한 용액을 포함하는 제2 용기를 포함하는 키트의 형태로 제공될 수 있다. 단백질 분말은 동결건조 동안 단백질을 안정화시키기 위해서 하나 이상의 저온보존제 예컨대 수크로스, 덱스트란, 솔비톨 및 아미노산을 포함할 수 있다. 대안적으로, 조성물은 현탁액 또는 용액에 항원-결합 키메라 단백질을 포함하는 단일 용기로 제공된다. 각 용액은 하나 이상의 부형제(들)를 함유할 수 있다. 전형적으로 용액은 물-기반이다. 그러므로, 정제수가 주요 부형제를 형성할 수 있다. 예를 들어, 바람직한 최종 농도를 제공하기 위한 단백질의 희석은 일반적으로 주사용 수 (WFI)로 수행될 것이다. 전형적으로 용액은 완충제를 함유한다. 그러므로, 추가 부형제는 완충제 및 pH 조절제 예컨대 소듐 시트레이트, 소듐 디히드로겐 포스페이트 모노히드레이트, 및 소듐 히드록시드를 포함한다. 일부 예에서, 증점제 예컨대 잔탄이 추가 부형제로서 존재할 수 있다. 계면활성제, 특히 비이온성 계면활성제 예컨대 폴리솔베이트 80이 또한 존재할 수 있다. 다른 부형제는 수크로스, 솔비톨, 무기 염, 아미노산 및 비타민을 포함한다.
본 발명은 또한 본 발명의 하나 이상의 화합물, 특히, 항원-결합 키메라 단백질 및 약학적으로 허용가능한 담체 또는 희석제를 포함하는 "약학 조성물"에 관한 것이다. 이들 약학 조성물은 이를 필요로 하는 환자에게 투여되어 바람직한 약학 효과를 달성하는데 이용될 수 있다. 본 발명은 약학적으로 허용가능한 담체 및 본 발명의 화합물 또는 이의 염의 약학적 유효량을 포함하는 약학 조성물을 포함한다. 화합물의 약학적 유효량은 바람직하게 치료하려는 특정 병태에 영향력을 발휘하거나 또는 결과를 일으키는 양이다. 일반적으로, "치료적 유효량", "치료적 유효 용량" 및 "유효량"은 바람직한 결과 또는 결과들을 달성하는데 필요한 양을 의미한다. 당업자는 역가 및 따라서 "유효량"이 본 발명의 화합물의 정체성 및 구조에 따라 가변적일 수 있다는 것을 인식하게 될 것이다. 당업자는 화합물의 역가를 쉽게 평가할 수 있다. "약학적으로 허용가능한"이란 생물학적이지 않거나 또는 달리 바람직하지 않은 물질을 의미하고, 다시 말해서, 물질이 그것이 함유된 약학 조성물의 임의의 다른 성분과 유해한 방식으로 상호작용하거나 또는 임의의 바람직하지 않은 생물학적 효과를 야기시키지 않고 화합물과 함께 개체에게 투여될 수 있다. 약학적으로 허용가능한 담체는 바람직하게 담체에 기인한 임의의 부작용이 활성 성분의 유익한 효과를 손상시키지 않도록 활성 성분의 유효한 활성과 일관되는 농도에서 환자에게 비교적 무독성이고 무해한 담체이다. 적합한 담체 또는 보조제는 전형적으로 하기의 비제한적인 목록에 포함되는 화합물 중 하나 이상을 포함한다: 거대한 서서히 대사되는 거대분자 예컨대 단백질, 폴리사카라이드, 폴리락트산, 폴리글리콜산, 중합체 아미노산, 아미노산 공중합체 및 불활성 바이러스 입자. 이러한 성분 및 절차는 하기 참조에 기술된 것들을 포함하고, 각각은 참조로 본 명세서에 편입된다: Powell, M. F. et al. ("Compendium of excipients for Parenteral Formulations" PDA Journal of Pharmaceutical Science & Technology 1998, 52(5), 238-311), Strickley, R.G ("Parenteral Formulations of Small Molecule Therapeutics Marketed in the United States (1999)-Part-1" PDA Journal of Pharmaceutical Science & Technology 1999, 53(6), 324-349), 및 Nema, S. et al. ("Excipients and Their Use in Injectable Products" PDA Journal of Pharmaceutical Science & Technology 1997, 51 (4), 166-171).
본 명세서에서 사용되는 용어 "부형제"는 약학 조성물에 존재할 수 있고 활성 성분이 아닌 모든 물질, 예컨대 염, 결합제 (예를 들어, 락토스, 덱스트로스, 수크로스, 트레할로스, 솔비톨, 만니톨), 윤활제, 증점제, 계면 활성제, 보존제, 유화제, 완충 물질, 안정화제, 풍미제 또는 착색제를 포함하고자 한다. "희석제", 특히 "약학적으로 허용가능한 비히클"은 비히클, 예컨대 물, 염수, 생리적 염 용액, 글리세롤, 에탄올 등을 포함한다. 보조 물질 예컨대 습윤제 또는 유화제, pH 완충 물질, 보존제가 이러한 비히클에 포함될 수 있다.
본 발명의 항원-결합 키메라 단백질 및 약학적으로 허용가능한 담체는 즉시, 지연 및 정기 방출 조제물을 포함한, 임의의 유효한 통상의 제형을 사용해 충분히 공지된 약학적으로 허용가능한 담체와 투여될 수 있고, 임의의 적합한 경로 예컨대 당업자에게 일반적으로 공지된 임의의 것들로 투여될 수 있다. 요법의 경우, 본 발명의 약학 조성물은 표준 기술에 따라 임의 환자에게 투여될 수 있다.
경구 투여의 경우, 화합물은 액상 또는 고상 조제물, 예컨대 캡슐, 알약, 정제, 트로키, 로진제, 멜트, 분말, 용액, 현탁액 또는 에멀션으로 제제화될 수 있고, 약학 조성물의 제조를 위해 당분야에 공지된 방법에 따라 제조될 수 있다. 고형 단위 제형은 예를 들어, 계면활성제, 윤활제, 및 불활성 충전제 예컨대 락토스, 수크로스, 칼슘 포스페이트, 및 옥수수 전분을 함유하는 통상의 경질 또는 연질-제피 젤라틴 유형의 캡슐일 수 있다. 다른 실시형태에서, 본 발명의 화합물은 통상의 정제 베이스 예컨대 락토스, 수크로스 및 옥수수 전분을 결합제 예컨대 아카시아, 옥수수 전분 또는 젤라틴, 투여 후 정제의 분해 및 용해를 보조하고자 하는 붕해제 예컨대 감자 전분, 알긴산, 옥수수 전분, 및 구아르 검, 검 트라가칸트, 아카시아, 정제 과립화의 흐름을 개선시키고 정제 다이스 및 펀치 표면에 정제 물질의 부착을 방지하고자 하는 윤활제, 예를 들어 탈크, 스테아르산, 또는 마그네슘, 칼슘 또는 아연 스테아레이트, 염료, 착색제, 및 풍미제 예컨대 페퍼민트, 윈터그린 오일, 또는 정제의 심미적 품질을 향상시키고 환자에게 보다 수용가능하게 만드는 체리향과 조합하여 타정될 수 있다. 경구 액상 제형에 사용을 위해 적합한 부형제는 약학적으로 허용가능한 계면활성제, 현탁제 또는 유화제의 첨가와 함께 또는 첨가없이, 디칼슘 포스페이트 및 희석제 예컨대 물 및 알콜, 예를 들어 에탄올, 벤질 알콜, 및 폴리에틸렌 알콜을 포함한다. 다양한 다른 물질이 제피로서 존재할 수 있거나 또는 달리 단위 제형의 물리적 형태를 변형시키기 위해 존재할 수 있다. 예를 들어, 정제, 알약 또는 캡슐은 셀락, 당류 또는 둘 모두로 피복될 수 있다. 분산가능한 분말 및 과립이 수성 현탁액의 제조에 적합하다. 그들은 분산제 또는 습윤제, 현탁제 및 하나 이상의 보존제와 혼합하여 활성 성분을 제공한다. 적합한 분산제 또는 습윤제 및 현탁제는 이미 상기에 언급된 것들로 유화된다. 추가 부형제, 예를 들어, 상기 기술된 감미제, 풍미제 및 착색제가 또한 존재할 수 있다.
약학 조성물은 멸균된 주사가능한 수성 현탁액의 형태일 수 있다. 이러한 현탁액은 적합한 분산제 또는 습윤제 및 현탁제 예컨대, 예를 들어 소듐 카복시메틸셀룰로스, 메틸셀룰로스, 히드록시프로필메틸-셀룰로스, 소듐 알기네이트, 폴리비닐피롤리돈, 검 트라가칸트 및 검 아카시아; 천연 발생 포스파티드 예컨대 레시틴, 알킬렌 옥시드와 지방산의 축합 산물, 예를 들어, 폴리옥시에틸렌 스테아레이트, 에틸렌 옥시드와 장쇄 지방족 알콜의 축합 산물, 예를 들어 헵타데카에틸렌옥시세타놀, 에틸렌 옥시드와 지방산 및 헥시톨 유래 부분 에스테르의 축합 산물 예컨대 폴리옥시에틸렌 솔비톨 모노올레에이트, 또는 에틸렌 옥시드와 지방산 및 헥시톨 무수물 유래 부분 에스테르의 축합 산물, 예를 들어 폴리옥시에틸렌 솔비탄 모노올레에이트일 수 있는 분산제 또는 습윤제를 사용하여 공지 방법에 따라 제제화될 수 있다. 멸균 주사가능한 조제물은 또한 무독성의 비경구로 허용가능한 희석제 또는 용매 중 멸균 주사가능한 용액 또는 현탁액일 수 있다. 적용할 수 있는 희석제 및 용매는 예를 들어, 물, 링거액, 등장성 소듐 클로라이드 용액 및 등장성 글루코스 용액이다. 또한, 멸균 고정유가 용매 또는 현탁 매질로서 통상적으로 적용된다. 이러한 목적을 위해서, 합성 모노글리세리드 또는 디글리세리드를 포함한 임의 블랜드, 고정유가 적용될 수 있다. 또한, 지방산 예컨대 올레산이 주사가능한 조제물에 사용될 수 있다.
다른 양상은 표적 단백질의 구조 분석에서, 본 발명의 항원-결합 키메라 단백질 또는 핵산 분자, 키메라 유전자, 발현 카세트, 벡터, 복합체, 또는 조성물의 용도에 관한 것이다. 특히, 표적 단백질의 구조 분석에서 항원-결합 키메라 단백질의 용도로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합하는 단백질이다. 본 명세서에서 사용되는 "구조 분해" 또는 "구조 분석"은 단백질의 원자 배열 또는 원자 좌표의 결정을 의미하고, 종종 생물리적 방법, 예컨대 X-선 결정학 또는 저온 전자 현미경 (cryo-EM)으로 수행된다. 특히, 실시형태는 단일 입자 cryo-EM을 포함하거나 또는 결정학을 포함하는 구조 분석에서의 용도에 관한 것이다. 구조 생물학에서 본 발명의 항원-결합 키메라 단백질의 용도는 결정화 보조제로서 제공되고, 즉 결정 접촉부로서 역할을 하고 대칭성을 증가시키고, 보다 더욱 거대 구조를 분해하는데 매우 가치있지만 주로 오늘날 대항되는 크기 장벽을 감소시키고, 최종적으로는 역시 대칭성을 증가시키는 주요 장점을 제공한다.
구조 결정에서 cryo-EM의 사용은 보다 전통적인 접근법 예컨대 X-선 결정학보다 몇몇 장점을 갖는다. 특히, cryo-EM은 순도, 균질성 및 분량에 대해 분석하려는 샘플에 덜 엄격한 요건을 갖는다. 중요하게, cryo-EM은 구조 결정을 위해 적합한 결정을 형성하지 않는 표적에 적용될 수 있다. 다른 단백질성 분자 예컨대 항원-결합 키메라 단백질 또는 비단백질성 분자 예컨대 핵산과의 복합체로 또는 단독으로, 정제 또는 미정제 단백질의 현탁액이 cryo-EM에 의한 영상화를 위한 탄소 격자로 적용될 수 있다. 코팅된 격자는 냉동-수화 상태로 현탁액 중에 입자를 보존하기 위해, 일반적으로 액상 에탄에서 급속 냉동된다. 더 큰 입자는 저온고정을 통해 유리화된다. 유리화된 샘플은 저온박편절단기에서 얇은 절편 (전형적으로 40 내지 200 nm 두께)으로 절단되고, 절편이 영상화를 위해 전자 현미경 격자 상에 위치될 수 있다. 이미지로부터 수득된 데이터의 품질은 ∼3.3Å정도로 높은 분해능을 수득하기 위해 더 나은 현미경 정렬 및 평행 조사를 사용해 개선될 수 있다. 이러한 높은 분해능에서, 전체 원자 구조의 초기 모델 구축이 가능하다. 그러나, 저분해능 영상화는 선택되거나 또는 밀접하게 관련된 표적 단백질에 대한 원자 분해능에서의 구조 데이터 및 선택된 이종성 단백질 또는 가까운 상동체가 제한된 비교 모델링에 이용가능한 경우에 충분할 수 있다. 데이터 품질을 더 개선시키기 위해서, 현미경은 영상화를 위해 사용되는 동일 조건 하에서 기록되는 탄소 필름 이미지의 퓨리에 전환에서 1/3 Å-1 를 넘는 가시적인 대비 전달 함수 (contrast transfer function) (CTF) 고리를 밝히도록 조심스럽게 정렬될 수 있다. 각 마이크로그래프에 대한 디포커스 값은 소프트웨어 예컨대 CTFFIND를 사용해 결정될 수 있다.
본 발명의 다른 양상은 표적 단백질 또는 관심 단백질의 3-차원 구조를 결정하는 방법에 관한 것으로서, 하기 단계를 포함한다:
(i) 복합체를 형성하도록, 항원-결합 키메라 단백질 또는 본 발명의 항원-결합 키메라 단백질의 조성물, 및 표적 단백질을 제공하는 단계로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질 또는 조성물에 특이적으로 결합하는 것인 단계,
또는 본 발명의 복합체를 제공하는 단계; 및
(ii) 구조 분석을 위해 적합한 조건 하에서 상기 믹스 또는 복합체를 디스플레이하는 단계,
여기서 상기 표적 단백질의 3D 구조는 고분해능에서 결정된다.
특별한 실시형태에서, 상기 구조 분석은 X-선 결정학을 통해 수행된다. 다른 실시형태에서, 상기 3D 분석은 Cryo-EM을 포함한다. 보다 특히, Cryo-EM 분석을 위한 방법론은 하기와 같이 본 명세서에 기술된다. 샘플 (예를 들어, 관심 표적과 복합체로 선택된 메가바디 단백질)은 블롯팅 전에 선택된 최고 성능 방출 격자 (탄소-코팅된 구리 격자, C-Flat, 1.2/1.3 200-mesh: Electron Microscopy Sciences; gold R1.2/1.3 300 mesh UltraAuFoil grids: Quantifoil; 등)에 적용되고 나서, 액상 에탄에 플런지-냉동된다 (Vitrobot Mark IV (FEI) 또는 기타 선택 플런저). 단일 격자의 데이터는 선택 검출기 (예로서 Falcon 3EC 직접 검출기)가 장착된 300kV 전자 현미경 (선택 위상판이 제공된 예로서 Krios 300kV)에서 수집된다. 마이크로그래프는 예상되는 메가바디-항원 복합체 크기에 적합한 적절한 배율에서 전자-계측 모드로 수집된다. 수집된 마이크로그래프는 추가 이미지 처리 전에 수동으로 검토된다. 선택 소프트웨어 (예로서, RELION, SPHIRE 패키지)에 의해 계기 보정, 빔 유도 방식, 용량-가중, CTF 적합화 상 이동 추정이 적용된다. 선택 소프트웨어를 사용하여 입자를 선택하고 그들을 2D 분류에 사용한다. 2D 클래스를 수동으로 조사하고 거짓 양성을 제거한다. 데이터 수집 설정에 따라 입자를 저장한다. 적절한 저역 필터를 적용하고 다수 (예로서 6)의 3D 클래스를 생성시켜서 초기 3D 기준 모델을 생성시킨다. 3D 정밀화 (필요하면 소프트 마스크 사용)를 위해 본래 입자를 사용한다. FSC (Fourier Shell Correlation) = 0.143 기준을 사용하여 재구성 분해능을 추정한다. 국소 분해는 Scipion의 MonoRes 구현을 통해 계산하였다. 재구성된 cryo-EM 지도는 UCSF Chimera 및 Coot 소프트웨어를 사용하여 분석하였다. 디자인 모델은 UCSF Chimera를 사용해 초기에 적합화시키고 선택 소프트웨어 (UCSF Chimera, PyMOL 또는 Coot)로 분석하였다.
본 발명의 방법의 다른 장점은 통상의 방식에서 고도로 순수한 단백질에 의해서만 오직 가능한, 구조 분석이 항원-결합 키메라 단백질의 사용 덕분에 순도 요건에 덜 엄격하다는 것이다. 이러한 항원-결합 단백질은 특히 나노바디의 경우에, 복합체 혼합물 내에서, 이에 에피토프와의 결합을 통해 관심 단백질을 특이적으로 걸러내게 된다. 표적 단백질을 이러한 방식으로 포획, 냉동하고 cryo-EM을 통해 분석할 수 있다.
대안적인 실시형태에서 상기 방법은 3D 분석에 적합하고 여기서 표적 단백질은 일시적 단백질-단백질 복합체이다. 추가로, 상기 키메라 항원-결합 분자는 또한 표적이 그들 구조 분석을 허용하게 일시적 단백질-단백질 상호작용을 안정화시키기 위한 표적의 3-차원 구조를 결정하기 위한 방법에 적용될 수 있다.
다른 실시형태는 하기 단계를 포함하는, 동일 표적 단백질의 상이한 에피토프에 결합하는 항원-결합 키메라 단백질의 패널에 대한 선택 또는 스크리닝 방법에 관한 것이다: (i) 표적 단백질에 결합하는 항원-결합 키메라 단백질의 면역 라이브러리를 디자인하는 단계, 및 (ii) 상기 표적의 몇몇 에피토프에 결합하는 단백질을 포함하는 항원-결합 키메라 단백질 패널을 수득하기 위해서 표면 효모 디스플레이, 파지 디스플레이 또는 박테리오파지를 통해 항원-결합 키메라 단백질을 선택하는 단계로서, 그리하여 표적 단백질의 몇몇 입체구조가 별개 이미지로 예를 들어 cryo-EM에서 분석될 수 있게 된다.
다른 실시형태에서, 본 발명의 상기 방법 및 상기 항원-결합 키메라 단백질은 구조-기반 약물 디자인 및 구조-기반 약물 스크리닝에 사용된다. 구조-기반 약물 디자인의 반복 과정은 종종 최적화된 선두체가 제I상 임상 시험으로 가기 전에 다수 사이클을 통해 진행된다. 제1 사이클은 클로닝, 정제, 및 3개 주요 방법: X-ray 결정학, NMR, 또는 상동성 모델링 중 하나를 통해서 표적 단백질 또는 핵산의 구조 결정을 포함한다. 컴퓨터 알고리즘을 사용하여, 데이터베이스의 화합물 또는 화합물의 단편이 구조의 선택된 영역에 위치된다. 본 발명의 항원-결합 키메라 단백질을 사용하여 표적의 일정 구조적 입체구조를 고정 또는 안정화시킬 수 있다. 선택된 화합물은 이 표적 부위와 그들의 입체적 및 정전기적 상호작용을 기반으로 채점되어 등급분류되고, 최고 화합물이 생화학 어세이에서 시험된다. 제2 사이클에서, 시험관내에서 적어도 마이크로몰로 억제했던 하나로서, 제1 사이클로부터의 유망한 선두체와 복합체로서 표적의 구조 결정은, 역가를 증가시키기 위해 최적화시킬 수 있는 화합물 상의 부위를 밝혀준다. 또한 이 시점에, 본 발명의 항원-결합 키메라 단백질은 이것이 일정한 입체구조적 상태에서 상기 표적의 구조 분석을 용이하게 하므로, 작용하게 될 것이다. 추가 사이클은 최적 선두체의 합성, 새로운 표적: 선두체 복합체의 구조 결정, 및 선두 화합물의 추가 최적화를 포함한다. 약물 디자인 과정의 몇몇 사이클 이후에, 최적 화합물은 일반적으로 결합, 및 종종 표적에 대한 특이성에서 두드러진 개선을 보인다. 라이브러리 스크리닝은 구조 정보뿐만 아니라, 구조-활성-상관성 분석을 위한 의약 화학에 필수적인, 선두체로 더욱 개발되는, 히트를 야기시킨다.
다른 실시형태에서, 본 발명의 방법에서 사용되는 상기 항원-결합 키메라 단백질의 항원-결합 도메인은 나노바디 Ig 도메인을 포함하고, 그리하여, 나노바디를 사용하는 디스플레이된 항원-결합 키메라에 대한 선택이 입체구조적 에피토프에 대한 대개의 결합제를 밝혀주기 때문에 올바르게 폴딩된 표적 단백질의 평균 이미지만을 포함하게 되는 상기 방법의 추가 장점을 제공한다.
다른 실시형태는 하기 단계들을 포함하는, (입체구조-선택적) 화합물을 동정하는 방법에 관한 것이다:
i) 표적 단백질 및 상기 표적 단백질에 특이적으로 결합하는 항원-결합 키메라 단백질을 제공하는 단계;
ii) 시험 화합물을 제공하는 단계;
iii) 표적 단백질에 대한 시험 화합물의 선택적 결합을 평가하는 단계.
특히 바람직한 실시형태에 따라서, 입체구조-선택적 화합물을 동정하는 상기 기술된 방법은 리간드 결합 어세이 또는 경쟁 어세이, 보다 더 바람직하게 방사리간드 결합 또는 경쟁 어세이를 통해 수행된다. 가장 바람직하게, 입체구조-선택적 화합물을 동정하는 상기 기술된 방법은 실시예 섹션에서 더욱 예시하는, 비교 어세이, 보다 특히 비교 리간드 경쟁 어세이, 보다 더 특히 비교 방사리간드 경쟁 어세이로 수행된다.
시험하려는 화합물은 임의의 소형 화합물, 또는 거대분자, 예컨대 단백질, 당류, 핵산 또는 지질일 수 있다. 전형적으로, 시험 화합물은 소형 화학 화합물, 펩티드, 항체 또는 이의 단편이게 될 것이다. 일부 예에서 시험 화합물은 시험 화합물의 라이브러리일 수 있다는 것을 이해할 것이다. 특히, 효현제, 길항제 또는 역효현제 및/또는 조절제와 같은 치료 화합물에 대한 대량고속 스크리닝 어세이가 본 발명의 일부를 형성한다. 대량 고속 목적의 경우, 화합물 라이브러리 또는 조합 라이브러리, 예컨대 알로스테릭 화합물 라이브러리, 펩티드 라이브러리, 항체 라이브러리, 단편-기반 라이브러리, 합성 화합물 라이브러리, 천연 화합물 라이브러리, 파지-디스플레이 라이브러리 등이 사용될 수 있다. 이러한 라이브러리를 제조 및 스크리닝하는 방법론은 당업자에게 공지되어 있다. 시험 화합물은 임의로는 검출가능한 표적에 공유적으로 또는 비공유적으로 연결될 수 있다. 그들을 부착시켜서, 사용하고 검출하기 위한 적합한 검출가능한 표지 및 기술은 당업자에게 자명할 것이고, 제한없이, 분광법, 광화학, 생화학, 면역화학, 전기, 광학 또는 화학 수단을 통해 검출가능한 임의의 조성물을 포함한다. 유용한 표지는 자성 비드 (예를 들어, dynabead), 형광성 염료 (예를 들어, 모든 Alexa Fluor 염료, 플루오레세인 이소티오시아네이트, 텍사스 레드, 로다민, 녹색 형광성 단백질 등), 방사능표지 (e.g. 3H, 125I, 35S, 14C, 또는 32P), 효소 (예를 들어, 홀스 래디쉬 퍼옥시다제, 알칼리 포스파타제), 및 비색 표지 예컨대 콜로이드 금 또는 유색 유리 또는 플라스틱 (예를 들어, 폴리스티렌, 폴리프로필렌, 라텍스 등) 비드를 포함한다. 이러한 표지를 검출하는 수단은 당업자에게 충분히 공지되어 있다. 따라서, 예를 들어, 방사능표지는 사진 필름 또는 섬광 계측기를 사용해 검출될 수 있고, 형광 마커는 방출 조명을 검출하기 위해 광검출기를 사용해 검출할 수 있다. 효소 표지는 전형적으로 효소에 기질을 제공하고 기질에 대한 효소의 작용으로 생산된 반응 산물을 검출하여 검출되며, 비색 표지는 유색 표지를 간단히 가시화하여 검출된다. 다른 적합한 검출가능한 표지는 본 발명의 키메라 폴리펩티드에 관한 본 발명의 제1 양상의 내용에서 앞서 기술하였다. 따라서, 특별한 실시형태에 따라서, 상기 임의의 스크리닝 방법에서 사용되는 시험 화합물은 앞서 본 명세서에 정의된 바와 같은, 폴리펩티드, 펩티드, 소형 분자, 천연 산물, 펩티드모방체, 핵산, 지질, 리포펩티드, 탄수화물, 항체 또는 이로부터 유래된 임의 단편, 예컨대 Fab, Fab' 및 F(ab')2, Fd, 단쇄 Fvs (scFv), 단쇄 항체, 디술피드-연결 Fv (dsFv) 및 VL 또는 VH 도메인을 포함하는 단계, 중쇄 항체 (hcAb), 단일 도메인 항체 (sdAb), 미니바디, 낙타과 중쇄 항체로부터 유래된 가변 도메인 (VHH 또는 나노바디), 상어 항체로부터 유래된 신규 항원 수용체의 가변 도메인 (VNAR), 알파바디를 포함하는 단백질 스캐폴드, 단백질 A, 단백질 G, 디자인된 앵키린-반복 도메인 (DARPin), 피브로넥틴 III형 반복부, 안티칼신, 노틴, 조작된 CH2 도메인 (나노항체)을 포함하는 군에서 선택된다. 바람직한 일 실시형태에서, 대량고석 스크리닝 방법은 많은 잠재적 치료 리간드를 함유하는 조합 화학 또는 펩티드 라이브러리를 제공하는 단계를 포함한다. 이러한 "조합 라이브러리" 또는 "화합물 라이브러리"는 바람직한 특징적인 활성을 디스플레이 하는 라이브러리 구성원 (특히 화학종 또는 하위부류)을 동정하기 위해, 본 명세서에 기술된 바와 같은, 하나 이상의 어세이에서 스크리닝된다. "화학 라이브러리"는 궁극적으로 대량고속 스크리닝에서 일반적으로 사용되는 저장된 화학물의 컬렉션이다. "조합 라이브러리"는 다수의 화학적 "빌딩 블록"을 조합하여, 화학 합성 또는 생물학적 합성으로 생성시킨 다양한 화학 화합물의 컬렉션이다. 조합 라이브러리의 제조 및 스크리닝은 당업자에게 충분히 공지되어 있다. 따라서 동정된 화합물은 통상적으로 "선두 화합물"로서 제공될 수 있거나 또는 그들 자체가 잠재적이거나 또는 실제의 치료제로서 사용될 수 있다.
다른 양상은 진단 도구, 또는 보다 특히 생체내 영상화를 위한, 상기 항원-결합 키메라 단백질의 용도를 제공하고, 여기서 스캐폴드 단백질은 표지된 단백질이다.
그리고 마지막 양상은 의약으로서 사용을 위한, 상기 항원-결합 키메라 단백질 또는 핵산, 벡터, 복합체, 또는 조성물을 제공한다. 본 명세서에서 용어 "의약"은 요법, 즉 질환 또는 장애의 예방 또는 치료에서 사용되는 물질/조성물을 의미한다. 본 발명에 따라서, 용어 "질환" 또는 "장애"는 임의의 병리학적 상태, 특히 본 명세서에 정의된 바와 같은 질환 또는 장애를 의미한다.
특정 실시형태, 특정 구성을 비롯한 물질 및/또는 분자가 본 발명에 따른 조작된 세포 및 방법을 위해 본 명세서에서 논의되었지만, 본 발명의 정신 및 범주를 벗어나지 않고 형태 및 상세한 내용에서 다양한 변화 또는 변형이 만들어질 수 있다는 것을 이해한다. 하기 실시예는 특정 실시형태를 보다 잘 예시하기 위해 제공되며, 그들이 본 출원을 제한하는 것으로 간주되어서는 안된다. 본 출원은 오직 청구항에 의해서만 제한된다.
실시예
일반
우리는 항원-결합 도메인 및 스캐폴드 단백질에 의해 구축된 강성 항원-결합 키메라 단백질을 디자인하였고, 여기서 항원-결합 도메인은 2개 또는 3개의 짧은 링커를 통해서, 또는 2개 또는 3개의 직접 연결을 통해 스캐폴드 단백질에 연결된다. 스캐폴드의 성질에 따라서, 이들 강성 항원-결합 키메라 단백질은 상이한 적용분야를 제공한다.
예로서, 본 명세서에서 제시하는 '항원-결합 키메라 단백질'은 또한 '메가바디' (Mb 또는 Mgb)라고도 하며 스캐폴드 단백질, 특히 거대 단량체 스캐폴드 상에 그라프트된 나노바디, VHH 또는 모노바디를 함유하는 면역글로불린- 또는 면역글로불린-유사 도메인으로부터 구축된다. 이들 항원-결합 키메라 또는 특히 본 명세서에서 사용되는 메가바디는 (소형) 단백질의 단백질 구조를 결정하기 위해 중요하고, X-선 결정학 및 cryo-EM 적용분야를 포함해 몇몇 적용에서 도움이 된다. Mb는 표적의 입체구조적 가요성을 감소시키고 결정 접촉부를 형성시키는 경향이 있는 표면을 연장시킬뿐만 아니라, 추가의 위상 정보를 제공하여 차세대 결정화 샤페론으로서 기능한다. 뿐만 아니라, 혁신적인 보조 도구로서 이들 키메라를 사용하여, Cryo-EM을 사용해 고분해능 구조를 수득하기 위해 크기-장벽을 감소시켰다. 특이적 메가바디 항원-결합 키메라 단백질과 이의 표적을 혼합하여, 그들 특이적 결합 상호작용은 "질량" 부가를 획득하고 입자에 대해 정해진 특성이 유리화 얼음에 포매되어서, 정확한 이미지 정렬을 촉진하고 3D 재구성의 분해능을 개선시킨다. 이러한 항원-결합 키메라 단백질 예컨대 Mb의 사용의 추가 장점은 그들이 1 대 1 비율로 입체구조적 에피토프에 선택적으로 결합하여, 입자 분류를 촉진하여 분류된 입자의 구조/입체구조 균질성을 개선시키고 3D 재구성의 분해능을 개선시킨다는 것이다. 유사하지만, 동일 단백질 상의 상이한 에피토프에 결합하는 상이한 Mb의 상당한 세트가 동일 거대분자 복합체로부터 상이한 입자를 제조하는데 사용/조합될 수 있다.
이러한 접근법의 개념의 증거로서, 우리는 도 2에 따라 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 HopQ (에이치. 피로리 유래 주변세포질 단백질, PDB 5LP2)의 어드헤신 도메인을 코딩하는 유전자의 원형 배열 변이체 (cHopQ)를 삽입시켰다 (실시예 1). 우리는 이 키메라를 이. 콜라이의 주변세포질에서 분비 단백질로서 발현시켰고 mg 양의 균질성으로 정제하였다 (실시예 2). 다음으로, 이 키메라 항체를 GFP에 결합시키고 이의 구조를 X-ray 결정학을 통해 분해시켜 확인하였다 (실시예 3). 동일한 스캐폴드를 사용하여, 또한 단백질 복합체를 안정화시키는 항원-결합 키메라 단백질 (실시예 4), GPCR에 결합하는 항원-결합 키메라 단백질 (실시예 5) 및 이온 채널에 결합하는 항원-결합 키메라 단백질 (실시예 6; 및 실시예 22)을 만들었다. 게다가, 실시예 5는 입체구조-특이적 안정화를 수득할 수 있어서, 메가바디를 구축시킨 항원-결합 도메인 또는 Nb의 모든 기능적 성질을 보존한다는 것을 밝혀주었다. 또한 링커 길이 및 링커 조성이 다양한 2개의 짧은 폴리펩티드 연결을 통해서 다른 기능성 HopQ-기반 메가바디를 디자인하기 위해 시험관내 진화 기술을 사용하였다 (실시예 7). 다른 거대 스캐폴드 단백질이 메가바디를 구축하는데 사용될 수 있다는 것을 보여주기 위해서, 다음으로 길이 및 조성이 상이한 2개의 짧은 폴리펩티드 연결을 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 이. 콜라이의 86 kDa 주변세포질 단백질인 YgjK (PDB 3W7S)를 코딩하는 유전자의 원형 배열 변이체를 삽입시켰다 (실시예 8). 또한 메가바디를 강성화시키기 위해서 나노바디의 C-말단 및 링커 펩티드 중 하나 사이에 디술피드 결합을 조작할 수 있다는 것을 보여주었다 (실시예 9). 보다 복잡한 연결 계획을 통해서 스캐폴드에 연결된 Nb로부터 구축된 다른 강성 항체 키메라를 또한 구축하였다. 시험관내 진화를 사용하여, 길이 및 조성이 다양한 3개의 짧은 폴리펩티드 연결부를 통해서 GFP-특이적 나노바디를 아주린 (PDB 2TSA)에 융합시켰다. 아주린은 X-선 결정학에서 변칙 산란에 의한 위상조절에 사용하기 위한 구리 함유 단일 도메인 단백질이다 (실시예 10). 메가바디로서 본 명세서에 기술된 최종 항원-결합 키메라 단백질은 X-선 결정학 및 단일 입자 cryo-EM에 의한 단백질 또는 복합체의 구조적 연구를 가능하게 한다는 것이 확인되었다. 유사하게, 항원-결합 도메인은 구조적 대칭성을 갖는 다량체 스캐폴드에 강성으로 커플링되어서 구조적 대칭성을 갖는 다량체 항원-결합 키메라 단백질 또는 다량체 메가바디를 생성시킬 수 있다. 이러한 원리를 증명하기 위해서, 리소자임-결합 Nb를 나노바디를 스캐폴드에 연결시키는 3개의 짧은 폴리펩티드 링커를 통해서, 비. 테타이오타오미크론 (B. thetaiotaomicron) (PDB 3WFA)의 전화성 글리코시다제 히드롤라제 동종 이량체, SusB 상에 그라프트시켰다 (실시예 11). 2-폴드 대칭성을 갖는 이러한 동종-이량체 Mb는 cryo-EM 또는 X-ray 결정학에서 대칭 제약을 활용할 수 있게 하여 고분해능으로 단백질 구조의 결정을 촉진한다. 다른 예에서, 천연 발생 원형 배열 PP7인, AP205 또는 PP7의 외피 단백질에 강성으로 융합된 Nb로부터 구축된 항원-결합 키메라 단백질로부터 나노바디를 디스플레이 하는 바이러스-유사 입자 (VLP)를 제조하였다. PP7는 피. 애루지노사 (P. Aeruginosa)의 20면체 박테리오파지이다. PP7로부터 유래된 VLP는 그들 합성을 유도하는 mRNA를 캡슐화시켜서, 항원 특이적 Nb의 친화성-선택된 서열에 필요한 유전자형/표현형 연결을 확립시킨다. 따라서, 우리는 고도의 대칭 배열로 그들 표면 상에서 90 Nb를 디스플레이하는 강건한 VLP의 디자인을 위한 시험관내 진화 기술을 적용하였다 (실시예 12 - 15). 이들 나노바디-디스플레이 VLP는 cryo-EM에 의한 소형 단백질의 구조를 분해하는데 탁월한 도구이다.
항원-결합 도메인 예컨대 면역글로불린은 진단, 영상화 또는 다른 생물리적 적용분야에서 사용하려는 형광단, 염료, 이온 또는 금속으로 표지될 수 있는 스캐폴드 상에 강건하게 그라프트될 수 있다. 실시예 10에서, 우리는 X-선 결정학에서 변칙 산란을 통해 위상조절을 위해 사용하려는 구리 함유 단일 도메인 단백질인 아주린 (PDB 2TSA)에 GFP-특이적 나노바디를 융합시켰다. 우리는 또한 GFP-결합 나노바디를 아실 캐리어 단백질 (ACP)에 강성으로 그라프트시켰다 (실시예 16). ACP는 공유 형광단으로 단일 효소 단계에서 직교적으로 표지될 수 있는 단백질이다.
면역글로불린 도메인은 또한 3개의 짧은 펩티드 링커를 통해서 동일한 Ig 도메인 또는 상이한 Ig 도메인 (또는 상이한 치료적 스캐폴드)에 강성으로 융합되어 각각 2가 또는 이중특이적 항원-결합 키메라 단백질을 생성시킬 수 있다 (나노2바디, N2b, 실시예 17 및 18). 2가 또는 이중특이적 항원-결합 키메라 단백질은 X-선 결정학 또는 cryo-EM에서 샤페론으로서 사용될 수 있지만 생물리학적 적용분야, 영상화, 진단 및 요법에서 다수의 적용성을 갖는다.
β-스트랜드 A가 모든 Nb에 공통인 고도로 보존된 N-말단 서열에 함유되므로 (Harmsen et al., 2000), 완전한 생체 내-성숙된 나노바디 레파토리가 편리하게 강성 항원-결합 키메라 단백질 라이브러리 (메가바디, 나노툴 또는 나노2바디로서 본 명세서에서 명명하는 바와 같은 항원-결합 키메라 단백질 포함)로서 클로닝될 수 있고 결합제에 대한 표준 방법으로 스크리닝될 수 있다. 기능성 항원-결합 키메라 단백질은 파지 디스플레이, 효모 디스플레이 또는 바이러스 디스플레이를 통해 선택될 수 있다 (실시예 19).
우리는 또한 GFP-특이적 나노바디 (실시예 20)의 제2 노출 β-턴 (β-스트랜드 C 및 C' 연결)에 삽입되는 HopQ의 어드헤신 도메인을 코딩하는 유전자의 원형 배열 변이체 (에이치. 피로리 유래 주변세포질 단백질; 본 명세서에서 'cHopQ'라고 하는 원형 배열 변이체)로부터 강성 항원-결합 키메라 단백질을 구축하였고 모노바디같은 합성 면역글로불린-유사 항원-결합 단백질로부터 구축된 항원-결합 키메라 단백질을 생성시켰다 (실시예 21).
게다가, 몇몇 디자인되고 생성된 항원-결합 키메라 단백질은 다루기 힘든 막-결합 복합체 예컨대 GPCR, 이온 채널, 및 티로신 수용체 키나제의 구조 분석에 적용하였다 (실시예 22).
다른 실시예는 cHopQ 스캐폴드 단백질에 결합하는 메가바디로부터 유래되는 항원-결합 키메라 단백질 또는 메가바디를 생산함으로써, 스캐폴드 크기를 더욱 확장시키기 위해서, 항원-결합 키메라 단백질 또는 '폴리바디'의 일정 조성물을 형성한다는 것을 입증하였다 (실시예 23).
실시예 24는 다량체 항원-결합 키메라 단백질이 Nb의 제1 β-스트랜드 AB에 삽입된 도데신 단백질로부터 구축될 수 있다는 것을 보여준다. 그리고, 마지막으로, 또한 디술피드-브릿지된 동종이량체가 증가된 질량 및 대칭성으로 항원-결합 키메라 단백질의 다른 포맷을 생성시키기 위한 스캐폴드 단백질로서 시험되었다 (실시예 25).
실시예 1: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 디자인 및 생성.
강성 항원-결합 키메라 단백질, 예컨대 메가바디를 얻기 위한 개념의 제1 증거로서, 나노바디는 강성 메가바디를 구축하기 위해 도 2에 따라서 나노바디를 스캐폴드에 연결하는 2개 펩티드 결합을 통해 거대 스캐폴드 단백질 상에 그라프트시켰다.
여기 기술된 58 kDa 메가바디는 도 2 및 3에 따라서 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 부분들로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린 도메인은 SEQ ID NO:1에 도시된 바와 같은 GFP-결합 나노바디이다. 스캐폴드 단백질은 HopQ라고 하는 헬리코박터 피롤리 균주 G27의 어드헤신 도메인 (PDB: 5LP2, SEQ ID NO:19)이다 (Javaheri et al, 2016). HopQ의 N-말단 및 C-말단은 cHopQ라고 하는 HopQ의 원형 배열 변이체의 생성을 허용하도록 연결되었고, 서열의 절단은 이의 서열 내 임의의 위치에서 만들어졌다. MbNb207 cHopQ 구성체를 디자인하기 위해서, 모든 부분은 펩티드 결합 (SEQ ID NO:20)을 통해 다음의 소정 순서로 아미노 (N-)에서 카복시 (C-) 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체 cHopQ를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA 태그 (US 9518084 B2; SEQ ID NO:209).
MbNb207 cHopQ (SEQ ID NO:20)가 충분히 폴딩된 기능성 단ㄷ백질로서 발현될 수 있다는 것을 입증하기 위해서, 우리는 이 단백질을 효모 표면 상에서 디스플레이시켰고 (Boder, 1997), 유세포측정법을 통해 이 메가바디를 디스플레이하는 효모 세포에 대한 동족 항원 (GFP)의 특이적 결합을 조사하였다. 효모 상에서 MbNb207 cHopQ 를 디스플레이시키기 위해서, 우리는 하기 다수의 보조 펩티드 및 단백질 (SEQ ID NO:22)과의 융합체로서 메가바디를 코딩하는 오픈 리딩 프레임을 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), MbNb207 cHopQ, 가요성 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착되는 효모 어글루티닌 단백질 Aga2p의 Aga2p 어드헤신 서브유닛, 디스플레이된 융합 단백질의 직교성 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005), 이어서 cMyc 태그. 이러한 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에 pCTCON2 벡터 (Chao, 2006)로 넣어져서 효모 균주 EBY100에 도입시켰다.
이 플라스미드를 보유하는 EBY100 효모 세포는 MbNb207 cHopQ-Aga2p-ACP 융합체의 발현 및 분비를 촉발시키기 위해 갈락토스-풍부 배지에서 밤새 성장 및 유도시켰다. ACP의 직교적 염색을 위해서, 세포는 형광 표지된 CoA 유사체 (coA-647, 2μM) 및 촉매량의 SFP 신타제 (1μM)의 존재 하에서 1시간 동안 인큐베이션시켰다. 우리는 효모 세포 상에서 MbNb207 cHopQ 의 발현을 글루코스-풍부 배지에서 갈락토스-풍부 배지로 성장 조건을 변화시켜 유도시킨다 (도 4). 표면 디스플레이 수준은 유세포측정법으로 쉽게 정량적으로 분석할 수 있다. 이들 실험에서, 유도된 효모 세포를 세척하고 유세포측정법을 수행하여 메가바디를 디스플레이하지만 동일한 방식으로 직교적으로 염색된 효모 세포와 CoA647-형광 수준을 비교하여 각 세포의 Mb 디스플레이 수준을 측정하였다. CoA647-형광 신호가 높은 구별가능한 효모 세포는 MbNb207 cHopQ 를 발현하는 배양물에서만 검출되어서, 메가바디가 효율적으로 디스플레이될 수 있고 효모 표면 상에서 직교적으로 염색될 수 있다는 것을 의미한다 (도 4).
디스플레이된 메가바디의 기능성을 분석하기 위해서, 유세포측정을 통해 동족 항원 (GFP)과 이의 결합을 조사하였다. EBY100 효모 세포를 유도시켰고 CoA647로 직교적으로 형광 염색시켜서 상기 기술된 바와 같이 MbNb207 cHopQ-Aga2p-ACP 융합체 디스플레이를 모니터링하였다. 이들 직교적으로 염색된 효모 세포를 다음으로 100 nM GFP의 존재 하에서 1시간 동안 인큐베이션시켰다 (Scholz et al., 2000). 이들 세포의 세척 후에, 디스플레이된 MbNb207 cHopQ 에 결합된 GFP의 검출가능한 양을 검출하였고, 이것은 효모 표면 상에서 MbNb207 cHopQ 의 발현 수준에 선형으로 상관되어야 한다. 실제로, 2-차원 유세포측정 분석은 GFP (높은 GFP-형광 수준)가 상당한 메가바디 디스플레이 수준 (높은 CoA647-형광 수준)으로 오직 효모 세포에 결합한다는 것을 확인하였다 (도 5). 대조적으로, GFP는 동일한 방식으로 염색하였지만 MbNb207 cHopQ 를 발현하지 않는 야생형 효모 세포에는 결합하지 않는다. 이들 실험으로부터 MbNb207 cHopQ 가 충분히 잘 폴딩되고 기능성인 항원-결합 (GFP-결합) 키메라 단백질을 효모 표면 상에서 발현시킬 수 있다고 결론내었다.
실시예 2: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 발현, 정제 및 특징규명.
다음으로, 우리는 이. 콜라이의 주변세포질에서 이 58 kDa MbNb207 cHopQ 를 발현시키도록 하였고, 이것을 균질하게 정제하여 이의 성질을 결정하였다. 이. 콜라이의 주변세포질에서 MbNb207 cHopQ (SEQ ID NO:20)와 같은 메가바디를 발현시키기 위해서, 우리는 임의 나노바디의 매우 보존된 β-스트랜드 A, 및 β-스트랜드 B를 연결하는 제1 β-턴에 삽입된 HopQ (의 원형 배열 변이체)로부터 구축된 임의의 바람직한 메가바디의 발현을 허용하는 클로닝 벡터 (pMESD2라고 함)를 구축하기 위해 표준 방법을 사용하였다. 이 벡터는 pMES4의 유도체 (Pardon, 2014)이고 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 메가바디의 분비를 유도하는 DsbA 리더 서열, 나노바디의 극도로 보존된 FR1을 대표하는 NbGFP207의 β-스트랜드 A, cHopQ라고 하는 HopQ의 원형 배열 변이체, 6xHis 태그 및 EPEA 태그, 이어서 앰버 중지 코돈. 임의의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G)은 이 벡터에 SapI 단편으로서 클로닝된다.
이. 콜라이의 주변세포질에서 MbNb207 cHopQ 를 발현시키고 균질하게 이 재조합 단백질을 정제하기 위해서, β-스트랜드 B 내지 G의 NbGFP207을 코딩하는 DNA 단편 (SEQ ID NO:121의 뉴클레오티드 52-378)을 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)로 증폭시켰고, Plac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 MbNb207 cHopQ 의 발현을 유도하는 pMESD2 벡터에 SapI 단편으로서 클로닝하였다.
WK6 박테리아 세포 (WK6는 su- 비억제 균주임)는 6 L TB 배지 중에 37℃에서 성장시켰고, 세포가 대수-성장기에 도달했을 때 IPTG로 유도시켰다. His-태그화 및 EPEA-태그화 MbNb207 cHopQ 의 주변세포질 발현을 밤새 28℃에서 계속하였다. 세포는 원심분리를 통해 회수하였고 재조합 MbNb207 cHopQ 는 삼투압 충격을 사용해 주변세포질로부터 방출시켰다 (Pardon et al., 2014). 다음으로 재조합 메가바디는 원심분리를 통해 원형질체로부터 분리하였고 HisTrap FF 5 mL의 사전충전 컬럼 상에서 맑은 상청액으로부터 회수하였다. 다음으로 단백질은 500 mM 이미다졸을 적용하여 NiNTA 레진에서 용리시켰고 컷오프가 3 kDa인 NMWL 필터 (Nominal Molecular Weight Limit)를 사용하여 원심분리를 통해 농축시켰다. 다음으로 농축된 샘플을 Superdex 200 PG 16/90 크기 배제 컬럼에 도포하여 겉보기 분자량이 약 60 kDa인 가용성 단백질로서 24 mg의 재조합 메가바디를 회수하였다.
다음으로 정제된 재조합 MbNb207 cHopQ 의 기능적 성질은 크기 배제 크로마토그래피 (SEC)를 통해 분석하였다. 메가바디는 4배-몰 과량의 GFP와 30분 동안 4℃에서 인큐베이션시켰고 Superdex 75 PG 16/90 컬럼 상에 도포하였다. 정제된 GFP 단독을 동일한 크기 배제 컬럼 상에 개별적으로 도포하였다 (도 6). 상이한 단백질의 용리는 280 nm (임의 단백질에 의한 흡광) 및 488 nm (GFP에 의한 흡광)에서 UV 흡광도를 측정하여 모니터링하였다. 도 6에 도시된 용리 스펙트럼은 메가바디 및 과량의 GFP를 함유하는 혼합물이 2개의 대칭 피크 (파란색 및 붉은색 흡광 프로파일)로 용리된다는 것을 예시한다. 제1 용리 피크 (최고 분자량)는 488 nm에서 흡광하여, GFP를 함유한다는 것을 의미한다. 제2 피크는 GFP 단독 (녹색 흡광 프로파일)의 동일 용리 부피에서 용리되고, 역시 488 nm에서 흡광된다. 상응하는 용리 분획의 SDS-폴리아크릴아미드 전기영동은 메가바디 및 과량의 GFP를 함유하는 혼합물의 제1 용리 피크가 메가바디 및 GFP를 함유하는 한편, 제2 피크는 GFP 만을 함유한다는 것을 확인해 준다. 모든 이들 데이터는 정제된 재조합 MbNb207 cHopQ 가 크기 배제 크로마토그래피에 의한 분리를 저지하는 GFP와의 복합체를 만든다는 것을 의미한다. 뿐만 아니라, GFP에 대한 MbNb207 cHopQ 의 특이적 결합의 실시간 운동학적 분석은 생물층 간섭계를 통해 수행하였다. 스트렙타비딘-코팅된 Octet ® 바이오센서가 바이오틴화된 GFP를 포획하는데 사용되었고 상이한 농도의 MbNb207 cHopQ 와 회합되었다. 도 24에 도시된 데이터는 MbNb207 cHopQ 를 사용한 GFP에 대한 친화성이 NbGFP207을 단독으로 사용할 때 친화성과 유사하였다는 것을 입증한다 (도 24B).
실시예 3. GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 50 kD 항원-결합 키메라 단백질의 X-선 결정학에 의한 구조 결정.
실시예 1 및 2에 기술된 58 kDa 키메라 MbNb207 cHopQ 를 발현 및 정제할 수 있었으므로, 우리는 이 메가바디를 결정화하고 X-선 결정학을 통해 이의 구조를 분해하는 것을 수행하였다.
MbNb207 cHopQ 는 실시예 2에 기술된 바와 같이 복합체로서 SEC를 통해 정제하였고 (도 6), 48 mg/mL로 농축하였으며 0.1 ㎕의 모액이 보충된 0.1 ㎕의 정착 액적 (lying drop) 중의 다수의 상업적 스파스-매트릭스 결정화 스크린 (JSCG/Proplex/PEGion/Wizard12/Morpheus)에 가하였다. 0J0SCG 스크린 A2 조건 (0.1 M 소듐 시트레이트, pH 5.5, 20% w/v PEG3000)에서 수득된 소형 결정을 씨딩 최적화 접근법에 사용하였다. JSCG A2 결정으로부터 씨딩된, 충분히 회절된 결정은 0.2 M 암모늄 시트레이트, 17% PEG3350, 10% 글리세롤 48 mg/mL Mb207로 수득하였다. 데이터는 다이아몬드의 I3 광원 (UK)에서 수집하였고 구조는 2.6Å 분해능까지 정밀화하였다 (표 1).
Figure pct00006
메가바디는 비대칭 유닛 당 10개 분자의 P1에서 결정화하였다. 비대칭 유닛의 상이한 결정 간 RMSD는 0.3 내지 2.7Å 범위여서, 나노바디가 나노바디를 스캐폴드에 연결하는 2개 펩티드 결합을 통해서 스캐폴드에 강성으로 연결된다는 것을 의미한다 (도 7).
실시예 4: 단백질 복합체 안정화 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 발현 및 정제.
제2 항원-결합 키메라 단백질 실시예로서, 우리는 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ 및 Gα 서브유닛 계면에서 결합하는 Nb35의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kDa 항원-결합 키메라 단백질을 발현 및 정제하는 것을 수행하였다 (Rasmussen et al, 2011a).
MbNb35 cHopQ 라고 불리는 58 kDa 메가바디는 도 2 및 3에 따라서 연결된 단일-도메인 면역글로불린의 일부분 및 스캐폴드 단백질의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린 도메인은 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ 및 Gα 서브유닛의 계면에 결합하는 나노바디 (Rasmussen et al, 2011a)로서, CDR1은 주로 Gβ와 상호작용하고 장형 CDR3 루프는 SEQ ID NO:24에 도시된 바와 같이 Gβ 및 Gα 서브유닛 둘 모두와 상호작용한다. 모든 부분은 펩티드 결합 (SEQ ID NO:25)을 통해서 다음의 소정 순서로 아미노 말단에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), 나노바디의 스트랜드 B 내지 G (SEQ ID NO:24의 잔기 16-128), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb35 cHopQ 를 발현시키고 균질하게 재조합 다백질을 정제하기 위해서, β-스트랜드 B 내지 G로부터의 Nb35를 코딩하는 DNA 단편을 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)을 통해 증폭시켰고, PLac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 cHopQNb35 메가바디 (SEQ ID NO:25)의 발현을 유도하는 pMESD2 벡터에 SapI 단편으로서 클로닝하였다.
MbNb35 cHopQ 는 또한 실시예 2에 기술된 바와 같이, 이. 콜라이의 주변세포질에 발현되고 그로부터 균질하게 정제되었다. 게다가, 정제된 cHopQNb35는 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ 및 Gα 서브유닛의 계면에 선택적으로 결합한다.
실시예 5: GPCR-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kDa 항원-결합 키메라 단백질의 발현 및 정제.
추가 실시예로서, 인간 β2 아드레날린성 수용체에 결합하고 G 단백질-유사 양태를 나타내는 Nb80의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질을 발현시키고 정제하기 위해 수행하였다 (Rasmussen et al, 2011b). 이러한 나노바디에 대한 대안은 예를 들어 WO2012/007593 (표 1,2 참조), WO2012/175643 (표 2, 3 참조), WO2014/122183 (표 1 및 2 참조), 및 WO2015/110449 (표 2 및 3 참조)에 기술되었다. 그러므로, 본 발명은 이들 인용된 특허 출원에 열거된 (상기 표에 열거된) 상기 Nb의 서열을 기반으로, 본 발명에 기술된 바와 같이 디자인되고 생산된 모든 항원-결합 키메라 단백질을 포함한다. 대안적으로, 상기 Nb의 CDR은 기술된 바와 같은 표적화된 GPCR 복합체 단백질의 특이적 안정화를 수득하기에 충분하며, 그러므로 또한 본 발명은 본 명세서에 기술된 바와 같이 디자인되고 생산된 항원-결합 키메라 단백질을 포함하고, 여기서 상기 인용된 GPCR-복합체 특이적 Nb로부터의 CDR은 상기 GPCR-복합체 결합 항원-결합 키메라 단백질의 항원-결합 도메인의 CDR을 기반으로 한다.
MbNb80 cHopQ 라고 하는 58 kDa 메가바디는 도 2 및 3에 따라 연결된 단일-도메인 면역글로불린의 부분 및 스캐폴드 단백질의 부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린 도메인은 Nb80 (SEQ ID NO:26), β2 아드레날린성 수용체의 세포질 측면에서 결합하는 나노바디이다. 이의 CDR3의 8-아미노산 서열은 수용체의 TM 절편 3, 5, 6 및 7로부터의 아미노산에 의해 형성된 소수성 포켓으로 침투된다. 이의 CDR의 4-아미노산 서열은 TM 절편 5 및 6의 세포질 말단과의 추가적인 안정화 상호작용을 제공한다 (Rasmussen et al, 2011b). 이의 CDR3은 β2AR-Gs 단백질 복합체에서 Gs의 카복시-말단 펩티드와 유사한 위치를 차지한다 (Rasmussen et al, 2011a). 모든 부분은 펩티드 결합 (SEQ ID NO:27)에 의해 다음의 소정 순서로 아미노 말단에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생산하기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), Nb80의 β-스트랜드 B 내지 G (SEQ ID NO:27의 잔기 16-120), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb80 cHopQ 를 발현시키고 이 재조합 단백질을 균질하게 정제하기 위해서, β-스트랜드 B 내지 G의 Nb80을 코딩하는 DNA 단편은 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)을 통해 증폭시켰고, 실시예 4에 기술된 바와 같이 SapI 단편으로서 pMESD2 벡터에 클로닝하였다. 이 플라스미드는 Plac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 MbNb80 cHopQ (SEQ ID NO:27)의 발현을 유도한다.
이전 실시예의 메가바디와 유사하게, 또한 MbNb80 cHopQ 는 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현되어 그로부터 균질하게 정제될 수 있다. 게다가, 정제된 MbNb80 cHopQ 는 β2AR의 활성 상태 입체구조에 선택적으로 결합하여 안정화시킨다. WO2012/007593에 기술된 실시예와 유사하게, 우리는 β2AR-야생형 (wt) 수용체의 약학적 성질을 Nb80 또는 MbNb80 cHopQ 의 존재 하에서 β2AR-wt 단독의 성질 및 미관련 메가바디 MbNb207 cHopQ 의 존재 하에서 β2AR-wt 성질과 비교하였다 (도 53). Nb80은 효현제 결합된 β2AR에 특택적으로 결합하고, G 단백질-유사 양태를 나타내는 나노바디이므로, 효현제·β2AR·Nb 80 복합체에서 수용체의 활성-상태 입체구조를 안정화시킨다 (Rasmussen et al., 2011). 우리는 인간 β2 아드레날린성 수용체에 결합하고 G 단백질-유사 양태를 나타내는 Nb80의 성질 (Rasmussen et al, 2011b)이 방사성-리간드 어세이를 통해 MbNb80 cHopQ 에서 유지되는지 여부를 조사하였다. MbNb207 cHopQ 와 유사하게 GFP에 특이적으로 결합하고, β2AR에 대한 친화성을 갖지 않는, 나노바디, NbGFP207이 음성 대조군으로서 사용되었고, β2AR에 대한 친화성을 보이지 않았다 (도 53).
β2AR에 대한 Nb80 또는 MbNb80 cHopQ 의 약학적 효과를 비교할 수 있기 위해서, 우리는 다음과 같이 방사리간드 어세이를 수행하였다. β2AR 야생형 (wt) 수용체를 발현시키기 위해서, 1 ㎍의 pFastBac1-β2ARwt 구성체는 Bac-to-Bac® 배큘로바이러스 발현 시스템을 제조사의 설명서에 따라 사용하여 DH10BacTM 세포로 형질전환시켰고 (Invitrogen, cat. Nr. 10359-016), 50 ㎍/mL 카나마이신, 7 ㎍/mL 젠타마이신, 10 ㎍/mL 테트라사이클린, 100 ㎍/mL X-gal 및 40 ㎍/mL IPTG가 보충된 신선한 LB 한천 플레이트 상에 플레이팅하였다. 흰색 콜로니를 선택하여, 백미드를 정제하였고 오픈 리딩 프레임의 서열은 시퀀싱을 통해 확인하였다. 재조합 배큘로바이러스는 2 ㎍ 백미드 DNA를 형질감염 시약으로서 8 ㎕의 셀펙틴과 함께 6웰 플레이트 포맷으로 Sf9 세포에 형질감염시켜 생산하였다. 세포는 27℃에서 인큐베이션시켰고 P1 바이러스는 3일 후에 수집하였다. 바이러스는 이후에 연속 계대를 통해 증폭시켰고 P3 바이러스를 수집하였다. 2-3x106 세포/mL 농도의 Sf9 세포를 0.5의 M.O.I로 배큘로바이러스로 감염시켰고, 세포를 27℃에서 72시간 동안 수용체를 발현시켰다. 수용체의 발현 및 세포 표면 국재화는 수용체의 N-말단 세포외 부분에서 FLAG 펩티드를 인식하는 1차 항체로서 마우스 항-FLAG M2 항체 (1:100), 및 2차 항체로서 항-마우스 DyLight405 (1:100)를 사용하는 유세포측정을 통해 평가하였다. 1000xg에서 30분 동안 세포를 스핀 다운시키고 최종 펠렛을 프로테아제 억제제 (cOmpleteTM EDTA-무함유 프로테아제 억제제 칵테일 정제, Roche)가 보충된 TME 결합 완충액 (75 mM Tris/HCl pH7.4, 12.5 mM MgCl2, 1 mM EDTA)에 재현탁시켜서 이들 세포로부터 막을 제조하였다. 세포는 최대 속도의 Ultra turrax 균질기를 사용하여 6회 10-초 버스트를 통해 용해시켰다. 막을 함유하는 용해물은 40.000xg로 40분 동안 4℃에서 원심분리시켰고, 상청액을 버리고, 막 펠렛을 10% 사카로스가 보충된 TME 결합 완충액에 재현탁시켰다. 막은 추가 사용까지 -80℃에서 저장하였다. 전체 막 단백질 함량은 제조사의 설명서에 따라서 Pierce BCA 단백질 어세이 키트 (Thermo Scientific)를 사용해 추산하였다. 추가 분석을 위해 전체 막 단백질 농도에 따라 데이터를 정규화시키기 위해서, 모든 샘플은 0.2 mg/mL의 최종 농도로 희석하였다. 방사리간드 경쟁 결합 어세이를 위해서, β2AR-wt를 발현하는 10 ㎍의 막을 2 nM [3H]-디히드로알프레놀롤의 존재 및 5 μM NbNb80 cHopQ, MbNb207 cHopQ 의 존재 또는 나노바디 부재에서 10-11 M 내지 10-4 M 범위의 에피네프린 (천연 효현제, Sigma cat. Nr E4250) 또는 (-)-이소프로테레놀 히드로클로라이드 (전체 효현제, Sigma cat. Nr I6504)의 증가 농도와 인큐베이션시켰다. 비특이적 결합은 10 μM 알프레놀롤의 존재 하에서 결정하였다. 샘플은 진탕 플랫폼 상에 실온에서 2시간 동안 인큐베이션시켰고, 수용체-결합 방사리간드는 96-웰 FilterMate harvester (Perkin Elmer)를 사용해 Whatman GF/C unifilter (Perkin Elmer, cat nr 6005174) 상에서 여과를 통해 유리 방사리간드로부터 분리하였다. 여과 이후에, 필터 플레이트 상에 유지된 막은 빙냉 세척 완충액 (20 mM Tris-HCl pH7.4)으로 세척하였고, 필터를 1시간 동안 50℃에서 건조시켰다. 35 ㎕의 섬광액 (MicroScint™-O, Perkin Elmer)을 첨가한 후에, 필터 상에 유지된 방사능(cpm)은 Wallac MicroBeta TriLux 섬광 계측기에서 측정하였다. 데이터는 이중으로 수행된 각 실험의 평균 ± s.e로 표시된다. IC50 값은 Prism (GraphPad Software, San Diego, CA)을 사용하여 비선형 회귀 분석을 통해 결정하였다.
도 53에 도시된 바와 같이, 우리는 MbNb80 cHopQ 의 존재 하에서 β2AR-wt의 약학적 성질이 Nb80의 존재 하에서 β2AR-wt의 약학적 성질과 매우 유사하고 β2AR-wt 단독 또는 MbNb207 cHopQ 의 존재 하에서 β2AR-wt 의 성질과 상당히 상이하다는 것을 확인하였다. β2AR-wt 단독과 비교하여, G 단백질-유사 양태를 갖는 MbNb80 cHopQ (cfr Nb80) 존재 하에서 β2AR-wt 수용체는 효현제 (에피네프린, 이소프로테레놀)에 대해 증가된 친화성을 나타내서, MbNb80 cHopQ 의 존재하에서 수용체가 활성-상태 입체구조를 채택한다는 것을 보여준다 (Rasmussen et al, 2011b). 대조군 β2AR-wt와 비교하여, MbNb80 cHopQ 의 존재 하에서, 천연 효현제 에피네프린에 대한 β2AR-wt의 증가된 친화성은 β2AR-wt 단독에 대한 에피테프린의 IC50을 MbNb80 cHopQ 존재하의 β2AR-wt에 대한 에피테프린의 IC50high 를 나누어서, 도 53 (A)에 도시된 경쟁적 결합 실험으로부터의 IC50 값의 비율로부터 계산되었고,
Figure pct00007
2000의 겉보기 역가 이동을 야기하였다. MbNb80 cHopQ 의 존재 하에서 합성 효현제 이소프로테네롤에 대한 β2AR-wt의 증가된 친화성은 β2AR-wt에 대한 이소프로테네롤의 IC50을 MbNb80 cHopQ 존재 하의 β2AR-wt에 대한 이소프로테네롤의 IC50high 를 나누어서 도 53 (B)에 도시된 경쟁적 결합 실험으로부터의 IC50 값의 비율로부터 계산할 수 있었고,
Figure pct00008
2000의 겉보기 역가 이동이 야기되었다. 결론적으로, 우리는 Nb80의 기능성이 MbNb80 cHopQ 포맷에서 유지되었고, 게다가 β2AR 표적에 대해 유지된 이의 항원-결합 친화성으로 인해서, β2AR 활성-상태 입체구조를 안정화시키고, Nb80와 유사하게 입체구조 선택적 항원 결합을 제공한다는 사실을 입증하였다.
실시예 6: 이온-채널-결합 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 발현 및 정제.
추가 실시예로서, 우리는 5량체 리간드-게이팅 이온 채널 GABAA 에 결합하는 Nb25의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질을 발현시키고 정제하는 것을 수행하였다 (Miller et al, 2017).
MbNb25 cHopQ 라고 불리는 58 kDa 메가바디는 도 2 및 3에 따라서 연결된 단일-도메인 면역글로불린의 일부분 및 스캐폴드 단백질의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서 사용된 면역글로불린 도메인은 GABAA 3β 서브유닛의 세포외 도메인에 결합하는 나노바디, Nb25 (SEQ ID NO:28)이다 (Miller et al, 2017). 모든 부분은 펩티드 결합 (SEQ ID NO:29)을 통해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP- 나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), Nb25의 β-스트랜드 B 내지 G (SEQ ID NO:28의 잔기 16-125), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb25 cHopQ 를 발현시키고 균질하게 이 재조합 다백질을 정제하기 위해서, β-스트랜드 B 내지 G의 Nb25를 코딩하는 DNA 단편을 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)을 통해 증폭시켰고 실시예 4에 기술된 바와 같이 SapI 단편으로서 pMESD2 벡터에 클로닝시켰다. 이 플라스미드는 Plac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 MbNb25 cHopQ (SEQ ID NO:29)의 발현을 유도시킨다.
이전 실시예의 메가바디와 유사하게, MbNb25 cHopQ 가 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현되었고 균질하게 정제할 수 있었다. 게다가, 정제된 MbNb25 cHopQ 는 GABAA 3β 서브유닛의 세포외 도메인에 결합한다.
실시예 7. GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴로 삽입된 c7HopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
폴딩되는 능력을 비롯하여, 메가바디의 안정성 및 강성이 스캐폴드에 면역글로불린을 연결시키는 폴리펩티드 연결부의 조성 및 길이에 의존할 수 있으므로, 우리는 필요하다면 특정 메가바디 포맷의 미세조율을 위해 시험관내 진화 기술을 도입시켰다. 실시예 1에 기술된 메가바디로부터 출발하여, 우리는 시험관내 선택에서 처리가능한, 가변 길이 및 혼합 아미노산 조성의 짧은 2개 펩티드가 도 2에 따른 스캐폴드에 나노바디를 연결하는 유사한 디자인으로 메가바디를 코딩하는 라이브러리를 구축하였다.
여기 기술된 58 kDa 메가바디는 도 2에 따라 짧은 폴리펩티드 연결부를 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린은 SEQ ID NO:1에 도시된 바와 같은 GFP-결합 나노바디이다. 모든 부분은 펩티드 결합 (SEQ ID NO:30-33)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성을 갖는 하나 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186 ), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 11-126), 6xHis 태그 및 EPEA 태그.
효모 상에서 스캐폴드에 나노바디를 연결시키는 링커의 조성 및 길이가 상이한 실시예 1, 2 및 3에 기술된 메가바디의 기능성 변이체를 디스플레이하고 선택하기 위해서, 우리는 도 8에 따라서 다수의 보조 펩티드 및 단백질 (SEQ ID NO:34-37)과의 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 11-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하의 pCTCON2 벡터 (Chao, 2006)에 두어서, 실시예 1, 2 및 3에 기술된 184.000개의 상이한 메가바디 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다 (도 8 참조).
시험관내 선택을 위해서, 이 라이브러리는 효모 균주 EBY100에 도입시켰다. 형질도입된 세포를 성장시켰고 갈락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합 나노바디를 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선택 라운드를 수행하였다.
1 라운드의 선택이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 스캐폴드 단백질에 나노바디를 연결시키는 대표적인 번호의 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 1-1, 1-2, 2-1 및 2-2 아미노산의 짧은 링커 변이체를 갖는 각 유형의 링커의 4개의 대표적 클론 (표 2)이 FACS 실험으로 100 nM GFP에 결합하는 것이 확인되었다 (도 30). 이것은 항원-결합 도메인 및 스캐폴드 단백질 간 상이한 짧은 펩티드 연결이 시험관내 선택에 의해 메가바디 라이브러리로부터 선택될 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 입증한다. 효모 표면 상에 메가바디의 기능성 변이체를 디스플레이 할 수 있었으므로 (상기), 우리는 이. 콜라이의 주변세포질에서 4종의 1-1 아미노산의 짧은 링커를 대표하는 메가바디 클론 (표 2의 MP1331_A5, MP1331_A12, MP1331_B7 및 MP1331_G10)을 발현시켰고, 균질하게 이들 키메라를 정제하였으며 이의 성질을 결정하였다. 메가바디 MbNb207 c7HopQ 의 4종의 변이체 (MbNb207 c7HopQ A5, MbNb207 c7HopQ A12, MbNb207 c7HopQ B7, MbNb207 c7HopQ G10) 및 짧은 (c7; 실시예 23 참조) 원형 배열을 갖는 야생형 (MbNb207 c7HopQ)은 본질적으로 실시예 22:MbNb207 c7HopQ (SEQ ID NO:136)에 기술된 대로 생성시켰다: 항-GFP-나노바디의 보존된 N-말단의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA 태그.
4종 MbNb207 c7HopQ 변이체 (SEQ ID NO:137-140): 항-GFP-나노바디의 보존된 N-말단의 β-스트랜드 A (SEQ ID NO:1의 1-12), 1개의 아미노산 링커 (표 2), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-185), 1개의 아미노산 링커 (표 2), 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
이들 메가바디 (SEQ ID NO:136-140)는 실시예 2에 기술된 바와 같이, 이. 콜라이에서 발현시켰고 정제하였다. 다음으로 농축된 샘플을 Superdex 200 PG 10/300 크기 배제 컬럼에 도포하였고, 약 60 kDa의 겉보기 분자량을 갖는 균질한, 가용성 단백질을 용리하였다 (도 31). 정제된 재조합 메가바디 (SEQ ID NO:136-140)의 기능적 성질은 효소-연결 면역흡착 어세이 (ELISA)로 분석하였다. 정제된 GFP는 소듐 바이카보네이트 완충액 pH 중 0,1 ㎍/웰의 농도로 maxisorp 마이크로타이터 플레이트 (Nunc)의 웰에 고정시켰다. 웰 내 잔류 단백질 결합 부위는 PBS 중 우유를 사용해 실온에서 2시간 동안 차단시켰다. 정제된 메가바디 샘플은 GFP 코팅 및 비코팅 웰에서 인큐베이션시켰다. 세척 단계 후에, GFP에 대한 메가바디의 결합은 메가바디 상에만 존재하는 EPEA-태그를 특이적으로 인식하는 CaptureSelect 바이오틴화 항체 (Life Technologies)를 사용해 조사하였다. Capture Select 바이오틴화 항체의 후속 검출은 스트렙타비딘-알칼리 포스파타제 (Promega)를 사용해 수행하였다. 405 nm의 흡광도는 효소 기질 p-니트로페닐 포스페이트를 첨가하여 측정하였다. 검출된 신호는 고정된 GFP가 존재하는 조건을 GFP 부재 조건과 비교하여 각 메가바디에 대해 적어도 10배의 더 높은 신호를 보인다. ELISA 및 SEC 데이터는 정제된 재조합 메가바디 (SEQ ID NO:136-140)가 균질하게 정제될 수 있고 GFP와 복합체를 형성할 수 있다는 것을 의미한다 (도 31 및 32 참조).
Figure pct00009
실시예 8: GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 cYgjK로부터 구축된 100 kDa 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
대안적으로, 메가바디는 보다 큰 스캐폴드에 연결된 나노바디로부터 구축되게 디자인되었다. 도 2 및 9에 따라서 2개 짧은 펩티드가 나노바디를 다른 스캐폴드에 연결시킨 메가바디 변이체를 코딩하는 라이브러리가 시험관내 선택을 위해 구축되었다.
디자인된 100 kDa 메가바디는 도 2에 따라서 짧은 폴리펩티드 링커에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터쇄상화된 키메라 폴리펩티드이다. 사용된 면역글로불린은 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디이다. 사용된 대안적인 스캐폴드 단백질은 이. 콜라이의 86 kDa 주변세포질 단백질, YgjK (PDB 3W7S, SEQ ID NO: 38)였다. 모든 부분은 펩티드 결합 (SEQ ID NO:39-42)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (잔기 SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결시키는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126).
효모 상에서 나노바디를 스캐폴드에 연결시키는 링커의 조성 및 길이가 상이한 MbNb207 cYgjkQ 무작위 링커 (SEQ ID NO:39-42)의 기능성 변이체를 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질 (SEQ ID NO:44-47)과의 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드의 원형 배열체를 생성시키기 위해 Ygjk의 C-말단 및 N-말단을 연결시키는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과의 디술피드 결합을 통해서 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에서 pCTCON2 벡터 (Chao, 2006)에 두어서, MbNb207 cYgjkQ 무작위 링커 (SEQ ID NO:39-42)의 184.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입시켰다. 형질전환된 세포를 성장시켰고 갈락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색시켰고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합 나노바디를 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석을 통해 후속 선택 라운드를 수행하였다.
2회 선택 라운드 이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결시키는 대표적인 번호의 펩티드 링커의 서열을 결정하였다. 각 링커 유형 (길이)의 1-1, 1-2, 2-1 및 2-2 아미노산의 짧은 링커 변이체의 1 또는 2개의 대표적인 클론 (표 3)을 FACS 실험에서 100 nM GFP에 결합한다는 것을 확인하였다 (도 33). 이것은 항원-결합 도메인 및 스캐폴드 단백질 간 상이한 짧은 펩티드 연결을 시험관내 선택을 통해 메가바디 라이브러리로부터 선택할 수 있었고 기능성 항원-결합 키메라 단백질로서 디스플레이할 수 있다는 것을 입증한다. 효모 표면 상에서 MbNb207 cYgjkQ 의 기능성 변이체를 디스플레이할 수 있었으므로 (상기), 우리는 이. 콜라이의 주변세포질에서 각 아미노산의 짧은 링커를 대표하는 메가바디 클론 (표 3의 MP1333_E2, MP1333_A2, MP1333_C4 및 MP1333_F5) 중 한 클론을 발현시키는 것을 수행하였다. 효모 디스플레이에 의해 선택된 MbNb207 cYgjkQ 의 4개 변이체를 하기 아미노산 서열을 갖는 키메라 폴리펩티드로서 생성시켰다: MbNb207 cYgjkE2 (SEQ ID NO:141): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결시키는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
유사한 구성체가 링커 정체에 차이가 존재하는, 다른 메가바디에 대해 수득되었다: MbNb207 cYgjkA2 (SEQ ID NO:142): Glu 1-아미노산 링커, Gly-Asp 2-아미노산 링커; MbNb207 cYgjkC4 (SEQ ID NO:143): Met-Tyr 2-아미노산 링커, Asn 1-아미노산 링커, MbNb207 cYgjkF5 (SEQ ID NO:144): Trp-Thr 2-아미노산 링커, Gly-Ala 2- 아미노산 링커.
MbNb207 cYgjk 변이체 (SEQ ID NO: 141-144)는 실시예 2에 기술된 바와 같이, 이. 콜라이에서 발현시켰고, 변형된 pMESD2 벡터를 적용하였다. 이러한 새로운 벡터 (pMESP3이라고 함)는 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 메가바디의 분비를 유도하는 pelB 리더 서열, NbGFP207의 β-스트랜드 A, YgjK의 원형 배열된 변이체, 임의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G), 6xHis 태그 및 EPEA 태그, 이어서 앰버 중지 코돈.
발현된 메가바디의 기능성 성질은 4개 MbNb207 cYgjk 변이체 각각의 주변세포질 추출물을 사용하여, 실시예 7에 기술된 바와 같이 ELISA를 통해 분석하였다. 고정된 GFP의 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 34)는 기능성 MbNb207 cYgjk 변이체 (SEQ ID NO:141-144)의 주변세포질 발현을 확인하였다.
1-1 아미노산의 짧은 링커 변이체를 대표하는 MbNb207 cYgjkE2 (SEQ ID NO:141)는 실시예 2에 기술된 바와 같이 IMAC 이후 SEC를 사용하여 균질하게 더 정제하였다 (도 35). 정제된 MbNb207 cYgjkE2 (SEQ ID NO:141)의 GFP에 대한 결합 운동학은 Octet® 를 통해 측정하였고 NbGFP207 나노바디 (SEQ ID NO:1) 및 MbNb207 cHopQ (SEQ ID NO:20)와 비교하였다 (도 24). 계산된 결합 친화성은 원형 배열된 HopQ 또는 YgjK 스캐폴드 단백질로부터 구축된, 항원-결합 키메라 단백질이 본래 단일-도메인 면역글로불린의 결합 성질을 간섭하지 않는다는 것을 확인하였다.
Figure pct00010
실시예 9: 스캐폴드를 나노바디에 연결시키는 추가 디술피드에 의해 더욱 강성화된, GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 c/c7HopQ로부터 구축된 58 kDa 항원-결합 키메라 단백질의 디자인 및 생성.
우리는 도 10에 따라서 스캐폴드에 항원-결합 도메인, 여기서 면역글로불린 도메인을 연결시키는 추가 디술피드 결합을 조작시켜서 보다 더 강성인 항원-결합 키메라 단백질을 더 개발하였다. 따라서, 우리는 도 2 및 10에 따라서 2개의 짧은 펩티드 및 디술피드 결합이 나노바디를 스캐폴드에 연결시키는 MbNb207 cHopQ 의 돌연변이체를 생성시키기 위해 부위 지정 돌연변이유발법을 사용하였다.
여기 기술된 58 kDa 메가바디는 도 2 및 도 10에 따라서 짧은 폴리펩티드 연결 및 디술피드 결합을 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 GFP-결합 나노바디이다. 스캐폴드 단백질은 HopQ라고 하는 헬리코박터 피로리 균주 G27의 어드헤신 도메인 (PDB: 5LP2, SEQ ID NO:19)이다. 모든 부분은 펩티드 결합 (SEQ ID NO:48-50)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체 (cHopQ)를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), 하나의 잔기가 시스테인으로 치환된 HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. SEQ ID NO:51은 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), 한 잔기가 시스테인으로 치환된 HopQ의 C-말단 부분 (SEQ ID NO:1의 잔기 192-414), 스캐폴드 단백질의 원형 배열체 (cHopQ)를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), 한 잔기가 시스테인으로 치환된 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그로부터 구축되었다.
추가 구성체는 스캐폴드로서 더 짧은 c7HopQ 원형 배열체 (c7HopQ: 실시예 23 참조)를 적용하여 디자인되었다: SEQ ID NO: 146-150은 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-411), 한 잔기가 시스테인으로 치환된 HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), 한 잔기가 시스테인으로 치환된 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA 태그로부터 구축되었다. SEQ ID NO:145는 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), 한 잔기가 시스테인으로 치환된 HopQ의 C-말단 부분 (SEQ ID NO:1의 잔기 192-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), 한 잔기가 시스테인으로 치환된 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA로부터 구축되었다.
총 10개 메가바디 변이체 (MbNb207 cHopQ Cys1-4 (SEQ ID NO:48-51) 및 MbNb207 c7HopQ Cys5-10 (SEQ ID NO:145-150)은 실시예 2이 기술된 바와 같이 이. 콜라이에서 발현시키고 정제하였다. 이들 정제된 재조합 메가바디의 기능적 성질은 실시예 7에 기술된 바와 같이 ELISA를 통해 분석하였다. 고정된 GFP의 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 36)는 이. 콜라이의 주변세포질로부터 정제된, MbNb207 cHopQ Cys1-4 (SEQ ID NO:48-51) 및 MbNb207 c7HopQ Cys5-10 (SEQ ID NO:145-150)의 기능성을 명확하게 확인하였다.
이들 조작된 메가바디 변이체의 열안정성에 대한 도입된 추가의 디술피드의 기여도를 측정하기 위해서, 우리는 열 이동 어세이 (TSA)를 수행하였고 이전에 기술된 바와 같이 각 메가바디 변이체의 용융 온도 (Tm)를 계산하였다 (Hunynh et al., 2015). 따라서, 0.2 mg/mL의 각각의 겔-여과 정제된 메가바디 변이체를 140 mM NaCl 및 10 mM Tris pH 7.3 완충액 중 SYPRO 오렌지 염료 (Sigma)와 혼합하였다. 다음으로, 20 ㎕ 샘플의 형광도는 25 내지 100℃ 범위 온도의 Bio-Rad CFX96 기계에서 실시간 PCR을 통해 삼중으로 측정하였다. 개별 Tm 값은 볼츠만 (Boltzmnann) 방정식을 사용하여 GraphPad Prism 소프트웨어를 통해 계산하였다 (표 4). 용융 온도는 각각 MbNb207 cHopQ C15-C534 (SEQ ID NO:51), MbNb207 c7HopQ C14-C512 (SEQ ID NO:145), MbNb207 c7HopQ C316-C472 (SEQ ID NO:147) 및 MbNb207 c7HopQ C314-C472 (SEQ ID NO:148)에 대해 야생형 메가바디와 비교하여, 10.9℃, 3.43℃, 4.29℃ 및 6.14℃만큼 증가되었고, 이들 디술피드 결합이 형성되어 메가바디를 강성화시킨다는 것을 의미한다.
Figure pct00011
실시예 10: 아주린 상에 그라프트된 GFP-특이적 나노바디로부터 구축된 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
강성 항원-결합 키메라 단백질을 생성시키기 위한 다른 방식은 대안적인 연결 계획을 통해 그들 스캐폴드에 면역글로불린을 연결시키는 것이다. 따라서, 도 11에 예시된 바와 같이 스캐폴드에 나노마디를 연결시키는 3개 폴리펩티드 연결을 통해서 스캐폴드 단백질 상에 그라프트된 나노바디로부터 구축된 메가바디를 코딩하는 라이브러리를 구축하였고 시험관내 선택으로 처리한다.
여기 기술된 강성 항원-결합 키메라 단백질은 도 11에 따라 3개의 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 슈도모나스 애루지노사의 소형 구리 함유 단일 도메인 단백질, 아주린 (PDB 2TSA, SEQ ID NO: 52, 피. 애루지노사 단백질과 비교된 M121A 돌연변이)이다. 모든 부분은 펩티드 결합 (SEQ ID NO:53-60)에 의해 다음 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 N-말단 부분 (SEQ ID NO:52의 잔기 3-22), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 C-말단 부분 (SEQ ID NO:52의 잔기 31-128), 6xHis 및 EPEA 태그.
3개의 짧은 펩티드가 나노바디를 스캐폴드에 연결시키는 이들 금속-결합 메가바디 (SEQ ID NO:53-60)의 기능성 대표물을 효모 상에 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질 (SEQ ID NO:61-68)과 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 N-말단 부분 (SEQ ID NO:52의 잔기 3-22), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 C-말단 부분 (SEQ ID NO:52의 잔기 31-128), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질에 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 제어 하에 pCTCON2 벡터 (Chao, 2006)에 두어서, 도 12에 따라 3개의 짧은 펩티드가 나노바디를 아주린에 연결시킨 메가바디의 77.280.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS에 의한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입시켰다. 형질전환된 세포를 성장시켰고 밤새 갈락토스-풍부 배지에서 Cu++ 의 존재 하에 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. GFP 결합 나노바디를 높은 수준으로 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켰고 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선별 라운드를 후속하였다.
2 라운드의 선택 이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결시키는 대표적인 번호의 펩티드 링커의 서열을 결정하였다. 2개의 대표적인 클론의 링커 유형 1-2-1, 2-2-1, 1-2-2, 및 2-2-2 아미노산의 짧은 링켜 변이체 (표 5)는 FACS 실험으로 100 nM GFP에 결합한다는 것을 확인하였다 (도 37). 이것은 3개의 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 메가바디가 시험관내 선택에 의해 메가바디 라이브러리로부터 선택될 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 입증한다.
MbNb207 아주린 의 기능성 변이체를 효모 세포 상에서 디스플레이시킬 수 있었으므로 (상기), 우리는 이. 콜라이의 주변세포질에서 이들 항원-결합 키메라 단백질을 발현시켰다. 효모 디스플레이에 의해 선택된 8종의 MbNb207 아주린 변이체 (표 5)는 하기 아미노산 서열을 갖는 키메라 폴리펩티드로서 생성시켰다: MbNb207 아주린 변이체 (SEQ ID NO:151-158), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 아미노산 링커 (표 5), 아주린의 N-말단 부분 (SEQ ID NO:52의 잔기 3-22), 아미노산 링커 (표 5), 항-GFP-나노바디의 스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 아미노산 링커 (표 5), 아주린의 C-말단 부분 (SEQ ID NO:52의 잔기 31-128), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb207 아주린 변이체 (SEQ ID NO:151-158)와 같은 메가바디를 발현시키기 위해서, 우리는 실시예 2에 기술된 pMESD2 벡터를 변형시켰다. 이러한 새로운 벡터 (pMESP5라고 함)는 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 메가바디의 분비를 유도하는pelB 리더 서열, NbGFP207의 β-스트랜드 A, 아주린의 N-말단 부분, 임의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G), 아주린의 C-말단 부분, 6xHis 태그 및 EPEA 태그, 이어서 앰버 중지 코돈. 8종 MbNb207 아주린 변이체 (SEQ ID NO: 151-158)는 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현시켰다. 발현된 메가바디의 기능적 성질은 8종 MbNb207 아주린 변이체 각각의 주변세포질 추출물을 사용하여 실시예 7에 기술된 바와 같이 ELISA를 통해 분석하였다. 고정된 GFP의 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 38)는 기능성 MbNb207 아주린 변이체 (SEQ ID NO: 151-158)의 주변세포질 발현을 분명하게 확인하였다. 이것은 3개의 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 메가바디가 이. 콜라이의 주변세포질에서 기능적으로 발현될 수 있다는 것을 입증한다.
Figure pct00012
실시예 11: 시험관내 선택에 의해 구조적 대칭성을 갖는 동종이량체 메가바디를 생성시키기 위해 GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 전화성 글리코시드 히드롤라제의 원형 배열 변이체로부터 구축된 항원-결합 키메라 단백질의 시험관내 선택에 의해 디자인 및 생성.
우리는 구조적 대칭성을 갖는 다량체 스캐폴드 단백질의 서브유닛 상에 Nb를 그라프팅시켜서 다량체 메가바디를 더욱 디자인하였다. 도 11에 따라서 나노바디를 스캐폴드를 연결시키는 3개 짧은 폴리펩티드 연결을 통해서 거대 동종이량체 스캐폴드 단백질의 서브유닛 상에 그라프트시킨 나노바디로부터 구축된 메가바디를 코딩하는 라이브러리는 효모 디스플레이 및 FACS를 통해 2-배 대칭성을 갖는 강성 동종이량체 메가바디를 동정하기 위해 구축하였다.
여기 기술된 동종이량체 메가바디 (이량체 당 191 kDa)는 도 11에 따라서 3개 짧은 폴리펩티드 링커를 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 항-GFP-나노바디이다. 사용된 스캐폴드 단백질은 비. 테타이오타오미크론의 동종이량체 글루칸 1,4-알파-글루코시다제, SusB (PDB 3WFA, SEQ ID NO:69)였다. 모든 부분은 다음의 소정 순서 (SEQ ID NO:70-77)로 아미노에서 카복시 말단으로 서로 연결되었다: 도 13에 따라서, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-14), 세린, 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 N-말단 부분 (SEQ ID NO:69의 잔기 1-68), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 15-125), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 C-말단 부분 (SEQ ID NO:69의 잔기 76-718), 6xHis/EPEA 태그.
3개의 짧은 펩티드가 나노바디를 동종이량체 스캐폴드의 각 서브유닛 (SEQ ID NO:70-77)에 연결시킨 이들 동종이량체 메가바디의 기능성 대표물을 효모 상에 디스플레이하고 선택하기 위해서, 우리는 다수의 부속 펩티드 및 단백질 (SEQ ID NO:78-85)과 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-14), 세린, 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 N-말단 부분 (SEQ ID NO:69의 잔기 1-68), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 15-125), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 C-말단 부분 (SEQ ID NO:69의 잔기 76-738), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 플레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하의 pCTCON2 벡터 (Chao, 2006)에 두어서 도 11에 따른 3개의 짧은 펩티드가 나노바디를 동종이량체 스캐폴드의 각 서브유닛에 연결시키는 메가바디의 77.280.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS를 통한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입시켰다. 형질전환된 세포를 성장시켰고 밤새 갈락토스-풍부 배지에서 Ca++ 의 존재 하에 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색시켰고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합을 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석을 통한 후속 선택 라운드를 수행하였다.
다수 선택 라운드 이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고, DNA 시퀀싱을 수행하여 높은 수준으로 디스플레이되고 항원에 결합하는 다수 메가바디 변이체에서 나노바디를 SusB에 연결하는 링커의 길이 및 조성을 분석하였고, 그들이 충분히 발현되고, 세포 분비되고 기능성 GFP-결합 키메라 단백질로 폴딩될 수 있다는 것을 의미한다.
이들 동종이량체 메가바디 중 하나는 이. 콜라이의 주변세포질에서 발현시키고 그로부터 균질하게 정제하였다. 정제된 단백질을 결정화하였고 이의 구조는 GFP와 복합체로 분해하였다.
실시예 12: GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 PP7의 바이러스 외피 단백질의 원형 배열 변이체로부터 구축된 나노바디-디스플레이 20면체 바이러스-유사 입자의 시험관내 선택에 의한 디자인 및 생성.
cryo-EM에 의한 3-차원 구조 결정은 입사 전자빕에 대해 가변적으로 기원하는, 개별 입자의 다수 카피의 2D 투사 이미지에 존재하는 정보의 평균화를 포함한다. 20면체 바이러스의 경우에, 개별 비리온이 입자로 간주될 수 있지만, 이들 구조의 대칭성은 많은 동일한 카피의 비대칭 유닛이 각 입자에 포함되어, 구조를 결정하기 위해 평균낸 유효한 수의 유닛의 많은 폴드에 의해 증가된다. 따라서, 외피 단백질에 의해 부여되는 대칭성 이후에 강건하게 어레이된 나노바디는 Cryo-EM에 의해 소형 단백질 및 그들 복합체의 구조를 분해하기 위한 궁극의 도구가 될 것이다.
여기서 우리는 바이러스-유사 입자 (VLP)로 자가 조립되는 20면체 박테리오파지의 외피 단백질 상에 Nb를 그라프트시켜서 나노바디-디스플레이 20면체 바이러스-유사 입자를 디자인하였다. 피. 애루지노사의 20면체 박테리오파지 PP7의 외피 단백질의 쇄상화된 이량체의 90 카피 또는 180 외피 단백질은 이. 콜라이에서 과발현시 자가 조립되어 20면체 바이러스 유사 입자 (VLP)를 생성시킬 수 있다는 것이 확인되었다 (O'Rourke et al., 2015). 이들 VLP에서, 외피 단백질은 섞여짜여진 단량체의 C-말단에 매우 밀접한 한 단량체의 N-말단과 쌍형성 방식으로 엮여진다. 펩티드가 상응하는 VLP의 표면 상에 이 펩티드를 디스플레이하도록 이러한 이량체의 노출 루프에 삽입될 수 있다는 것이 또한 입증되었다. 따라서, 우리는 도 2에 따라서 2개 짧은 펩티드가 나노바디를 스캐폴드에 연결시키는 PP7 외피 단백질의 쇄상화된 이량체 상에 그라프트된 나노바디로부터 구축된 강성 항체 키메라를 코딩하는 무작위 라이브러리를 구축하였다. 여기 기술된 3.9 MDa의 20면체 바이러스-유사 입자는 도 14에 따라서 직접 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가-조립된다. 사용되는 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 PP7의 외피 단백질의 공유 이량체의 원형 배열된 형태 (PDB: 1DWN, SEQ ID NO:2)이다. PP7은 피. 애루지노사의 20면체 RNA 박테리오파지이다. 모든 부분은 다음의 소정 순서 (SEQ ID NO:3-6)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩된 메티오닌, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-13), PP7 외피 단백질 (SEQ ID NO:2의 잔기 12-128), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 글리신, PP7 외피 단백질 (SEQ ID NO:2의 잔기 2-128), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 글리신, PP7 외피 단백질 (SEQ ID NO:2의 잔기 2-8), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이러한 강성 항원-결합 키메라 단백질은 이의 표면 상에 90 카피의 나노바디를 디스플레이하는 20면체 VLP (NanoVLP)로 자가 조립된다 (도 14).
NanoVLP로 자가 조립되는 조작된 이들 GFP-결합 외피 단백질의 기능성 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 원형 배열 이량체 PP7 외피 단백질, GFP-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임 (SEQ ID NO:3-6)의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편으로서 pMESP 벡터 (ref CA12729, pMES4의 유도체, GenBank GQ907248로서 LguI 부위가 제거됨)에 클로닝되어, pelB 신호 펩티드, 임의의 Nb 서열, 및 유전자3을 포함하는 모든 검출 태그를 대체시켰다. 이러한 새롭게 생성된 라이브러리를 pcPP72NbGFP207L이라고 한다.
20면체 바이러스-유사 입자를 형성시키기 위해 시험관내에서 재조합적으로 발현 및 조립시킬 수 있는 재조합 GFP-결합 PP7 외피 단백질을 선택하기 위해서, 키메라 이량체의 라이브러리를 플라스미드 수준에서 구축된다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. NanoVLP로 조립시킬 수 있는 키메라 이량체를 이. 콜라이에서 발현시켰고 크로마토그래피 선택을 수행하였다. IMAC 정제는 키메라 이량체를 발현시키고 VLP로 조립시킬 수 있는 이들 클론을 선택하기 위한 라이브러리에 대해 수행하였다. 각각의 조립-컴피턴트 VLP가 이의 쉘에 나노바디-외피 단백질을 코딩하는 핵산을 캡슐화시켰으므로, 우리는 NanoVLP로부터 유래된 RNA의 RT-PCR을 통해 클론을 증폭시켰다. 항원-결합 키메라 단백질을 발현하는 몇몇 클론은 단일 콜로니로서 성장시켰고 제1 PP7 외피 단백질을 다음 PP7에 연결시키는 펩티드 링커의 서열을 결정하고 원형 배열 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 전체 길이 구성체를 보유하는 개별 클론에 대해서 실시예 7에 기술된 바와 같이 ELISA를 수행항 GFP에 결합하는 클론을 동정하였다 (도 39). 이것은 폴리펩티드 연결에 의해 연결된 (원형 배열) PP7 외피 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 항원-결합 키메라 단백질이 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 상이한 링커 변이체의 대표적인 클론은 표 6에 제공된다.
Figure pct00013
실시예 13: 리소자임-특이적 나노바디의 제1 노출 β-턴에 삽입된 MS2의 바이러스 외피 단백질의 원형 배열 변이체로부터 구축된 나노바디-디스플레이 20면체 바이러스-유사 입자의 시험관내 선택에 의한 디자인 및 생성.
여기 기술된 3.9 MDa 20면체 바이러스-유사 입자는 도 15에 따라 짧은 폴리펩티드 링커를 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로빈의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가-조립된다. 사용된 면역글로불린은 리소자임-결합 나노바디 (PDB: 1MEL, SEQ ID NO:7)이다. 사용된 스캐폴드 단백질은 MS2의 외피 단백질의 공유 이량체의 원형 배열 형태 (PDB: 2MS2, SEQ ID NO:2)였다. MS2는 에스케리치아 콜라이의 20면체 RNA 박테리오파지이다. 모든 부분은 다음의 소정 순서 (SEQ ID NO:9-13)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩되는 메티오닌, 나노바디 β-스트랜드 A (항-GFP-나노바디의 β-스트랜드 A, 잔기 1-12), 무작위 조성의 2개 아미노산의 원형 배열 링커, MS2 외피 단백질 (SEQ ID NO:8의 잔기 17-130; 이후 SEQ ID NO:8의 잔기 2-130 및 SEQ ID NO:8의 잔기 2-14), 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7의 잔기 17-133), 6xHis/EPEA 태그. 이러한 강성 항원-결합 키메라 단백질은 이의 표면에 90 카피의 나노바디를 디스플레이하는 20면체 VLP로 자가 조립된다 (도 15).
NanoVLP로 자가 조립되는 이들 조작된 리소자임-결합 외피 단백질의 기능적 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 원형 배열 이량체 MS2 외피 단백질, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임 (SEQ ID NO:9-13)의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편으로서 pMESP 벡터 (ref CA12729)에 클로닝하였다. 이러한 새롭게 생성된 플라스미드 라이브러리는 pcMS22cAbLys3L이라고 하였다.
20면체 바이러스-유사 입자를 형성시키기 위해 시험관내에서 재조합적으로 발현시킬 수 있고 조립할 수 있는 재조합 리소자임-결합 MS2 외피 단백질을 선택하기 위해서, NanoVLP의 라이브러리를 플라스미드 수준에서 구축한다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. NanoVLP를 이. 콜라이에서 발현시켰고 VLP 조립을 위해 크로마토그래피 선택을 수행하였다. 이러한 각각의 조립-컴피턴트 VLP가 이의 쉘에서 나노바디-외피 단백질을 코딩하는 핵산을 캡슐화시켰으므로, 침전 후 크기 배제 크로마토그래피를 통해 정제할 수 있는 NanoVLP로부터 유래된 RNA의 RT-PCR에 의한 시퀀싱은 조립을 위해 선택을 통해 농축된 유전자를 밝혀준다. 리소자임을 사용한 친화성 선택 시, RNA는 리소자임에 특이적으로 결합하는 NanoVLP로부터 단리 및 증폭된다.
이들 리소자임-결합 MS2 외피 단백질로부터 구축된 일부 조립-컴피턴트 리소자입 특이적 NanoVLP는 균질하게 정제되었고 리소자임의 존재 및 부재 하에서 단일 입자 cryo-EM에 의해 분석되었다.
실시예 14: GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 AP205의 천연 배열 바이러스 외피 단백질로부터 구축된 나노바디-디스플레이 20면체 바이러스-유사 입자의 시험관내 선택에 의한 디자인 및 생성.
여기 기술된 이량체는 도 40에 따라 짧은 폴리펩티드 링커에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가-조립된다. 사용된 면역글로불린은 GFP-결합 나노바디 (SEQ ID NO:1)이다. 사용된 스캐폴드 단백질은 AP205의 외피 단백질의 공유 이량체였다 (PDB: 5FS4, SEQ ID NO: 166). AP205는 아시네토박터 박테리아의 20면체 RNA 박테리오파지이다. AP205 외피 단백질 이량체는 다른 기지의 단일-가닥 RNA 파지에서 베타-헤어핀을 형성하는, N-말단 영역을 제외하고 보존된 레비바이러스과 외피 단백질을 채택한다. AP205는 N-말단 및 C-말단 베타-스트랜드에 의해 형성된 동일 위치에서 유사한 구조를 가져서, 다른 외피 단백질과 비교하여 원형 배열체를 만든다. 그 배열은 외피 단백질 말단에서 조립된 입자의 대부분의 표면-노출 부분으로 이동하고, 이것은 긴 N-말단 및 C-말단 융합체에 대해 증가된 이의 내성을 설명해 준다 (Shishovs et al., 2016).
모든 부분은 다음의 소정 순서 (SEQ ID NO:167)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩되는 메티오닌, 나노바디 β-스트랜드 A (항-GFP-나노바디의 β-스트랜드 A, 잔기 1-11), 1개 아미노산의 무작위 링커, AP205 외피 단백질 이량체 (SEQ ID NO:166의 잔기 4-128; 이후 SEQ ID NO:166의 잔기 4-126), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이러한 항원-결합 키메라 단백질의 기능성 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 이량체 AP205 외피 단백질, GFP-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편로서 pMESP 벡터 (ref CA12729)에 클로닝하였다. 이러한 새롭게 생성된 플라스미드는 pMESAP2052XXPNbGFP207이라고 하였다. 시험관내에서 재조합적으로 발현시키고 올바르게 조립시킬 수 있는 항원-결합 키메라 (AP205) 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축된다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. 키메라 이량체로서 올바르게 조립되는 키메라 단백질을 동정하기 위해서, 개별 클론은 이. 콜라이에서 발현되었고 GFP에 결합하는 클론에 대해 스크리닝하기 위해 실시예 7에 기술된 바와 같은 ELISA를 수행하였다 (도 41). GFP에 결합하는 MbNb207 AP205x2XX를 발현시키는 몇몇 클론은 단일 콜로니로서 성장시켰고 나노바디를 스캐폴드 단백질에 연결시키는 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 이것은 2개의 짧은 폴리펩티드 연결에 의해 연결된 바이러스 AP205 외피 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 항원-결합 키메라 단백질이 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 1-1 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 7에 제공된다. 우리는 이들 항원-결합 키메라 단백질의 일부가 표면 상에 90 카피의 나노바디를 디스플레이하는 20면체 VLP로 자가 조립된다는 것을 확인하였다.
Figure pct00014
실시예 15: GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 AP205의 외피 단백질로부터 구축된 2개 폴리펩티드로 구성된 이량체 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
여기 기술된 이량체는 도 42에 따라서 짧은 폴리펩티드 링커에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가 조립된다. 사용된 면역글로불린은 GFP-결합 나노바디 (SEQ ID NO:1)이다. 사용된 스캐폴드 단백질은 AP205 (PDB: 5FS4, SEQ ID NO: 166)였다. AP205 단량체가 이량체 또는 VLP로 조립되었을 때, 한 단량체의 N-말단은 제2 단량체의 C-말단에 밀접하게 근접하여 오게되고 그반대도 마찬가지이다. 기능성 항원 결합 키메라를 얻기 위해서, 이량체 항원-결합 키메라 단백질로 조립되기 위해, 제1 단량체의 β-스트랜드 A는 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G를 조합시킬 필요가 있고 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G는 제1 단량체의 β-스트랜드 A와 조합될 필요가 있다.
모든 부분은 다음의 소정 순서 (SEQ ID NO:173)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩되는 메티오닌, 나노바디 β-스트랜드 A (항-GFP-나노바디의 β-스트랜드 A, 잔기 1-11), 1개 아미노산의 무작위 링커, AP205 외피 단백질 (SEQ ID NO:166의 잔기 4-126), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA.
이러한 이량체 항원-결합 키메라 단백질의 기능적 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 단량체 AP205 외피 단백질, GFP-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편으로서 pMESP 벡터에 클로닝되었다. 이러한 새롭게 생성된 플라스미드 pMESAP2051XXPNbGFP207이라고 하였다.
시험관내에서 재조합적으로 발현시키고 올바르게 조립시킬 수 있는 이량체 항원-결합 키메라 단백질을 선택하기 위해서, 이량체 항원-결합 키메라 단백질의 이들 라이브러리를 플라스미드 수준에서 구축한다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. 이량체로서 올바르게 조립된 키메라 단백질을 동정하기 위해서, 개별 클론은 이. 콜라이에서 발현시켰고 GFP에 결합하는 클론을 스크리닝하기 위해서 실시예 7에 기술된 대로 ELISA를 수행하였다 (도 43). GFP에 결합하는 MbNb207 AP205XX의 이량체를 발현시키는 몇몇 클론은 단일 콜로니로서 성장시켰고 나노바디를 스캐폴드 단백질에 연결하는 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 이것은 2개의 짧은 폴리펩티드 연결에 의해 연결된 바이러스 AP205 외피 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 이량체 항원-결합 키메라 단백질을 이량체 항원-결합 키메라 단백질로서 라이브러리로부터 선택할 수 있다는 것을 입증한다. 1-1 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 8에 제공된다.
하나는 예를 들어, GFP-결합 나노바디 및 FedF-결합 나노바디인, 상이한 항원 결합 도메인을 갖는 2개 항원-결합 키메라 단백질이 세포에서 공발현되면, 그들은 이종이량체 키메라 단백질로서 조립될 수 있다.
Figure pct00015
실시예 16: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 ACP로부터 구축된 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
우리의 최초 메가바디의 성공적인 디자인을 구축하여, 우리는 또한 면역글로불린 도메인이 진단, 영상화 또는 다른 생물리학적 적용분야에서 사용되도록 형광단, 염료, 이온 또는 금속으로 표지될 수 있는 스캐폴드 상에 강성으로 그라프트될 수 있는지를 시험하였다. 따라서, 우리는 CoA 및 SFP 신타제의 형광성 유도체의 사용을 통해 특이적 세린 (도 16)에 직교적으로 표지될 수 있는 강성 항원-결합 키메라 단백질을 생성시키기 위해서 도 2에 따라서 2개 짧은 펩티드가 스캐폴드에 나노바디를 연결한 (그러나 스캐폴드의 원형 배열은 필요없음) ACP 상에 그라프트된 나노바디로부터 구축된 강성 항체 키메라를 코딩하는 무작위 라이브러리를 구축하였다 (Yin et al, 2006).
여기 기술된 나노툴은 도 2에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 이러한 특정한 메가바디에서, 야생형 ACP의 N-말단 및 C-말단이 서로 가까이 있고 나노바디를 ACP에 연결시키는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되었기 때문에 스캐폴드 단백질의 원형 배열을 요구하지 않았다 (도 16). 사용된 면역글로불린은 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디이다. 스캐폴드 단백질은 ACP로 축약된 에스케리치아 콜라이의 아실 캐리어 단백질 (PDB:1T8K, SEQ ID NO:86)이다. 모든 부분은 펩티드 결합 (SEQ ID NO:87-90)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 도 2에 따라서, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, ACP (SEQ ID NO:86의 잔기 2-76), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
2개 짧은 펩티드가 나노바디를 ACP (SEQ ID NO:87-90)에 연결시키는 이들 나노툴의 기능성 대표물을 효모 상에 디스플레이시키고 선택하기 위해서, 우리는 다수의 부속 펩티드 및 단백질 (SEQ ID NO:91-94)과 융합체로 다양한 MbNb207 ACP 툴바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, ACP (SEQ ID NO:86의 잔기 2-76), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질와의 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 제어 하에서 pCTCON2 벡터 (Chao, 2006)에 두어서 도 16에 따라 2개 짧은 펩티드가 나노바디를 ACP 스캐폴드에 연결시키는 나노툴의 77.280.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS에 의한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고 100 nM의 GFP와 인큐베이션시켰다. 다음으로 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 나노툴 (높은 CoA-647 형광도)을 디스플레이하고 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합을 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선택 라운드를 수행하였다.
1 라운드의 선택 후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결하는 대표적인 번호의 펩티드 링커의 서열을 결정하였다. 1-1, 2-1 및 2-2 아미노산의 짧은 링커 변이체의 대표적인 2개 클론 (표 9)은 FACS 실험에서 100 nM GFP에 결합한다는 것을 확인하였다 (도 44). 이것은 2개의 짧은 폴리펩티드 연결에 의해 연결된 아실 캐리어 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 나노툴을 메가바디 라이브러리로부터 선택할 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이할 수 있다는 것을 입증한다. 우리가 MbNb207 ACP 나노툴의 기능성 변이체를 효모의 표면 상에 디스플레이할 수 있었으므로 (상기), 우리는 이들 항원-결합 키메라 단백질을 이. 콜라이의 주변세포질에서 발현시키도록 하였다. 효모 디스플레이에 의해 선택된 6종 MbNb207 ACP 나노툴 변이체는 하기 아미노산 서열을 갖는 키메라 폴리펩티드로서 생성시켰다: MbNb207 ACP 변이체 (SEQ ID NO:178-183): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 아미노산 링커 (연결부#1 표 9), ACP (SEQ ID NO:86의 잔기 2-76), 아미노산 링커 (연결부#2 표 9), 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
이. 콜라이에서 이들 변이체를 발현시키기 위해서, 실시예 2에 기술된, pMESD2 벡터를 변형시켰다. 이러한 새로운 벡터 (pMESP6이라고 함)는 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 나노툴의 분비를 유도하는 pelB 리더 서열, NbGFP207의 β-스트랜드 A, ACP, 임의의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G), 6xHis/EPEA 태그, 이어서 앰버 중지 코돈. 6종의 MbNb207 ACP 나노툴 변이체 (SEQ ID NO:178-182)는 실시예 2에 기술된 대로 발현시켰다. 다음으로 발현된 나노툴의 기능적 성질은 각각의 6종 MbNb207 ACP 나노툴 변이체의 주변세포질 추출물을 사용해, 실시예 7에 기술된 바와 같이 ELISa를 통해 분석하였다. 고정된 GFP 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 45)는 기능성 MbNb207 ACP 나노툴 변이체의 주변세포질 발현을 분명히 확인하였다. 이것은 2개 짧은 폴리펩티드 연결에 의해 연결된 아실 캐리어 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 나노툴이 이. 콜라이의 주변세포질에서 기능적으로 발현될 수 있다는 것을 입증한다.
Figure pct00016
실시예 17: 파지 디스플레이를 사용한 시험관내 선택에 의한 리소자임-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 GFP-특이적 나노바디로부터 구축된 항원-결합 키메라 단백질의 디자인 및 생성.
나노바디 자체가 스캐폴드 단백질로서 적용될 수 있는지 여부, 그래서, 나노바디가 또한 동일하거나 또는 상이한 나노바디에 강성으로 융합되어 2가 또는 이중특이적 항원-결합 키메라 단백질를 생성시킬 수 있는지 여부를 더욱 조사하였다. 따라서, 나노바디는 강성 Nb-Nb 키메라 (나노2바디)를 구축하기 위해 도 17에 따라 스캐폴드에 나노바디를 연결하는 3개 폴리펩티드 연결을 통해 다른 나노바디에 그라프트되었다. 이러한 연결은 양쪽 Nb의 파라토프가 그들의 개별 항원에 결합하는 것이 자유롭도록 수행되었다. 따라서, 이러한 융합체는 나노2바디의 양쪽 나노바디가 동일한 항원에 결합한다면 더 높은 화합력으로 결합할 수 있거나 또는 나노2바디의 각 나노바디가 상이한 항원에 결합한다면 2개의 상이한 항원에 결합하여 가교될 수 있을 것이다.
여기 기술된 나노2바디 (도 18)는 도 17에 따라서 짧은 폴리펩티드 연결에 의해 연결된 제1 나노바디의 일부분 및 다른 (상이한) 나노바디의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 제1 나노바디는 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디 (NbGFP207)이다. 제2 나노바디는 흰계란 리소자임 (cAbLys3, PDB 1MEL, SEQ ID NO:7)에 결합한다 (Desmyter A et al., 1996). 모든 부분은 도 18에 도시된 바와 같이 펩티드 결합 (SEQ ID NO:14)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A NbGFP207 (잔기 1-15, SEQ ID NO: EP1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7의 잔기 16-133), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그.
이들 나노2바디 (SEQ ID NO: 14)의 기능성 대표물을 사상 파지 상에 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질과의 융합체로 다양한 나노2바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이를 위해서, 둘 모두 β-스트랜드 A를 함유하는, pelB 신호를 보유하는 pMESP1 벡터 및 DsbA 신호 펩티드를 보유하는 pMESD1 벡터는 2개 나노바디가 다음의 나노2바디를 생성시키도록 삽입될 수 있는 방식으로 개조되었다: SEQ ID NO:15: 이. 콜라이의 주변세포질로 융합 단백질의 분비를 유도하는 PelB 리더 서열, 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-15, SEQ ID NO:1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7이 잔기 16-133), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그, 앰버 중지 코돈, HA 태그 및 M13 파지의 단백질 3. 또는 나노2바디 SEQ ID NO:16: 이. 콜라이의 주변세포질로 융합 단백질의 분비를 유도하는 DsbA 리더 서열, 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-15, SEQ ID NO:1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7의 잔기 16-133), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis 태그/EPEA 태그, 앰버 중지 코돈, HA 태그 및 M13 파지의 단백질 3.
실시예 18: 파지 디스플레이를 사용한 시험관내 선택에 의한 FedF-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 GFP-특이적 나노바디로부터 구축된 항원-결합 키메라 단백질의 디자인 및 생성.
우리는 또한 나노바디가 동일하거나 또는 상이한 나노바디에 강성으로 융합되어 2가 또는 이중특이적 항원-결합 키메라 단백질을 생성시킬 수 있는가를 시험하였다. 따라서, 나노바디는 강성 Nb-Nb 키메라 (나노2바디; N2b)를 구축하기 위해 도 17에 따라 스캐폴드에 나노바디를 연결하는 3개 폴리펩티드 연결을 통해 다른 나노바디 상에 그라프트되었다. 연결은 양쪽 Nb의 파라토프가 그들 개별 항체에 자유롭게 결합하도록 수행되었다. 따라서, 이러한 융합은 양쪽 단량체가 동일 항원에 결합하면 더 높은 화합력으로 결합할 수 있을 것이거나 또는 각 단량체가 상이한 항원에 결합하면 2종의 상이한 항원에 결합할 수 있을 것이다.
여기 기술된 나노2바디 (도 19)는 도 19에 따라 짧은 폴리펩티드 연결에 의해 연결된 제1 나노바디의 일부분 및 다른 (상이한) 나노바디의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 제1 나노바디는 SEQ ID NO:1로 표시된 GFP-결합 나노바디 (NbGFP207)이다. 제2 나노바디는 F18 핌브리아 어드헤신 FedF의 렉틴 도메인 (NbFedF9, SEQ ID NO:17)을 인식한다 (Moonens et al.,2014). 모든 부분은 도 10에 도시된 바와 같이 펩티드 결합 (SEQ ID NO:18)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로에 연결되었다: 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-15, SEQ ID NO: 1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, FedF-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:17의 잔기 16-129), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그.
고도로 보존된 N-말단 서열 및 고도로 보존된 C-말단 서열이 모든 Nb에 공통이므로, 생체내-성숙된 나노바디 레파토리는 매우 유사한 방식으로 편리하게 클로닝될 수 있다.
나노2바디의 2개 형태를 만들 수 있다: 제1 결합 도메인으로서 NbGFP207 및 제2 결합 도메인으로서 NbFedF9 및 그 반대.
스크리닝을 단순화시키기 위해서, 우리는 도 46에 도시된 바와 같이 에너지적으로 안정한 구성체 (SEQ ID NO: 184-185)로부터 시작하기 위해 컴퓨터 모델링을 사용하였다. 사상 파지 상에서 이들 나노2바디의 기능성 대표물을 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질과 융합체로 다양한 나노2바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이를 위해서 그 둘 모두 β-스트랜드 A를 함유하는, pelB 신호 펩티드를 보유하는 pMESP1 벡터 및 DsbA 신호 펩티드를 보유하는 pMESD1 벡터는 2개 나노바디가 나노2바디: SEQ ID NO: 184-185를 생성하도록 삽입될 수 있는 방식으로 개조되었다. pMESP 구성체에서 PelB 리더 서열은 이. 콜라이의 주변세포질로 항원-결합 키메라 단백질의 분비를 유도하고, pMESD 구성체에서 DsbA 리더 서열은 이. 콜라이의 주변세포질로 항원-결합 키메라 단백질의 분비를 유도한다. 모든 부분은 펩티드 결합에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로에 연결되었다: 신호 펩티드, 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-13, SEQ ID NO:1), 4개 아미노산의 펩티드 링커: TENH (잔기 14-17, SEQ ID NO: 184-185), NbGFP207 (잔기 3-116, SEQ ID NO:1, 잔기 5에 V에서 Q 돌연변이 존재), 무작위 조성의 4개 아미노산의 펩티드 링커, FedF-결합 나노바디의 β-스트랜드 B 내지 G (SEQ NO:17의 잔기 16-128), 3개 아미노산의 펩티드 링커: GQE (SEQ ID NO:184의 잔기 249-251) 또는 GQQ (SEQ ID NO:185의 잔기 249-251), NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그, 앰버 중지 코돈, HA 태그 및 M13 파지의 단백질 3.
시험관내에서 재조합적으로 발현될 수 있는 항원-결합 키메라 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축된다. pMESP 벡터에 클로닝된 DNA 단편의 라이브러리는 pMESPNIIbGFP207XFedF9라고 하였고, pMESP 벡터에 클로닝된 DNA 단편의 라이브러리는 pMESDNIIbGFP207XFedF9라고 하였다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용되었다. 올바르게 조립된 키메라 단백질을 동정하기 위해서, 우리는 FedF 상에서 파지 디스플레이 (Pardon et al., 2014)를 통해 1 또는 2 라운드의 시험관내 선택을 수행한 후에 GFP 상에서 1 라운드의 선택을 수행하였다. 선택 후, 개별 클론을 선택하였고 관심 DNA 단편을 PCR하였으며, 각 클론의 크기를 1% 아가로스 겔 상에서 검토하였다. 올바른 크기의 DNA 단편을 보유하는 몇개 클론을 서열 분석하여 상이한 나노바디 단편을 연결하는 펩티드 링커의 서열을 결정하였다. 올바른 클론을 이. 콜라이에서 발현시켰고, IMAC를 사용해 반정제하였으며 ELISA를 수행하여 다음과 같이 발현되어 GFP 및 FedF에 결합하는 클론을 스크리닝하였다 (도 47): 정제된 GFP 및 FedF는 소듐 바이카보네이트 완충액 pH 8.2 중 0,5 ㎍/웰 농도로 maxisorp 마이크로타이터 플레이트 (Nunc)의 웰에 개별적으로 고정시켰다. 웰 내 잔류 단백질 결합 부위는 PBS 중 우유를 사용해 실온에서 2시간 동안 차단시켰다. IMAC 정제된 나노2바디 샘플은 GFP 코팅, FedF 코팅 및 비코팅 웰에서 인큐베이션시켰다. 세척 단계 이후에, GFP에 대한 나노2바디의 결합은 나노2바디에만 존재하는, EPEA-태그를 특이적으로 인식하는 CaptureSelect C-태그 바이오틴화된 항체 (Life Technologies)를 사용하여 조사하였다. CaptureSelect 바이오틴화된 항체의 후속 검출은 스트렙타비딘-알칼리 포스파타제 (Promega)로 수행하였다. 405 nm에서의 흡광도는 효소 기질 p-니트로페닐 포스페이트의 부가 후 측정하였다. 검출된 신호는 일부 이들 항원-결합 키메라 단백질이 GFP 및 FedF를 인식할 수 있다는 것을 보여준다. 이것은 3개의 짧은 폴리펩티드 연결에 의해 연결된 단일-도메인 면역글로불린의 일부분 및 상이한 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 나노2바디가 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 4-4-3 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 10에 제공된다.
Figure pct00017
실시예 19: 효모 디스플레이 또는 파지 디스플레이에 의해 면역 라이브러리로부터 GFP-특이적 항원-결합 키메라 단백질의 선택을 위한 디스플레이 벡터.
면역글로불린 폴드의 프레임워크의 일부로서, N-말단 아미노산 서열 (β-스트랜드 A 내지 B를 연결하는 β-턴을 형성하는 잔기 및 β-스트랜드 A 포함)은 상이한 낙타과 항체 중에서 고도로 보존적이다 (Harmsen, 2000). 결론적으로, 하나의 대표적인 나노바디를 스캐폴드에 연결시키는 링커 펩티드의 길이 및 서열이 최적화되었으면, 동일 링커는 임의 나노바디의 β-스트랜드 A 내지 B를 연결하는 제1 β-턴에 특정한 스캐폴드를 삽입시켜 잘 폴딩된 안정한 메가바디를 생성시키는데 사용될 수 있다 (앞의 실시예들 참조). 유사하게, 상이한 낙타과 항체의 C-말단 서열이 고도로 보존적이다. 따라서, 대표적인 한 나노바디를 스캐폴드에 연결시키는 이러한 링커 펩티드의 길이 및 서열이 최적화되면, 동일한 링커가 나노바디의 C-말단을 스캐폴드에 연결시키는데 사용될 수 있다.
나노바디의 생체내 성숙된 라이브러리는 특히 도 2 또는 11에 제시된 연결 계획에 따라서 강성 항원-결합 키메라 단백질의 거대 라이브러리를 클로닝시키는데 편리하게 사용될 수 있다고 결론내려진다. 이들 라이브러리는 예상되는 적용분야에 따라서, 특정 디자인의 기능성 메가바디, 대칭성을 갖는 다량체 메가바디, VLP, 나노툴 또는 나노2바디에 대해 파지 디스플레이, 효모 디스플레이 또는 바이러스 디스플레이에 의해 스크리닝될 수 있다. 이러한 개념을 증명하기 위해서, 나노바디 면역 라이브러리는 동일 스캐폴드 상에 그라프트된 상이한 나노바디로부터 조립되는 강성 항원-결합 키메라 단백질의 거대 레파토리의 디스플레이를 위한 라이브러리를 구축하기 위해서 도 2에 따라 스캐폴드에 나노바디를 연결하는 2개 펩티드 결합을 통해 스캐폴드 단백질 HopQ 상에 그라프트되었다 (도 20). 여기 기술된 메가바디는 도 2에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 면역글로불린은 [Pardon et al. (2014)]에 기술된 바와 같이 GFP로 면역화된 라마의 혈액 샘플로부터 클로닝된 나노바디이다. 모든 부분은 펩티드 결합에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), GFP로 면역화된 라마로부터 유래된 나노바디의 β-스트랜드 B 내지 G. 나노바디-코팅 유전자는 [Pardon et al. (2014)]에 기술된 바와 같이 이러한 면역화된 동물로부터 클로닝되었다. 2개의 짧은 펩티드가 다른 GFP-특이적 나노바디를 스캐폴드에 연결시킨 신규한 기능성 GFP-결합 메가바디를 효모 상에 디스플레이하고 선택하기 위해서, 우리는 프라이머 TU64 (SEQ ID NO:124) 및 TU65 (SEQ ID NO:125)를 사용하여 나노바디-코딩 유전자를 증폭시켰고 도 8에 따라서 다수의 보조 펩티드 및 단백질과 융합체로 이들 메가바디를 코딩하는 오픈 리딩 프레임의 하기 라이브러리를 구축하기 위해 효모에서 GAP 복구 상동성 재조합을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), cHopQNb_from_immune_library 메가바디 라이브러리, 가요성 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005), 이어서 cMyc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에서 pCTCON2 벡터 (Chao, 2006)에 두어서 2개의 짧은 펩티드가 면역 라이브러리 유래 나노바디를 HopQ에 연결시킨 107 의 상이한 메가바디를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS에 의한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고 200 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합을 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선별 라운드 (100 nM, 10 nM 및 1 nM의 낮은 GFP 농도)를 수행하였다.
다수 라운드의 선별 이후에, CoA-647 및 GFP 채널에서 대표 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 높은 수준으로 디스플레이되고 GFP에 결합하는 대표적인 번호의 메가바디의 서열을 결정하였다. FACS 실험에서 100 nM GFP에 결합하는 9종의 상이한 GFP-특이적 메가바디 (SEQ ID NO: 95-103, 도 21 참조)를 동정하였고, 항원-결합 키메라 단백질은 면역 라이브러리로부터 유래된 메가바디 라이브러리로부터 선택될 수 있다는 것을 입증한다.
실시예 20. 시험관내 선택에 의한 GFP-특이적 나노바디의 제2 β-스트랜드 CC'-연결 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD 항원-결합 키메라 단백질의 디자인 및 생성.
실시예 1-17은 항원-결합 키메라 단백질이 β-스트랜드 A 내지 B를 연결하는 나노바디의 제1 β-턴에 삽입된 스캐폴드로부터 구축될 수 있다는 것을 예시한다. 스캐폴드가 다른 턴을 통해서 또한 면역글로불린 도메인에 연결될 수 있다는 것을 입증하기 위해서, 우리는 또한 시험관내 선택을 통해서 GFP-특이적 나노바디의 제2 노출 β-턴 (β-스트랜드 C 및 C'을 연결)에 삽입된 cHopQ 스캐폴드 단백질로부터 항원-결합 키메라 단백질을 구축하였다.
여기서 기술된 58 kDa 메가바디는 도 22에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린은 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디이다. 모든 부분은 펩티드 결합 (SEQ ID NO:104-107)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A 내지 C (SEQ ID NO:1의 1-39), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 C' 내지 G (SEQ ID NO:1의 잔기 46-126), / EPEA 태그.
HopQ의 원형 배열체가 GFP-특이적 나노바디의 제2 β-턴에 삽입된 메가바디의 기능성 변이체를 효모 상에서 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질 (SEQ ID NO:108-111)과의 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A 내지 C (SEQ ID NO:1의 1-39), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커 HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 C' 내지 G (SEQ ID NO:1의 잔기 46-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착되는 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에 pCTCON2 벡터 (Chao, 2006)에 두어서 도 22에 기술된 메가바디의 184.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 특한 메가바디 (높은 CoA-647 형광도) 및 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합 나노바디를 디스플레이하는 세포를 분류하였고 포도당-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 선택의 후속 라운드를 수행하였다.
1 라운드의 선별이후에, CoA-647 및 GFP 채널에서 대표적 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 스캐폴드에 나노바디를 연결하는 대표 번호의 펩티드 링커의 서열을 결정하였다. 1-1, 2-1, 1-2 및 2-2 아미노산의 짧은 링커 변이체의 1개 또는 2개의 대표적인 클론 (표 11)은 FACS 실험에서 100 nM GFP에 결합한다는 것이 확인되었다 (도 48). 이것은 스캐폴드 단백질이 단일-도메인 면역글로불린의 제2 노출 β-턴 (β-스트랜드 C 및 C' 연결)에 삽입되고 2개 짧은 폴리펩티드 연결에 의해 연결된, 메가바디는 시험관내 선택을 통해 메가바디 라이브러리로부터 선택할 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 입증한다.
Figure pct00018
실시예 21. K-Ras-특이적 모노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
여기서 우리는 합성 항원-결합 도메인을 기반으로 하는 항원-결합 키메라 단백질, 예컨대 모노바디를 기술한다. 메가바디는 H-RAS 및 K-RAS-특이적 모노바디 NS1의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ 스캐폴드 단백질로부터 구축하였다 (Spencer-Smith et al, 2017).
여기에 기술되는 58 kDa 메가바디 MbNS1 cHopQ 는 NS1의 일부분, 합성 결합 단백질 (모노바디) 및 도 2에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 합성 결합 단백질은 SEQ ID NO:112로 표시된 바와 같은 H-Ras 및 K-Ras 결합 모노바디 NS1 (Spencer-Smith et al, 2017)이다. 모노바디는 피브로넥틴 III형 도메인을 기반으로 구축된, 합성 단백질이다. 수용체의 세포외 도메인, 키나제, 스테로이드 호르몬 수용체 및 모듈 단백질 도메인을 포함한, 표적의 다양한 어레이에 대해 높은 친화성으로 결합하는 모노바디가 단리되었다 (Koide, 2012). 모든 부분은 도 23에 도시된 바와 같이 펩티드 결합 (SEQ ID NO:113-116)에 의해 다음 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: NS1의 β-스트랜드 A (SEQ ID NO:112의 1-13), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, NS1 모노바디의 β-스트랜드 B 내지 G (SEQ ID NO:112의 잔기 16-94), 6xHis/EPEA 태그.
모노바디를 스캐폴드에 연결하는 링커의 조성 및 길이가 상이한 기능성 메가바디 MbNS1 cHopQ 를 효모 상에서 디스플레이 및 선택하기 위해서, 우리는 다양한 보조 펩티드 및 단백질 (SEQ ID NO:117-120)과의 융합체로 다양한 MbNS1 cHopQ 를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: NS1의 β-스트랜드 A (SEQ ID NO:112의 1-13), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, NS1 모노바디의 β-스트랜드 B 내지 G (SEQ ID NO:112의 잔기 16-94), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 유닛, 이어서, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에 pCTCON2 벡터 (Chao, 2006)에 두어서 모노바디 NS1 및 스캐폴드 HopQ로부터 구축된 메가바디의 184.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-488 (2 μM)로 직교적으로 염색되었고 100 nM의 Dylight-647-표지된 K-RAS와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정한 메가바디 (높은 CoA-488 형광도)를 디스플레이하고 K-RAS (높은 Dylight-647 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 K-RAS 결합 모노바디를 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선택 라운드를 수행하였다.
1 라운드의 선택 이후에, CoA-488 및 Dylight-647 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 스케폴드 단백질에 모노바디 NS1을 연결하는 펩티드 링커의 대표적인 번호의 서열을 결정하였다. 1-1 및 2-2 아미노산의 짧은 링커 변이체의 3종의 대표적인 클론 (표 12)은 FACS 실험에서 100 nM K-Ras에 결합하는 것을 확인하였다 (도 49). 제시된 높은 디스플레이 수준 및 항원에 대한 결합은 이들 메가바디가 세포 분비를 수행할 수 있고 기능성 K-RAS-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 의미한다.
Figure pct00019
실시예 22. 다루기 힘든 막-결합 복합체 예컨대 GPCR, 이온 채널, 및 티로신 수용체 키나제의 구조 분석을 위한 항원-결합 키메라 단백질의 디자인 및 생성.
소위 '다루기 힘든' 표적에 특이적으로 결합하는, 본 명세서에 기술된 바와 같은 항원-결합 키메라 단백질의 적용은 그들의 정밀한 구조 분석을 촉진한다. 이미 실시예 4-6에 예시한 바와 같이, 58 kDa 메가바디를 디자인하고, 생산하였으며, GPCR, G 단백질, 또는 이온 채널의 구조 결정에 사용하였다. 실시예 4에서, β2 아드레날린성 수용체-G 단백질 복합체의 Gβ 및 Gα 서브유닛의 계면에 특이적으로 결합하는, Nb35 기반 Mb35 구성체; 실시예 5에서, 인간 β2 아드레날린성 수용체에 특이적으로 결합하는 Nb80 기반 Mb80 구성체; 실시예 6에서, 5량체 리간드-게이팅 이온 채널 GABAA 에 특이적으로 결합하는, Nb25 기반 Mb25 구성체 (Miller et al, 2017). 또한, GABAA 이온 채널 β1 서브유닛 (Miller et al. 2018)의 세포외 도메인에 특이적으로 결합하는, 나노바디 Nb38 (SEQ ID NO:130)를 기반으로 하는 MbNb38 cHopQ 를 생산하였고, 이러한 막-결합 단백질의 고분해능 구조를 결정할 수 있게 하였다. MbNb38 cHopQ 는 실시예 6에 기술된 대로 생성되었다. 여기서, Nb38 (SEQ ID NO:130)의 면역글로불린 도메인은 스캐폴드 단백질 cHopQ와 연결되었다. 모든 부분은 펩티드 결합 (SEQ ID NO:131)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 보존된 N-말단의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), Nb38의 β-스트랜드 B 내지 G (SEQ ID NO:130의 잔기 16-123), 6xHis/EPEA 태그.
이. 콜라이에서 MbNb38 cHopQ 구성체의 발현 및 균질한 정제는 니켈 친화성 크로마토그래피, 및 크기 배제 크로마토그래피를 사용해 수행하였고, 최종적으로 샘플을 15 mg/mL로 -80℃에 저장하였다. 정제된 MbNb38 cHopQ (SEQ ID NO: 131)는 경쟁적 길항제 비쿨쿨린, 채널 차단제 피크로톡신, 효현제 GABA 및 고전적인 벤조디아제핀 알프라졸람 (Xanax) 및 디아제팜 (Valium)에 각각 결합된 지질 나노디스크에서 전체 길이 인간 α1β3γ2 GABAA 수용체의 고분해능 cryo-EM 구조를 분해하는데 사용되었다. A형 γ-아미노부티르산 수용체 (GABAARs)를 통한 이온향성 신호전달은 포유동물 신경계에서 빠른 억제성 신경전달을 구동시킨다. 결론적으로, GABAAR은 사실상 뇌 기능의 모든 측면에서 결정적이며 중요한 약물 표적을 대표한다.
대안적으로, 100 kDa 항원-결합 키메라 단백질은 이러한 다루기 힘든 막-결합 복합체의 구조 분석을 용이하게 하기 위해서, 상기 나노바디를 기반으로, cYgjK 스캐폴드를 적용하여 디자인되고 생산되었다. 이것은 YgjK의 원형 배열된 형태 상에 Nb35, Nb80, Nb25 및 Nb38의 그라프트시켜 본 명세서에서 입증하였다. 이들 메가바디 클론은 본질적으로 실시예 8에 기술된 대로 생성되었다: MbNb35 cYgjk E2 (SEQ ID NO:194): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, Nb35 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:24의 잔기 17-128), 6xHis/EPEA 태그. Nb80 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:26의 잔기 17-120)를 사용하여, MbNb80 cYgjk E2 (SEQ ID NO:195); Nb25 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:28의 잔기 17-125)를 사용하여, MbNb25 cYgjk E2 (SEQ ID NO:196); Nb38 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:130의 잔기 17-123)를 사용하여, MbNb38 cYgjk E2 (SEQ ID NO:197)를 디자인하고 생산하기 위해 유사한 구성을 따랐다.
또한, 트로포미오신-관련 키나제 수용체 B (TrkB)에 특이적으로 결합하는 Nb22 나노바디 (SEQ ID NO:198) 기반의 MbNb22 cYgjk E2 는 이러한 막-결합 수용체의 고분해능 구조의 결정을 허용하도록 생산되었다. MbNb22 cYgjk E2 도 역시 실시예 8에 기술된 대로 생성되었다: MbNb22 cYgjk E2 (SEQ ID NO:199): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, Nb22 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:198의 잔기 17-124), 6xHis/EPEA 태그. 이들 메가바디 (SEQ ID NO: 194-195-196-197-199)의 주변세포질 발현 및 균질한 정제는 본질적으로 실시예 8에 기술된 대로 수행하였다.
예로서, MbNb22 cYgjk E2 (SEQ ID NO:199)는 트로포미오신-관련 키나제 수용체 B (TrkB)에 결합된 인간 뇌-유래 신경영양 인자 (BDNF)를 결정화시키기 위한 결정화 샤페론으로서 사용되었고 X-선 결정학을 통해 TrkB-BDNF-cYgjkE2Nb22 3원 복합체의 고분해능 구조를 분해하였다. BDNF는 뉴런 생존, 시냅스 생성, 시냅스 전달 및 시냅스 가소성을 촉진하여 회로의 기능적 조절 및 발생에 관여하는 신경영양 인자이다. BDNF는 TrkB와의 결합을 통해 작용한다 (Yoshii and Constantine-Paton, 2010).
실시예 23: 항원-결합 키메라 단백질 스캐폴드에 결합하여 더욱 연장시키기 위해, cHopQ-함유 항원-결합 키메라 단백질의 cHopQ 스캐폴드에 특이적으로 결합할 수 있는, 항원-결합 키메라 단백질의 디자인 및 생성.
도 26에 개략적으로 제시된 바와 같이, 다른 항원-결합 키메라 단백질은 도 2의 융합에 따라서, 스캐폴드 단백질 상에 그라프트된, cHopQ-특이적 나노바디 (Nb60)를 포함하는 것을 생성시켰다. 항원-결합 키메라 단백질, 또는 '조립된 항원-결합 키메라 단백질', 또는 '폴리바디' 또는 '확대된 항원-결합 키메라 단백질 스캐폴드'의 최종 조성물은 이러한 특이적 '항-Mb-스캐폴드 메가바디'를 사용하여 본 발명의 항원-결합 키메라 단백질의 크기를 더욱 증가시킬 수 있게 한다. 이러한 '폴리바디'는 예를 들어 응집을 초래하는 자기-상호작용을 피하도록, Nb60 cHopQ 결합 부위에 결합하지 않는 돌연변이된 cHopoQ 단백질을 스캐폴드 단백질로서 포함할 수 있다. 폴리바디에 사용되는 스캐폴드는 또한 상기 자기-결합을 피하기 위해서, 본 명세서에 기술된 cYgjK 스캐폴드 단백질과 같은 상이한 스캐폴드로 구성될 수 있다. 첫째로, cHopQ에 결합하는 Nb60 (SEQ ID NO:132)은 생성되어 MbNb207 cHopQ (SEQ ID NO:20)의 존재 하에서 결정화에 사용되었다. 분해된 결정 구조를 기반으로 MbNb207 cHopQ 의 cHopQ의 3개 잔기 (T289, N296 및 E197)가 Nb60-cHopQ 상호작용을 위한 주요 기여인자로서 확인되었다 (도 27). 게다가, cHopQ-기반 메가바디 디자인의 보다 짧은 형태로서, MbNb207 cHopQ 결정 구조의 전자 밀도에서 전혀 완전히 볼 수 없는 루프로서 항상 나타나는 원형 배열 영역 (c7HopQ라고 함)을 절단한 것이 제안될 수 있었다.
MbNb60 c7HopQ 는 펩티드 결합에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결된, 다음의 부분들로 구성된다: 항-GFP 나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), c7HopQ-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:132의 잔기 16-133), 6xHis/EPEA 태그. 그러나, c/c7HopQ-함유 메가바디에 결합하지만 그 자체에 결합 (자가 중합)하지 않는 MbNb60 c7HopQ 메가바디를 생성시키기 위해서, MbNb60 c7HopQ 의 2종의 상이한 돌연변이체가 사용되었다:
· N277K, T270R (MbNb60 c7HopQ mut2, SEQ ID NO:133)
· N277K, T270R, E197R (MbNb60 c7HopQmut3, SEQ ID NO:134)
MbNb60 c7HopQ 의 이들 돌연변이체는 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현되었고, 균질하게 정제되었다. 다음으로, Octet 측정 (도 29)은 도 24에 도시된 바와 유사한 측정을 사용하여, 이들 2종의 MbNb60 c7HopQ 돌연변이체 메가바디가 야생형 cHopQ 스캐폴드 단백질을 함유하는 메가바디에 결합할 수 있다는 증거를 제공하였다. 바이오틴화된 MbNb207 cHopQ (SEQ ID NO:20)는 스트렙타비딘 바이오센서 상에 고정되었다. 상이한 농도의 Nb60 (SEQ ID NO:132), MbNb60 c7HopQ mut 2 (SEQ ID NO:133) 및 MbNb60 c7HopQ mut 3 (SEQ ID NO:134)을 고정된 MbNb207 cHopQ 와의 결합에 대해 조사하였다. Nb60 및 2종 MbNb60 c7HopQ 돌연변이체의 경우 MbNb207 cHopQ 와의 결합이 확인되었다.
cHopQ-돌연변이체-기반 접근법과 유사하게, 다른 스캐폴드 단백질은 항원-결합 키메라 단백질의 조성물 또는 폴리바디를 생성시키는데 사용될 수 있다. 따라서, 대안적인 스캐폴드 단백질 YgjK, 이. 콜라이의 86 kDa 주변세포질 단백질 (PDB 3W7S, SEQ ID NO: 38)이 사용되었다 (도 26, B). MbNb60 cYgjk E2 는 실시예 8에 기술된 대로 생성되었다: MbNb60 cYgjk E2 (SEQ ID NO:135): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, Nb60 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:132의 잔기 17-133), 6xHis/EPEA 태그.
이러한 메가바디는 실시예 8에 기술된 대로 발현시키고 정제하였다. 다음으로, MbNb207 cHopQ 에 대한 MbNb60 cYgjk E2 의 결합은 상기 기술된 대로 Octet 측정으로 검증하였다 (도 29).
실시예 24: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 도데신으로부터 구축된 다량체 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
여기서 우리는 면역글로불린 도메인이 또한 어떻게 도데신 Rv1498A 상에 강건하게 그라프트될 수 있는가를 입증한다. 고세균 미코박테리움 튜버큘로시스 (Mycobacterium tuberculosis) 유래의 이러한 소형 플라보단백질은 12개 단량체의 조립체이다. 단량체의 12 카피가 이. 콜라이에서 과발현시 자가-조립되어 고도로 열안정된 도데신을 형성할 수 있다는 것이 확인되었다 (Liu et al., 2011). 도데신에서, 각 단량체의 N-말다는 동일 단량체의 C-말단에 매우 가깝다. 따라서, 우리는 도 2에 따라 2개 짧은 펩티드가 나노바디를 스캐폴드에 연결한 도데신 단량체 상에 그라프트된 나노바디로부터 구축된 강성 항원-결합 키메라 단백질을 코딩하는 무작위 라이브러리를 구축하였다.
여기에 기술된 258 kDa MbNb207 도데신 분자는 도 50에 따라 직접 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가 조립된다. 사용된 면역글로불린은 SEQ ID NO:1로 표시된 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 엠. 튜버큘로시스의 도데신 Rv1498A의 단량체 (GenBank 등록 번호: 3205040, SEQ ID NO:192)였다. 모든 부분은 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다 (SEQ ID NO:193): 출발 코돈에 의해 코딩되는 메티오닌, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 무작위 조성의 1개 아미노산의 펩티드 링커, 도데신 Rv1498A 단백질 (SEQ ID NO:192의 잔기 5-66), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그. 이러한 항원-결합 키메라 단백질은 12 카피의 메가바디를 함유하는 도데신 다량체로 자가 조립된다 (도 50).
2개 짧은 펩티드가 나노바디를 도데신 (SEQ ID NO:193)에 연결한 이들 항원-결합 키메라 단백질의 기능적 대표물을 선택하기 위해서, 우리는 상기 기술된, 항원-결합 키메라 단백질 (SEQ ID NO:193)을 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 HindIII-SpI 단편으로서 pMESP 벡터에 클로닝된다. 이렇게 새롭게 생성된 플라스미드는 pMESP도데신XNbGFP207이라고 하였다. 재조합적으로 발현되고 시험관내에서 올바르게 조립된 항원-결합 키메라 MbNb207 도데신 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축하였다. 이들 라이브러리를 이. 콜라이 세포를 형질전환시키는데 사용하였다. 도데신으로 올바르게 조립된 키메라 단백질을 동정하기 위해서, 개별 클론을 이. 콜라이에서 발현시켰고, 실시예 7에 기술된 대로 ELISA를 수행하여 GFP에 결합하는 클론을 스크리닝하였다 (도 51). 항원-결합 키메라 단백질을 발현하고 GFP에 결합하는 몇몇 클론을 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결하는 펩티드 링커의 서열을 결정하였다. 이것은 2개 짧은 폴리펩티드 연결에 의해 연결된 단일-도메인 면역글로불린의 일부분 및 도데신으로부터의 쇄상화된 항원-결합 키메라 단백질이 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 1-1 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 13에 제공된다. 이것은 도데신 Rv1498A의 단량체 상에 그라프트된 나노바디로부터 구축된 이들 항원-결합 키메라 단백질이 이. 콜라이에서 기능적으로 발현될 수 있다는 것을 의미한다.
Figure pct00020
실시예 25: 시험관내 선택에 의한 GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 디술피드-브릿지된 동종이량체로부터 구축된 메가바디의 디자인 및 생성.
여기서 면역글로불린 도메인이 또한 어떻게 4QYB라고 하는 동종이량체 상에 강성으로 그라프트될 수 있는지를 설명한다. 버크홀데리아 세노파시아 (Burkholderia cenocepacia) J2315 유래의 미지 기능의 이러한 소형 단백질은 이 단백질의 보소된 결정 구조를 통해 확인된 바와 같이, 2개 단량체가 단일 분자내 디술피드 브릿지를 통해 연결된 동종이량체이다 (Halavaty et. al. Unpublished data, PDB code 4QYB). 추가로, 한 단량체의 N-말단은 동일 단량체의 C-말단에 매우 가깝다. 따라서, 우리는 도 2에 따라 2개 짧은 펩티드가 나노바디를 스캐폴드에 연결한 4QYB 단량체 상에 그라프트된 나노바디로부터 구축된 강성 항체 키메라를 코딩하는 무작위 라이브러리를 구축하였다.
여기 기술된 51 kDa 동종이량체 MbNb207 4QYB 는 도 52에 따라 직접적으로 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가 조립된다. 사용된 면역글로불린은 SEQ ID NO:1로 표시된 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 비. 세노세파시아 J2315 유래 4QYB의 단량체 (PDB 4QYB, SEQ ID NO:200)였다. 모든 부분은 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다 (SEQ ID NO:201-204): 항-GFP-나노바디의 β-스트랜드 A (잔기 SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 4QYB 단백질 (SEQ ID NO:200의 잔기 8-121), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이러한 강성 항원-결합 키메라 단백질은 2 카피의 나노바디를 함유하는 디술피드-브릿지된 동종이량체로 자가 조립된다 (도 52).
2개 짧은 펩티드 (SEQ ID NO:201-204)가 나노바디를 스캐폴드에 연결시킨 이들 항원-결합 키메라 단백질의 기능적 대표물을 선택하고, 그들을 이. 콜라이의 주변세포질에서 발현시키기 위해, 우리는 상기 기술된 항원-결합 키메라 단백질 (SEQ ID NO:205-208)을 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 이. 콜라이의 주변세포질로 융합 단백질의 분비를 유도하는 PelB 리더 서열, 항-GFP-나노바디의 β-스트랜드 A (잔기 SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 4QYB 단백질 (SEQ ID NO:200의 잔기 8-121), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이들 DNA 단편은 HindIII-SpI 단편으로서 pMESP 벡터에 클로닝된다. 이렇게 새롭게 생성된 플라스미드는 pMESP4QYBXXNbGFP207이라고 하였다.
재조합적으로 발현되어 시험관내에서 올바르게 조립된 MbNb207 4QYB 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축되었다. 이들 라이브러리는 올바르게 조립된 동종이량체의 동정을 위해서, 이. 콜라이 세포를 형질전환시키는데 사용된다. 개별 클론은 이. 콜라이에서 발현시켰고, 실시예 7에 기술된 대로 ELISA를 수행하여 GFP에 결합하는 클론을 스크리닝하였다. 항원-결합 키메라 단백질을 발현하고 GFP에 결합하는 몇몇 클론은 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드에 연결하는 펩티드 링커의 서열을 결정하였다.
서열 목록
>SEQ ID NO:1: NbGFP207 GFP-특이적 나노바디 = Nb207
>SEQ ID NO:2: 피. 애루지노사의 박테리오 파지 PP7 외피 단백질 단량체
>SEQ ID NO:3-6: MbNb207 cPP7x2L 이량체
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, PP7 서열: 밑줄, (X)1-2: 가변 길이 (1개 또는 2개 아미노산)의 짧은 펩티드 링커, 태그: 소문자)
Figure pct00021
Figure pct00022
>SEQ ID NO:7: cAbLys3 흰계란 리소자임 특이적 나노바디 (PDB 1MEL)
>SEQ ID NO:8: 에스케리치아 콜라이의 박테리오파지 외피 단백질 단량체 (PDB 2MS2)
>SEQ ID NO:9: MbcAbLys3 cMS2x2L 이량체
(Nb GFP 207 스트랜드 A 및 cAb Lys 3, 서열: 굵은체, 원형 배열 링커: 이탤릭체, MS2 서열: 밑줄, 태그: 소문자)
Figure pct00023
>SEQ ID NO:10-13: MbcAbLys3 cMS2x2L 이량체
Figure pct00024
>SEQ ID NO:14: N2bNb207 cAbLys3L 나노2바디
(
Figure pct00025
, Nb GFP 207: 굵은체,cAb Lys3 서열: 밑줄)
Figure pct00026
>SEQ ID NO:15: PelB_ N2bNb207 cAbLys3L_태그, 앰버 중지 코돈(*)_단백질3 나노2바디
(PelB 리더 서열,
Figure pct00027
, Nb GFP 207: 굵은체, cAbLys3 서열: 밑줄, 태그: 소문자, 앰버 중지 코돈: *, 단백질3: 이탤릭체_)
Figure pct00028
>SEQ ID NO:16: DsbA_ N2bNb207 cAbLys3L_태그, 앰버 중지 코돈(*)_단백질3 나노2바디
(DsbA 리더 서열,
Figure pct00029
, Nb GFP 207: 굵은체, cAbLys3 서열: 밑줄, 태그: 소문자, 앰버 중지 코돈: *, 단백질3: 이탤릭체_)
Figure pct00030
Figure pct00031
>SEQ ID NO:17: NbFEDF9 F18 핌브리아 어드헤신 FedF의 렉틴 도메인 특이적 나노바디 (PDB 4W6Y)
>SEQ ID NO:18: N2bNb207 NbFEDF9L 나노2바디
(
Figure pct00032
, Nb GFP 207: 굵은체, Nb FedF 9 서열: 밑줄)
Figure pct00033
>SEQ ID NO:19: 헬리코박터 피로리 균주 G27 HopQ 어드헤신 도메인 단백질 (PDB 5LP2)
>SEQ ID NO:20: MbNb207 cHopQ
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄)
Figure pct00034
>SEQ ID NO:21: cHopQ 원형 배열 링커 펩티드
>SEQ ID NO:22: MbNb207 cHopQ_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cHopQNb GFP 207: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00035
, cMyc 태그)
Figure pct00036
>SEQ ID NO:23: DsbA-MbNb207 cHopQ
>SEQ ID NO:24: Nb35 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ/Gα 서브유닛-특이적 나노바디
>SEQ ID NO:25: MbNb35 cHopQ
(
Figure pct00037
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄, Nb35 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00038
Figure pct00039
>SEQ ID NO:26: Nb80 β2 아드레날린성 수용체-특이적 나노바디
>SEQ ID NO:27: MbNb80 cHopQ
(
Figure pct00040
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄, Nb80 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00041
>SEQ ID NO:28: Nb25 GABAA-특이적 나노바디
>SEQ ID NO:29: MbNb25 cHopQ
(
Figure pct00042
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄, Nb25 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00043
>SEQ ID NO:30-33: MbNb207 cHopQ무작위 링커
(Nb GFP 207 서열: 굵은체, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄)
Figure pct00044
>SEQ ID NO:34-37: MbNb207 cHopQ무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cHopQNb GFP 207무작위 링커: 굵은체, (X)1-2: 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 가요성 (GGGS) n 폴리펩티드 링커: 이탤릭체, Aga2p 단백질 서열: 밑줄,
Figure pct00045
, cMyc 태그)
Figure pct00046
>SEQ ID NO:38: 이. 콜라이 Ygjk 단백질 (PDB 3WFS)
>SEQ ID NO:39-42: MbNb207 cYgjkQ무작위 링커
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, Ygjk 서열: 밑줄, (X)1-2: 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 6xHis & EPEA 태그)
Figure pct00047
>SEQ ID NO:43: cYgjk 원형 배열 링커 펩티드
>SEQ ID NO:44-47: MbNb207 cYgjk무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cYgjkQNb GFP 207무작위 링커 라이브러리: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00048
, cMyc 태그)
Figure pct00049
>SEQ ID NO:48: MbNb207 cHopQC357-C425
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄,
Figure pct00050
)
Figure pct00051
>SEQ ID NO:49: MbNb207 cHopQC358-C488
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄,
Figure pct00052
)
Figure pct00053
>SEQ ID NO:50: MbNb207 cHopQC359-C490
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄,
Figure pct00054
)
Figure pct00055
>SEQ ID NO:51: MbNb207 cHopQC15-C534
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄)
Figure pct00056
>SEQ ID NO:52: 피. 애루지노사 아주린 (PDB 2TSA) M121A 돌연변이체 단백질
>SEQ ID NO:53-60: MbNb207 아주린Q 무작위 링커
(Nb GFP 207 서열: 굵은체, 아주린 서열: 밑줄, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커)
Figure pct00057
>SEQ ID NO:61-68: MbNb207 아주린Q 연결 라이브러리_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 아주린Nb GFP 207_무작위 링커 라이브러리: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00058
, cMyc 태그)
Figure pct00059
>SEQ ID NO:69: 박테로이데스 테타이오타오미크론 SusB 단백질 (PDB3wfa)
>SEQ ID NO:70-77: MbNb207 SusB 무작위 링커 메가바디 라이브러리 단백질 서열
(Nb GFP 207 서열: 굵은체, (X)1-2: 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, susB 서열: 밑줄)
Figure pct00060
>SEQ ID NO:78-85: 동종-이량체 메가바디 MbNb207 SusB 무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, susBNb GFP 207무작위 링커 메가바디 라이브러리: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00061
, cMyc 태그)
Figure pct00062
>SEQ ID NO:86: 이. 콜라이 아실 캐리어 단백질 (PDB1T8K)
>SEQ ID NO:87-90: 나노툴 MbNb207 ACP 무작위 링커
(Nb GFP 207 서열: 굵은체, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, ACP 서열: 밑줄)
Figure pct00063
>SEQ ID NO:91-94: 나노툴 MbNb207 ACP무작위 링커_Aga2p 단백질 서열
(appS4 리더 서열,나노툴 ACPNb GFP 207무작위 링커, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00064
)
Figure pct00065
>SEQ ID NO:95: MbNb207 cHopQMP1251_A7
(
Figure pct00066
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1251_A7의 β-스트랜드 A 내지 G)
Figure pct00067
>SEQ ID NO:96: MbNb207 cHopQMP1252_D10
(
Figure pct00068
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1252_D10의 β-스트랜드 A 내지 G)
>SEQ ID NO:97: MbNb207 cHopQMP1251_D10
(
Figure pct00069
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1251_D10의 β-스트랜드 A 내지 G)
>SEQ ID NO:98: MbNb207 cHopQMP1251_A10
(
Figure pct00070
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1251_A10의 β-스트랜드 A 내지 G)
>SEQ ID NO:99: MbNb207 cHopQMP1251_D4
(
Figure pct00071
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1251_D4의 β-스트랜드 A 내지 G)
>SEQ ID NO:100: MbNb207 cHopQMP1252_C10
(
Figure pct00072
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1252_C10의 β-스트랜드 A 내지 G)
>SEQ ID NO:101: MbNb207 cHopQMP1251_H6
(
Figure pct00073
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1251_H6의 β-스트랜드 A 내지 G)
>SEQ ID NO:102: MbNb207 cHopQMP1251_A5
(
Figure pct00074
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1251_A5의 β-스트랜드 A 내지 G)
>SEQ ID NO:103: MbNb207 cHopQMP1263_C9
(
Figure pct00075
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄 , 나노바디 MP1263_C9의 β-스트랜드 A 내지 G)
>SEQ ID NO:104-107: MbNb207 cHopQ_β턴CC'_무작위 링커 단백질 서열
(
Figure pct00076
, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄, Nb207 β-스트랜드 C' 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00077
>SEQ ID NO:108-111: MbNb207 cHopQ_β턴CC'_무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cHopQNb GFP 207_β턴CC'_무작위 링커 라이브러리 도시: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00078
, cMyc 태그)
Figure pct00079
>SEQ ID NO:112: 데이노코커스 라디오두란스 모노바디 NS1 (PDB5E59 유래)
>SEQ ID NO:113-116: MbNS1 cHopQ_무작위 링커
(
Figure pct00080
, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, HopQ 서열: 밑줄, 원형 배열 링커: 이탤릭체, NS1 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00081
>SEQ ID NO:117-120: MbNS1 cHopQ_무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, cHopQNS1_무작위 링커 메가바디 라이브러리 도시: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄,
Figure pct00082
, cMyc 태그)
Figure pct00083
>SEQ ID NO:121: NbGFP207 (DNA) = Nb207
>SEQ ID NO:122: TU89 전방향 프라이머 (SapI 분해 부위) (DNA)
>SEQ ID NO:123: EP230 역방향 프라이머 (SapI 분해 부위) (DNA)
>SEQ ID NO:124: TU64 프라이머 (DNA)
>SEQ ID NO:125: TU65 프라이머 (DNA)
>SEQ ID NO:126: TU131 프라이머 (DNA)
>SEQ ID NO:127: TU132 프라이머 (DNA)
>SEQ ID NO:128: TU133 프라이머 (DNA)
>SEQ ID NO:129: TU134 프라이머 (DNA)
>SEQ ID NO: 130: Nb38 GABAA-특이적 나노바디
>SEQ ID NO: 131: MbNb38 cHopQ
(
Figure pct00084
, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄, Nb38 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00085
>SEQ ID NO: 132: Nb60 HopQ-특이적 나노바디
>SEQ ID NO: 133: MbNb60 c7HopQ N277K T270R
(
Figure pct00086
, HopQ 서열: 밑줄,
Figure pct00087
돌연변이, Nb60 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00088
>SEQ ID NO:134: MbNb60 c7HopQ N277K T270R E197R
(
Figure pct00089
, HopQ 서열: 밑줄,
Figure pct00090
돌연변이, Nb60 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00091
>SEQ ID NO:135: MbNb60 cYgjkQE2
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, Ygjk 서열: 밑줄, 1개 아미노산 링커, 6xHis & EPEA 태그)
Figure pct00092
Figure pct00093
>SEQ ID NO:136: MbNb207 c7HopQ
(
Figure pct00094
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
Figure pct00095
>SEQ ID NO: 137-140: MbNb207 c7HopQ A5 , A12, B7, 및 G10, resp.
>SEQ ID NO:141: MbNb207 cYgjkE2
(Nb GFP 207 서열: 굵은체,
Figure pct00096
짧은 펩티드 링커, YgjK 서열: 밑줄, 원형 배열 링커: 이탤릭체, YgjK 서열: 밑줄,
Figure pct00097
짧은 펩티드 링커, 6xHis & EPEA 태그)
Figure pct00098
>SEQ ID NO:142-144: MbNb207 cYgjkA2, C4 및 F5, resp.
>SEQ ID NO: 145: MbNb207 c7HopQ C14-C512
(
Figure pct00099
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체,
Figure pct00100
) 6xHis 태그, EPEA 태그)
Figure pct00101
>SEQ ID NO: 146: MbNb207 c7HopQ C402-C474
(
Figure pct00102
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체,
Figure pct00103
), 6xHis 태그, EPEA 태그)
Figure pct00104
>SEQ ID NO: 147: MbNb207 c7HopQ C316-C472
(
Figure pct00105
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체,
Figure pct00106
) 6xHis 태그, EPEA 태그)
Figure pct00107
>SEQ ID NO: 148: MbNb207 c7HopQ C314-C472
(
Figure pct00108
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체,
Figure pct00109
) 6xHis 태그, EPEA 태그)
Figure pct00110
>SEQ ID NO: 149: MbNb207 c7HopQ C312-C453
(
Figure pct00111
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체,
Figure pct00112
) 6xHis 태그, EPEA 태그)
Figure pct00113
>SEQ ID NO: 150: MbNb207 c7HopQ C349-C452
(
Figure pct00114
, HopQ 서열: 밑줄, Nb GFP 207 β-스트랜드 B 내지 G: 굵은체,
Figure pct00115
) 6xHis 태그, EPEA 태그)
Figure pct00116
>SEQ ID NO: 151-158: MbNb207 아주린 A8, D9, D10, D11, G6, B8, B2, 및 C8, resp.
>SEQ ID NO: 159: MbNb207 cPP7x2A3 (MP1403_A3)
(Nb GFP 207 서열: 굵은체, 링커: 이탤릭체, PP7 서열: 밑줄, 태그: 소문자)
Figure pct00117
>SEQ ID NO: 160-165: MbNb207 cPP7x2 D3, G5, E6, D7, A9, B9, resp. (MP1403)
>SEQ ID NO:166: AP205 아시네토박터 파지 외피 단백질 NP_085472.1
>SEQ ID NO: 167: MbNb207 AP205x2 XX
(Nb GFP 207 서열: 굵은체, 무작위 링커: 이탤릭체, X: 짧은 펩티드 링커 (1개 아미노산), AP205 서열: 밑줄, 태그: 소문자)
Figure pct00118
>SEQ ID NO: 168-172: MbNb207 AP205x2C5, B7, B8, D3, A4, resp.
>SEQ ID NO: 173: MbNb207 AP205 XX
(Nb GFP 207 서열: 굵은체, 무작위 링커: 이탤릭체, X: 짧은 펩티드 링커 (1개 아미노산), AP205 서열: 밑줄, 태그: 소문자)
Figure pct00119
>SEQ ID NO: 174-183: MbNb207 AP205 C12, A4, E8, D10, A3, A10, D10, D2, C10, F1, resp.
>SEQ ID NO: 184: N2bNb207 NbFedF9E
(
Figure pct00120
, Nb GFP 207: 굵은체, Nb FedF 9 서열: 밑줄), 링커 서열: 이탤릭체
Figure pct00121
>SEQ ID NO: 185: N2bNb207 NbFedF9Q
(
Figure pct00122
, Nb GFP 207: 굵은체, Nb FedF 9 서열: 밑줄), 링커 서열: 이탤릭체
Figure pct00123
>SEQ ID NO: 186: N2bNb207 NbFedF9 CA14543 (MP1411_B3)
>SEQ ID NO: 187: N2bNb207 NbFedF9 CA14544 (MP1411_C6)
>SEQ ID NO: 188: N2bNb207 NbFedF9 CA14546 (MP1438_A5)
>SEQ ID NO: 189: N2bNb207 NbFedF9 CA14548 (MP1438_B11)
>SEQ ID NO: 190: N2bNb207 NbFedF9 CA14550 (MP1438_D2)
>SEQ ID NO: 191: N2bNb207 NbFedF9 CA14552 (MP1440_C5)
>SEQ ID NO:192: 미코박테리움 튜버큘로시스 도데신 Rv1498A 단백질 (GenBank 등록 번호: 3205040)
>SEQ ID NO: 193: MbNb207 도데신 무작위 링커 메가바디
(Nb GFP 207 서열: 굵은체,
Figure pct00124
: 혼합 조성의 짧은 펩티드 링커 (1개 아미노산), 도데신 Rv1498A 단백질 서열: 밑줄, 6xHis 태그, EPEA 태그)
Figure pct00125
>SEQ ID NO:194: MbNb35 cYgjk E2  
>SEQ ID NO:195: MbNb80 cYgjk E2
>SEQ ID NO:196: MbNb25 cYgjk E2
>SEQ ID NO:197: MbNb38 cYgjk E2
>SEQ ID NO: 198: Nb22 트로포미오신-관련 키나제 수용체 B (TrkB)-특이적 나노바디 
>SEQ ID NO: 199: MbNb22 cYgjk E2
>SEQ ID NO:200: 버크홀데리아 세노세파시아 4QYB 단백질 (PDB 4QYB)
>SEQ ID NO:201-204: MbNb207 4QYB 무작위 링커
(Nb GFP 207 서열: 굵은체, (X)1-2: 혼합 조성의 짧은 펩티드 링커 (1개 또는 2개 아미노산), 4QYB 단백질 서열: 밑줄, 6xHis 태그, EPEA 태그)
Figure pct00126
>SEQ ID NO:205-208: PelB_MbNb207 4QYB 무작위 링커
(
Figure pct00127
, Nb GFP 207 서열: 굵은체, (X)1-2: 혼합 조성의 짧은 펩티드 링커 (1개 또는 2개 아미노산), 4QYB 단백질 서열: 밑줄, 6xHis 태그, EPEA 태그)
Figure pct00128
>SEQ ID NO:209: 친화성 태그 (US 9518084 B2)
EPEA
>SEQ ID NO:210-213: 도 8C의 서열.
참조문헌
Figure pct00129
Figure pct00130
Figure pct00131
<110> VIB VZW VRIJE UNIVERSITEIT BRUSSEL <120> Novel antigen-binding chimeric proteins and methods and uses thereof <130> JaSt/MEGABO/613 <150> EP 17199472.6 <151> 2017-10-31 <150> EP 18199709.9 <151> 2018-10-10 <160> 220 <170> PatentIn version 3.5 <210> 1 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> NbGFP207 GFP-specific Nanobody <400> 1 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 20 25 30 Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val 35 40 45 Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 65 70 75 80 Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu 100 105 110 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 115 120 125 <210> 2 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> bacteriophage of P. Aeruginosa PP7 coat protein monomer <400> 2 Met Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr Leu 1 5 10 15 Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys Val 20 25 30 Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln Asn 35 40 45 Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala Asp 50 55 60 Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro Lys Val Arg 65 70 75 80 Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala Asn Ser Thr 85 90 95 Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala 100 105 110 Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg 115 120 125 <210> 3 <211> 390 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2L dimer <220> <221> MISC_FEATURE <222> (132) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (261) <223> Xaa can be any naturally occurring amino acid <400> 3 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala 130 135 140 Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe 145 150 155 160 Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser 165 170 175 Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu 180 185 190 Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu 195 200 205 Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val 210 215 220 Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys 225 230 235 240 Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val 245 250 255 Pro Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly Ser Leu 260 265 270 Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met 275 280 285 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly 290 295 300 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 305 310 315 320 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 325 330 335 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 340 345 350 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 355 360 365 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His 370 375 380 His His Glu Pro Glu Ala 385 390 <210> 4 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2L dimer <220> <221> MISC_FEATURE <222> (132)..(133) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (262) <223> Xaa can be any naturally occurring amino acid <400> 4 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu 130 135 140 Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile 145 150 155 160 Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala 165 170 175 Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys 180 185 190 Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu 195 200 205 Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile 210 215 220 Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr 225 230 235 240 Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu 245 250 255 Val Pro Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 290 295 300 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 340 345 350 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 355 360 365 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 370 375 380 His His His Glu Pro Glu Ala 385 390 <210> 5 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2L dimer <220> <221> MISC_FEATURE <222> (132) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (261)..(262) <223> Xaa can be any naturally occurring amino acid <400> 5 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala 130 135 140 Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe 145 150 155 160 Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser 165 170 175 Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu 180 185 190 Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu 195 200 205 Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val 210 215 220 Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys 225 230 235 240 Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val 245 250 255 Pro Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 290 295 300 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 340 345 350 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 355 360 365 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 370 375 380 His His His Glu Pro Glu Ala 385 390 <210> 6 <211> 392 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2L dimer <220> <221> MISC_FEATURE <222> (132)..(133) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (262)..(263) <223> Xaa can be any naturally occurring amino acid <400> 6 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu 130 135 140 Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile 145 150 155 160 Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala 165 170 175 Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys 180 185 190 Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu 195 200 205 Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile 210 215 220 Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr 225 230 235 240 Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu 245 250 255 Val Pro Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly 260 265 270 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 275 280 285 Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val 290 295 300 Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala 305 310 315 320 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 325 330 335 Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 340 345 350 Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu 355 360 365 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His 370 375 380 His His His His Glu Pro Glu Ala 385 390 <210> 7 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> cAbLys3 hen egg-white lysozyme specific Nanobody (PDB 1MEL) <400> 7 Asp Val Gln Leu Gln Ala Ser Gly Gly Gly Ser Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr 20 25 30 Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val 35 40 45 Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr 65 70 75 80 Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys 85 90 95 Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly 100 105 110 Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln 115 120 125 Val Thr Val Ser Ser 130 <210> 8 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> bacteriophage of Escherichia coli coat protein monomer (PDB 2MS2) <400> 8 Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr 1 5 10 15 Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu 20 25 30 Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser 35 40 45 Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu 50 55 60 Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val 65 70 75 80 Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe 85 90 95 Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu 100 105 110 Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly 115 120 125 Ile Tyr 130 <210> 9 <211> 400 <212> PRT <213> Artificial Sequence <220> <223> MbcAbLys3cMS2x2 L dimer <220> <221> MISC_FEATURE <222> (14)..(15) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (272)..(273) <223> Xaa can be any naturally occurring amino acid <400> 9 Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Xaa Gly 1 5 10 15 Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp 20 25 30 Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val 35 40 45 Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val 50 55 60 Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala 65 70 75 80 Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala 85 90 95 Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu 100 105 110 Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile 115 120 125 Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr 130 135 140 Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu 145 150 155 160 Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser 165 170 175 Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu 180 185 190 Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val 195 200 205 Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe 210 215 220 Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu 225 230 235 240 Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly 245 250 255 Ile Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa 260 265 270 Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro 275 280 285 Tyr Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly 290 295 300 Val Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser 305 310 315 320 Val Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val 325 330 335 Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr 340 345 350 Cys Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His 355 360 365 Gly Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr 370 375 380 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 385 390 395 400 <210> 10 <211> 398 <212> PRT <213> Artificial Sequence <220> <223> MbcAbLys3cMS2x2 L dimer <220> <221> MISC_FEATURE <222> (14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (271) <223> Xaa can be any naturally occurring amino acid <400> 10 Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Gly Asp 1 5 10 15 Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp Ile 20 25 30 Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val Arg 35 40 45 Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val Pro 50 55 60 Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala Ala 65 70 75 80 Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr 85 90 95 Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys 100 105 110 Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr 115 120 125 Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly 130 135 140 Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp 145 150 155 160 Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val 165 170 175 Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val 180 185 190 Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala 195 200 205 Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala 210 215 220 Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu 225 230 235 240 Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile 245 250 255 Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr Cys 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala 290 295 300 Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala 340 345 350 Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly Leu 355 360 365 Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val 370 375 380 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 385 390 395 <210> 11 <211> 399 <212> PRT <213> Artificial Sequence <220> <223> MbcAbLys3cMS2x2 L dimer <220> <221> MISC_FEATURE <222> (14)..(15) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (272) <223> Xaa can be any naturally occurring amino acid <400> 11 Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Xaa Gly 1 5 10 15 Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp 20 25 30 Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val 35 40 45 Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val 50 55 60 Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala 65 70 75 80 Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala 85 90 95 Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu 100 105 110 Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile 115 120 125 Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr 130 135 140 Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu 145 150 155 160 Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser 165 170 175 Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu 180 185 190 Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val 195 200 205 Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe 210 215 220 Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu 225 230 235 240 Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly 245 250 255 Ile Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa 260 265 270 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr 275 280 285 Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val 290 295 300 Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val 305 310 315 320 Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr 325 330 335 Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys 340 345 350 Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly 355 360 365 Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln 370 375 380 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 385 390 395 <210> 12 <211> 399 <212> PRT <213> Artificial Sequence <220> <223> MbcAbLys3cMS2x2 L dimer <220> <221> MISC_FEATURE <222> (14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (271)..(272) <223> Xaa can be any naturally occurring amino acid <400> 12 Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Gly Asp 1 5 10 15 Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp Ile 20 25 30 Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val Arg 35 40 45 Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val Pro 50 55 60 Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala Ala 65 70 75 80 Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr 85 90 95 Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys 100 105 110 Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr 115 120 125 Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly 130 135 140 Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp 145 150 155 160 Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val 165 170 175 Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val 180 185 190 Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala 195 200 205 Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala 210 215 220 Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu 225 230 235 240 Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile 245 250 255 Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa Xaa 260 265 270 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr 275 280 285 Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val 290 295 300 Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val 305 310 315 320 Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr 325 330 335 Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys 340 345 350 Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly 355 360 365 Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln 370 375 380 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 385 390 395 <210> 13 <211> 400 <212> PRT <213> Artificial Sequence <220> <223> MbcAbLys3cMS2x2 L dimer <220> <221> MISC_FEATURE <222> (14)..(15) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (272)..(273) <223> Xaa can be any naturally occurring amino acid <400> 13 Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Xaa Gly 1 5 10 15 Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp 20 25 30 Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val 35 40 45 Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val 50 55 60 Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala 65 70 75 80 Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala 85 90 95 Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu 100 105 110 Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile 115 120 125 Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr 130 135 140 Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu 145 150 155 160 Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser 165 170 175 Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu 180 185 190 Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val 195 200 205 Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe 210 215 220 Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu 225 230 235 240 Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly 245 250 255 Ile Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa 260 265 270 Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro 275 280 285 Tyr Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly 290 295 300 Val Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser 305 310 315 320 Val Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val 325 330 335 Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr 340 345 350 Cys Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His 355 360 365 Gly Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr 370 375 380 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 385 390 395 400 <210> 14 <211> 279 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207cAbLys3 Nano2body <220> <221> MISC_FEATURE <222> (16)..(18) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (137)..(138) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (257)..(259) <223> Xaa can be any naturally occurring amino acid <400> 14 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Xaa 1 5 10 15 Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala 20 25 30 Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 35 40 45 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 50 55 60 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 65 70 75 80 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 85 90 95 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 100 105 110 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 115 120 125 Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa Gly Ser Leu Arg Leu Ser 130 135 140 Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr Cys Met Gly Trp Phe 145 150 155 160 Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala Ala Ile Asn Met 165 170 175 Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr 180 185 190 Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr Leu Leu Met Asn Ser 195 200 205 Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala Ala Asp Ser Thr 210 215 220 Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly Leu Ser Thr Gly Gly 225 230 235 240 Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 245 250 255 Xaa Xaa Xaa Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 260 265 270 His His His Glu Pro Glu Ala 275 <210> 15 <211> 720 <212> PRT <213> Artificial Sequence <220> <223> PelB__N2bNb207cAbLys3L_tags, amberstopcodon(*)_protein3 Nano2body <220> <221> MISC_FEATURE <222> (38)..(40) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (159)..(160) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (279)..(281) <223> Xaa can be any naturally occurring amino acid <400> 15 Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 1 5 10 15 Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Gln Ala Gly Xaa Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly 35 40 45 Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala 50 55 60 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 65 70 75 80 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 85 90 95 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 100 105 110 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 115 120 125 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 130 135 140 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa 145 150 155 160 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro 165 170 175 Tyr Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly 180 185 190 Val Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser 195 200 205 Val Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val 210 215 220 Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr 225 230 235 240 Cys Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His 245 250 255 Gly Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr 260 265 270 Gln Val Thr Val Ser Ser Xaa Xaa Xaa Gly Gln Gly Thr Gln Val Thr 275 280 285 Val Ser Ser His His His His His His Glu Pro Glu Ala Tyr Pro Tyr 290 295 300 Asp Val Pro Asp Tyr Gly Ser Thr Val Glu Ser Cys Leu Ala Lys Pro 305 310 315 320 His Thr Glu Asn Ser Phe Thr Asn Val Trp Lys Asp Asp Lys Thr Leu 325 330 335 Asp Arg Tyr Ala Asn Tyr Glu Gly Cys Leu Trp Asn Ala Thr Gly Val 340 345 350 Val Val Cys Thr Gly Asp Glu Thr Gln Cys Tyr Gly Thr Trp Val Pro 355 360 365 Ile Gly Leu Ala Ile Pro Glu Asn Glu Gly Gly Gly Ser Glu Gly Gly 370 375 380 Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Thr Lys Pro Pro Glu 385 390 395 400 Tyr Gly Asp Thr Pro Ile Pro Gly Tyr Thr Tyr Ile Asn Pro Leu Asp 405 410 415 Gly Thr Tyr Pro Pro Gly Thr Glu Gln Asn Pro Ala Asn Pro Asn Pro 420 425 430 Ser Leu Glu Glu Ser Gln Pro Leu Asn Thr Phe Met Phe Gln Asn Asn 435 440 445 Arg Phe Arg Asn Arg Gln Gly Ala Leu Thr Val Tyr Thr Gly Thr Val 450 455 460 Thr Gln Gly Thr Asp Pro Val Lys Thr Tyr Tyr Gln Tyr Thr Pro Val 465 470 475 480 Ser Ser Lys Ala Met Tyr Asp Ala Tyr Trp Asn Gly Lys Phe Arg Asp 485 490 495 Cys Ala Phe His Ser Gly Phe Asn Glu Asp Pro Phe Val Cys Glu Tyr 500 505 510 Gln Gly Gln Ser Ser Asp Leu Pro Gln Pro Pro Val Asn Ala Gly Gly 515 520 525 Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu 530 535 540 Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly 545 550 555 560 Gly Gly Ser Gly Gly Gly Ser Gly Ser Gly Asp Phe Asp Tyr Glu Lys 565 570 575 Met Ala Asn Ala Asn Lys Gly Ala Met Thr Glu Asn Ala Asp Glu Asn 580 585 590 Ala Leu Gln Ser Asp Ala Lys Gly Lys Leu Asp Ser Val Ala Thr Asp 595 600 605 Tyr Gly Ala Ala Ile Asp Gly Phe Ile Gly Asp Val Ser Gly Leu Ala 610 615 620 Asn Gly Asn Gly Ala Thr Gly Asp Phe Ala Gly Ser Asn Ser Gln Met 625 630 635 640 Ala Gln Val Gly Asp Gly Asp Asn Ser Pro Leu Met Asn Asn Phe Arg 645 650 655 Gln Tyr Leu Pro Ser Leu Pro Gln Ser Val Glu Cys Arg Pro Tyr Val 660 665 670 Phe Gly Ala Gly Lys Pro Tyr Glu Phe Ser Ile Asp Cys Asp Lys Ile 675 680 685 Asn Leu Phe Arg Gly Val Phe Ala Phe Leu Leu Tyr Val Ala Thr Phe 690 695 700 Met Tyr Val Phe Ser Thr Phe Ala Asn Ile Leu Arg Asn Lys Glu Ser 705 710 715 720 <210> 16 <211> 717 <212> PRT <213> Artificial Sequence <220> <223> DsbA_N2bNb207cAbLys3L_tags, amberstopcodon(*)_protein3 Nano2body <220> <221> MISC_FEATURE <222> (35)..(37) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (156)..(157) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (276)..(278) <223> Xaa can be any naturally occurring amino acid <400> 16 Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser 1 5 10 15 Ala Ser Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 Ala Gly Xaa Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly Gly Gly Leu 35 40 45 Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 50 55 60 Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 65 70 75 80 Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr 85 90 95 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 100 105 110 Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr 115 120 125 Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro 130 135 140 Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa Gly Ser Leu 145 150 155 160 Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr Cys Met 165 170 175 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala Ala 180 185 190 Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly 195 200 205 Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr Leu Leu 210 215 220 Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala Ala 225 230 235 240 Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly Leu Ser 245 250 255 Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val Thr 260 265 270 Val Ser Ser Xaa Xaa Xaa Gly Gln Gly Thr Gln Val Thr Val Ser Ser 275 280 285 His His His His His His Glu Pro Glu Ala Tyr Pro Tyr Asp Val Pro 290 295 300 Asp Tyr Gly Ser Thr Val Glu Ser Cys Leu Ala Lys Pro His Thr Glu 305 310 315 320 Asn Ser Phe Thr Asn Val Trp Lys Asp Asp Lys Thr Leu Asp Arg Tyr 325 330 335 Ala Asn Tyr Glu Gly Cys Leu Trp Asn Ala Thr Gly Val Val Val Cys 340 345 350 Thr Gly Asp Glu Thr Gln Cys Tyr Gly Thr Trp Val Pro Ile Gly Leu 355 360 365 Ala Ile Pro Glu Asn Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu 370 375 380 Gly Gly Gly Ser Glu Gly Gly Gly Thr Lys Pro Pro Glu Tyr Gly Asp 385 390 395 400 Thr Pro Ile Pro Gly Tyr Thr Tyr Ile Asn Pro Leu Asp Gly Thr Tyr 405 410 415 Pro Pro Gly Thr Glu Gln Asn Pro Ala Asn Pro Asn Pro Ser Leu Glu 420 425 430 Glu Ser Gln Pro Leu Asn Thr Phe Met Phe Gln Asn Asn Arg Phe Arg 435 440 445 Asn Arg Gln Gly Ala Leu Thr Val Tyr Thr Gly Thr Val Thr Gln Gly 450 455 460 Thr Asp Pro Val Lys Thr Tyr Tyr Gln Tyr Thr Pro Val Ser Ser Lys 465 470 475 480 Ala Met Tyr Asp Ala Tyr Trp Asn Gly Lys Phe Arg Asp Cys Ala Phe 485 490 495 His Ser Gly Phe Asn Glu Asp Pro Phe Val Cys Glu Tyr Gln Gly Gln 500 505 510 Ser Ser Asp Leu Pro Gln Pro Pro Val Asn Ala Gly Gly Gly Ser Gly 515 520 525 Gly Gly Ser Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly 530 535 540 Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser 545 550 555 560 Gly Gly Gly Ser Gly Ser Gly Asp Phe Asp Tyr Glu Lys Met Ala Asn 565 570 575 Ala Asn Lys Gly Ala Met Thr Glu Asn Ala Asp Glu Asn Ala Leu Gln 580 585 590 Ser Asp Ala Lys Gly Lys Leu Asp Ser Val Ala Thr Asp Tyr Gly Ala 595 600 605 Ala Ile Asp Gly Phe Ile Gly Asp Val Ser Gly Leu Ala Asn Gly Asn 610 615 620 Gly Ala Thr Gly Asp Phe Ala Gly Ser Asn Ser Gln Met Ala Gln Val 625 630 635 640 Gly Asp Gly Asp Asn Ser Pro Leu Met Asn Asn Phe Arg Gln Tyr Leu 645 650 655 Pro Ser Leu Pro Gln Ser Val Glu Cys Arg Pro Tyr Val Phe Gly Ala 660 665 670 Gly Lys Pro Tyr Glu Phe Ser Ile Asp Cys Asp Lys Ile Asn Leu Phe 675 680 685 Arg Gly Val Phe Ala Phe Leu Leu Tyr Val Ala Thr Phe Met Tyr Val 690 695 700 Phe Ser Thr Phe Ala Asn Ile Leu Arg Asn Lys Glu Ser 705 710 715 <210> 17 <211> 129 <212> PRT <213> Artificial Sequence <220> <223> NbFEDF9 the lectin domain of the F18 fimbrial adhesin FedF specific Nanobody (PDB 4W6Y) <400> 17 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Ser Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Tyr Ser Ser Asn 20 25 30 Cys Met Ala Trp Phe Arg Gln Val Pro Gly Lys Glu Arg Glu Gly Val 35 40 45 Ala Ser Ile Asn Thr Arg Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Ser 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Thr Tyr Tyr Cys 85 90 95 Ala Ala Val Arg Glu Ala Thr Tyr Ser Asp Asn Arg Cys Ser Val Arg 100 105 110 Ser Tyr Thr Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 115 120 125 Ser <210> 18 <211> 275 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFEDF9L Nano2body <220> <221> MISC_FEATURE <222> (16)..(18) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (137)..(138) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (253)..(255) <223> Xaa can be any naturally occurring amino acid <400> 18 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Xaa 1 5 10 15 Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala 20 25 30 Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 35 40 45 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 50 55 60 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 65 70 75 80 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 85 90 95 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 100 105 110 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 115 120 125 Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa Gly Ser Leu Arg Leu Ser 130 135 140 Cys Ala Ala Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe 145 150 155 160 Arg Gln Val Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr 165 170 175 Arg Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr 180 185 190 Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser 195 200 205 Leu Lys Pro Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu 210 215 220 Ala Thr Tyr Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp 225 230 235 240 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Xaa Gly 245 250 255 Gln Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu 260 265 270 Pro Glu Ala 275 <210> 19 <211> 434 <212> PRT <213> Artificial Sequence <220> <223> Helicobacter pylori strain G27 HopQ adhesin domain protein (PDB 5LP2) <400> 19 Met Ala Val Gln Lys Val Lys Asn Ala Asp Lys Val Gln Lys Leu Ser 1 5 10 15 Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr 20 25 30 Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu 35 40 45 Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala 50 55 60 Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn 65 70 75 80 Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly 85 90 95 Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly 100 105 110 Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser 115 120 125 Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser 130 135 140 Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys 145 150 155 160 Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys 165 170 175 Leu Glu Ala His Val Thr Thr Ser Lys Tyr Gln Gln Asp Asn Gln Thr 180 185 190 Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu 195 200 205 Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro 210 215 220 Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala 225 230 235 240 Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala 245 250 255 Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala 260 265 270 Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys 275 280 285 Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu 290 295 300 Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu 305 310 315 320 Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser 325 330 335 Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile 340 345 350 Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn 355 360 365 Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala 370 375 380 Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu 385 390 395 400 Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Asn Met 405 410 415 Gly Met Ile Ala Ser Ser Thr Thr Asn Asn Gly Ala His His His His 420 425 430 His His <210> 20 <211> 542 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ <400> 20 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 21 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> cHopQ circular permutation linker peptide <400> 21 Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 <210> 22 <211> 821 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_Aga2p_ACP protein sequence <400> 22 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Thr Lys Thr Thr Thr Ser Val Ile Asp Thr 100 105 110 Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn 115 120 125 Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser 130 135 140 Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly 145 150 155 160 Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala 165 170 175 Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln 180 185 190 Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn 195 200 205 Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys 210 215 220 Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu 225 230 235 240 Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly 245 250 255 Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn 260 265 270 Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln 275 280 285 Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln 290 295 300 Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly 305 310 315 320 Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser 325 330 335 Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn 340 345 350 Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala 355 360 365 Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr 370 375 380 Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu 385 390 395 400 Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr 405 410 415 Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu 420 425 430 Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn 435 440 445 Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn 450 455 460 Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln 465 470 475 480 Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser 485 490 495 Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Gly Ser 500 505 510 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 515 520 525 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 530 535 540 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 545 550 555 560 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 565 570 575 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 580 585 590 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 595 600 605 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly 610 615 620 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 625 630 635 640 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 645 650 655 Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu 660 665 670 Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys 675 680 685 Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser 690 695 700 Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn 705 710 715 720 Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile 725 730 735 Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln 740 745 750 Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp 755 760 765 Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp 770 775 780 Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala 785 790 795 800 Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile 805 810 815 Ser Glu Glu Asp Leu 820 <210> 23 <211> 561 <212> PRT <213> Artificial Sequence <220> <223> DsbA- MbNb207cHopQ <400> 23 Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser 1 5 10 15 Ala Ser Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 Thr Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn 35 40 45 Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys 50 55 60 Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn 65 70 75 80 Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys 85 90 95 Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn 100 105 110 Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro 115 120 125 Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser 130 135 140 Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala 145 150 155 160 Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu 165 170 175 Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala 180 185 190 Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly 195 200 205 Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser 210 215 220 Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn 225 230 235 240 Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala 245 250 255 Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr 260 265 270 Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser 275 280 285 Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu 290 295 300 Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln 305 310 315 320 Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met 325 330 335 Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn 340 345 350 Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr 355 360 365 Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn 370 375 380 Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu 385 390 395 400 Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu 405 410 415 Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu 420 425 430 Ala His Val Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala 435 440 445 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 450 455 460 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 465 470 475 480 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 485 490 495 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 500 505 510 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 515 520 525 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 530 535 540 Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu 545 550 555 560 Ala <210> 24 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> Nb35 Gbeta/Galpha subunit of the beta2 adrenergic receptor-Gs protein complex-specific Nanobody <400> 24 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Lys Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Asp Ile Ser Gln Ser Gly Ala Ser Ile Ser Tyr Thr Gly Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Cys Pro Ala Pro Phe Thr Arg Asp Cys Phe Asp Val Thr Ser 100 105 110 Thr Thr Tyr Ala Tyr Arg Gly Gln Gly Thr Gln Val Thr Val Ser Ser 115 120 125 <210> 25 <211> 544 <212> PRT <213> Artificial Sequence <220> <223> MbNb35cHopQ <400> 25 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Phe Thr Phe Ser Asn Tyr Lys Met Asn Trp Val Arg Gln Ala Pro Gly 435 440 445 Lys Gly Leu Glu Trp Val Ser Asp Ile Ser Gln Ser Gly Ala Ser Ile 450 455 460 Ser Tyr Thr Gly Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Arg Cys Pro Ala Pro Phe Thr Arg Asp 500 505 510 Cys Phe Asp Val Thr Ser Thr Thr Tyr Ala Tyr Arg Gly Gln Gly Thr 515 520 525 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 26 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Nb80 beta2 adrenergic receptor-specific Nanobody <400> 26 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Ser Ile Phe Ser Ile Asn 20 25 30 Thr Met Gly Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val 35 40 45 Ala Ala Ile His Ser Gly Gly Ser Thr Asn Tyr Ala Asn Ser Val Lys 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Ala Asn Thr Val Tyr Leu 65 70 75 80 Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn 85 90 95 Val Lys Asp Tyr Gly Ala Val Leu Tyr Glu Tyr Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Gln Val Thr Val Ser Ser 115 120 <210> 27 <211> 536 <212> PRT <213> Artificial Sequence <220> <223> MbNb80cHopQ <400> 27 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Ser Ile Phe Ser Ile Asn Thr Met Gly Trp Tyr Arg Gln Ala Pro Gly 435 440 445 Lys Gln Arg Glu Leu Val Ala Ala Ile His Ser Gly Gly Ser Thr Asn 450 455 460 Tyr Ala Asn Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 465 470 475 480 Ala Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr 485 490 495 Ala Val Tyr Tyr Cys Asn Val Lys Asp Tyr Gly Ala Val Leu Tyr Glu 500 505 510 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His 515 520 525 His His His His Glu Pro Glu Ala 530 535 <210> 28 <211> 125 <212> PRT <213> Artificial Sequence <220> <223> Nb25 GABAA-specific Nanobody <400> 28 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly His Thr Phe Asn Tyr Pro 20 25 30 Ile Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Phe Val 35 40 45 Gly Ala Ile Ser Trp Ser Gly Gly Ser Thr Ser Tyr Ala Asp Ser Val 50 55 60 Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 65 70 75 80 Leu Glu Met Asn Asn Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Ala Lys Gly Arg Tyr Ser Gly Gly Leu Tyr Tyr Pro Thr Asn Tyr 100 105 110 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 115 120 125 <210> 29 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> MbNb25cHopQ <400> 29 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 His Thr Phe Asn Tyr Pro Ile Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Val Gly Ala Ile Ser Trp Ser Gly Gly Ser Thr 450 455 460 Ser Tyr Ala Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Glu Met Asn Asn Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Lys Gly Arg Tyr Ser Gly Gly Leu 500 505 510 Tyr Tyr Pro Thr Asn Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 515 520 525 Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 30 <211> 540 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (420) <223> Xaa can be any naturally occurring amino acid <400> 30 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Thr Thr 1 5 10 15 Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln 20 25 30 Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile 35 40 45 Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro 50 55 60 Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly 65 70 75 80 Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile 85 90 95 Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr 100 105 110 Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu 115 120 125 Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys 130 135 140 Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His 145 150 155 160 Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala 165 170 175 Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala 180 185 190 Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe 195 200 205 Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr 210 215 220 Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly 225 230 235 240 Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu 245 250 255 Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala 260 265 270 Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr 275 280 285 Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu 290 295 300 Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val 305 310 315 320 Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp 325 330 335 Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly 340 345 350 Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr 355 360 365 Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys 370 375 380 Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly 385 390 395 400 Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr 405 410 415 Thr Ser Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 420 425 430 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 435 440 445 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 450 455 460 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 465 470 475 480 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 485 490 495 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 500 505 510 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 515 520 525 Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 31 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (421) <223> Xaa can be any naturally occurring amino acid <400> 31 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 420 425 430 Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 435 440 445 Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr 450 455 460 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 465 470 475 480 Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr 485 490 495 Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro 500 505 510 Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 515 520 525 Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 32 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (420)..(421) <223> Xaa can be any naturally occurring amino acid <400> 32 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Thr Thr 1 5 10 15 Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln 20 25 30 Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile 35 40 45 Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro 50 55 60 Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly 65 70 75 80 Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile 85 90 95 Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr 100 105 110 Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu 115 120 125 Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys 130 135 140 Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His 145 150 155 160 Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala 165 170 175 Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala 180 185 190 Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe 195 200 205 Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr 210 215 220 Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly 225 230 235 240 Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu 245 250 255 Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala 260 265 270 Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr 275 280 285 Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu 290 295 300 Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val 305 310 315 320 Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp 325 330 335 Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly 340 345 350 Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr 355 360 365 Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys 370 375 380 Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly 385 390 395 400 Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr 405 410 415 Thr Ser Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 420 425 430 Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 435 440 445 Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr 450 455 460 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 465 470 475 480 Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr 485 490 495 Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro 500 505 510 Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 515 520 525 Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 33 <211> 542 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (421)..(422) <223> Xaa can be any naturally occurring amino acid <400> 33 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 34 <211> 819 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (509) <223> Xaa can be any naturally occurring amino acid <400> 34 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr 100 105 110 Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr 115 120 125 Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn 130 135 140 Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly 145 150 155 160 Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser 165 170 175 Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu 180 185 190 Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu 195 200 205 Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn 210 215 220 Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser 225 230 235 240 Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys 245 250 255 Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln 260 265 270 Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser 275 280 285 Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile 290 295 300 Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn 305 310 315 320 Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 325 330 335 Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp 340 345 350 Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val 355 360 365 Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn 370 375 380 Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly 385 390 395 400 Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys 405 410 415 Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn 420 425 430 Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly 435 440 445 Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val 450 455 460 Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile 465 470 475 480 Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys 485 490 495 Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Ser Leu Arg 500 505 510 Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly 515 520 525 Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile 530 535 540 Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg 545 550 555 560 Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met 565 570 575 Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg 580 585 590 Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr 595 600 605 Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser 610 615 620 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 625 630 635 640 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu 645 650 655 Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr 660 665 670 Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met 675 680 685 Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys 690 695 700 Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln 705 710 715 720 Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu 725 730 735 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 740 745 750 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 755 760 765 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 770 775 780 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 785 790 795 800 Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu 805 810 815 Glu Asp Leu <210> 35 <211> 820 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (510) <223> Xaa can be any naturally occurring amino acid <400> 35 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr 100 105 110 Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn 115 120 125 Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser 130 135 140 Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly 145 150 155 160 Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala 165 170 175 Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln 180 185 190 Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn 195 200 205 Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys 210 215 220 Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu 225 230 235 240 Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly 245 250 255 Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn 260 265 270 Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln 275 280 285 Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln 290 295 300 Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly 305 310 315 320 Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser 325 330 335 Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn 340 345 350 Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala 355 360 365 Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr 370 375 380 Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu 385 390 395 400 Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr 405 410 415 Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu 420 425 430 Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn 435 440 445 Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn 450 455 460 Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln 465 470 475 480 Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser 485 490 495 Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Ser Leu 500 505 510 Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met 515 520 525 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly 530 535 540 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 545 550 555 560 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 565 570 575 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 580 585 590 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 595 600 605 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly 610 615 620 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 625 630 635 640 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln 645 650 655 Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser 660 665 670 Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala 675 680 685 Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn 690 695 700 Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr 705 710 715 720 Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu 725 730 735 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 740 745 750 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 755 760 765 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 770 775 780 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 785 790 795 800 Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser 805 810 815 Glu Glu Asp Leu 820 <210> 36 <211> 820 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (509)..(510) <223> Xaa can be any naturally occurring amino acid <400> 36 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr 100 105 110 Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr 115 120 125 Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn 130 135 140 Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly 145 150 155 160 Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser 165 170 175 Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu 180 185 190 Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu 195 200 205 Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn 210 215 220 Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser 225 230 235 240 Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys 245 250 255 Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln 260 265 270 Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser 275 280 285 Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile 290 295 300 Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn 305 310 315 320 Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 325 330 335 Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp 340 345 350 Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val 355 360 365 Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn 370 375 380 Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly 385 390 395 400 Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys 405 410 415 Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn 420 425 430 Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly 435 440 445 Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val 450 455 460 Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile 465 470 475 480 Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys 485 490 495 Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Xaa Ser Leu 500 505 510 Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met 515 520 525 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly 530 535 540 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 545 550 555 560 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 565 570 575 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 580 585 590 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 595 600 605 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly 610 615 620 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 625 630 635 640 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln 645 650 655 Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser 660 665 670 Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala 675 680 685 Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn 690 695 700 Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr 705 710 715 720 Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu 725 730 735 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 740 745 750 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 755 760 765 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 770 775 780 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 785 790 795 800 Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser 805 810 815 Glu Glu Asp Leu 820 <210> 37 <211> 821 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (510)..(511) <223> Xaa can be any naturally occurring amino acid <400> 37 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr 100 105 110 Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn 115 120 125 Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser 130 135 140 Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly 145 150 155 160 Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala 165 170 175 Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln 180 185 190 Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn 195 200 205 Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys 210 215 220 Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu 225 230 235 240 Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly 245 250 255 Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn 260 265 270 Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln 275 280 285 Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln 290 295 300 Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly 305 310 315 320 Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser 325 330 335 Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn 340 345 350 Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala 355 360 365 Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr 370 375 380 Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu 385 390 395 400 Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr 405 410 415 Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu 420 425 430 Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn 435 440 445 Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn 450 455 460 Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln 465 470 475 480 Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser 485 490 495 Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Xaa Ser 500 505 510 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 515 520 525 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 530 535 540 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 545 550 555 560 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 565 570 575 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 580 585 590 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 595 600 605 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly 610 615 620 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 625 630 635 640 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 645 650 655 Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu 660 665 670 Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys 675 680 685 Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser 690 695 700 Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn 705 710 715 720 Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile 725 730 735 Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln 740 745 750 Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp 755 760 765 Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp 770 775 780 Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala 785 790 795 800 Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile 805 810 815 Ser Glu Glu Asp Leu 820 <210> 38 <211> 760 <212> PRT <213> Escherichia coli <400> 38 Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro Gln 1 5 10 15 Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro Phe 20 25 30 Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro Asn 35 40 45 Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr Ile 50 55 60 Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp Gly 65 70 75 80 Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala Leu 85 90 95 Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu Arg 100 105 110 Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser Asn 115 120 125 Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu Glu 130 135 140 Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu Tyr 145 150 155 160 Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys Val 165 170 175 Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly Glu 180 185 190 Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile Asn 195 200 205 Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr Leu 210 215 220 Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys Glu 225 230 235 240 Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu Thr 245 250 255 Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr Asn 260 265 270 Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile Glu 275 280 285 Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe Asn 290 295 300 Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln Thr 305 310 315 320 Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe Asn 325 330 335 Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln Ile 340 345 350 Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro Asp 355 360 365 Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly Asn 370 375 380 Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val Met 385 390 395 400 Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met Tyr 405 410 415 Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp His 420 425 430 Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala His 435 440 445 Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Gly Asp Lys 450 455 460 Glu Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys 465 470 475 480 Gly Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp 485 490 495 Glu Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu 500 505 510 Gln Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr 515 520 525 Val Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr 530 535 540 Ser Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp 545 550 555 560 Asn His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu 565 570 575 Ala Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn 580 585 590 Thr Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile 595 600 605 Glu Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu 610 615 620 Arg Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala 625 630 635 640 Thr Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys 645 650 655 Glu Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro 660 665 670 Ala Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln 675 680 685 Phe Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp 690 695 700 Ala Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr 705 710 715 720 Ala Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln 725 730 735 Gln Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu 740 745 750 Tyr Asn Asp Phe Phe Arg Lys Gln 755 760 <210> 39 <211> 909 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (789) <223> Xaa can be any naturally occurring amino acid <400> 39 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 785 790 795 800 Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 805 810 815 Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr 820 825 830 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 835 840 845 Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr 850 855 860 Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro 865 870 875 880 Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 885 890 895 Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 <210> 40 <211> 910 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (790) <223> Xaa can be any naturally occurring amino acid <400> 40 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Glu 1 5 10 15 Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly 20 25 30 Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu 35 40 45 Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln 50 55 60 Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val 65 70 75 80 Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser 85 90 95 Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn 100 105 110 His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala 115 120 125 Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr 130 135 140 Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu 145 150 155 160 Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg 165 170 175 Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr 180 185 190 Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu 195 200 205 Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala 210 215 220 Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe 225 230 235 240 Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala 245 250 255 Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala 260 265 270 Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln 275 280 285 Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr 290 295 300 Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly 305 310 315 320 Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val 325 330 335 Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp 340 345 350 Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly 355 360 365 His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val 370 375 380 Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp 385 390 395 400 Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu 405 410 415 Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp 420 425 430 Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu 435 440 445 Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp 450 455 460 Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser 465 470 475 480 Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser 485 490 495 Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr 500 505 510 Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser 515 520 525 Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala 530 535 540 His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu 545 550 555 560 Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu 565 570 575 Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu 580 585 590 Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr 595 600 605 Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser 610 615 620 Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly 625 630 635 640 Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln 645 650 655 Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile 660 665 670 Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro 675 680 685 Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro 690 695 700 Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro 705 710 715 720 Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp 725 730 735 Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp 740 745 750 Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr 755 760 765 Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu 770 775 780 Phe Thr Val Lys Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 785 790 795 800 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 805 810 815 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 820 825 830 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 835 840 845 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 850 855 860 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 865 870 875 880 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 885 890 895 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 41 <211> 910 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (789)..(790) <223> Xaa can be any naturally occurring amino acid <400> 41 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 785 790 795 800 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 805 810 815 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 820 825 830 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 835 840 845 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 850 855 860 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 865 870 875 880 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 885 890 895 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 42 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (790)..(791) <223> Xaa can be any naturally occurring amino acid <400> 42 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Glu 1 5 10 15 Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly 20 25 30 Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu 35 40 45 Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln 50 55 60 Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val 65 70 75 80 Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser 85 90 95 Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn 100 105 110 His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala 115 120 125 Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr 130 135 140 Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu 145 150 155 160 Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg 165 170 175 Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr 180 185 190 Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu 195 200 205 Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala 210 215 220 Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe 225 230 235 240 Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala 245 250 255 Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala 260 265 270 Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln 275 280 285 Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr 290 295 300 Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly 305 310 315 320 Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val 325 330 335 Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp 340 345 350 Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly 355 360 365 His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val 370 375 380 Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp 385 390 395 400 Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu 405 410 415 Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp 420 425 430 Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu 435 440 445 Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp 450 455 460 Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser 465 470 475 480 Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser 485 490 495 Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr 500 505 510 Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser 515 520 525 Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala 530 535 540 His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu 545 550 555 560 Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu 565 570 575 Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu 580 585 590 Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr 595 600 605 Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser 610 615 620 Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly 625 630 635 640 Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln 645 650 655 Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile 660 665 670 Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro 675 680 685 Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro 690 695 700 Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro 705 710 715 720 Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp 725 730 735 Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp 740 745 750 Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr 755 760 765 Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu 770 775 780 Phe Thr Val Lys Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser 785 790 795 800 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 805 810 815 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 820 825 830 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 835 840 845 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 850 855 860 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 865 870 875 880 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 885 890 895 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 43 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> cYgjk circular permutation linker peptide <400> 43 Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 Gly <210> 44 <211> 1188 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (878) <223> Xaa can be any naturally occurring amino acid <400> 44 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn Asn 100 105 110 Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile Pro 115 120 125 Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala Val 130 135 140 Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn Gly 145 150 155 160 Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser Gln 165 170 175 Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp Gln 180 185 190 Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala Thr 195 200 205 Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala Gln 210 215 220 Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr Gln 225 230 235 240 Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly Cys 245 250 255 Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp Ser 260 265 270 Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val Val 275 280 285 Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu Gly 290 295 300 Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp Arg 305 310 315 320 Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met Glu 325 330 335 Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe Phe 340 345 350 Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn Tyr 355 360 365 Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp Ser 370 375 380 Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln Ala 385 390 395 400 Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 405 410 415 Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro Gln 420 425 430 Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro Phe 435 440 445 Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro Asn 450 455 460 Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr Ile 465 470 475 480 Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp Gly 485 490 495 Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala Leu 500 505 510 Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu Arg 515 520 525 Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser Asn 530 535 540 Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu Glu 545 550 555 560 Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu Tyr 565 570 575 Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys Val 580 585 590 Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly Glu 595 600 605 Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile Asn 610 615 620 Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr Leu 625 630 635 640 Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys Glu 645 650 655 Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu Thr 660 665 670 Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr Asn 675 680 685 Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile Glu 690 695 700 Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe Asn 705 710 715 720 Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln Thr 725 730 735 Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe Asn 740 745 750 Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln Ile 755 760 765 Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro Asp 770 775 780 Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly Asn 785 790 795 800 Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val Met 805 810 815 Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met Tyr 820 825 830 Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp His 835 840 845 Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala His 850 855 860 Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Ser Leu 865 870 875 880 Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met 885 890 895 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly 900 905 910 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 915 920 925 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 930 935 940 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 945 950 955 960 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 965 970 975 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly 980 985 990 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 995 1000 1005 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln 1010 1015 1020 Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser 1025 1030 1035 1040 Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala 1045 1050 1055 Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn 1060 1065 1070 Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr 1075 1080 1085 Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu 1090 1095 1100 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 1105 1110 1115 1120 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 1125 1130 1135 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 1140 1145 1150 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 1155 1160 1165 Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser 1170 1175 1180 Glu Glu Asp Leu 1185 <210> 45 <211> 1189 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (879) <223> Xaa can be any naturally occurring amino acid <400> 45 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn 100 105 110 Asn Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile 115 120 125 Pro Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala 130 135 140 Val Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn 145 150 155 160 Gly Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser 165 170 175 Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp 180 185 190 Gln Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala 195 200 205 Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala 210 215 220 Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr 225 230 235 240 Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly 245 250 255 Cys Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp 260 265 270 Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val 275 280 285 Val Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu 290 295 300 Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp 305 310 315 320 Arg Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met 325 330 335 Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe 340 345 350 Phe Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn 355 360 365 Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp 370 375 380 Ser Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln 385 390 395 400 Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 405 410 415 Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro 420 425 430 Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro 435 440 445 Phe Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro 450 455 460 Asn Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr 465 470 475 480 Ile Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp 485 490 495 Gly Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala 500 505 510 Leu Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu 515 520 525 Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser 530 535 540 Asn Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu 545 550 555 560 Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu 565 570 575 Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys 580 585 590 Val Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly 595 600 605 Glu Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile 610 615 620 Asn Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr 625 630 635 640 Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys 645 650 655 Glu Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu 660 665 670 Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr 675 680 685 Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile 690 695 700 Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe 705 710 715 720 Asn Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln 725 730 735 Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe 740 745 750 Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln 755 760 765 Ile Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro 770 775 780 Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly 785 790 795 800 Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val 805 810 815 Met Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met 820 825 830 Tyr Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp 835 840 845 His Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala 850 855 860 His Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Ser 865 870 875 880 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 885 890 895 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 900 905 910 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 915 920 925 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 930 935 940 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 945 950 955 960 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 965 970 975 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly 980 985 990 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 995 1000 1005 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1010 1015 1020 Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu 1025 1030 1035 1040 Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys 1045 1050 1055 Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser 1060 1065 1070 Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn 1075 1080 1085 Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile 1090 1095 1100 Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln 1105 1110 1115 1120 Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp 1125 1130 1135 Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp 1140 1145 1150 Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala 1155 1160 1165 Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile 1170 1175 1180 Ser Glu Glu Asp Leu 1185 <210> 46 <211> 1189 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (878)..(879) <223> Xaa can be any naturally occurring amino acid <400> 46 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn Asn 100 105 110 Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile Pro 115 120 125 Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala Val 130 135 140 Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn Gly 145 150 155 160 Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser Gln 165 170 175 Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp Gln 180 185 190 Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala Thr 195 200 205 Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala Gln 210 215 220 Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr Gln 225 230 235 240 Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly Cys 245 250 255 Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp Ser 260 265 270 Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val Val 275 280 285 Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu Gly 290 295 300 Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp Arg 305 310 315 320 Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met Glu 325 330 335 Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe Phe 340 345 350 Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn Tyr 355 360 365 Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp Ser 370 375 380 Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln Ala 385 390 395 400 Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 405 410 415 Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro Gln 420 425 430 Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro Phe 435 440 445 Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro Asn 450 455 460 Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr Ile 465 470 475 480 Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp Gly 485 490 495 Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala Leu 500 505 510 Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu Arg 515 520 525 Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser Asn 530 535 540 Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu Glu 545 550 555 560 Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu Tyr 565 570 575 Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys Val 580 585 590 Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly Glu 595 600 605 Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile Asn 610 615 620 Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr Leu 625 630 635 640 Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys Glu 645 650 655 Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu Thr 660 665 670 Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr Asn 675 680 685 Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile Glu 690 695 700 Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe Asn 705 710 715 720 Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln Thr 725 730 735 Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe Asn 740 745 750 Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln Ile 755 760 765 Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro Asp 770 775 780 Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly Asn 785 790 795 800 Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val Met 805 810 815 Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met Tyr 820 825 830 Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp His 835 840 845 Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala His 850 855 860 Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Xaa Ser 865 870 875 880 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 885 890 895 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 900 905 910 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 915 920 925 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 930 935 940 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 945 950 955 960 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 965 970 975 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly 980 985 990 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 995 1000 1005 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1010 1015 1020 Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu 1025 1030 1035 1040 Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys 1045 1050 1055 Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser 1060 1065 1070 Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn 1075 1080 1085 Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile 1090 1095 1100 Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln 1105 1110 1115 1120 Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp 1125 1130 1135 Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp 1140 1145 1150 Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala 1155 1160 1165 Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile 1170 1175 1180 Ser Glu Glu Asp Leu 1185 <210> 47 <211> 1190 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (879)..(880) <223> Xaa can be any naturally occurring amino acid <400> 47 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn 100 105 110 Asn Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile 115 120 125 Pro Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala 130 135 140 Val Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn 145 150 155 160 Gly Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser 165 170 175 Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp 180 185 190 Gln Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala 195 200 205 Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala 210 215 220 Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr 225 230 235 240 Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly 245 250 255 Cys Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp 260 265 270 Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val 275 280 285 Val Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu 290 295 300 Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp 305 310 315 320 Arg Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met 325 330 335 Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe 340 345 350 Phe Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn 355 360 365 Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp 370 375 380 Ser Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln 385 390 395 400 Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 405 410 415 Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro 420 425 430 Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro 435 440 445 Phe Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro 450 455 460 Asn Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr 465 470 475 480 Ile Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp 485 490 495 Gly Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala 500 505 510 Leu Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu 515 520 525 Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser 530 535 540 Asn Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu 545 550 555 560 Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu 565 570 575 Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys 580 585 590 Val Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly 595 600 605 Glu Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile 610 615 620 Asn Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr 625 630 635 640 Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys 645 650 655 Glu Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu 660 665 670 Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr 675 680 685 Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile 690 695 700 Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe 705 710 715 720 Asn Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln 725 730 735 Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe 740 745 750 Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln 755 760 765 Ile Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro 770 775 780 Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly 785 790 795 800 Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val 805 810 815 Met Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met 820 825 830 Tyr Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp 835 840 845 His Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala 850 855 860 His Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Xaa 865 870 875 880 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 885 890 895 Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val 900 905 910 Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala 915 920 925 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 930 935 940 Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 945 950 955 960 Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu 965 970 975 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly 980 985 990 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 995 1000 1005 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 1010 1015 1020 Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu 1025 1030 1035 1040 Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly 1045 1050 1055 Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val 1060 1065 1070 Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile 1075 1080 1085 Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr 1090 1095 1100 Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys 1105 1110 1115 1120 Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala 1125 1130 1135 Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe 1140 1145 1150 Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln 1155 1160 1165 Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu 1170 1175 1180 Ile Ser Glu Glu Asp Leu 1185 1190 <210> 48 <211> 542 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQC357-C425 <400> 48 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Cys Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Cys Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 49 <211> 542 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQC358-C488 <400> 49 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Cys Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Cys Met Asp Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 50 <211> 542 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQC359-C490 <400> 50 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Cys Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Cys Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 51 <211> 544 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQC15-C534 <400> 51 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Cys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser Gly Cys His His His His His His Glu Pro Glu Ala 530 535 540 <210> 52 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> P.aeruginosa Azurin (PDB 2TSA) M121A mutant protein <400> 52 Ala Glu Cys Ser Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn 1 5 10 15 Thr Asn Ala Ile Thr Val Asp Lys Ser Cys Lys Gln Phe Thr Val Asn 20 25 30 Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp 35 40 45 Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met 50 55 60 Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val 65 70 75 80 Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr 85 90 95 Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys 100 105 110 Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys 115 120 125 <210> 53 <211> 253 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (34) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (145) <223> Xaa can be any naturally occurring amino acid <400> 53 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 35 40 45 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 50 55 60 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 65 70 75 80 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 85 90 95 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 100 105 110 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 115 120 125 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 130 135 140 Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met Gly 145 150 155 160 His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr 165 170 175 Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp 180 185 190 Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp 195 200 205 Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met 210 215 220 Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu 225 230 235 240 Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 <210> 54 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (35) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (146) <223> Xaa can be any naturally occurring amino acid <400> 54 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met 145 150 155 160 Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val 165 170 175 Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp 180 185 190 Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys 195 200 205 Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr 210 215 220 Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr 225 230 235 240 Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 <210> 55 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (34)..(35) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (146) <223> Xaa can be any naturally occurring amino acid <400> 55 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met 145 150 155 160 Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val 165 170 175 Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp 180 185 190 Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys 195 200 205 Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr 210 215 220 Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr 225 230 235 240 Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 <210> 56 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (34) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (145)..(146) <223> Xaa can be any naturally occurring amino acid <400> 56 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 35 40 45 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 50 55 60 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 65 70 75 80 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 85 90 95 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 100 105 110 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 115 120 125 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 130 135 140 Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met 145 150 155 160 Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val 165 170 175 Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp 180 185 190 Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys 195 200 205 Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr 210 215 220 Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr 225 230 235 240 Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 <210> 57 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (34)..(35) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (146)..(147) <223> Xaa can be any naturally occurring amino acid <400> 57 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 58 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (35) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (146)..(147) <223> Xaa can be any naturally occurring amino acid <400> 58 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 59 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (35)..(36) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (147) <223> Xaa can be any naturally occurring amino acid <400> 59 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 35 40 45 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 50 55 60 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 65 70 75 80 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 85 90 95 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 115 120 125 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 130 135 140 Ser Ser Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 60 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (35)..(36) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (147)..(148) <223> Xaa can be any naturally occurring amino acid <400> 60 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 35 40 45 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 50 55 60 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 65 70 75 80 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 85 90 95 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 115 120 125 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 130 135 140 Ser Ser Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn 145 150 155 160 Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly 165 170 175 Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys 180 185 190 Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly 195 200 205 Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu 210 215 220 Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys 225 230 235 240 Gly Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 61 <211> 533 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (123) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (234) <223> Xaa can be any naturally occurring amino acid <400> 61 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln 100 105 110 Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu Ser 115 120 125 Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe 130 135 140 Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp 145 150 155 160 Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr 165 170 175 Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser 180 185 190 Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg 195 200 205 Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly 210 215 220 Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser His Pro 225 230 235 240 Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser Thr 245 250 255 Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly Leu 260 265 270 Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His Thr 275 280 285 Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val Ser 290 295 300 Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly 305 310 315 320 His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly Gly 325 330 335 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 340 345 350 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 355 360 365 Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu 370 375 380 Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys 385 390 395 400 Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser 405 410 415 Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn 420 425 430 Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile 435 440 445 Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln 450 455 460 Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp 465 470 475 480 Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp 485 490 495 Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala 500 505 510 Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile 515 520 525 Ser Glu Glu Asp Leu 530 <210> 62 <211> 534 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (124) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (235) <223> Xaa can be any naturally occurring amino acid <400> 62 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp 100 105 110 Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu 115 120 125 Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp 130 135 140 Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr 145 150 155 160 Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe 165 170 175 Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp 180 185 190 Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg 195 200 205 Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp 210 215 220 Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser His 225 230 235 240 Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser 245 250 255 Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly 260 265 270 Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His 275 280 285 Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val 290 295 300 Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro 305 310 315 320 Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly 325 330 335 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 340 345 350 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 355 360 365 Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu 370 375 380 Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly 385 390 395 400 Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val 405 410 415 Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile 420 425 430 Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr 435 440 445 Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys 450 455 460 Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala 465 470 475 480 Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe 485 490 495 Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln 500 505 510 Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu 515 520 525 Ile Ser Glu Glu Asp Leu 530 <210> 63 <211> 534 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (123)..(124) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (235) <223> Xaa can be any naturally occurring amino acid <400> 63 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln 100 105 110 Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg Leu 115 120 125 Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp 130 135 140 Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr 145 150 155 160 Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe 165 170 175 Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp 180 185 190 Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg 195 200 205 Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp 210 215 220 Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser His 225 230 235 240 Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser 245 250 255 Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly 260 265 270 Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His 275 280 285 Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val 290 295 300 Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro 305 310 315 320 Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly 325 330 335 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 340 345 350 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 355 360 365 Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu 370 375 380 Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly 385 390 395 400 Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val 405 410 415 Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile 420 425 430 Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr 435 440 445 Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys 450 455 460 Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala 465 470 475 480 Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe 485 490 495 Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln 500 505 510 Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu 515 520 525 Ile Ser Glu Glu Asp Leu 530 <210> 64 <211> 534 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (123) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (234)..(235) <223> Xaa can be any naturally occurring amino acid <400> 64 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln 100 105 110 Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu Ser 115 120 125 Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe 130 135 140 Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp 145 150 155 160 Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr 165 170 175 Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser 180 185 190 Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg 195 200 205 Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly 210 215 220 Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu Ser His 225 230 235 240 Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser 245 250 255 Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly 260 265 270 Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His 275 280 285 Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val 290 295 300 Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro 305 310 315 320 Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly 325 330 335 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 340 345 350 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 355 360 365 Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu 370 375 380 Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly 385 390 395 400 Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val 405 410 415 Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile 420 425 430 Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr 435 440 445 Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys 450 455 460 Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala 465 470 475 480 Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe 485 490 495 Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln 500 505 510 Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu 515 520 525 Ile Ser Glu Glu Asp Leu 530 <210> 65 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (123)..(124) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (235)..(236) <223> Xaa can be any naturally occurring amino acid <400> 65 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln 100 105 110 Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg Leu 115 120 125 Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp 130 135 140 Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr 145 150 155 160 Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe 165 170 175 Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp 180 185 190 Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg 195 200 205 Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp 210 215 220 Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu Ser 225 230 235 240 His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu 245 250 255 Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser 260 265 270 Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala 275 280 285 His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp 290 295 300 Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe 305 310 315 320 Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu 325 330 335 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 340 345 350 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 355 360 365 Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr 370 375 380 Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn 385 390 395 400 Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe 405 410 415 Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro 420 425 430 Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser 435 440 445 Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val 450 455 460 Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly 465 470 475 480 Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu 485 490 495 Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val 500 505 510 Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys 515 520 525 Leu Ile Ser Glu Glu Asp Leu 530 535 <210> 66 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (124) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (235)..(236) <223> Xaa can be any naturally occurring amino acid <400> 66 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp 100 105 110 Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu 115 120 125 Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp 130 135 140 Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr 145 150 155 160 Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe 165 170 175 Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp 180 185 190 Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg 195 200 205 Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp 210 215 220 Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu Ser 225 230 235 240 His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu 245 250 255 Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser 260 265 270 Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala 275 280 285 His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp 290 295 300 Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe 305 310 315 320 Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu 325 330 335 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 340 345 350 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 355 360 365 Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr 370 375 380 Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn 385 390 395 400 Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe 405 410 415 Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro 420 425 430 Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser 435 440 445 Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val 450 455 460 Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly 465 470 475 480 Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu 485 490 495 Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val 500 505 510 Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys 515 520 525 Leu Ile Ser Glu Glu Asp Leu 530 535 <210> 67 <211> 535 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (124)..(125) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (236) <223> Xaa can be any naturally occurring amino acid <400> 67 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp 100 105 110 Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg 115 120 125 Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly 130 135 140 Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile 145 150 155 160 Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg 165 170 175 Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met 180 185 190 Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg 195 200 205 Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr 210 215 220 Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser 225 230 235 240 His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu 245 250 255 Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser 260 265 270 Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala 275 280 285 His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp 290 295 300 Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe 305 310 315 320 Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu 325 330 335 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 340 345 350 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 355 360 365 Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr 370 375 380 Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn 385 390 395 400 Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe 405 410 415 Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro 420 425 430 Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser 435 440 445 Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val 450 455 460 Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly 465 470 475 480 Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu 485 490 495 Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val 500 505 510 Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys 515 520 525 Leu Ile Ser Glu Glu Asp Leu 530 535 <210> 68 <211> 536 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence <220> <221> MISC_FEATURE <222> (102)..(103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (124)..(125) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (236)..(237) <223> Xaa can be any naturally occurring amino acid <400> 68 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp 100 105 110 Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg 115 120 125 Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly 130 135 140 Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile 145 150 155 160 Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg 165 170 175 Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met 180 185 190 Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg 195 200 205 Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr 210 215 220 Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu 225 230 235 240 Ser His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val 245 250 255 Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala 260 265 270 Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile 275 280 285 Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe 290 295 300 Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr 305 310 315 320 Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser 325 330 335 Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 340 345 350 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 355 360 365 Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro 370 375 380 Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala 385 390 395 400 Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr 405 410 415 Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser 420 425 430 Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met 435 440 445 Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly 450 455 460 Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu 465 470 475 480 Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu 485 490 495 Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr 500 505 510 Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln 515 520 525 Lys Leu Ile Ser Glu Glu Asp Leu 530 535 <210> 69 <211> 726 <212> PRT <213> Bacteroides thetaiotaomicron <400> 69 Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe 1 5 10 15 Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn 20 25 30 Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu 35 40 45 Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr 50 55 60 Lys Leu Asp Ser Lys Thr Asn Leu Tyr Asp Gly Phe Glu Val Lys Asp 65 70 75 80 Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu 85 90 95 Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr 100 105 110 Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn 115 120 125 Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn 130 135 140 Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp 145 150 155 160 His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp 165 170 175 Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala 180 185 190 Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln 195 200 205 Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His 210 215 220 Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp 225 230 235 240 Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp 245 250 255 Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile 260 265 270 Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn 275 280 285 Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro 290 295 300 Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser 305 310 315 320 Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp 325 330 335 Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn 340 345 350 Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val 355 360 365 Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser 370 375 380 Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val 385 390 395 400 Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met 405 410 415 His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp 420 425 430 Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser 435 440 445 Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln 450 455 460 Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr 465 470 475 480 Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys 485 490 495 Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu 500 505 510 Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro 515 520 525 Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe 530 535 540 Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg 545 550 555 560 Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro 565 570 575 Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp 580 585 590 Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn 595 600 605 Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala 610 615 620 Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly 625 630 635 640 His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr 645 650 655 Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn 660 665 670 Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys 675 680 685 Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys 690 695 700 Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu Leu Glu 705 710 715 720 His His His His His His 725 <210> 70 <211> 850 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (85) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (197) <223> Xaa can be any naturally occurring amino acid <400> 70 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe 20 25 30 Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn 35 40 45 Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu 50 55 60 Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr 65 70 75 80 Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 85 90 95 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 100 105 110 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 115 120 125 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 130 135 140 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 145 150 155 160 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 165 170 175 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 180 185 190 Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe 195 200 205 Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn 210 215 220 His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg 225 230 235 240 Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg 245 250 255 Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu 260 265 270 Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile 275 280 285 Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu 290 295 300 Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser 305 310 315 320 Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys 325 330 335 Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp 340 345 350 Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu 355 360 365 Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr 370 375 380 Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg 385 390 395 400 Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys 405 410 415 Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val 420 425 430 Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu 435 440 445 Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro 450 455 460 Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp 465 470 475 480 Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn 485 490 495 Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp 500 505 510 Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr 515 520 525 Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser Ala 530 535 540 Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met 545 550 555 560 Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile 565 570 575 Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His Tyr 580 585 590 Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala 595 600 605 His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu 610 615 620 Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly 625 630 635 640 Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly 645 650 655 Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys 660 665 670 Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln 675 680 685 Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp 690 695 700 Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys 705 710 715 720 Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro 725 730 735 Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp 740 745 750 Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val 755 760 765 Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala 770 775 780 Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile 785 790 795 800 Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala 805 810 815 Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser 820 825 830 Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu Pro 835 840 845 Glu Ala 850 <210> 71 <211> 851 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16)..(17) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (86) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (198) <223> Xaa can be any naturally occurring amino acid <400> 71 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr 20 25 30 Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys 35 40 45 Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys 50 55 60 Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu 65 70 75 80 Thr Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr 195 200 205 Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg 210 215 220 Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp 225 230 235 240 Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe 245 250 255 Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys 260 265 270 Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp 275 280 285 Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg 290 295 300 Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser 305 310 315 320 Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met 325 330 335 Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val 340 345 350 Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe 355 360 365 Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln 370 375 380 Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala 385 390 395 400 Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys 405 410 415 Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly 420 425 430 Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp 435 440 445 Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys 450 455 460 Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile 465 470 475 480 Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp 485 490 495 Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe 500 505 510 Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg 515 520 525 Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser 530 535 540 Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe 545 550 555 560 Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn 565 570 575 Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His 580 585 590 Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn 595 600 605 Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn 610 615 620 Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly 625 630 635 640 Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val 645 650 655 Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn 660 665 670 Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg 675 680 685 Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala 690 695 700 Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile 705 710 715 720 Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu 725 730 735 Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp 740 745 750 Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu 755 760 765 Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr 770 775 780 Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr 785 790 795 800 Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala 805 810 815 Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys 820 825 830 Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu 835 840 845 Pro Glu Ala 850 <210> 72 <211> 851 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (85)..(86) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (198) <223> Xaa can be any naturally occurring amino acid <400> 72 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe 20 25 30 Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn 35 40 45 Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu 50 55 60 Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr 65 70 75 80 Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr 195 200 205 Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg 210 215 220 Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp 225 230 235 240 Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe 245 250 255 Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys 260 265 270 Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp 275 280 285 Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg 290 295 300 Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser 305 310 315 320 Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met 325 330 335 Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val 340 345 350 Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe 355 360 365 Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln 370 375 380 Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala 385 390 395 400 Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys 405 410 415 Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly 420 425 430 Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp 435 440 445 Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys 450 455 460 Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile 465 470 475 480 Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp 485 490 495 Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe 500 505 510 Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg 515 520 525 Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser 530 535 540 Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe 545 550 555 560 Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn 565 570 575 Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His 580 585 590 Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn 595 600 605 Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn 610 615 620 Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly 625 630 635 640 Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val 645 650 655 Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn 660 665 670 Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg 675 680 685 Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala 690 695 700 Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile 705 710 715 720 Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu 725 730 735 Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp 740 745 750 Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu 755 760 765 Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr 770 775 780 Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr 785 790 795 800 Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala 805 810 815 Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys 820 825 830 Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu 835 840 845 Pro Glu Ala 850 <210> 73 <211> 851 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (85) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (197)..(198) <223> Xaa can be any naturally occurring amino acid <400> 73 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe 20 25 30 Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn 35 40 45 Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu 50 55 60 Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr 65 70 75 80 Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 85 90 95 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 100 105 110 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 115 120 125 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 130 135 140 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 145 150 155 160 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 165 170 175 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 180 185 190 Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr 195 200 205 Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg 210 215 220 Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp 225 230 235 240 Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe 245 250 255 Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys 260 265 270 Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp 275 280 285 Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg 290 295 300 Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser 305 310 315 320 Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met 325 330 335 Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val 340 345 350 Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe 355 360 365 Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln 370 375 380 Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala 385 390 395 400 Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys 405 410 415 Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly 420 425 430 Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp 435 440 445 Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys 450 455 460 Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile 465 470 475 480 Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp 485 490 495 Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe 500 505 510 Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg 515 520 525 Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser 530 535 540 Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe 545 550 555 560 Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn 565 570 575 Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His 580 585 590 Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn 595 600 605 Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn 610 615 620 Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly 625 630 635 640 Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val 645 650 655 Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn 660 665 670 Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg 675 680 685 Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala 690 695 700 Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile 705 710 715 720 Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu 725 730 735 Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp 740 745 750 Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu 755 760 765 Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr 770 775 780 Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr 785 790 795 800 Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala 805 810 815 Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys 820 825 830 Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu 835 840 845 Pro Glu Ala 850 <210> 74 <211> 852 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (85)..(86) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (198)..(199) <223> Xaa can be any naturally occurring amino acid <400> 74 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe 20 25 30 Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn 35 40 45 Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu 50 55 60 Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr 65 70 75 80 Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala 195 200 205 Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile 210 215 220 Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn 225 230 235 240 Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly 245 250 255 Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile 260 265 270 Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe 275 280 285 Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser 290 295 300 Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn 305 310 315 320 Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met 325 330 335 Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu 340 345 350 Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val 355 360 365 Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met 370 375 380 Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp 385 390 395 400 Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro 405 410 415 Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile 420 425 430 Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr 435 440 445 Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr 450 455 460 Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr 465 470 475 480 Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly 485 490 495 Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val 500 505 510 Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His 515 520 525 Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr 530 535 540 Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln 545 550 555 560 Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly 565 570 575 Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn 580 585 590 His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val 595 600 605 Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro 610 615 620 Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe 625 630 635 640 Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu 645 650 655 Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys 660 665 670 Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala 675 680 685 Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala 690 695 700 Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe 705 710 715 720 Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala 725 730 735 Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp 740 745 750 Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys 755 760 765 Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val 770 775 780 Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr 785 790 795 800 Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His 805 810 815 Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp 820 825 830 Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His 835 840 845 Glu Pro Glu Ala 850 <210> 75 <211> 852 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16)..(17) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (86) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (198)..(199) <223> Xaa can be any naturally occurring amino acid <400> 75 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr 20 25 30 Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys 35 40 45 Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys 50 55 60 Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu 65 70 75 80 Thr Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala 195 200 205 Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile 210 215 220 Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn 225 230 235 240 Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly 245 250 255 Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile 260 265 270 Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe 275 280 285 Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser 290 295 300 Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn 305 310 315 320 Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met 325 330 335 Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu 340 345 350 Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val 355 360 365 Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met 370 375 380 Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp 385 390 395 400 Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro 405 410 415 Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile 420 425 430 Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr 435 440 445 Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr 450 455 460 Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr 465 470 475 480 Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly 485 490 495 Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val 500 505 510 Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His 515 520 525 Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr 530 535 540 Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln 545 550 555 560 Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly 565 570 575 Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn 580 585 590 His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val 595 600 605 Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro 610 615 620 Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe 625 630 635 640 Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu 645 650 655 Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys 660 665 670 Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala 675 680 685 Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala 690 695 700 Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe 705 710 715 720 Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala 725 730 735 Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp 740 745 750 Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys 755 760 765 Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val 770 775 780 Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr 785 790 795 800 Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His 805 810 815 Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp 820 825 830 Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His 835 840 845 Glu Pro Glu Ala 850 <210> 76 <211> 852 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16)..(17) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (86)..(87) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (199) <223> Xaa can be any naturally occurring amino acid <400> 76 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr 20 25 30 Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys 35 40 45 Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys 50 55 60 Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu 65 70 75 80 Thr Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala 85 90 95 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 100 105 110 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 115 120 125 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 130 135 140 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 145 150 155 160 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 165 170 175 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 180 185 190 Thr Gln Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala 195 200 205 Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile 210 215 220 Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn 225 230 235 240 Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly 245 250 255 Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile 260 265 270 Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe 275 280 285 Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser 290 295 300 Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn 305 310 315 320 Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met 325 330 335 Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu 340 345 350 Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val 355 360 365 Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met 370 375 380 Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp 385 390 395 400 Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro 405 410 415 Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile 420 425 430 Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr 435 440 445 Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr 450 455 460 Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr 465 470 475 480 Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly 485 490 495 Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val 500 505 510 Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His 515 520 525 Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr 530 535 540 Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln 545 550 555 560 Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly 565 570 575 Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn 580 585 590 His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val 595 600 605 Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro 610 615 620 Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe 625 630 635 640 Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu 645 650 655 Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys 660 665 670 Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala 675 680 685 Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala 690 695 700 Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe 705 710 715 720 Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala 725 730 735 Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp 740 745 750 Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys 755 760 765 Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val 770 775 780 Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr 785 790 795 800 Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His 805 810 815 Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp 820 825 830 Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His 835 840 845 Glu Pro Glu Ala 850 <210> 77 <211> 853 <212> PRT <213> Artificial Sequence <220> <223> MbNb207SusBrandomlinkers Megabody library protein sequences <220> <221> MISC_FEATURE <222> (16)..(17) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (86)..(87) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (199)..(200) <223> Xaa can be any naturally occurring amino acid <400> 77 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa 1 5 10 15 Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr 20 25 30 Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys 35 40 45 Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys 50 55 60 Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu 65 70 75 80 Thr Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala 85 90 95 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 100 105 110 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 115 120 125 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 130 135 140 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 145 150 155 160 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 165 170 175 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 180 185 190 Thr Gln Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr 195 200 205 Ala Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu 210 215 220 Ile Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met 225 230 235 240 Asn Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu 245 250 255 Gly Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val 260 265 270 Ile Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala 275 280 285 Phe Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile 290 295 300 Ser Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro 305 310 315 320 Asn Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu 325 330 335 Met Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala 340 345 350 Leu Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met 355 360 365 Val Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr 370 375 380 Met Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp 385 390 395 400 Asp Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu 405 410 415 Pro Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr 420 425 430 Ile Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr 435 440 445 Thr Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys 450 455 460 Thr Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg 465 470 475 480 Tyr Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu 485 490 495 Gly Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr 500 505 510 Val Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile 515 520 525 His Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu 530 535 540 Thr Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr 545 550 555 560 Gln Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val 565 570 575 Gly Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn 580 585 590 Asn His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met 595 600 605 Val Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr 610 615 620 Pro Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser 625 630 635 640 Phe Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg 645 650 655 Leu Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His 660 665 670 Cys Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile 675 680 685 Ala Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met 690 695 700 Ala Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln 705 710 715 720 Phe Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu 725 730 735 Ala Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr 740 745 750 Asp Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser 755 760 765 Lys Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr 770 775 780 Val Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala 785 790 795 800 Tyr Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu 805 810 815 His Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys 820 825 830 Asp Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His 835 840 845 His Glu Pro Glu Ala 850 <210> 78 <211> 1130 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (174) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (286) <223> Xaa can be any naturally occurring amino acid <400> 78 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser 100 105 110 Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala 115 120 125 Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser 130 135 140 Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe 145 150 155 160 Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly Gly 165 170 175 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 180 185 190 Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val 195 200 205 Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala 210 215 220 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 225 230 235 240 Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 245 250 255 Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu 260 265 270 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Phe Glu 275 280 285 Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro Val 290 295 300 Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala Val 305 310 315 320 Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe Arg 325 330 335 Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln Lys 340 345 350 Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly Met 355 360 365 Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr Gln 370 375 380 Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu Met 385 390 395 400 Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln Thr 405 410 415 Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr Ile 420 425 430 Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu Asn 435 440 445 Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp Ala 450 455 460 Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp Arg 465 470 475 480 Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg Ile 485 490 495 Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser Trp 500 505 510 Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr Gly 515 520 525 Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu Gly 530 535 540 Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala Asn 545 550 555 560 Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly Phe 565 570 575 Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp Phe 580 585 590 Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro Asp 595 600 605 Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile Lys 610 615 620 Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu Arg 625 630 635 640 His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn Ser 645 650 655 Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His His 660 665 670 Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys Ala 675 680 685 Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro Thr 690 695 700 Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala Arg 705 710 715 720 Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr Thr 725 730 735 Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr Pro 740 745 750 Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn Ser 755 760 765 Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr Met 770 775 780 Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu Arg 785 790 795 800 Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp Asp 805 810 815 Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile Ala 820 825 830 Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala Gly 835 840 845 Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro Gly 850 855 860 Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp Trp 865 870 875 880 Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr Asn 885 890 895 Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala Ile 900 905 910 Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys Arg 915 920 925 Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 930 935 940 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 945 950 955 960 Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro 965 970 975 Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile 980 985 990 Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser 995 1000 1005 Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys 1010 1015 1020 Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr 1025 1030 1035 1040 Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln 1045 1050 1055 Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu 1060 1065 1070 Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu 1075 1080 1085 Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile 1090 1095 1100 Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser 1105 1110 1115 1120 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 79 <211> 1131 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105)..(106) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (175) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (287) <223> Xaa can be any naturally occurring amino acid <400> 79 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr 100 105 110 Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly 115 120 125 Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro 130 135 140 Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp 145 150 155 160 Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly 165 170 175 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 180 185 190 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 195 200 205 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 210 215 220 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 225 230 235 240 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 245 250 255 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 260 265 270 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Phe 275 280 285 Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro 290 295 300 Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala 305 310 315 320 Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe 325 330 335 Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln 340 345 350 Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly 355 360 365 Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr 370 375 380 Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu 385 390 395 400 Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln 405 410 415 Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr 420 425 430 Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu 435 440 445 Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp 450 455 460 Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp 465 470 475 480 Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg 485 490 495 Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser 500 505 510 Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr 515 520 525 Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu 530 535 540 Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala 545 550 555 560 Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly 565 570 575 Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp 580 585 590 Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro 595 600 605 Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile 610 615 620 Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu 625 630 635 640 Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn 645 650 655 Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His 660 665 670 His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys 675 680 685 Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro 690 695 700 Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala 705 710 715 720 Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr 725 730 735 Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr 740 745 750 Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn 755 760 765 Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr 770 775 780 Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu 785 790 795 800 Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp 805 810 815 Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile 820 825 830 Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala 835 840 845 Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro 850 855 860 Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp 865 870 875 880 Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr 885 890 895 Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala 900 905 910 Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys 915 920 925 Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 930 935 940 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 945 950 955 960 Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile 965 970 975 Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr 980 985 990 Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys 995 1000 1005 Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser 1010 1015 1020 Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser 1025 1030 1035 1040 Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu 1045 1050 1055 Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val 1060 1065 1070 Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala 1075 1080 1085 Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys 1090 1095 1100 Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala 1105 1110 1115 1120 Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 80 <211> 1131 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (174)..(175) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (287) <223> Xaa can be any naturally occurring amino acid <400> 80 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser 100 105 110 Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala 115 120 125 Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser 130 135 140 Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe 145 150 155 160 Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa Gly 165 170 175 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 180 185 190 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 195 200 205 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 210 215 220 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 225 230 235 240 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 245 250 255 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 260 265 270 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Phe 275 280 285 Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro 290 295 300 Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala 305 310 315 320 Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe 325 330 335 Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln 340 345 350 Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly 355 360 365 Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr 370 375 380 Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu 385 390 395 400 Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln 405 410 415 Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr 420 425 430 Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu 435 440 445 Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp 450 455 460 Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp 465 470 475 480 Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg 485 490 495 Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser 500 505 510 Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr 515 520 525 Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu 530 535 540 Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala 545 550 555 560 Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly 565 570 575 Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp 580 585 590 Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro 595 600 605 Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile 610 615 620 Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu 625 630 635 640 Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn 645 650 655 Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His 660 665 670 His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys 675 680 685 Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro 690 695 700 Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala 705 710 715 720 Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr 725 730 735 Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr 740 745 750 Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn 755 760 765 Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr 770 775 780 Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu 785 790 795 800 Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp 805 810 815 Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile 820 825 830 Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala 835 840 845 Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro 850 855 860 Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp 865 870 875 880 Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr 885 890 895 Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala 900 905 910 Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys 915 920 925 Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 930 935 940 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 945 950 955 960 Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile 965 970 975 Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr 980 985 990 Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys 995 1000 1005 Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser 1010 1015 1020 Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser 1025 1030 1035 1040 Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu 1045 1050 1055 Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val 1060 1065 1070 Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala 1075 1080 1085 Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys 1090 1095 1100 Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala 1105 1110 1115 1120 Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 81 <211> 1131 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (174) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (286)..(287) <223> Xaa can be any naturally occurring amino acid <400> 81 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser 100 105 110 Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala 115 120 125 Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser 130 135 140 Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe 145 150 155 160 Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly Gly 165 170 175 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 180 185 190 Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val 195 200 205 Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala 210 215 220 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 225 230 235 240 Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 245 250 255 Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu 260 265 270 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Xaa Phe 275 280 285 Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro 290 295 300 Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala 305 310 315 320 Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe 325 330 335 Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln 340 345 350 Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly 355 360 365 Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr 370 375 380 Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu 385 390 395 400 Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln 405 410 415 Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr 420 425 430 Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu 435 440 445 Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp 450 455 460 Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp 465 470 475 480 Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg 485 490 495 Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser 500 505 510 Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr 515 520 525 Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu 530 535 540 Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala 545 550 555 560 Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly 565 570 575 Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp 580 585 590 Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro 595 600 605 Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile 610 615 620 Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu 625 630 635 640 Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn 645 650 655 Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His 660 665 670 His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys 675 680 685 Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro 690 695 700 Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala 705 710 715 720 Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr 725 730 735 Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr 740 745 750 Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn 755 760 765 Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr 770 775 780 Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu 785 790 795 800 Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp 805 810 815 Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile 820 825 830 Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala 835 840 845 Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro 850 855 860 Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp 865 870 875 880 Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr 885 890 895 Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala 900 905 910 Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys 915 920 925 Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 930 935 940 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 945 950 955 960 Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile 965 970 975 Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr 980 985 990 Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys 995 1000 1005 Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser 1010 1015 1020 Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser 1025 1030 1035 1040 Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu 1045 1050 1055 Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val 1060 1065 1070 Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala 1075 1080 1085 Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys 1090 1095 1100 Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala 1105 1110 1115 1120 Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 82 <211> 1132 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (174)..(175) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (287)..(288) <223> Xaa can be any naturally occurring amino acid <400> 82 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser 100 105 110 Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala 115 120 125 Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser 130 135 140 Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe 145 150 155 160 Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa Gly 165 170 175 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 180 185 190 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 195 200 205 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 210 215 220 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 225 230 235 240 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 245 250 255 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 260 265 270 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Xaa 275 280 285 Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln 290 295 300 Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu 305 310 315 320 Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg 325 330 335 Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln 340 345 350 Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe 355 360 365 Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp 370 375 380 Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly 385 390 395 400 Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser 405 410 415 Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu 420 425 430 Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His 435 440 445 Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro 450 455 460 Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro 465 470 475 480 Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser 485 490 495 Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala 500 505 510 Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile 515 520 525 Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys 530 535 540 Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser 545 550 555 560 Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His 565 570 575 Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp 580 585 590 Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr 595 600 605 Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly 610 615 620 Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr 625 630 635 640 Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr 645 650 655 Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu 660 665 670 His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys 675 680 685 Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg 690 695 700 Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser 705 710 715 720 Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His 725 730 735 Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr 740 745 750 Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn 755 760 765 Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val 770 775 780 Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr 785 790 795 800 Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp 805 810 815 Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr 820 825 830 Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr 835 840 845 Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr 850 855 860 Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala 865 870 875 880 Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu 885 890 895 Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr 900 905 910 Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu 915 920 925 Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 930 935 940 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 945 950 955 960 Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln 965 970 975 Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr 980 985 990 Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr 995 1000 1005 Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr 1010 1015 1020 Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser 1025 1030 1035 1040 Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly 1045 1050 1055 Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe 1060 1065 1070 Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 1075 1080 1085 Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu 1090 1095 1100 Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln 1105 1110 1115 1120 Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 83 <211> 1132 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105)..(106) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (175) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (287)..(288) <223> Xaa can be any naturally occurring amino acid <400> 83 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr 100 105 110 Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly 115 120 125 Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro 130 135 140 Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp 145 150 155 160 Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly 165 170 175 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 180 185 190 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 195 200 205 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 210 215 220 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 225 230 235 240 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 245 250 255 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 260 265 270 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Xaa 275 280 285 Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln 290 295 300 Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu 305 310 315 320 Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg 325 330 335 Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln 340 345 350 Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe 355 360 365 Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp 370 375 380 Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly 385 390 395 400 Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser 405 410 415 Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu 420 425 430 Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His 435 440 445 Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro 450 455 460 Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro 465 470 475 480 Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser 485 490 495 Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala 500 505 510 Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile 515 520 525 Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys 530 535 540 Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser 545 550 555 560 Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His 565 570 575 Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp 580 585 590 Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr 595 600 605 Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly 610 615 620 Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr 625 630 635 640 Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr 645 650 655 Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu 660 665 670 His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys 675 680 685 Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg 690 695 700 Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser 705 710 715 720 Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His 725 730 735 Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr 740 745 750 Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn 755 760 765 Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val 770 775 780 Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr 785 790 795 800 Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp 805 810 815 Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr 820 825 830 Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr 835 840 845 Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr 850 855 860 Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala 865 870 875 880 Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu 885 890 895 Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr 900 905 910 Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu 915 920 925 Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 930 935 940 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 945 950 955 960 Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln 965 970 975 Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr 980 985 990 Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr 995 1000 1005 Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr 1010 1015 1020 Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser 1025 1030 1035 1040 Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly 1045 1050 1055 Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe 1060 1065 1070 Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 1075 1080 1085 Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu 1090 1095 1100 Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln 1105 1110 1115 1120 Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 84 <211> 1132 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105)..(106) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (175)..(176) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (288) <223> Xaa can be any naturally occurring amino acid <400> 84 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr 100 105 110 Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly 115 120 125 Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro 130 135 140 Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp 145 150 155 160 Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa 165 170 175 Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 180 185 190 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 195 200 205 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 210 215 220 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 225 230 235 240 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 245 250 255 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 260 265 270 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa 275 280 285 Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln 290 295 300 Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu 305 310 315 320 Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg 325 330 335 Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln 340 345 350 Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe 355 360 365 Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp 370 375 380 Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly 385 390 395 400 Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser 405 410 415 Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu 420 425 430 Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His 435 440 445 Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro 450 455 460 Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro 465 470 475 480 Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser 485 490 495 Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala 500 505 510 Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile 515 520 525 Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys 530 535 540 Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser 545 550 555 560 Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His 565 570 575 Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp 580 585 590 Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr 595 600 605 Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly 610 615 620 Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr 625 630 635 640 Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr 645 650 655 Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu 660 665 670 His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys 675 680 685 Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg 690 695 700 Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser 705 710 715 720 Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His 725 730 735 Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr 740 745 750 Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn 755 760 765 Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val 770 775 780 Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr 785 790 795 800 Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp 805 810 815 Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr 820 825 830 Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr 835 840 845 Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr 850 855 860 Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala 865 870 875 880 Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu 885 890 895 Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr 900 905 910 Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu 915 920 925 Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 930 935 940 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 945 950 955 960 Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln 965 970 975 Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr 980 985 990 Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr 995 1000 1005 Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr 1010 1015 1020 Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser 1025 1030 1035 1040 Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly 1045 1050 1055 Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe 1060 1065 1070 Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 1075 1080 1085 Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu 1090 1095 1100 Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln 1105 1110 1115 1120 Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 85 <211> 1133 <212> PRT <213> Artificial Sequence <220> <223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein seuqences <220> <221> MISC_FEATURE <222> (105)..(106) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (175)..(176) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (288)..(289) <223> Xaa can be any naturally occurring amino acid <400> 85 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr 100 105 110 Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly 115 120 125 Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro 130 135 140 Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp 145 150 155 160 Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa 165 170 175 Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 180 185 190 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 195 200 205 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 210 215 220 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 225 230 235 240 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 245 250 255 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 260 265 270 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa 275 280 285 Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp 290 295 300 Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu 305 310 315 320 Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile 325 330 335 Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro 340 345 350 Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln 355 360 365 Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr 370 375 380 Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg 385 390 395 400 Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe 405 410 415 Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly 420 425 430 Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met 435 440 445 His Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr 450 455 460 Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr 465 470 475 480 Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala 485 490 495 Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala 500 505 510 Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met 515 520 525 Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val 530 535 540 Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His 545 550 555 560 Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala 565 570 575 His Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu 580 585 590 Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro 595 600 605 Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys 610 615 620 Gly Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn 625 630 635 640 Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly 645 650 655 Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly 660 665 670 Glu His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val 675 680 685 Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr 690 695 700 Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu 705 710 715 720 Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr 725 730 735 His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp 740 745 750 Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala 755 760 765 Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr 770 775 780 Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn 785 790 795 800 Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu 805 810 815 Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile 820 825 830 Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys 835 840 845 Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu 850 855 860 Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp 865 870 875 880 Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile 885 890 895 Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly 900 905 910 Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly 915 920 925 Leu Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 930 935 940 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 945 950 955 960 Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu 965 970 975 Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr 980 985 990 Thr Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr 995 1000 1005 Tyr Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr 1010 1015 1020 Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn 1025 1030 1035 1040 Ser Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile 1045 1050 1055 Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser 1060 1065 1070 Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val 1075 1080 1085 Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala 1090 1095 1100 Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His 1105 1110 1115 1120 Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1125 1130 <210> 86 <211> 77 <212> PRT <213> Escherichia coli <400> 86 Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly 1 5 10 15 Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu 20 25 30 Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu 35 40 45 Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr 50 55 60 Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala 65 70 75 <210> 87 <211> 208 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers <220> <221> MISC_FEATURE <222> (12) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (88) <223> Xaa can be any naturally occurring amino acid <400> 87 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Thr Ile Glu Glu 1 5 10 15 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 20 25 30 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 35 40 45 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 50 55 60 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 65 70 75 80 Asp Tyr Ile Asn Gly His Gln Xaa Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 195 200 205 <210> 88 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers <220> <221> MISC_FEATURE <222> (12)..(13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (89) <223> Xaa can be any naturally occurring amino acid <400> 88 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Xaa Thr Ile Glu 1 5 10 15 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 20 25 30 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 35 40 45 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 50 55 60 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 65 70 75 80 Ile Asp Tyr Ile Asn Gly His Gln Xaa Ser Leu Arg Leu Ser Cys Ala 85 90 95 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 100 105 110 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 115 120 125 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 130 135 140 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 145 150 155 160 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 165 170 175 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 180 185 190 Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu 195 200 205 Ala <210> 89 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers <220> <221> MISC_FEATURE <222> (12) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (88)..(89) <223> Xaa can be any naturally occurring amino acid <400> 89 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Thr Ile Glu Glu 1 5 10 15 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 20 25 30 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 35 40 45 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 50 55 60 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 65 70 75 80 Asp Tyr Ile Asn Gly His Gln Xaa Xaa Ser Leu Arg Leu Ser Cys Ala 85 90 95 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 100 105 110 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 115 120 125 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 130 135 140 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 145 150 155 160 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 165 170 175 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 180 185 190 Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu 195 200 205 Ala <210> 90 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers <220> <221> MISC_FEATURE <222> (12)..(13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (89)..(90) <223> Xaa can be any naturally occurring amino acid <400> 90 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Xaa Thr Ile Glu 1 5 10 15 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 20 25 30 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 35 40 45 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 50 55 60 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 65 70 75 80 Ile Asp Tyr Ile Asn Gly His Gln Xaa Xaa Ser Leu Arg Leu Ser Cys 85 90 95 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 100 105 110 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 115 120 125 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 130 135 140 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 145 150 155 160 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 165 170 175 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 180 185 190 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 195 200 205 Glu Ala 210 <210> 91 <211> 408 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences <220> <221> MISC_FEATURE <222> (101) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (177) <223> Xaa can be any naturally occurring amino acid <400> 91 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly 100 105 110 Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe 115 120 125 Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 130 135 140 Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu 145 150 155 160 Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln 165 170 175 Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 180 185 190 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 195 200 205 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 210 215 220 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 225 230 235 240 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 245 250 255 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 260 265 270 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu 275 280 285 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 290 295 300 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 305 310 315 320 Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr 325 330 335 Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn 340 345 350 Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe 355 360 365 Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro 370 375 380 Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Glu Gln 385 390 395 400 Lys Leu Ile Ser Glu Glu Asp Leu 405 <210> 92 <211> 409 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences <220> <221> MISC_FEATURE <222> (101)..(102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (178) <223> Xaa can be any naturally occurring amino acid <400> 92 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Xaa Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile 100 105 110 Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser 115 120 125 Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val 130 135 140 Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala 145 150 155 160 Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His 165 170 175 Gln Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 180 185 190 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 195 200 205 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 210 215 220 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 225 230 235 240 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 245 250 255 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 260 265 270 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 275 280 285 Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 290 295 300 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 305 310 315 320 Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro 325 330 335 Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala 340 345 350 Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr 355 360 365 Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser 370 375 380 Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Glu 385 390 395 400 Gln Lys Leu Ile Ser Glu Glu Asp Leu 405 <210> 93 <211> 409 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences <220> <221> MISC_FEATURE <222> (101) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (177)..(178) <223> Xaa can be any naturally occurring amino acid <400> 93 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly 100 105 110 Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe 115 120 125 Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 130 135 140 Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu 145 150 155 160 Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln 165 170 175 Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 180 185 190 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 195 200 205 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 210 215 220 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 225 230 235 240 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 245 250 255 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 260 265 270 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 275 280 285 Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 290 295 300 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 305 310 315 320 Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro 325 330 335 Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala 340 345 350 Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr 355 360 365 Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser 370 375 380 Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Glu 385 390 395 400 Gln Lys Leu Ile Ser Glu Glu Asp Leu 405 <210> 94 <211> 410 <212> PRT <213> Artificial Sequence <220> <223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences <220> <221> MISC_FEATURE <222> (101)..(102) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (178)..(179) <223> Xaa can be any naturally occurring amino acid <400> 94 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Xaa Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile 100 105 110 Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser 115 120 125 Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val 130 135 140 Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala 145 150 155 160 Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His 165 170 175 Gln Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 180 185 190 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 195 200 205 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 210 215 220 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 225 230 235 240 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 245 250 255 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 260 265 270 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 275 280 285 Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 290 295 300 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 305 310 315 320 Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser 325 330 335 Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu 340 345 350 Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val 355 360 365 Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly 370 375 380 Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser 385 390 395 400 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 405 410 <210> 95 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1251_A7 <400> 95 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Val Ser Asn Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Val Phe Val Ala Ala Ile Gly Trp Thr Thr Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Thr Lys Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Arg Cys Ala Ala Arg Arg Arg Gly Tyr Ser Arg Val 500 505 510 Pro Met Thr Pro Asp Glu Tyr Glu Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 96 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1252_D10 <400> 96 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Leu Ser Met Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Val Ala Gly Ile Ser Trp Ser Arg Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Thr Lys Asn Thr Val Ile Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Val Cys Ala Ala Arg Arg Arg Gly Tyr Ile Ser Ile 500 505 510 Pro Thr Thr Pro Asp Glu Phe Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 97 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1251_D10 <400> 97 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 450 455 460 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 500 505 510 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 98 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1251_A10 <400> 98 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Ile Ser Leu Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Val Ala Gly Ile Gly Trp Ser Thr Gly Asn Thr 450 455 460 Tyr Tyr Ser Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Ile Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Trp Gly Pro Ile 500 505 510 Pro Thr Met Glu Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 99 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1251_D4 <400> 99 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Met Ser Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Asp Phe Thr Ala Leu Ile Thr Trp Ser Val Gly Ser Pro 450 455 460 Ser Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Ser 465 470 475 480 Ala Lys Asn Thr Met Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Ala Gly Tyr Val Arg Leu 500 505 510 Pro Thr Arg Glu Asp Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 100 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1252_C10 <400> 100 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Met Ser Ala Val Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Ile Ala Leu Ile Ser Trp Thr Val Gly Arg Pro 450 455 460 Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Met Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Ala Gly Tyr Ser Arg Val 500 505 510 Pro Thr Arg Glu Tyr Asp Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 101 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1251_H6 <400> 101 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Gly Thr Phe Ser Ile Ser Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Ile Ala Leu Ile Ser Trp Asn Val Gly Arg Pro 450 455 460 Tyr Tyr Glu Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Met Phe Leu Gln Ile His Ser Leu Lys Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Gly Arg Arg Ala Gly Tyr Phe Gly Met 500 505 510 Pro Thr Arg Glu Tyr Glu Tyr Glu Tyr Trp Gly Gln Gly Thr Gln Val 515 520 525 Thr Val Ser Ser 530 <210> 102 <211> 531 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1251_A5 <400> 102 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Ser Ser Asn Asn His Met Ala Trp Phe Arg Gln Gly Pro Arg 435 440 445 Lys Glu Arg Glu Phe Val Ala Ala Ile Ser Trp Ser Arg Asp Phe Thr 450 455 460 Lys Tyr Ala Asp Ser Val Glu Gly Arg Phe Ile Ile Ser Arg Asp Asn 465 470 475 480 Ala Lys Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Ser Pro Glu Asp 485 490 495 Thr Ala Val Tyr Tyr Cys Ala Ala Ala Pro Trp Gly Thr Asn Trp Arg 500 505 510 Val Lys Glu Ser Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 515 520 525 Val Ser Ser 530 <210> 103 <211> 531 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQMP1263_C9 <400> 103 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Ser Ser Asp Ala Val Gly Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Val Ala Tyr Ile Ser Trp Ser Asn Ala Ile Thr 450 455 460 Tyr Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn 465 470 475 480 Ala Glu Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Ala Glu Asp 485 490 495 Thr Ala Ile Tyr Tyr Cys Ala Gly Gly Leu Asn Ser Tyr Gly Ser Thr 500 505 510 Trp Ala Pro Gln Ser Tyr Ala Val Trp Gly Gln Gly Thr Gln Val Thr 515 520 525 Val Ser Ser 530 <210> 104 <211> 539 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences <220> <221> MISC_FEATURE <222> (40) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (448) <223> Xaa can be any naturally occurring amino acid <400> 104 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 20 25 30 Ala Met Gly Trp Phe Arg Gln Xaa Lys Thr Thr Thr Ser Val Ile Asp 35 40 45 Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val 50 55 60 Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser 65 70 75 80 Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala 85 90 95 Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala 100 105 110 Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln 115 120 125 Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu 130 135 140 Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu 145 150 155 160 Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val 165 170 175 Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile 180 185 190 Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln 195 200 205 Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr 210 215 220 Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro 225 230 235 240 Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu 245 250 255 Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 260 265 270 Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr 275 280 285 Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln 290 295 300 Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr 305 310 315 320 Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val 325 330 335 Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr 340 345 350 Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp 355 360 365 Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser 370 375 380 Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys 385 390 395 400 Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr 405 410 415 Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn 420 425 430 Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa 435 440 445 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 450 455 460 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 465 470 475 480 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 485 490 495 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 500 505 510 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 515 520 525 Ser His His His His His His Glu Pro Glu Ala 530 535 <210> 105 <211> 540 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences <220> <221> MISC_FEATURE <222> (40)..(41) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (449) <223> Xaa can be any naturally occurring amino acid <400> 105 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 20 25 30 Ala Met Gly Trp Phe Arg Gln Xaa Xaa Lys Thr Thr Thr Ser Val Ile 35 40 45 Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile 50 55 60 Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser 65 70 75 80 Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr 85 90 95 Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser 100 105 110 Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr 115 120 125 Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn 130 135 140 Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met 145 150 155 160 Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln 165 170 175 Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr 180 185 190 Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met 195 200 205 Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu 210 215 220 Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr 225 230 235 240 Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu 245 250 255 Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly 260 265 270 Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu 275 280 285 Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn 290 295 300 Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly 305 310 315 320 Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser 325 330 335 Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly 340 345 350 Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr 355 360 365 Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn 370 375 380 Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp 385 390 395 400 Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala 405 410 415 Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu 420 425 430 Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr 435 440 445 Xaa Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 450 455 460 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 465 470 475 480 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 485 490 495 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 500 505 510 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 515 520 525 Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 106 <211> 540 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences <220> <221> MISC_FEATURE <222> (40) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (448)..(449) <223> Xaa can be any naturally occurring amino acid <400> 106 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 20 25 30 Ala Met Gly Trp Phe Arg Gln Xaa Lys Thr Thr Thr Ser Val Ile Asp 35 40 45 Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val 50 55 60 Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser 65 70 75 80 Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala 85 90 95 Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala 100 105 110 Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln 115 120 125 Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu 130 135 140 Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu 145 150 155 160 Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val 165 170 175 Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile 180 185 190 Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln 195 200 205 Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr 210 215 220 Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro 225 230 235 240 Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu 245 250 255 Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 260 265 270 Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr 275 280 285 Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln 290 295 300 Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr 305 310 315 320 Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val 325 330 335 Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr 340 345 350 Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp 355 360 365 Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser 370 375 380 Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys 385 390 395 400 Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr 405 410 415 Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn 420 425 430 Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa 435 440 445 Xaa Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 450 455 460 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 465 470 475 480 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 485 490 495 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 500 505 510 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 515 520 525 Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 107 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences <220> <221> MISC_FEATURE <222> (40)..(41) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (449)..(450) <223> Xaa can be any naturally occurring amino acid <400> 107 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 20 25 30 Ala Met Gly Trp Phe Arg Gln Xaa Xaa Lys Thr Thr Thr Ser Val Ile 35 40 45 Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile 50 55 60 Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser 65 70 75 80 Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr 85 90 95 Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser 100 105 110 Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr 115 120 125 Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn 130 135 140 Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met 145 150 155 160 Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln 165 170 175 Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr 180 185 190 Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met 195 200 205 Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu 210 215 220 Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr 225 230 235 240 Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu 245 250 255 Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly 260 265 270 Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu 275 280 285 Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn 290 295 300 Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly 305 310 315 320 Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser 325 330 335 Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly 340 345 350 Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr 355 360 365 Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn 370 375 380 Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp 385 390 395 400 Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala 405 410 415 Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu 420 425 430 Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr 435 440 445 Xaa Xaa Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr 450 455 460 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 465 470 475 480 Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr 485 490 495 Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro 500 505 510 Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 515 520 525 Val Ser Ser His His His His His His Glu Pro Glu Ala 530 535 540 <210> 108 <211> 818 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (129) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (537) <223> Xaa can be any naturally occurring amino acid <400> 108 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala 100 105 110 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 115 120 125 Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn 130 135 140 Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys 145 150 155 160 Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn 165 170 175 Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys 180 185 190 Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn 195 200 205 Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro 210 215 220 Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser 225 230 235 240 Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala 245 250 255 Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu 260 265 270 Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala 275 280 285 Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly 290 295 300 Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser 305 310 315 320 Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn 325 330 335 Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala 340 345 350 Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr 355 360 365 Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser 370 375 380 Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu 385 390 395 400 Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln 405 410 415 Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met 420 425 430 Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn 435 440 445 Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr 450 455 460 Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn 465 470 475 480 Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu 485 490 495 Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu 500 505 510 Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu 515 520 525 Ala His Val Thr Thr Ser Lys Tyr Xaa Asp Phe Val Ala Gly Ile Tyr 530 535 540 Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe 545 550 555 560 Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp 565 570 575 Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg 580 585 590 Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp 595 600 605 Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser Gly 610 615 620 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 625 630 635 640 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu 645 650 655 Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro 660 665 670 Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met Gln 675 680 685 Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys Gly 690 695 700 Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr 705 710 715 720 Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu Arg 725 730 735 Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val 740 745 750 Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp 755 760 765 Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile 770 775 780 Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp 785 790 795 800 Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu 805 810 815 Asp Leu <210> 109 <211> 819 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (129)..(130) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (538) <223> Xaa can be any naturally occurring amino acid <400> 109 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala 100 105 110 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 115 120 125 Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln 130 135 140 Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr 145 150 155 160 Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn 165 170 175 Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser 180 185 190 Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn 195 200 205 Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln 210 215 220 Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser 225 230 235 240 Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln 245 250 255 Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys 260 265 270 Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser 275 280 285 Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp 290 295 300 Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr 305 310 315 320 Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln 325 330 335 Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg 340 345 350 Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp 355 360 365 Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn 370 375 380 Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn 385 390 395 400 Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr 405 410 415 Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser 420 425 430 Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu 435 440 445 Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr 450 455 460 Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr 465 470 475 480 Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile 485 490 495 Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala 500 505 510 Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu 515 520 525 Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Asp Phe Val Ala Gly Ile 530 535 540 Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg 545 550 555 560 Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met 565 570 575 Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg 580 585 590 Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr 595 600 605 Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser 610 615 620 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 625 630 635 640 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu 645 650 655 Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr 660 665 670 Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met 675 680 685 Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys 690 695 700 Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln 705 710 715 720 Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu 725 730 735 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 740 745 750 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 755 760 765 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 770 775 780 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 785 790 795 800 Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu 805 810 815 Glu Asp Leu <210> 110 <211> 819 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (129) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (537)..(538) <223> Xaa can be any naturally occurring amino acid <400> 110 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala 100 105 110 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 115 120 125 Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn 130 135 140 Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys 145 150 155 160 Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn 165 170 175 Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys 180 185 190 Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn 195 200 205 Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro 210 215 220 Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser 225 230 235 240 Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala 245 250 255 Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu 260 265 270 Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala 275 280 285 Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly 290 295 300 Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser 305 310 315 320 Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn 325 330 335 Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala 340 345 350 Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr 355 360 365 Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser 370 375 380 Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu 385 390 395 400 Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln 405 410 415 Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met 420 425 430 Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn 435 440 445 Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr 450 455 460 Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn 465 470 475 480 Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu 485 490 495 Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu 500 505 510 Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu 515 520 525 Ala His Val Thr Thr Ser Lys Tyr Xaa Xaa Asp Phe Val Ala Gly Ile 530 535 540 Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg 545 550 555 560 Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met 565 570 575 Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg 580 585 590 Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr 595 600 605 Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser 610 615 620 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 625 630 635 640 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu 645 650 655 Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr 660 665 670 Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met 675 680 685 Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys 690 695 700 Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln 705 710 715 720 Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu 725 730 735 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 740 745 750 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 755 760 765 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 770 775 780 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 785 790 795 800 Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu 805 810 815 Glu Asp Leu <210> 111 <211> 820 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (129)..(130) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (538)..(539) <223> Xaa can be any naturally occurring amino acid <400> 111 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser 85 90 95 Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala 100 105 110 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 115 120 125 Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln 130 135 140 Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr 145 150 155 160 Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn 165 170 175 Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser 180 185 190 Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn 195 200 205 Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln 210 215 220 Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser 225 230 235 240 Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln 245 250 255 Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys 260 265 270 Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser 275 280 285 Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp 290 295 300 Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr 305 310 315 320 Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln 325 330 335 Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg 340 345 350 Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp 355 360 365 Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn 370 375 380 Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn 385 390 395 400 Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr 405 410 415 Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser 420 425 430 Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu 435 440 445 Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr 450 455 460 Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr 465 470 475 480 Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile 485 490 495 Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala 500 505 510 Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu 515 520 525 Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Xaa Asp Phe Val Ala Gly 530 535 540 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 545 550 555 560 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 565 570 575 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 580 585 590 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 595 600 605 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly 610 615 620 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 625 630 635 640 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln 645 650 655 Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser 660 665 670 Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala 675 680 685 Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn 690 695 700 Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr 705 710 715 720 Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu 725 730 735 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 740 745 750 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 755 760 765 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 770 775 780 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 785 790 795 800 Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser 805 810 815 Glu Glu Asp Leu 820 <210> 112 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> Deinococcus radiodurans Monobody NS1 (from PDB5E59) <400> 112 Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Pro Thr Ser 1 5 10 15 Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr Val 20 25 30 Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe Glu 35 40 45 Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro Gly 50 55 60 Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln Val 65 70 75 80 Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr 85 90 <210> 113 <211> 511 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers <220> <221> MISC_FEATURE <222> (14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (422) <223> Xaa can be any naturally occurring amino acid <400> 113 Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala 420 425 430 Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn 435 440 445 Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr Ala Thr 450 455 460 Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala 465 470 475 480 Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser 485 490 495 Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu Ala 500 505 510 <210> 114 <211> 512 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers <220> <221> MISC_FEATURE <222> (14)..(15) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (423) <223> Xaa can be any naturally occurring amino acid <400> 114 Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Xaa Lys 1 5 10 15 Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu 20 25 30 Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile 35 40 45 Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn 50 55 60 Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr 65 70 75 80 Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln 85 90 95 Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn 100 105 110 Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr 115 120 125 Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile 130 135 140 Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser 145 150 155 160 Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser 165 170 175 Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly 180 185 190 Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala 195 200 205 Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala 210 215 220 Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly 225 230 235 240 Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu 245 250 255 Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr 260 265 270 Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala 275 280 285 Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr 290 295 300 Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr 305 310 315 320 Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln 325 330 335 Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn 340 345 350 Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr 355 360 365 Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr 370 375 380 Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln 385 390 395 400 Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His 405 410 415 Val Thr Thr Ser Lys Tyr Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro 420 425 430 Ala Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly 435 440 445 Asn Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr Ala 450 455 460 Thr Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr 465 470 475 480 Ala Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile 485 490 495 Ser Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu Ala 500 505 510 <210> 115 <211> 512 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers <220> <221> MISC_FEATURE <222> (14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (422)..(423) <223> Xaa can be any naturally occurring amino acid <400> 115 Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Xaa Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro 420 425 430 Ala Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly 435 440 445 Asn Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr Ala 450 455 460 Thr Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr 465 470 475 480 Ala Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile 485 490 495 Ser Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu Ala 500 505 510 <210> 116 <211> 513 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers <220> <221> MISC_FEATURE <222> (14)..(15) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (423)..(424) <223> Xaa can be any naturally occurring amino acid <400> 116 Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Xaa Lys 1 5 10 15 Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu 20 25 30 Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile 35 40 45 Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn 50 55 60 Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr 65 70 75 80 Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln 85 90 95 Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn 100 105 110 Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr 115 120 125 Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile 130 135 140 Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser 145 150 155 160 Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser 165 170 175 Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly 180 185 190 Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala 195 200 205 Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala 210 215 220 Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly 225 230 235 240 Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu 245 250 255 Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr 260 265 270 Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala 275 280 285 Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr 290 295 300 Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr 305 310 315 320 Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln 325 330 335 Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn 340 345 350 Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr 355 360 365 Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr 370 375 380 Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln 385 390 395 400 Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His 405 410 415 Val Thr Thr Ser Lys Tyr Xaa Xaa Ser Leu Leu Ile Ser Trp Asp Ala 420 425 430 Pro Ala Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly 435 440 445 Gly Asn Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr 450 455 460 Ala Thr Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val 465 470 475 480 Tyr Ala Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro 485 490 495 Ile Ser Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu 500 505 510 Ala <210> 117 <211> 790 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (511) <223> Xaa can be any naturally occurring amino acid <400> 117 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu 85 90 95 Glu Val Val Ala Ala Thr Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr 100 105 110 Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn 115 120 125 Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser 130 135 140 Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly 145 150 155 160 Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala 165 170 175 Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln 180 185 190 Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn 195 200 205 Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys 210 215 220 Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu 225 230 235 240 Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly 245 250 255 Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn 260 265 270 Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln 275 280 285 Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln 290 295 300 Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly 305 310 315 320 Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser 325 330 335 Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn 340 345 350 Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala 355 360 365 Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr 370 375 380 Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu 385 390 395 400 Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr 405 410 415 Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu 420 425 430 Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn 435 440 445 Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn 450 455 460 Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln 465 470 475 480 Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser 485 490 495 Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Ser 500 505 510 Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr Val 515 520 525 Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe Glu 530 535 540 Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro Gly 545 550 555 560 Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln Val 565 570 575 Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr Ser Leu 580 585 590 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 595 600 605 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 610 615 620 Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr 625 630 635 640 Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn 645 650 655 Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe 660 665 670 Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro 675 680 685 Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser 690 695 700 Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val 705 710 715 720 Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly 725 730 735 Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu 740 745 750 Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val 755 760 765 Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys 770 775 780 Leu Ile Ser Glu Glu Asp 785 790 <210> 118 <211> 791 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (103)..(104) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (512) <223> Xaa can be any naturally occurring amino acid <400> 118 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu 85 90 95 Glu Val Val Ala Ala Thr Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp 100 105 110 Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val 115 120 125 Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser 130 135 140 Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala 145 150 155 160 Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala 165 170 175 Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln 180 185 190 Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu 195 200 205 Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu 210 215 220 Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val 225 230 235 240 Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile 245 250 255 Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln 260 265 270 Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr 275 280 285 Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro 290 295 300 Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu 305 310 315 320 Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 325 330 335 Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr 340 345 350 Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln 355 360 365 Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr 370 375 380 Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val 385 390 395 400 Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr 405 410 415 Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp 420 425 430 Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser 435 440 445 Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys 450 455 460 Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr 465 470 475 480 Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn 485 490 495 Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa 500 505 510 Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr 515 520 525 Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe 530 535 540 Glu Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro 545 550 555 560 Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln 565 570 575 Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr Ser 580 585 590 Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 595 600 605 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 610 615 620 Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro 625 630 635 640 Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala 645 650 655 Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr 660 665 670 Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser 675 680 685 Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met 690 695 700 Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly 705 710 715 720 Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu 725 730 735 Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu 740 745 750 Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr 755 760 765 Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln 770 775 780 Lys Leu Ile Ser Glu Glu Asp 785 790 <210> 119 <211> 791 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (103) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (511)..(512) <223> Xaa can be any naturally occurring amino acid <400> 119 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu 85 90 95 Glu Val Val Ala Ala Thr Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr 100 105 110 Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn 115 120 125 Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser 130 135 140 Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly 145 150 155 160 Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala 165 170 175 Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln 180 185 190 Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn 195 200 205 Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys 210 215 220 Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu 225 230 235 240 Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly 245 250 255 Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn 260 265 270 Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln 275 280 285 Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln 290 295 300 Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly 305 310 315 320 Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser 325 330 335 Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn 340 345 350 Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala 355 360 365 Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr 370 375 380 Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu 385 390 395 400 Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr 405 410 415 Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu 420 425 430 Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn 435 440 445 Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn 450 455 460 Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln 465 470 475 480 Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser 485 490 495 Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Xaa 500 505 510 Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr 515 520 525 Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe 530 535 540 Glu Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro 545 550 555 560 Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln 565 570 575 Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr Ser 580 585 590 Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 595 600 605 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 610 615 620 Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro 625 630 635 640 Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala 645 650 655 Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr 660 665 670 Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser 675 680 685 Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met 690 695 700 Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly 705 710 715 720 Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu 725 730 735 Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu 740 745 750 Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr 755 760 765 Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln 770 775 780 Lys Leu Ile Ser Glu Glu Asp 785 790 <210> 120 <211> 792 <212> PRT <213> Artificial Sequence <220> <223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences <220> <221> MISC_FEATURE <222> (103)..(104) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (512)..(513) <223> Xaa can be any naturally occurring amino acid <400> 120 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser 35 40 45 Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu 50 55 60 Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu 85 90 95 Glu Val Val Ala Ala Thr Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp 100 105 110 Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val 115 120 125 Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser 130 135 140 Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala 145 150 155 160 Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala 165 170 175 Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln 180 185 190 Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu 195 200 205 Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu 210 215 220 Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val 225 230 235 240 Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile 245 250 255 Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln 260 265 270 Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr 275 280 285 Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro 290 295 300 Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu 305 310 315 320 Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 325 330 335 Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr 340 345 350 Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln 355 360 365 Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr 370 375 380 Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val 385 390 395 400 Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr 405 410 415 Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp 420 425 430 Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser 435 440 445 Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys 450 455 460 Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr 465 470 475 480 Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn 485 490 495 Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa 500 505 510 Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr 515 520 525 Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys 530 535 540 Phe Glu Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys 545 550 555 560 Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly 565 570 575 Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr 580 585 590 Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 595 600 605 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 610 615 620 Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser 625 630 635 640 Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu 645 650 655 Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val 660 665 670 Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly 675 680 685 Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser 690 695 700 Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu 705 710 715 720 Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp 725 730 735 Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu 740 745 750 Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr 755 760 765 Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu 770 775 780 Gln Lys Leu Ile Ser Glu Glu Asp 785 790 <210> 121 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> NbGFP207 <400> 121 caggtgcagc tggtggagtc tggaggagga ttggtgcagg ctgggggctc tctgagactc 60 tcctgtgcag cctctggacg caccttcagt accgctgcca tgggctggtt ccgccaggct 120 ccaggaaagg agcgtgactt cgtagcaggt atttactgga ctgttggcag cacatactat 180 gcagactccg cgaagggccg attcaccatc tccagagaca acgccaagaa cacggtgtat 240 ctgcaaatgg acagcctgaa accagaggac acggccgttt attactgtgc agctaggcgg 300 aggggcttta ctttagcccc tactcgagca aatgaatatg actactgggg tcaggggacc 360 caggtcaccg tctccagc 378 <210> 122 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> TU89 Forward primer (SapI digestion site) <400> 122 ccttgagctc ttcgtccctg agactctcct g 31 <210> 123 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> EP230 Reverse primer (SapI digestion site) <400> 123 aggactgctc ttccactgga gacggtgacc tgggt 35 <210> 124 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> TU64 primer <400> 124 ccctccacca gagccacctc ccaagcttga gacggtgacc tgggt 45 <210> 125 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> TU65 primer <400> 125 gcatgtaacc acatcaaagt atggatccct gagactctcc tg 42 <210> 126 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> TU131 primer <220> <221> misc_feature <222> (28)..(29) <223> n is a, c, g, or t <400> 126 ctggtggagt ctgggggagg actagtannk aaaacaacaa cttctgttat tg 52 <210> 127 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> TU132 primer <220> <221> misc_feature <222> (28)..(29) <223> n is a, c, g, or t <220> <221> misc_feature <222> (31)..(32) <223> n is a, c, g, or t <400> 127 ctggtggagt ctgggggagg actagtannk nnkaaaacaa caacttctgt tattg 55 <210> 128 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> TU133 primer <220> <221> misc_feature <222> (29)..(30) <223> n is a, c, g, or t <400> 128 agaggctgca caggagagtc tcagggamnn ctttgatgtg gttacatgtg c 51 <210> 129 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> TU134 primer <220> <221> misc_feature <222> (29)..(30) <223> n is a, c, g, or t <220> <221> misc_feature <222> (32)..(33) <223> n is a, c, g, or t <400> 129 agaggctgca caggagagtc tcagggamnn mnnctttgat gtggttacat gtgc 54 <210> 130 <211> 123 <212> PRT <213> Artificial Sequence <220> <223> Nb38 GABAA-specific Nanobody <400> 130 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly 1 5 10 15 Ser Leu Arg Val Ser Cys Ala Ala Ser Gly Arg Thr Phe Thr Thr Tyr 20 25 30 Ile Met Ala Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Phe Leu 35 40 45 Ala Ala Met Asp Gln Gly Arg Ile Gln Tyr Tyr Gly Asp Ser Val Arg 50 55 60 Gly Arg Phe Thr Ile Ser Arg Asp Tyr Ala Lys Asn Ser Val Asp Leu 65 70 75 80 Gln Leu Asp Gly Leu Arg Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 85 90 95 Ala Gly Ala Gly Phe Trp Gly Leu Arg Thr Ala Ser Ser Tyr His Tyr 100 105 110 Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 115 120 <210> 131 <211> 539 <212> PRT <213> Artificial Sequence <220> <223> MbNb38cHopQ <400> 131 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly 225 230 235 240 Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln 245 250 255 Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser 260 265 270 Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys 275 280 285 Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu 290 295 300 Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala 305 310 315 320 Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys 325 330 335 Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys 340 345 350 Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn 355 360 365 Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu 370 375 380 Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala 385 390 395 400 Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val 405 410 415 Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 420 425 430 Arg Thr Phe Thr Thr Tyr Ile Met Ala Trp Phe Arg Gln Ala Pro Gly 435 440 445 Lys Glu Arg Glu Phe Leu Ala Ala Met Asp Gln Gly Arg Ile Gln Tyr 450 455 460 Tyr Gly Asp Ser Val Arg Gly Arg Phe Thr Ile Ser Arg Asp Tyr Ala 465 470 475 480 Lys Asn Ser Val Asp Leu Gln Leu Asp Gly Leu Arg Pro Glu Asp Thr 485 490 495 Ala Val Tyr Tyr Cys Ala Ala Gly Ala Gly Phe Trp Gly Leu Arg Thr 500 505 510 Ala Ser Ser Tyr His Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 515 520 525 Ser His His His His His His Glu Pro Glu Ala 530 535 <210> 132 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> Nb60 HopQ-specific Nanobody <400> 132 Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Arg Tyr 20 25 30 Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Pro Glu Trp Val 35 40 45 Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His Thr Ile Val Ala Val 100 105 110 Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp Gly Gln Gly Thr Gln 115 120 125 Val Thr Val Ser Ser 130 <210> 133 <211> 530 <212> PRT <213> Artificial Sequence <220> <223> MbNb60c7HopQ N277K T270R <400> 133 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Arg Leu Ala 260 265 270 Gly Gly Thr Thr Lys Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 405 410 415 Ser Arg Tyr Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Pro 420 425 430 Glu Trp Val Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser Tyr Ala 435 440 445 Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His Thr Ile 485 490 495 Val Ala Val Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp Gly Gln 500 505 510 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 515 520 525 Glu Ala 530 <210> 134 <211> 530 <212> PRT <213> Artificial Sequence <220> <223> MbNb60c7HopQ N277K T270R E197R <400> 134 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Arg Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Arg Leu Ala 260 265 270 Gly Gly Thr Thr Lys Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe 405 410 415 Ser Arg Tyr Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Pro 420 425 430 Glu Trp Val Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser Tyr Ala 435 440 445 Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His Thr Ile 485 490 495 Val Ala Val Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp Gly Gln 500 505 510 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 515 520 525 Glu Ala 530 <210> 135 <211> 916 <212> PRT <213> Artificial Sequence <220> <223> MbNb60cYgjkQE2 <400> 135 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe 785 790 795 800 Thr Phe Ser Arg Tyr Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys 805 810 815 Gly Pro Glu Trp Val Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser 820 825 830 Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 835 840 845 Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr 850 855 860 Ala Val Tyr Tyr Cys Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His 865 870 875 880 Thr Ile Val Ala Val Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp 885 890 895 Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His His His 900 905 910 Glu Pro Glu Ala 915 <210> 136 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ <400> 136 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 137 <211> 521 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQA5 <400> 137 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Ala Lys Thr Thr 1 5 10 15 Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln 20 25 30 Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile 35 40 45 Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro 50 55 60 Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly 65 70 75 80 Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile 85 90 95 Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr 100 105 110 Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu 115 120 125 Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys 130 135 140 Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His 145 150 155 160 Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala 165 170 175 Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala 180 185 190 Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe 195 200 205 Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr 210 215 220 Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu 225 230 235 240 Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile 245 250 255 Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly 260 265 270 Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg 275 280 285 Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly 290 295 300 Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr 305 310 315 320 Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr 325 330 335 Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala 340 345 350 Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu 355 360 365 Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro 370 375 380 Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys 385 390 395 400 Met Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 405 410 415 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 420 425 430 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 435 440 445 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 450 455 460 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 465 470 475 480 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 485 490 495 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His 500 505 510 His His His His His Glu Pro Glu Ala 515 520 <210> 138 <211> 521 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQA12 <400> 138 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Arg Lys Thr Thr 1 5 10 15 Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln 20 25 30 Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile 35 40 45 Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro 50 55 60 Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly 65 70 75 80 Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile 85 90 95 Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr 100 105 110 Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu 115 120 125 Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys 130 135 140 Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His 145 150 155 160 Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala 165 170 175 Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala 180 185 190 Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe 195 200 205 Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr 210 215 220 Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu 225 230 235 240 Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile 245 250 255 Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly 260 265 270 Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg 275 280 285 Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly 290 295 300 Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr 305 310 315 320 Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr 325 330 335 Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala 340 345 350 Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu 355 360 365 Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro 370 375 380 Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys 385 390 395 400 Pro Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 405 410 415 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 420 425 430 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 435 440 445 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 450 455 460 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 465 470 475 480 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 485 490 495 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His 500 505 510 His His His His His Glu Pro Glu Ala 515 520 <210> 139 <211> 521 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQB7 <400> 139 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Thr Thr 1 5 10 15 Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln 20 25 30 Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile 35 40 45 Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro 50 55 60 Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly 65 70 75 80 Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile 85 90 95 Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr 100 105 110 Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu 115 120 125 Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys 130 135 140 Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His 145 150 155 160 Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala 165 170 175 Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala 180 185 190 Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe 195 200 205 Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr 210 215 220 Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu 225 230 235 240 Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile 245 250 255 Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly 260 265 270 Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg 275 280 285 Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly 290 295 300 Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr 305 310 315 320 Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr 325 330 335 Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala 340 345 350 Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu 355 360 365 Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro 370 375 380 Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys 385 390 395 400 Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 405 410 415 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 420 425 430 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 435 440 445 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 450 455 460 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 465 470 475 480 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 485 490 495 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His 500 505 510 His His His His His Glu Pro Glu Ala 515 520 <210> 140 <211> 521 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQG10 <400> 140 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Leu Lys Thr Thr 1 5 10 15 Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln 20 25 30 Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile 35 40 45 Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro 50 55 60 Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly 65 70 75 80 Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile 85 90 95 Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr 100 105 110 Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu 115 120 125 Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys 130 135 140 Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His 145 150 155 160 Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala 165 170 175 Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala 180 185 190 Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe 195 200 205 Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr 210 215 220 Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu 225 230 235 240 Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile 245 250 255 Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly 260 265 270 Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg 275 280 285 Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly 290 295 300 Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr 305 310 315 320 Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr 325 330 335 Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala 340 345 350 Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu 355 360 365 Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro 370 375 380 Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys 385 390 395 400 Ser Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 405 410 415 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 420 425 430 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 435 440 445 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 450 455 460 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 465 470 475 480 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 485 490 495 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His 500 505 510 His His His His His Glu Pro Glu Ala 515 520 <210> 141 <211> 909 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkE2 <400> 141 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 785 790 795 800 Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 805 810 815 Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr 820 825 830 Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 835 840 845 Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr 850 855 860 Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro 865 870 875 880 Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr 885 890 895 Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 <210> 142 <211> 910 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkA2 <400> 142 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Glu Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Gly Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 785 790 795 800 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 805 810 815 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 820 825 830 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 835 840 845 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 850 855 860 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 865 870 875 880 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 885 890 895 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 143 <211> 910 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkC4 <400> 143 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Met Tyr Lys Glu 1 5 10 15 Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly 20 25 30 Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu 35 40 45 Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln 50 55 60 Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val 65 70 75 80 Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser 85 90 95 Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn 100 105 110 His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala 115 120 125 Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr 130 135 140 Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu 145 150 155 160 Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg 165 170 175 Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr 180 185 190 Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu 195 200 205 Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala 210 215 220 Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe 225 230 235 240 Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala 245 250 255 Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala 260 265 270 Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln 275 280 285 Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr 290 295 300 Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly 305 310 315 320 Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val 325 330 335 Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp 340 345 350 Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly 355 360 365 His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val 370 375 380 Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp 385 390 395 400 Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu 405 410 415 Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp 420 425 430 Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu 435 440 445 Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp 450 455 460 Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser 465 470 475 480 Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser 485 490 495 Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr 500 505 510 Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser 515 520 525 Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala 530 535 540 His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu 545 550 555 560 Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu 565 570 575 Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu 580 585 590 Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr 595 600 605 Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser 610 615 620 Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly 625 630 635 640 Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln 645 650 655 Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile 660 665 670 Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro 675 680 685 Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro 690 695 700 Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro 705 710 715 720 Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp 725 730 735 Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp 740 745 750 Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr 755 760 765 Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu 770 775 780 Phe Thr Val Lys Lys Asn Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 785 790 795 800 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 805 810 815 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 820 825 830 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 835 840 845 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 850 855 860 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 865 870 875 880 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 885 890 895 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 144 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cYgjkF5 <400> 144 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Trp Thr Lys Glu 1 5 10 15 Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly 20 25 30 Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu 35 40 45 Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln 50 55 60 Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val 65 70 75 80 Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser 85 90 95 Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn 100 105 110 His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala 115 120 125 Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr 130 135 140 Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu 145 150 155 160 Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg 165 170 175 Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr 180 185 190 Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu 195 200 205 Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala 210 215 220 Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe 225 230 235 240 Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala 245 250 255 Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala 260 265 270 Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln 275 280 285 Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr 290 295 300 Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly 305 310 315 320 Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val 325 330 335 Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp 340 345 350 Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly 355 360 365 His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val 370 375 380 Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp 385 390 395 400 Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu 405 410 415 Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp 420 425 430 Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu 435 440 445 Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp 450 455 460 Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser 465 470 475 480 Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser 485 490 495 Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr 500 505 510 Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser 515 520 525 Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala 530 535 540 His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu 545 550 555 560 Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu 565 570 575 Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu 580 585 590 Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr 595 600 605 Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser 610 615 620 Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly 625 630 635 640 Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln 645 650 655 Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile 660 665 670 Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro 675 680 685 Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro 690 695 700 Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro 705 710 715 720 Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp 725 730 735 Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp 740 745 750 Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr 755 760 765 Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu 770 775 780 Phe Thr Val Lys Lys Gly Ala Ser Leu Arg Leu Ser Cys Ala Ala Ser 785 790 795 800 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 805 810 815 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 820 825 830 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 835 840 845 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 850 855 860 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 865 870 875 880 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 885 890 895 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 145 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ C14-C512 <400> 145 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Cys Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Cys 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 146 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ C402-C474 <400> 146 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Cys Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Asp Ser Leu Cys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 147 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ C316-C472 <400> 147 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Cys Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Asp Cys Leu Lys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 148 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ C314-C472 <400> 148 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Cys Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Cys Ser Leu Lys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 149 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ C312-C453 <400> 149 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Cys Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Lys Cys Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 150 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> MbNb207c7HopQ C349-C452 <400> 150 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr 1 5 10 15 Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr 20 25 30 Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu 35 40 45 Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr 50 55 60 Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe 65 70 75 80 Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys 85 90 95 Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile 100 105 110 Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala 115 120 125 Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu 130 135 140 Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly 145 150 155 160 His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser 165 170 175 Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys 180 185 190 Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp 195 200 205 Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn 210 215 220 Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg 225 230 235 240 Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala 245 250 255 Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala 260 265 270 Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu 275 280 285 Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys 290 295 300 Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His 305 310 315 320 Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser 325 330 335 Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Cys Thr Leu Lys 340 345 350 Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His 355 360 365 Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala 370 375 380 Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser 385 390 395 400 Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 405 410 415 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 420 425 430 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 435 440 445 Asp Ser Ala Cys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 450 455 460 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 465 470 475 480 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 485 490 495 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 500 505 510 Ser His His His His His His Glu Pro Glu Ala 515 520 <210> 151 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinA8 <400> 151 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Asn Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Ala Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met 145 150 155 160 Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val 165 170 175 Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp 180 185 190 Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys 195 200 205 Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr 210 215 220 Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr 225 230 235 240 Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 <210> 152 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinD9 <400> 152 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Pro Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Pro Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met 145 150 155 160 Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val 165 170 175 Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp 180 185 190 Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys 195 200 205 Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr 210 215 220 Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr 225 230 235 240 Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 <210> 153 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinD10 <400> 153 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Asn Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 35 40 45 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 50 55 60 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 65 70 75 80 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 85 90 95 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 115 120 125 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 130 135 140 Ser Ser Lys Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 154 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinD11 <400> 154 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Glu Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 35 40 45 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 50 55 60 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 65 70 75 80 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 85 90 95 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 115 120 125 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 130 135 140 Ser Ser Asn Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 155 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinG6 <400> 155 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Ser Thr Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Asp Gly Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 156 <211> 255 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinB8 <400> 156 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Cys Ser Val 1 5 10 15 Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr 20 25 30 Val Ser Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 35 40 45 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 50 55 60 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 65 70 75 80 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 85 90 95 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 115 120 125 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 130 135 140 Ser Thr Met Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val 145 150 155 160 Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val 165 170 175 Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro 180 185 190 Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu 195 200 205 Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln 210 215 220 Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly 225 230 235 240 Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 157 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinB2 <400> 157 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Gly Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 35 40 45 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 50 55 60 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 65 70 75 80 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 85 90 95 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 115 120 125 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 130 135 140 Ser Ser Pro Pro Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn 145 150 155 160 Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly 165 170 175 Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys 180 185 190 Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly 195 200 205 Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu 210 215 220 Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys 225 230 235 240 Gly Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 158 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AzurinC8 <400> 158 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Arg Ile Cys Ser 1 5 10 15 Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile 20 25 30 Thr Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr 35 40 45 Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu 50 55 60 Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr 65 70 75 80 Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys 85 90 95 Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala 100 105 110 Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr 115 120 125 Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 130 135 140 Ser Ser Asn Tyr Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn 145 150 155 160 Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly 165 170 175 Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys 180 185 190 Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly 195 200 205 Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu 210 215 220 Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys 225 230 235 240 Gly Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala 245 250 255 <210> 159 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2A3 (MP1403_A3) <400> 159 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Gly Leu Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu 130 135 140 Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile 145 150 155 160 Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala 165 170 175 Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys 180 185 190 Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu 195 200 205 Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile 210 215 220 Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr 225 230 235 240 Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu 245 250 255 Val Pro Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 290 295 300 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 340 345 350 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 355 360 365 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 370 375 380 His His His Glu Pro Glu Ala 385 390 <210> 160 <211> 390 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2D3 (MP1403_D3) <400> 160 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Gly Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala 130 135 140 Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe 145 150 155 160 Glu Glu Lys Ala Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser 165 170 175 Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu 180 185 190 Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu 195 200 205 Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val 210 215 220 Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys 225 230 235 240 Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Ser Leu Val 245 250 255 Pro Leu Gly Arg Pro Gly Ser Lys Thr Ile Val Leu Ser Gly Ser Leu 260 265 270 Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met 275 280 285 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly 290 295 300 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 305 310 315 320 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 325 330 335 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 340 345 350 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 355 360 365 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His 370 375 380 His His Glu Pro Glu Ala 385 390 <210> 161 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2G5 (MP1403_G5) <400> 161 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Gly Val Gly Ser Lys Ile Ile Val Leu Ser Val Gly Glu 130 135 140 Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile 145 150 155 160 Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala 165 170 175 Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys 180 185 190 Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu 195 200 205 Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile 210 215 220 Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr 225 230 235 240 Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu 245 250 255 Val Pro Leu Gly Arg Leu Gly Ser Lys Thr Ile Val Leu Ser Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Arg Thr Ala Ala 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 290 295 300 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 340 345 350 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 355 360 365 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 370 375 380 His His His Glu Pro Glu Ala 385 390 <210> 162 <211> 390 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2E6 (MP1403_E6) <400> 162 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Trp Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala 130 135 140 Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe 145 150 155 160 Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser 165 170 175 Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu 180 185 190 Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu 195 200 205 Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val 210 215 220 Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys 225 230 235 240 Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val 245 250 255 Pro Leu Gly Arg Pro Gly Ser Lys Thr Ile Val Leu Ser Gly Ser Leu 260 265 270 Arg Leu Ser Cys Ala Ala Ser Glu Arg Thr Phe Ser Thr Ala Ala Met 275 280 285 Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly 290 295 300 Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly 305 310 315 320 Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln 325 330 335 Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala 340 345 350 Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp 355 360 365 Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His 370 375 380 His His Glu Pro Glu Ala 385 390 <210> 163 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2D7 (MP1403_D7) <400> 163 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala 130 135 140 Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe 145 150 155 160 Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser 165 170 175 Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu 180 185 190 Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu 195 200 205 Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val 210 215 220 Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys 225 230 235 240 Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val 245 250 255 Pro Leu Gly Arg Gly Pro Gly Ser Lys Thr Ile Val Leu Ser Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 290 295 300 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 340 345 350 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 355 360 365 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 370 375 380 His His His Glu Pro Glu Ala 385 390 <210> 164 <211> 391 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2A9 (MP1403_A9) <400> 164 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Gln Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Cys Arg Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu 130 135 140 Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile 145 150 155 160 Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala 165 170 175 Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys 180 185 190 Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu 195 200 205 Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile 210 215 220 Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr 225 230 235 240 Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu 245 250 255 Val Pro Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 275 280 285 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 290 295 300 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 305 310 315 320 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 325 330 335 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 340 345 350 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 355 360 365 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 370 375 380 His His His Glu Pro Glu Ala 385 390 <210> 165 <211> 392 <212> PRT <213> Artificial Sequence <220> <223> MbNb207cPP7x2B9 (MP1403_B9) <400> 165 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr 1 5 10 15 Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Leu Ile Phe Glu 20 25 30 Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu 35 40 45 Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp 50 55 60 Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro 65 70 75 80 Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala 85 90 95 Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser 100 105 110 Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro 115 120 125 Leu Gly Arg Arg Val Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu 130 135 140 Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile 145 150 155 160 Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala 165 170 175 Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys 180 185 190 Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu 195 200 205 Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile 210 215 220 Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr 225 230 235 240 Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu 245 250 255 Val Pro Leu Gly Arg Pro Leu Gly Ser Lys Thr Ile Val Leu Ser Gly 260 265 270 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala 275 280 285 Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val 290 295 300 Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala 305 310 315 320 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr 325 330 335 Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys 340 345 350 Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu 355 360 365 Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His 370 375 380 His His His His Glu Pro Glu Ala 385 390 <210> 166 <211> 131 <212> PRT <213> Acinetobacter bacterial phage protein <400> 166 Met Ala Asn Lys Pro Met Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile 1 5 10 15 Val Trp Ser Asp Pro Thr Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu 20 25 30 Leu Arg Gln Arg Val Lys Val Gly Ile Ala Glu Leu Asn Asn Val Ser 35 40 45 Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly 50 55 60 Cys Ala Asp Ala Cys Val Ile Met Pro Asn Glu Asn Gln Ser Ile Arg 65 70 75 80 Thr Val Ile Ser Gly Ser Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu 85 90 95 Trp Glu Thr His Lys Arg Asn Val Asp Thr Leu Phe Ala Ser Gly Asn 100 105 110 Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala Ala Ile Val Ser Ser Asp 115 120 125 Thr Thr Ala 130 <210> 167 <211> 383 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205x2 XX <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (262) <223> Xaa can be any naturally occurring amino acid <400> 167 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile 130 135 140 Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser 145 150 155 160 Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile 165 170 175 Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg 180 185 190 Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro 195 200 205 Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn 210 215 220 Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp 225 230 235 240 Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr 245 250 255 Ala Ala Ile Val Ser Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 260 265 270 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 275 280 285 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 290 295 300 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 305 310 315 320 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 325 330 335 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 340 345 350 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 355 360 365 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 370 375 380 <210> 168 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205x2C5 <400> 168 Met Val Gln Leu Val Glu Ser Gly Gly Gly Leu Tyr Lys Pro Met Gln 1 5 10 15 Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg 20 25 30 Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val 35 40 45 Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr 50 55 60 Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile 65 70 75 80 Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala 85 90 95 Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn 100 105 110 Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp 115 120 125 Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile Thr 130 135 140 Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser Thr 145 150 155 160 Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile Ala 165 170 175 Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro 180 185 190 Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro Asn 195 200 205 Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn Leu 210 215 220 Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp Thr 225 230 235 240 Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala 245 250 255 Ala Ile Val Ser Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly 260 265 270 Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly 275 280 285 Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr 290 295 300 Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn 305 310 315 320 Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp 325 330 335 Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala 340 345 350 Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val 355 360 365 Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 370 375 380 <210> 169 <211> 383 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205x2B7 <400> 169 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile 130 135 140 Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser 145 150 155 160 Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile 165 170 175 Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg 180 185 190 Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro 195 200 205 Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn 210 215 220 Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp 225 230 235 240 Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr 245 250 255 Ala Ala Ile Val Ser Pro Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 260 265 270 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 275 280 285 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 290 295 300 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 305 310 315 320 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 325 330 335 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 340 345 350 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 355 360 365 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 370 375 380 <210> 170 <211> 383 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205x2B8 <400> 170 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ser Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile 130 135 140 Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser 145 150 155 160 Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile 165 170 175 Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg 180 185 190 Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro 195 200 205 Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn 210 215 220 Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp 225 230 235 240 Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr 245 250 255 Ala Ala Ile Val Ser Leu Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 260 265 270 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 275 280 285 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 290 295 300 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 305 310 315 320 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 325 330 335 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 340 345 350 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 355 360 365 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 370 375 380 <210> 171 <211> 383 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205x2D3 <400> 171 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Leu Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile 130 135 140 Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser 145 150 155 160 Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile 165 170 175 Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg 180 185 190 Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro 195 200 205 Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn 210 215 220 Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp 225 230 235 240 Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr 245 250 255 Ala Ala Ile Val Ser Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 260 265 270 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 275 280 285 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 290 295 300 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 305 310 315 320 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 325 330 335 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 340 345 350 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 355 360 365 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 370 375 380 <210> 172 <211> 383 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205x2A4 <400> 172 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Arg Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile 130 135 140 Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser 145 150 155 160 Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile 165 170 175 Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg 180 185 190 Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro 195 200 205 Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn 210 215 220 Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp 225 230 235 240 Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr 245 250 255 Ala Ala Ile Val Ser Ser Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 260 265 270 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 275 280 285 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 290 295 300 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 305 310 315 320 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 325 330 335 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 340 345 350 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 355 360 365 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 370 375 380 <210> 173 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205 XX <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (137) <223> Xaa can be any naturally occurring amino acid <400> 173 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Xaa Gly Ser Leu Arg Leu Ser Cys 130 135 140 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 145 150 155 160 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 165 170 175 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 180 185 190 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 195 200 205 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 210 215 220 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 245 250 255 Glu Ala <210> 174 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205C12 <400> 174 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Trp Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ser Gly Ser Leu Arg Leu Ser Cys 130 135 140 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 145 150 155 160 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 165 170 175 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 180 185 190 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 195 200 205 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 210 215 220 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 245 250 255 Glu Ala <210> 175 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205A4 <400> 175 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Met Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Gly Gly Ser Leu Arg Leu Ser Cys 130 135 140 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 145 150 155 160 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 165 170 175 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 180 185 190 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 195 200 205 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 210 215 220 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 245 250 255 Glu Ala <210> 176 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205E8 <400> 176 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Arg Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser Ile Gly Ser Leu Arg Leu Ser Cys 130 135 140 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 145 150 155 160 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 165 170 175 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 180 185 190 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 195 200 205 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 210 215 220 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 245 250 255 Glu Ala <210> 177 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> MbNb207AP205D10 <400> 177 Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ser Lys Pro Met 1 5 10 15 Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr 20 25 30 Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys 35 40 45 Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val 50 55 60 Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val 65 70 75 80 Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser 85 90 95 Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg 100 105 110 Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu 115 120 125 Asp Pro Thr Ala Ala Ile Val Ser His Gly Ser Leu Arg Leu Ser Cys 130 135 140 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 145 150 155 160 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 165 170 175 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 180 185 190 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 195 200 205 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 210 215 220 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 225 230 235 240 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 245 250 255 Glu Ala <210> 178 <211> 208 <212> PRT <213> Artificial Sequence <220> <223> MbNb207ACPA3 <400> 178 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Gly Thr Ile Glu Glu 1 5 10 15 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 20 25 30 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 35 40 45 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 50 55 60 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 65 70 75 80 Asp Tyr Ile Asn Gly His Gln Tyr Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 195 200 205 <210> 179 <211> 208 <212> PRT <213> Artificial Sequence <220> <223> MbNb207ACPA10 <400> 179 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Lys Thr Ile Glu Glu 1 5 10 15 Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu 20 25 30 Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu 35 40 45 Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu 50 55 60 Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile 65 70 75 80 Asp Tyr Ile Asn Gly His Gln Arg Ser Leu Arg Leu Ser Cys Ala Ala 85 90 95 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 100 105 110 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 115 120 125 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 130 135 140 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 145 150 155 160 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 165 170 175 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 180 185 190 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 195 200 205 <210> 180 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> MbNb207ACPD10 <400> 180 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Arg Thr Thr Ile Glu 1 5 10 15 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 20 25 30 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 35 40 45 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 50 55 60 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 65 70 75 80 Ile Asp Tyr Ile Asn Gly His Gln Pro Ser Leu Arg Leu Ser Cys Ala 85 90 95 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 100 105 110 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 115 120 125 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 130 135 140 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 145 150 155 160 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 165 170 175 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 180 185 190 Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu 195 200 205 Ala <210> 181 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> MbNb207ACPD2 <400> 181 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Phe Thr Ile Glu 1 5 10 15 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 20 25 30 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 35 40 45 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 50 55 60 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 65 70 75 80 Ile Asp Tyr Ile Asn Gly His Gln Ser Ser Leu Arg Leu Ser Cys Ala 85 90 95 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 100 105 110 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 115 120 125 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 130 135 140 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 145 150 155 160 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 165 170 175 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 180 185 190 Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu 195 200 205 Ala <210> 182 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> MbNb207ACPC10 <400> 182 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Leu Glu Thr Ile Glu 1 5 10 15 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 20 25 30 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 35 40 45 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 50 55 60 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 65 70 75 80 Ile Asp Tyr Ile Asn Gly His Gln Asn Leu Ser Leu Arg Leu Ser Cys 85 90 95 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 100 105 110 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 115 120 125 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 130 135 140 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 145 150 155 160 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 165 170 175 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 180 185 190 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 195 200 205 Glu Ala 210 <210> 183 <211> 210 <212> PRT <213> Artificial Sequence <220> <223> MbNb207ACPF1 <400> 183 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Trp Tyr Thr Ile Glu 1 5 10 15 Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu 20 25 30 Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser 35 40 45 Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr 50 55 60 Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala 65 70 75 80 Ile Asp Tyr Ile Asn Gly His Gln Asn Leu Ser Leu Arg Leu Ser Cys 85 90 95 Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg 100 105 110 Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr 115 120 125 Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile 130 135 140 Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu 145 150 155 160 Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly 165 170 175 Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln 180 185 190 Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro 195 200 205 Glu Ala 210 <210> 184 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9E <220> <221> MISC_FEATURE <222> (132)..(135) <223> Xaa can be any naturally occurring amino acid <400> 184 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Xaa Xaa Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 185 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9Q <220> <221> MISC_FEATURE <222> (132)..(135) <223> Xaa can be any naturally occurring amino acid <400> 185 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Xaa Xaa Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 186 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9 CA14543 (MP1411_B3) <400> 186 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Trp Gly Ser Leu Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 187 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9 CA14544 (MP1411_C6) <400> 187 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Gly Val Leu Leu Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 188 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9 CA14546 (MP1438_A5) <400> 188 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Ala Gln Trp Met Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 189 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9 CA14548 (MP1438_B11) <400> 189 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Ser Glu Val Arg Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 190 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9 CA14550 (MP1438_D2) <400> 190 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Arg Ala Ala Ala Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 191 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> N2bNb207NbFedF9 CA14552 (MP1440_C5) <400> 191 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn 1 5 10 15 His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser 20 25 30 Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala 35 40 45 Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala 50 55 60 Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys 65 70 75 80 Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu 85 90 95 Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala 100 105 110 Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr 115 120 125 Asp Tyr Trp Val Glu Ala Ala Gly Ser Leu Arg Leu Ser Cys Ala Ala 130 135 140 Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val 145 150 155 160 Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly 165 170 175 Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg 180 185 190 Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro 195 200 205 Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr 210 215 220 Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly 225 230 235 240 Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 192 <211> 70 <212> PRT <213> Mycobacterium tuberculosis <400> 192 Met Ser Asn His Thr Tyr Arg Val Ile Glu Ile Val Gly Thr Ser Pro 1 5 10 15 Asp Gly Val Asp Ala Ala Ile Gln Gly Gly Leu Ala Arg Ala Ala Gln 20 25 30 Thr Met Arg Ala Leu Asp Trp Phe Glu Val Gln Ser Ile Arg Gly His 35 40 45 Leu Val Asp Gly Ala Val Ala His Phe Gln Val Thr Met Lys Val Gly 50 55 60 Phe Arg Leu Glu Asp Ser 65 70 <210> 193 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> MbNb207Dodecinrandomlinkers Megabody <220> <221> MISC_FEATURE <222> (12) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (75) <223> Xaa can be any naturally occurring amino acid <400> 193 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Thr Tyr Arg Val 1 5 10 15 Ile Glu Ile Val Gly Thr Ser Pro Asp Gly Val Asp Ala Ala Ile Gln 20 25 30 Gly Gly Leu Ala Arg Ala Ala Gln Thr Met Arg Ala Leu Asp Trp Phe 35 40 45 Glu Val Gln Ser Ile Arg Gly His Leu Val Asp Gly Ala Val Ala His 50 55 60 Phe Gln Val Thr Met Lys Val Gly Phe Arg Xaa Ser Leu Arg Leu Ser 65 70 75 80 Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe 85 90 95 Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp 100 105 110 Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr 115 120 125 Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser 130 135 140 Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg 145 150 155 160 Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly 165 170 175 Gln Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu 180 185 190 Pro Glu Ala 195 <210> 194 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> MbNb35cYgjkE2 <400> 194 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe 785 790 795 800 Thr Phe Ser Asn Tyr Lys Met Asn Trp Val Arg Gln Ala Pro Gly Lys 805 810 815 Gly Leu Glu Trp Val Ser Asp Ile Ser Gln Ser Gly Ala Ser Ile Ser 820 825 830 Tyr Thr Gly Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 835 840 845 Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr 850 855 860 Ala Val Tyr Tyr Cys Ala Arg Cys Pro Ala Pro Phe Thr Arg Asp Cys 865 870 875 880 Phe Asp Val Thr Ser Thr Thr Tyr Ala Tyr Arg Gly Gln Gly Thr Gln 885 890 895 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 900 905 910 <210> 195 <211> 903 <212> PRT <213> Artificial Sequence <220> <223> MbNb80cYgjkE2 <400> 195 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Ser 785 790 795 800 Ile Phe Ser Ile Asn Thr Met Gly Trp Tyr Arg Gln Ala Pro Gly Lys 805 810 815 Gln Arg Glu Leu Val Ala Ala Ile His Ser Gly Gly Ser Thr Asn Tyr 820 825 830 Ala Asn Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Ala 835 840 845 Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala 850 855 860 Val Tyr Tyr Cys Asn Val Lys Asp Tyr Gly Ala Val Leu Tyr Glu Tyr 865 870 875 880 Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His 885 890 895 His His His Glu Pro Glu Ala 900 <210> 196 <211> 908 <212> PRT <213> Artificial Sequence <220> <223> MbNb25cYgjkE2 <400> 196 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly His 785 790 795 800 Thr Phe Asn Tyr Pro Ile Met Gly Trp Phe Arg Gln Ala Pro Gly Lys 805 810 815 Glu Arg Glu Phe Val Gly Ala Ile Ser Trp Ser Gly Gly Ser Thr Ser 820 825 830 Tyr Ala Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ala 835 840 845 Lys Asn Thr Val Tyr Leu Glu Met Asn Asn Leu Lys Pro Glu Asp Thr 850 855 860 Ala Val Tyr Tyr Cys Ala Ala Lys Gly Arg Tyr Ser Gly Gly Leu Tyr 865 870 875 880 Tyr Pro Thr Asn Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val 885 890 895 Ser Ser His His His His His His Glu Pro Glu Ala 900 905 <210> 197 <211> 906 <212> PRT <213> Artificial Sequence <220> <223> MbNb38cYgjkE2 <400> 197 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg 785 790 795 800 Thr Phe Thr Thr Tyr Ile Met Ala Trp Phe Arg Gln Ala Pro Gly Lys 805 810 815 Glu Arg Glu Phe Leu Ala Ala Met Asp Gln Gly Arg Ile Gln Tyr Tyr 820 825 830 Gly Asp Ser Val Arg Gly Arg Phe Thr Ile Ser Arg Asp Tyr Ala Lys 835 840 845 Asn Ser Val Asp Leu Gln Leu Asp Gly Leu Arg Pro Glu Asp Thr Ala 850 855 860 Val Tyr Tyr Cys Ala Ala Gly Ala Gly Phe Trp Gly Leu Arg Thr Ala 865 870 875 880 Ser Ser Tyr His Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 885 890 895 His His His His His His Glu Pro Glu Ala 900 905 <210> 198 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> Nb22 Tropomyosin-Related Kinase receptor B (TrkB)-specific Nanobody <400> 198 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Phe Thr Phe Asp Asn Tyr 20 25 30 Ala Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val 35 40 45 Ser Cys Ile Ser Arg Ser Gly Arg Ser Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Val Thr Ile Ala Lys Glu Lys Asn Thr Val Leu Leu Gln 65 70 75 80 Met Asn Asp Leu Gln Pro Asp Asp Thr Ala Val Tyr Tyr Cys Ala Ala 85 90 95 Gly Thr Val Thr Val Val Gly Ser Ala Cys Pro Ser Thr Ala Arg Arg 100 105 110 Leu Trp Gly Arg Gly Thr Gln Val Thr Val Ser Ser 115 120 <210> 199 <211> 907 <212> PRT <213> Artificial Sequence <220> <223> MbNb22cYgjkE2 <400> 199 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu 1 5 10 15 Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln 20 25 30 Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser 35 40 45 Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu 50 55 60 Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys 65 70 75 80 Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu 85 90 95 Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His 100 105 110 Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys 115 120 125 Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys 130 135 140 Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp 145 150 155 160 Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly 165 170 175 Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln 180 185 190 Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe 195 200 205 Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe 210 215 220 Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp 225 230 235 240 Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu 245 250 255 Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp 260 265 270 Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly 275 280 285 Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn 290 295 300 Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly 305 310 315 320 Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile 325 330 335 Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp 340 345 350 His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His 355 360 365 Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala 370 375 380 Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg 385 390 395 400 Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala 405 410 415 Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val 420 425 430 Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu 435 440 445 Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly 450 455 460 Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp 465 470 475 480 Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala 485 490 495 Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp 500 505 510 Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu 515 520 525 Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His 530 535 540 Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr 545 550 555 560 Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala 565 570 575 Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr 580 585 590 Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg 595 600 605 Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro 610 615 620 Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg 625 630 635 640 Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala 645 650 655 Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg 660 665 670 Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln 675 680 685 Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu 690 695 700 Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser 705 710 715 720 Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys 725 730 735 Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp 740 745 750 Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly 755 760 765 Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe 770 775 780 Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Phe 785 790 795 800 Thr Phe Asp Asn Tyr Ala Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys 805 810 815 Glu Arg Glu Gly Val Ser Cys Ile Ser Arg Ser Gly Arg Ser Thr Tyr 820 825 830 Tyr Ala Asp Ser Val Lys Gly Arg Val Thr Ile Ala Lys Glu Lys Asn 835 840 845 Thr Val Leu Leu Gln Met Asn Asp Leu Gln Pro Asp Asp Thr Ala Val 850 855 860 Tyr Tyr Cys Ala Ala Gly Thr Val Thr Val Val Gly Ser Ala Cys Pro 865 870 875 880 Ser Thr Ala Arg Arg Leu Trp Gly Arg Gly Thr Gln Val Thr Val Ser 885 890 895 Ser His His His His His His Glu Pro Glu Ala 900 905 <210> 200 <211> 125 <212> PRT <213> Burkholderia cenocepacia <400> 200 Met His His His His His His Met Gln Val Gln Asp Leu Thr Gly Ala 1 5 10 15 Ala Leu Asp Tyr Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg 20 25 30 Ala Asp Ala Ser Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro 35 40 45 Thr Pro Phe Ala Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val 50 55 60 Glu Arg Leu Pro Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala 65 70 75 80 Trp Arg Ala Val Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys 85 90 95 Thr Phe Asn Gln Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr 100 105 110 Leu Val Ala Ser Thr Phe Gly Asp Asp Val Pro Asp Leu 115 120 125 <210> 201 <211> 249 <212> PRT <213> Artificial Sequence <220> <223> MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (128) <223> Xaa can be any naturally occurring amino acid <400> 201 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Met Gln Val 1 5 10 15 Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala Glu 20 25 30 Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile Arg 35 40 45 Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp Ala 50 55 60 Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu Arg 65 70 75 80 Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val Pro 85 90 95 Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu Leu 100 105 110 Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp Xaa 115 120 125 Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr 130 135 140 Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe 145 150 155 160 Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser 165 170 175 Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val 180 185 190 Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 195 200 205 Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn 210 215 220 Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His 225 230 235 240 His His His His His Glu Pro Glu Ala 245 <210> 202 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (129)..(130) <223> Xaa can be any naturally occurring amino acid <400> 202 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Met Gln 1 5 10 15 Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala 20 25 30 Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile 35 40 45 Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp 50 55 60 Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu 65 70 75 80 Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val 85 90 95 Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu 100 105 110 Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp 115 120 125 Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe 130 135 140 Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg 145 150 155 160 Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala 165 170 175 Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn 180 185 190 Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val 195 200 205 Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg 210 215 220 Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser 225 230 235 240 Ser His His His His His His Glu Pro Glu Ala 245 250 <210> 203 <211> 250 <212> PRT <213> Artificial Sequence <220> <223> MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (13)..(14) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (129) <223> Xaa can be any naturally occurring amino acid <400> 203 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Met Gln 1 5 10 15 Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala 20 25 30 Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile 35 40 45 Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp 50 55 60 Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu 65 70 75 80 Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val 85 90 95 Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu 100 105 110 Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp 115 120 125 Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 130 135 140 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 145 150 155 160 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 165 170 175 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 180 185 190 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 195 200 205 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 210 215 220 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 225 230 235 240 His His His His His His Glu Pro Glu Ala 245 250 <210> 204 <211> 250 <212> PRT <213> Artificial Sequence <220> <223> MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (13) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (128)..(129) <223> Xaa can be any naturally occurring amino acid <400> 204 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Met Gln Val 1 5 10 15 Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala Glu 20 25 30 Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile Arg 35 40 45 Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp Ala 50 55 60 Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu Arg 65 70 75 80 Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val Pro 85 90 95 Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu Leu 100 105 110 Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp Xaa 115 120 125 Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser 130 135 140 Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp 145 150 155 160 Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp 165 170 175 Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr 180 185 190 Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr 195 200 205 Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala 210 215 220 Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser 225 230 235 240 His His His His His His Glu Pro Glu Ala 245 250 <210> 205 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> PelB_MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (35) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (150) <223> Xaa can be any naturally occurring amino acid <400> 205 Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 1 5 10 15 Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr 35 40 45 Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser 50 55 60 Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala 65 70 75 80 Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro 85 90 95 Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val 100 105 110 Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln 115 120 125 Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser 130 135 140 Thr Phe Gly Asp Asp Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser 145 150 155 160 Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro 165 170 175 Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser 180 185 190 Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp 195 200 205 Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu 210 215 220 Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu 225 230 235 240 Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln 245 250 255 Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 206 <211> 273 <212> PRT <213> Artificial Sequence <220> <223> PelB_MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (35)..(36) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (151)..(152) <223> Xaa can be any naturally occurring amino acid <400> 206 Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 1 5 10 15 Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Xaa Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp 35 40 45 Tyr Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala 50 55 60 Ser Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe 65 70 75 80 Ala Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu 85 90 95 Pro Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala 100 105 110 Val Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn 115 120 125 Gln Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala 130 135 140 Ser Thr Phe Gly Asp Asp Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala 145 150 155 160 Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln 165 170 175 Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val 180 185 190 Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser 195 200 205 Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys 210 215 220 Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe 225 230 235 240 Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly 245 250 255 Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu 260 265 270 Ala <210> 207 <211> 272 <212> PRT <213> Artificial Sequence <220> <223> PelB_MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (35)..(36) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (151) <223> Xaa can be any naturally occurring amino acid <400> 207 Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 1 5 10 15 Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Xaa Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp 35 40 45 Tyr Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala 50 55 60 Ser Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe 65 70 75 80 Ala Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu 85 90 95 Pro Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala 100 105 110 Val Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn 115 120 125 Gln Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala 130 135 140 Ser Thr Phe Gly Asp Asp Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala 145 150 155 160 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 165 170 175 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 180 185 190 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 195 200 205 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 210 215 220 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 225 230 235 240 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 245 250 255 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 208 <211> 272 <212> PRT <213> Artificial Sequence <220> <223> PelB_MbNb2074QYBrandomlinkers <220> <221> MISC_FEATURE <222> (35) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (150)..(151) <223> Xaa can be any naturally occurring amino acid <400> 208 Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 1 5 10 15 Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly 20 25 30 Leu Val Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr 35 40 45 Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser 50 55 60 Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala 65 70 75 80 Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro 85 90 95 Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val 100 105 110 Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln 115 120 125 Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser 130 135 140 Thr Phe Gly Asp Asp Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala 145 150 155 160 Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala 165 170 175 Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly 180 185 190 Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg 195 200 205 Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro 210 215 220 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr 225 230 235 240 Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr 245 250 255 Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala 260 265 270 <210> 209 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> affinity tag <400> 209 Glu Pro Glu Ala 1 <210> 210 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> antigenbinding chimeric protein <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <400> 210 Leu Val Xaa Xaa Lys Thr 1 5 <210> 211 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> antigen-binding chimeric protein <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <400> 211 Ser Lys Xaa Xaa Ser Leu 1 5 <210> 212 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> antigen-binding chimeric protein <220> <221> MISC_FEATURE <222> (3) <223> Xaa can be any naturally occurring amino acid <400> 212 Ser Lys Xaa Ser Leu 1 5 <210> 213 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> antigen-binding chimeric protein <220> <221> MISC_FEATURE <222> (3) <223> Xaa can be any naturally occurring amino acid <400> 213 Leu Val Xaa Lys Thr 1 5 <210> 214 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 214 Thr Glu Asn His 1 <210> 215 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 215 Trp Gly Ser Leu 1 <210> 216 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 216 Gly Val Leu Leu 1 <210> 217 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 217 Ala Gln Trp Met 1 <210> 218 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 218 Ser Glu Val Arg 1 <210> 219 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 219 Arg Ala Ala Ala 1 <210> 220 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> linker peptide <400> 220 Val Glu Ala Ala 1

Claims (33)

  1. 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 항원-결합 키메라 단백질로서, 상기 스캐폴드 단백질은 상기 도메인의 하나 이상의 접근가능한 부위에서 항원-결합 도메인의 토폴로지를 방해하는 것인 항원-결합 키메라 단백질.
  2. 제1항에 있어서, 스캐폴드 단백질은 적어도 둘 이상의 직접 융합 또는 링커에 의해 만들어진 융합을 통해서, 상기 도메인의 하나 이상의 접근가능한 부위에서 상기 항원-결합 도메인에 융합되는 것인 항원-결합 키메라 단백질.
  3. 제1항 또는 제2항에 있어서, 상기 하나 이상의 접근가능한 부위는 상기 도메인의 노출된 영역에 존재하는 것인 항원-결합 키메라 단백질.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 항원-결합 도메인은 적어도 7개의 역평행 β-스트랜드 및 적어도 3개의 β-턴을 포함하고, 상기 β-스트랜드 및 β-턴은 IMGT 명명법에 따라 정의되는 것인 항원-결합 키메라 단백질.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 항원-결합 도메인은 면역글로불린 (Ig) 도메인을 포함하는 것인 항원-결합 키메라 단백질.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 스캐폴드 단백질은 다음과 같이 삽입되는 것인 항원-결합 키메라 단백질:
    a. 상기 항원-결합 도메인의 β-스트랜드 A 및 B를 연결하는 제1 β-턴 내; 또는
    b. 상기 항원-결합 도메인의 β-스트랜드 C 및 C'을 연결하는 β-턴 내; 또는
    c. 상기 항원-결합 도메인의 β-스트랜드 C" 및 D를 연결하는 β-턴 내; 또는
    d. 상기 항원-결합 도메인의 β-스트랜드 D 및 E를 연결하는 β-턴 내; 또는
    e. 상기 항원-결합 도메인의 β-스트랜드 E 및 F를 연결하는 β-턴 내
    (여기서 β-스트랜드는 IMGT 명명법에 따라 정의됨).
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 스캐폴드 단백질은 원형 배열 단백질인 항원-결합 키메라 단백질.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 스캐폴드 단백질은 단량체 단백질인 항원-결합 키메라 단백질.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, 스캐폴드 단백질은 대칭성 단백질, 예컨대 다량체 스캐폴드 또는 바이러스-유사 입자 형성 단백질인 항원-결합 키메라 단백질.
  10. 제9항에 있어서, 상기 다량체의 각각의 단량체는 상기 항원-결합 도메인에 연결되는 것인 항원-결합 키메라 단백질.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 항원-결합 도메인 및 스캐폴드는 디술피드 결합을 통해 더욱 연결되는 것인 항원-결합 키메라 단백질.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 스캐폴드 단백질은 적어도 30 kDa의 총 분자 질량을 갖는 것인 항원-결합 키메라 단백질.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 스캐폴드 단백질은 항원-결합 도메인, 예컨대 VHH를 포함하는 것인 항원-결합 키메라 단백질.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 스캐폴드 단백질은 표지된 단백질인 항원-결합 키메라 단백질.
  15. 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 코딩하는 핵산 분자.
  16. 프로모터, 제15항의 핵산 분자, 및 전사 종결 신호를 포함하는 3' 말단 영역을 포함하는 키메라 유전자.
  17. 제15항의 핵산 분자, 또는 제16항의 키메라 유전자를 포함하는, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 코딩하는 발현 카세트.
  18. 제17항의 발현 카세트, 제16항의 키메라 유전자 또는 제15항의 핵산 분자를 포함하는 벡터.
  19. 제18항에 있어서, 이. 콜라이에서 발현을 위한 것인 벡터.
  20. 제18항에 있어서, 효모, 파지, 박테리아 또는 바이러스에서 표면 디스플레이를 위한 것인 벡터.
  21. 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 포함하는, 숙주 세포.
  22. 제21항에 있어서, 상기 항원-결합 키메라 단백질 및 표적 항원은 공발현되는 것인 숙주 세포.
  23. (i) 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 및
    (ii) 표적 단백질
    을 포함하는 복합체로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합하는 것인 복합체.
  24. 제23항에 있어서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질의 항원-결합 도메인에 결합되는 것인 복합체.
  25. 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 포함하는 조성물.
  26. 제1항 내지 제14항 중 어느 한 항의 제1 및 제2 항원-결합 키메라 단백질을 포함하는 조성물로서, 상기 제2 항원-결합 키메라 단백질의 항원-결합 도메인은 제1 항원-결합 키메라 단백질의 스캐폴드 단백질에 특이적으로 결합하는 것인 조성물.
  27. 표적 단백질의 구조 분석을 위한, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 제15항의 핵산 분자, 제16항의 키메라 유전자, 제17항의 발현 카세트, 제18항 내지 제20항 중 어느 한 항의 벡터, 제21항 또는 제22항의 숙주 세포, 제23항 또는 제24항의 복합체, 또는 제25항 또는 제26항의 조성물의 용도.
  28. 제27항에 있어서, 상기 구조 분석은 단일 입자 cryo-EM 또는 결정학을 포함하는 것인 용도.
  29. 표적 단백질의 3-차원 구조를 결정하는 방법으로서,
    (i) 복합체를 형성하도록 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 또는 제26항의 항원-결합 키메라 단백질의 조성물, 및 표적 단백질을 제공하는 단계로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합하는 것인 단계,
    또는 제23항 또는 제24항에 따른 복합체를 제공하는 단계;
    (ii) 구조 분석에 적합한 조건에서 상기 복합체를 디스플레이하는 단계
    를 포함하고,
    상기 표적 단백질의 3D 구조는 고분해능에서 결정되는 것인 결정 방법.
  30. 진단제로서의, 제1항 내지 제14항 어느 한 항의 항원-결합 키메라 단백질, 제15항의 핵산 분자, 제16항의 키메라 유전자, 제17항의 발현 카세트, 제18항 내지 제20항 중 어느 한 항의 벡터, 제21항 또는 제22항의 숙주 세포, 제23항 또는 제24항의 복합체, 또는 제25항 또는 제26항의 조성물의 용도.
  31. 생체내 영상화를 위한, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 제15항의 핵산 분자, 제16항의 키메라 유전자, 제17항의 발현 카세트, 제18항 내지 제20항 중 어느 한 항의 벡터, 제21항 또는 제22항의 숙주 세포, 제23항 또는 제24항의 복합체, 또는 제25항 또는 제26항의 조성물의 용도.
  32. 의약으로서 사용을 위한, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 또는 제25항 또는 제26항의 조성물.
  33. 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 또는 제26항에 따른 조성물을 포함하는 바이러스-유사 입자.
KR1020207013860A 2017-10-31 2018-10-31 신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도 KR20200091400A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP17199472 2017-10-31
EP17199472.6 2017-10-31
EP18199709.9 2018-10-10
EP18199709 2018-10-10
PCT/EP2018/079891 WO2019086548A1 (en) 2017-10-31 2018-10-31 Novel antigen-binding chimeric proteins and methods and uses thereof

Publications (1)

Publication Number Publication Date
KR20200091400A true KR20200091400A (ko) 2020-07-30

Family

ID=64308706

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207013860A KR20200091400A (ko) 2017-10-31 2018-10-31 신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도

Country Status (7)

Country Link
US (2) US11873347B2 (ko)
EP (1) EP3704160A1 (ko)
JP (2) JP2021502063A (ko)
KR (1) KR20200091400A (ko)
CN (1) CN111315784A (ko)
CA (1) CA3076791A1 (ko)
WO (1) WO2019086548A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022515150A (ja) * 2018-12-21 2022-02-17 フエー・イー・ベー・フエー・ゼツト・ウエー サイトカイン及び足場タンパク質を含む融合タンパク質
AU2019408420A1 (en) * 2018-12-21 2021-07-08 Vib Vzw Fusion protein with a toxin and scaffold protein
US20220324998A1 (en) * 2019-06-18 2022-10-13 Musc Foundation For Research Development Compositions and methods targeting the nucleotide free state of ras to block oncogenic signaling and transformation
EP4034146A4 (en) * 2019-09-26 2024-03-06 Orionis Biosciences, Inc. CONJUGATED CHIMERIC PROTEINS
EP3799881A1 (en) 2019-10-04 2021-04-07 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Single domain antibodies specifically binding globo - series glycans
CN110982824B (zh) * 2019-10-09 2022-04-15 天津大学 拮抗pd-1的抗体类似物bp基因及蛋白和应用
WO2021078786A1 (en) 2019-10-21 2021-04-29 Vib Vzw Nanodisc-specific antigen-binding chimeric proteins
US20240027467A1 (en) 2019-12-20 2024-01-25 Vib Vzw Nanobody Exchange Chromatography
EP3845553A1 (en) * 2019-12-30 2021-07-07 Johann Wolfgang Goethe-Universität Carrier matrix comprising dodecin protein
CN111518180B (zh) * 2020-04-10 2023-01-03 四川大学 一种结核病候选疫苗融合蛋白
WO2022066923A1 (en) * 2020-09-24 2022-03-31 The Regents Of The University Of California Multimeric protein complexes as antibody substitutes for neutralization of viral pathogens in prophylactic and therapeutic applications
WO2022218928A1 (en) * 2021-04-12 2022-10-20 Saiba AG Modified virus-like particles of bacteriophage ap205
US20240287501A1 (en) 2021-06-23 2024-08-29 Vib Vzw Means and Methods for Selection of Specific Binders
US12050189B2 (en) * 2021-09-10 2024-07-30 President And Fellows Of Harvard College Compositions and methods relating to structural determination of small proteins
CN114540328A (zh) * 2022-02-18 2022-05-27 浙江工业大学 一种温度敏感型α-淀粉酶及其制备方法与应用
CN115819599B (zh) * 2022-11-29 2024-01-16 江苏耀海生物制药有限公司 一种利用重组大肠杆菌分泌表达纳米抗体Cablivi的方法

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU634186B2 (en) 1988-11-11 1993-02-18 Medical Research Council Single domain ligands, receptors comprising said ligands, methods for their production, and use of said ligands and receptors
ES2338791T3 (es) 1992-08-21 2010-05-12 Vrije Universiteit Brussel Inmunoglobulinas desprovistas de cadenas ligeras.
WO1994025591A1 (en) 1993-04-29 1994-11-10 Unilever N.V. PRODUCTION OF ANTIBODIES OR (FUNCTIONALIZED) FRAGMENTS THEREOF DERIVED FROM HEAVY CHAIN IMMUNOGLOBULINS OF $i(CAMELIDAE)
FR2708622B1 (fr) 1993-08-02 1997-04-18 Raymond Hamers Vecteur recombinant contenant une séquence d'un gène de lipoprotéine de structure pour l'expression de séquences de nucléotides.
EP0739981A1 (en) 1995-04-25 1996-10-30 Vrije Universiteit Brussel Variable fragments of immunoglobulins - use for therapeutic or veterinary purposes
WO1997049805A2 (en) 1996-06-27 1997-12-31 Vlaams Interuniversitair Instituut Voor Biotechnologie Vzw Recognition molecules interacting specifically with the active site or cleft of a target molecule
AU3596599A (en) 1998-01-26 1999-08-09 Unilever Plc Method for producing antibody fragments
AU3041100A (en) 1999-01-05 2000-07-24 Unilever Plc Binding of antibody fragments to solid supports
ATE276359T1 (de) 1999-01-19 2004-10-15 Unilever Nv Verfahren zur herstellung von antikörperfragmenten
EP1169453A1 (en) 1999-04-22 2002-01-09 Unilever Plc Inhibition of viral infection using monovalent antigen-binding proteins
US6479280B1 (en) 1999-09-24 2002-11-12 Vlaams Interuniversitair Institutuut Voor Biotechnologie Vzw Recombinant phages capable of entering host cells via specific interaction with an artificial receptor
DE60042789D1 (de) 1999-11-29 2009-10-01 Bac Ip B V Immobilisierte antigenbindende moleküle aus einer domäne
DK1242460T3 (da) 1999-11-29 2006-12-11 Unilever Nv Immobilisering af proteiner ved hjælp af et polypeptidsegment
ATE428733T1 (de) 2000-03-14 2009-05-15 Unilever Nv Variabele domänen der schweren kette eines antikörpers gegen menschliche ernährungslipasen und deren verwendungen
AU2001268855A1 (en) 2000-05-26 2001-12-03 National Research Council Of Canada Single-domain antigen-binding antibody fragments derived from llama antibodies
ES2368623T3 (es) 2000-12-13 2011-11-18 Bac Ip B.V. Matrices de proteína de dominios variables de inmunoglobulina de cadena pesada de camilidae.
US20060073141A1 (en) 2001-06-28 2006-04-06 Domantis Limited Compositions and methods for treating inflammatory disorders
ATE477280T1 (de) 2001-06-28 2010-08-15 Domantis Ltd Doppelspezifischer ligand und dessen verwendung
EP1433793A4 (en) 2001-09-13 2006-01-25 Inst Antibodies Co Ltd METHOD FOR CREATING A CAMEL ANTIBODY LIBRARY
JP2005289809A (ja) 2001-10-24 2005-10-20 Vlaams Interuniversitair Inst Voor Biotechnologie Vzw (Vib Vzw) 突然変異重鎖抗体
AU2002351896A1 (en) 2001-12-11 2003-06-23 Ablynx N.V. Method for displaying loops from immunoglobulin domains in different contexts
US20050037358A1 (en) 2001-12-21 2005-02-17 Serge Muyldermans Method for cloning of variable domain sequences
EP1461085A2 (en) 2002-01-03 2004-09-29 Vlaams Interuniversitair Instituut voor Biotechnologie vzw. Immunoconjugates useful for treatment of tumours
BRPI0316092B8 (pt) 2002-11-08 2021-05-25 Ablynx Nv anticorpos de domínio único direcionados contra o fator de necrose tumoral alfa e usos para os mesmos
EP2284192A3 (en) 2002-11-08 2011-07-20 Ablynx N.V. Camelidae antibodies for sublingual administration
CN100343304C (zh) 2002-12-31 2007-10-17 尼克塔治疗亚拉巴马公司 水解稳定的马来酰亚胺封端的聚合物
KR20080113286A (ko) 2003-01-10 2008-12-29 아블린쓰 엔.브이. 폰 빌레브란트 인자(vWF) 또는 콜라겐에 대한 낙타과로부터의 재조합 VHH 단일 도메인 항체
US7461263B2 (en) 2003-01-23 2008-12-02 Unspam, Llc. Method and apparatus for a non-revealing do-not-contact list system
CA2535550A1 (en) 2003-08-12 2005-03-03 William M. Yarbrough Treatment for acne vulgaris and method of use
AU2003283136A1 (en) 2003-11-07 2005-05-26 Ablynx N.V. Camelidae single domain antibodies vhh directed against epidermal growth factor receptor and uses therefor
US7563443B2 (en) 2004-09-17 2009-07-21 Domantis Limited Monovalent anti-CD40L antibody polypeptides and compositions thereof
US20080107601A1 (en) 2004-10-13 2008-05-08 Ablynx N.V. Nanobodies Tm Against Amyloid-Beta and Polypeptides Comprising the Same for the Treatment of Degenerative Neural Diseases Such as Alzheimer's Disease
EP1844073A1 (en) 2005-01-31 2007-10-17 Ablynx N.V. Method for generating variable domain sequences of heavy chain antibodies
RU2464276C2 (ru) 2005-05-18 2012-10-20 Аблинкс Н.В. Улучшенные нанотела против фактора некроза опухоли-альфа
KR101414438B1 (ko) 2005-05-20 2014-07-10 아블린쓰 엔.브이. 폰 빌레브란트 인자에 대한 단일 도메인 vhh 항체
EP2057191A1 (en) 2006-08-18 2009-05-13 Ablynx N.V. Amino acid sequences directed against il-6r and polypeptides comprising the same for the treatment of deseases and disorders associated with il-6-mediated signalling
WO2008101985A2 (en) 2007-02-21 2008-08-28 Ablynx N.V. Amino acid sequences directed against vascular endothelial growth factor and polypeptides comprising the same for the treatment of conditions and diseases characterized by excessive and/or pathological angiogenesis or neovascularization
WO2008142164A2 (en) 2007-05-24 2008-11-27 Ablynx N.V. Amino acid sequences directed against rank-l and polypeptides comprising the same for the treatment of bone diseases and disorders
GB201008682D0 (en) 2010-05-25 2010-07-07 Vib Vzw Epitope tag for affinity based applications
GB201014715D0 (en) 2010-09-06 2010-10-20 Vib Vzw Nanobodies stabilizing functional conformational states of GPCRS
CA3142288A1 (en) 2011-06-23 2012-12-27 Ablynx Nv Techniques for predicting, detecting and reducing aspecific protein interference in assays involving immunoglobulin single variable domains
NO2723764T3 (ko) 2011-09-15 2018-05-26
CA2900147C (en) 2013-02-05 2023-09-05 Vib Vzw Muscarinic acetylcholine receptor binding agents and uses thereof
NO2951201T3 (ko) * 2013-02-08 2018-03-17
CA2936726C (en) 2014-01-21 2024-04-30 Vrije Universiteit Brussel Muscle-specific nucleic acid regulatory elements and methods and use thereof
PL3143042T3 (pl) 2014-05-16 2020-11-16 Ablynx N.V. Domeny zmienne immunoglobuliny

Also Published As

Publication number Publication date
JP2023138991A (ja) 2023-10-03
US20240174767A1 (en) 2024-05-30
CN111315784A (zh) 2020-06-19
US20210206880A1 (en) 2021-07-08
WO2019086548A1 (en) 2019-05-09
EP3704160A1 (en) 2020-09-09
US11873347B2 (en) 2024-01-16
JP2021502063A (ja) 2021-01-28
CA3076791A1 (en) 2019-05-09

Similar Documents

Publication Publication Date Title
US20240174767A1 (en) Novel Antigen-Binding Chimeric Proteins and Methods and Uses Thereof
JP6356748B2 (ja) 安定したフィブロネクチンドメイン組成物、方法及び用途
US11014977B2 (en) Synthetic single domain antibody
JP2019505206A (ja) 多様性を変化させた足場ドメインを有する結合メンバー
AU2011245225A1 (en) Stabilized fibronectin domain compositions, methods and uses
US20110189183A1 (en) Antibodies against candida, collections thereof and methods of use
JP2009520468A (ja) 融合タンパク質ライブラリーの作製法およびスクリーニング法、ならびにそれらの使用
US11628222B2 (en) CD71 binding fibronectin type III domains
JP7010491B2 (ja) ヒト化抗rage抗体
Fu et al. The humanized nanobody RBD-1-2G tolerates the spike N501Y mutation to neutralize SARS-CoV-2
AU2017202915B2 (en) Stabilized fibronectin domain compositions, methods and uses
CA3204634A1 (en) Recombinant plant-derived antibodies and fc variants and related methods
EP3898658A1 (en) Fusion protein with a toxin and scaffold protein
US20230330239A1 (en) Epcam binding fibronectin type iii domains
Gera Hyperthermophilic Protein Scaffolds for Engineering Biomolecular Recognition
Jakkaraju The thermodynamic dissection and design of high-affinity antibodies

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application