Nothing Special   »   [go: up one dir, main page]

KR101219628B1 - 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법 - Google Patents

인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법 Download PDF

Info

Publication number
KR101219628B1
KR101219628B1 KR1020100018735A KR20100018735A KR101219628B1 KR 101219628 B1 KR101219628 B1 KR 101219628B1 KR 1020100018735 A KR1020100018735 A KR 1020100018735A KR 20100018735 A KR20100018735 A KR 20100018735A KR 101219628 B1 KR101219628 B1 KR 101219628B1
Authority
KR
South Korea
Prior art keywords
protein
internalin
fusion polypeptide
module
vector
Prior art date
Application number
KR1020100018735A
Other languages
English (en)
Other versions
KR20110099600A (ko
Inventor
김학성
이지오
김동섭
이상철
이병철
한지은
이중재
박근완
홍승표
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020100018735A priority Critical patent/KR101219628B1/ko
Publication of KR20110099600A publication Critical patent/KR20110099600A/ko
Application granted granted Critical
Publication of KR101219628B1 publication Critical patent/KR101219628B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 인터날린 단백질의 N-말단 및 LRR (Leucine rich repeat) 패밀리 단백질이 융합된 수용성 폴리펩타이드에 관한 것이다. 보다 구체적으로, 본 발명은 인터날린 단백질의 N-말단 및 LRR 패밀리 단백질이 융합된 수용성 폴리펩타이드, 상기 폴리펩타이드를 제조하는 방법, 상기 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터, 벡터를 포함하는 숙주세포, 숙주세포 내에서 벡터를 발현시켜서 수용성 및 접힘이 향상된 융합 폴리펩타이드를 생산하는 방법 및 융합 폴리펩타이드의 수용성 및 접힘을 향상시키는 방법에 관한 것이다.

Description

인터날린 단백질의 N-말단 및 LRR 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법{Internalin-fused soluble Leucin-Rich Repeat (LRR) family proteins and method for preparing the same}
본 발명은 인터날린 단백질의 N-말단 및 LRR (Leucine rich repeat) 패밀리 단백질이 융합된 수용성 폴리펩타이드에 관한 것이다. 보다 구체적으로, 본 발명은 인터날린 단백질의 N-말단 및 LRR 패밀리 단백질이 융합된 수용성 폴리펩타이드, 상기 폴리펩타이드를 제조하는 방법, 상기 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터, 벡터를 포함하는 숙주세포, 숙주세포 내에서 벡터를 발현시켜서 수용성 및 접힘이 향상된 융합 폴리펩타이드를 생산하는 방법 및 융합 폴리펩타이드의 수용성 및 접힘을 향상시키는 방법에 관한 것이다.
단백질은 생물의 생체 내 조절의 대부분을 맡고 있는 물질로서, 단백질 자체의 성질을 파악하거나 단백질과 다른 물질과의 상호작용을 연구하고 조절하는 기술은 각종 질병의 치료 등을 위해 최근 더욱 중요시되고 있다. 이러한 단백질의 연구 및 활용에서 가장 어려운 점 중의 하나는 단백질을 충분한 양으로 생산하기 어렵다는 데 있다. 특히 많은 인간 유래의 단백질들은 단백질을 대량 생산하는데 유용하게 이용되는 시스템인 박테리아에 적용이 불가능한 경우가 많아 생산량이 적은 동물세포나 식물세포 등을 이용해야 하는 실정이다.
LRR (Leucine Rich Repeat) 패밀리 단백질은 루이신이 일정한 위치에서 반복되는 모듈의 조합으로 이루어진 단백질을 통틀어 이르는 용어로, 이러한 LRR 패밀리 단백질은 N-말단, 다양한 개수의 반복 모듈 및 C-말단으로 구분된 조합이 안정적인 구조를 이루고 있다. LRR 패밀리 단백질의 반복 모듈은 다음과 같은 특징을 갖는다; (1) 하나 이상의 반복 모듈을 갖는다, (2) 반복 모듈은 20 내지 30개의 아미노산으로 이루어져 있다. (3) 반복 모듈은 보존 패턴 "LxxLxxLxLxxN"를 갖는다. 여기에서, L은 알라닌, 글리신, 패닐알라닌, 티로신, 루이신, 이소루이신, 발린 및 트립토판과 같은 소수성 아미노산을, N은 아스파라진, 글루타민, 세린, 시스테인 또는 쓰레오닌을, X는 임의의 아미노산을 의미한다. LRR 패밀리 단백질은 이중 반복 모듈의 개수를 조절하고 C-말단의 모양을 바꾸며 다른 단백질과의 결합면적을 넓히고 새로운 결합부위를 만들어낼수 있는 특징을 가지고 있다. LRR 패밀리 단백질에 속하는 대표적인 예로는 인체의 면역에 관계되는 톨-유사 수용체 단백질 (Toll-like receptor protein; TLR), 먹장어의 면역에 이용되는 가변 림프구 수용체 (Variable Lymphocyte Receptor; VLR), 리보핵산분해효소 저해 단백질 (Ribonuclease inhibitor protein; RI) 등이 있다. 이들은 각각 면역을 연구하거나 분자생물학 연구를 위해 활용되지만 곤충세포, 동물세포 등에서 생산되거나 항원 물질을 주입한 후 장어에서 VLR을 추출하거나, 태반 등에서 직접 RI를 추출하는 등의 방법으로 단백질을 생산하여 판매 및 연구에 이용되고 있다. VLR의 경우에는 대장균에서 불용성 형태 (inclusion body)로 발현되어 재접힘 (refolding) 후 사용한 예 정도가 더 있다. 이와 같이, LRR 패밀리 단백질들이 대장균과 같은 박테리아에서 수용성 형태로 대량 생산이 어려운 것은 LRR 패밀리 단백질 반복 모듈들의 연속된 소수성 잔기들이 단백질의 수용성 발현에 어려움을 더해주는 것으로 인한 것으로 예측된다. VLR 단백질은 원구류어 (jawless fish)의 면역작용에 쓰이는 단백질로써 그 구성 및 활용이 항체와 같아, 대량 생산시 항체와 같은 활용을 보일 것으로 기대되는 물질이다. 또한 LRR 패밀리 단백질은 신호전달, 세포 주기 조절, 세포사멸 및 면역반응과 같은 다양한 생리적 과정에 관여하는 것으로 알려져 있으며, 이러한 LRR 패밀리 단백질을 대장균 등의 숙주세포에서 수용성으로 대량 생산할 기술이 개발될 수 있다면 생물 및 의학 분야에서 LRR 패밀리 단백질을 다양하게 이용할 수 있기 때문에 시급히 필요한 기술이다.
이에 본 발명자들은 LRR 패밀리 단백질의 대장균 등의 숙주세포에서 수용성으로 대량 생산할 수 있는 기술을 개발하기 위해 예의 노력한 결과, 인터날린의 N-말단 일부를 LRR 패밀리 단백질과 융합시킬 경우 대장균에서 안정적으로 수용성 형태로 대량 생산할 수 있음을 확인하여 본 발명을 완성하였다.
본 발명의 하나의 목적은 인터날린 단백질의 N-말단 및 LRR (Leucine rich repeat) 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드를 제공하는 것이다.
본 발명의 다른 목적은 (a) 인터날린 단백질의 반복 모듈과 LRR 패밀리 단백질의 반복 모듈간의 유사도가 높은 순으로 정렬하는 단계; (b) 상기 (a) 단계의 정렬된 반복 모듈 중 유사도가 높은 모듈을 선정하는 단계; (c) 상기 (b) 단계에서 선정된 모듈 중 인터날린 단백질의 반복 모듈이 N-말단에 위치하고, LRR 패밀리 단백질의 반복 모듈을 C-말단에 위치하도록 설계하는 단계; (d) 상기 (c) 단계에서 설계된 융합 폴리펩타이드의 결합에너지를 계산하여 인터날린 단백질과 LRR 패밀리 단백질의 결합 부위가 안정된 최적의 융합 폴리펩타이드를 선정하는 단계; 및 (e) 상기 (d) 단계에서 선정된 융합 폴리펩타이드에 포함된 인터날린 단백질의 반복 모듈 중 표면 친수성 잔기들을 변형시켜서 에너지 함수 값을 최소화하는 최종 서열 조합을 선정하는 단계를 포함하는, 제1항의 융합 폴리펩타이드를 제조하는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 수용성 융합 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터 또는 벡터를 포함하는 숙주세포를 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 수용성 융합 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터를 제조하는 단계; (b) 제조된 벡터를 숙주세포에 도입하는 단계; 및 (c) 숙주세포로부터 융합 폴리펩타이드를 회수하는 단계를 포함하는, 수용성 및 접힘이 향상된 융합 폴리펩타이드를 생산하는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 수용성 융합 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터를 제조하는 단계; (b) 제조된 벡터를 숙주세포에 도입하는 단계; 및 (c) 숙주세포로부터 융합 폴리펩타이드를 발현하는 단계를 포함하는, 융합 폴리펩타이드의 수용성 및 접힘을 향상시키는 방법을 제공하는 것이다.
상기의 목적을 달성하기 위한 하나의 양태로서, 본 발명은 인터날린 단백질의 N-말단 및 LRR (Leucine rich repeat) 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드에 관한 것이다.
본 발명에서 용어, "인터날린 단백질"이란 리스테리아 (Listeria) 균주에서 발현되는 LRR 패밀리 단백질의 일종으로 다른 소수성 코어가 전 분자에 걸쳐서 일정하게 분포되어 있는 다른 LRR 패밀리 단백질들과는 다른 유형의 N-말단 구조 때문에 미생물에서도 안정적으로 발현되는 것으로 알려져 있다. 이러한 인터날린 단백질의 N-말단은 반복 모듈의 접힘 (folding)에 가장 중요한 N-말단 부위가 미생물 유래일 뿐 아니라 그 형태가 알파 나선을 포함하는 더욱 안정적인 모양을 가졌기 때문에 미생물에서 안정적으로 발현되는 것으로 생각되고 있다. 본 발명의 융합에 사용되는 인터날린 단백질은 N-말단의 구조가 유사하며 단백질 접힘에 중요한 역할을 할 것으로 예상되는 것은 제한 없이 포함되나, 그 예로 인터날린 A, 인터날린 B, 인터날린 C, 인터날린 H 또는 인터날린 J 등이 있으며, 바람직하게는 인터날린 B이다. 상기 인터날린 A 내지 J는 구조적으로 매우 유사하며 구조 정열을 통한 인터날린 B 단백질의 N-말단 (36 내지 115)과의 RMSD (Root mean square deviation)값은 인터날린 A (36 내지115)는 0.6, 인터날린 C (36 내지 115)는 0.793, 인터날린 H (36 내지 115)는 0.619, 인터날린 J (57 내지 131)는 0.862로 매우 유사한 것을 알 수 있다.
본 발명에서 용어, "인터날린 단백질의 N-말단"은 단백질의 수용성 발현 및 접힘에 있어서 필요한 인터날린 단백질의 N-말단을 의미하며 알파 나선형 캡핑 모티프 (capping motif) 및 인터날린 단백질의 반복 모듈을 의미한다. 인터날린 단백질의 N-말단은 단백질의 수용성 발현 및 접힘에 있어서 필요한 인터날린 단백질의 N-말단은 제한 없이 포함되나, 그 예로 알파 나선형 캡핑 모티프인 " ETITVSTPIKQIFPDDAFAETIKANLKKKSVTDAVTQNE" 및 반복 모듈을 포함할 수 있다. 바람직하게 반복 모듈 패턴은 "LxxLxxLxLxxN"을 포함할 수 있다. 상기 반복 모듈 패턴 중 L은 알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린 또는 트립토판; N은 아스파라진, 글루타민, 세린, 시스테인 또는 트레오닌, x는 친수성 아미노산을 의미한다. 인터날린 단백질의 N-말단은 서열번호 13일 수 있으나, 융합될 수 있는 LRR 패밀리 단백질의 종류에 따라 높은 구조 유사도를 갖는 N-말단이 선택될 수 있으며 결합 에너지 등의 계산을 통해 가장 안정적인 아미노산을 선택하여 해당 모듈의 아미노산의 변이가 가능하다.
본 발명에서 용어, "LRR (Leucine rich repeat) 패밀리 단백질"은 루이신이 일정한 위치에 반복되는 모듈의 조합으로 이루어진 단백질을 의미하는 것으로, (i) 하나 이상의 LRR 반복 모듈을 갖고 있고, (ii) 상기 LRR 반복 모듈은 20 내지 30개의 아미노산으로 이루어져 있고, (iii) LRR 반복 모듈은 보존 패턴으로 "LxxLxxLxLxxN"을 갖고 있으며, 여기서 L은 알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린 및 트립토판과 같은 소수성 아미노산을, N은 아스파라진, 글루타민, 세린, 시스테인 또는 쓰레오닌을, x는 임의의 의미하며, (iv) LRR 패밀리 단백질은 말발굽과 같은 삼차원 구조를 갖는 구조를 갖고 있는 단백질을 의미한다. 본 발명의 LRR 패밀리 단백질은 이미 그 서열이 알려져 있거나, 생체에서 새로 유도된 mRNA나 cDNA를 이용하여 찾아낸 것 뿐 아니라, 컨센서스 디자인 (consensus design) 등의 설계를 통하여 자연계에 알려지지 않은 서열을 가지면서 반복모듈의 골격 구조가 있는 변이체를 모두 포함할 수 있으며, 이에 제한되지는 않으나, 그 예로 가변 임파구 수용체 (Variable lymphocyte receptor; VLR), 톨 유사 수용체 (Toll-like receptor; TLR), TV3 단백질, U2A 또는 리보뉴클레아제 억제제 (Ribonuclease inhibitor; RI)일 수 있다. 본 발명의 일 구현예에 따르면, 인터날린 B 단백질의 N-말단 및 VLR 단백질의 융합 단백질을 제조하여 인터날린 N-말단을 융합하기 이전보다 융합 이후에 생산량이 크게 향상된 것을 확인하였다 (도 9). 이러한 결과는 본 발명의 융합 폴리펩타이드가 대장균 내에서 수용성으로 과발현될 수 있음을 시사하는 결과이다.
바람직한 일 실시태양으로 상기 LRR 패밀리 단백질은 반복 모듈의 개수를 융합한 수용성 융합 폴리펩타이드가 안정적으로 발현될 수 있는 개수를 제한 없이 포함할 수 있으나, 바람직하게는 1개 내지 9개일 수 있으며, LRR 반복 모듈의 개수는 자연계에 존재하는 것으로 알려진 것뿐만 아니라 인위적으로 모듈을 추가 및 제거하면서도 융합 폴리펩타이드의 골격 구조를 유지할 수 있는 것을 모두 포함할 수 있다. 본 발명의 일 구현예에 따르면 인터날린-VLR 융합 단백질을 반복 모듈의 개수를 증가시키더라도 대장균에서 수용성으로 과량 발현되는 결과를 확인하였다 (도 12).
바람직한 일 실시태양으로 상기 인터날린 단백질의 N-말단 및 LRR 패밀리 단백질은 링커 (linker)를 통해 연결될 수 있으며, 상기 링커는 융합되는 LRR 패밀리 단백질과 다른 유래의 LRR 패밀리 단백질의 반복 모듈일 수 있으며, 이에 제한되는 것은 아니나, VLR 반복 모듈일 수 있다. 이는 융합된 LRR 패밀리 단백질과 인터날린 단백질의 N-말단간의 반복 모듈 내의 아미노산의 개수의 차이로 인하여 구조적인 안정성이 부족하여 융합된 폴리펩타이드의 대장균 등의 박테리아에서 수용성 과량 발현이 되지 않을 경우 유사한 개수의 아미노산으로 이루어진 반복 모듈을 갖고 있는 LRR 패밀리 단백질의 LRR 반복 모듈을 링커로 사용하여 안정한 구조를 형성하여 수용성으로 과발현시키기 위한 것이다.
본 발명에서 용어 "융합 폴리펩타이드", "융합 단백질" 및 "결합 단백질"은 혼용되어 사용될 수 있으며, 이는 인터날린 단백질의 N-말단 및 LRR 패밀리 단백질이 서로 반복 모듈 간의 구조 유사도가 높은 모듈을 선정하여 융합시킨 것으로, 인터날린 단백질과 LRR 패밀리 단백질의 반복 모듈 간의 결합에너지 계산을 통해 가장 안정적인 서열조합이 되도록 일부 아미노산의 변이를 추가한 융합된 폴리펩타이드를 포함한다. 융합되어 안정적으로 대장균에서 수용성 형태로 과량 발현될 수 있는 융합된 폴리펩타이드는 제한 없이 포함될 수 있으며, 그 예로 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10 또는 서열번호 12로 기재되는 아미노산 서열을 가지는 융합된 폴리펩타이드일 수 있다.
또 하나의 양태로서, 본 발명은 (a) 인터날린 단백질의 반복 모듈과 LRR 패밀리 단백질의 반복 모듈 간의 유사도가 높은 순으로 정렬하는 단계; (b) 상기 (a) 단계의 정렬된 반복 모듈 중 유사도가 높은 모듈을 선정하는 단계; (c) 상기 (b) 단계에서 선정된 모듈 중 인터날린 단백질의 반복 모듈이 N-말단에 위치하고, LRR 패밀리 단백질의 반복 모듈을 C-말단에 위치하도록 설계하는 단계; (d) 상기 (c) 단계에서 설계된 융합 폴리펩타이드의 결합에너지를 계산하여 인터날린 단백질과 LRR 패밀리 단백질의 결합 부위가 안정된 최적의 융합 폴리펩타이드를 선정하는 단계; 및 (e) 상기 (d) 단계에서 선정된 융합 폴리펩타이드에 포함된 인터날린 단백질의 반복 모듈 중 표면 친수성 잔기들을 변형시켜서 에너지 함수 값을 최소화하는 최종 서열 조합을 선정하는 단계를 포함하는, 수용성 융합 폴리펩타이드를 제조하는 방법에 관한 것이다.
바람직한 일 실시태양으로 상기에서 설명한 바와 같이, 상기 (c) 단계는 반복 모듈을 추가 또는 제거하는 단계를 추가로 포함할 수 있으며, 또는 인터날린 단백질과 LRR 패밀리 단백질을 링커로 연결시키는 단계를 추가로 포함할 수 있다. 반복 모듈 및 링커는 상기에서 설명한 바와 같다.
(a) 단계의 인터날린 단백질의 반복 모듈과 LRR 패밀리 단백질의 반복 모듈 간의 구조 정렬 및 (b) 단계의 정렬된 반복 모듈 중 유사도가 높은 모듈을 선정하는 단계는 상기 단백질을 반복 모듈의 쌍으로 분리하고, 구조의 유사성을 계산하여 RMSD 등 유사도 점수가 높으면서 원하는 성질을 유지하는 쌍을 선호하여 선택할 수 있다. 구조의 유사도 점수는 단백질 구조 간의 유사도를 계산할 수 있는 공지의 프로그램 또는 직접 제작한 프로그램 등을 사용하여 선정할 수 있으며, 그 예로 이에 제한되는 것은 아니나, TM-align (http://zhang.bioinformatics.ku.edu/TM-align/), CE (http://cl.sdsc.edu/), Mammoth (http://ub.cbm.uam.es/mammoth/pair/index3.php) 또는 DALI (http://ekhidna.biocenter.helsinki.fi/dali_server/start) 등이 있다.
(c) 단계 및 (d) 단계는 상기에서 선택된 모듈의 쌍을 앞의 모듈 즉, N-말단은 인터날린의 서열, 뒤의 모듈 즉, C-말단은 LRR 패밀리 단백질을 위치하도록 설계하며 설계된 융합 폴리펩타이드의 결합에너지를 계산하여 최적의 융합 폴리펩타이드의 구조를 선정하여 이러한 최종 구조 모델은 모델러 (Modeller, 버전 9v4) 등 공지의 프로그램을 이용하여 분자 동역학 시뮬레이션 및 에너지 안정화 과정을 반복적으로 수행하여 선정할 수 있다.
(e) 단계의 최종 서열 조합을 선정하는 단계는 에너지 함수 값을 계산할 수 있는 공지의 프로그램을 이용하여 에너지 함수 값이 가장 작은 아미노산을 선정하여 이를 표면 친수성 잔기들에 치환시킴으로써 최종 서열 후보로 선정한다. 에너지 함수 값을 계산하는 프로그램은 공지의 프로그램을 제한 없이 사용할 수 있으며, 그 예로 이에 제한되는 것은 아니나, 로제타 디자인 (RosettaDesign), Fold-X, GROMACS 또는 AMBER 등이 있다.
또 하나의 양태로서, 본 발명은 상기 융합 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터에 관한 것이다.
본 발명의 용어 "벡터"란 적당한 숙주세포에서 목적 단백질을 발현할 수 있는 발현 벡터로서, 유전자 삽입물이 발현되도록 작동가능하게 연결된 필수적인 조절 요소를 포함하는 유전자 작제물을 말한다. 재조합 벡터와의 작동적 연결은 당해 기술 분야에서 잘 알려진 유전자 재조합 기술을 이용하여 제조할 수 있으며, 부위-특이적DNA 절단 및 연결은 당해 기술 분야에서 일반적으로 알려진 효소 등을 사용한다. 본 발명의 벡터는 프로모터, 오퍼레이터, 개시코돈, 종결코돈, 폴리아데닐화 시그널, 인핸서 같은 발현 조절 요소 외에도 막 표적화 또는 분비를 위한 신호 서열 또는 리더 서열을 포함할 수 있으며 목적에 따라 다양하게 제조될 수 있다. 벡터의 프로모터는 구성적 또는 유도성일 수 있다. 또한, 발현벡터는 벡터를 함유하는 숙주 세포를 선택하기 위한 선택성 마커를 포함하고, 복제 가능한 발현벡터인 경우 복제 기원을 포함한다. 벡터는 자가 복제하거나 숙주 DNA에 통합될 수 있다.
바람직하게는 상기 벡터는 단백질 정제용 태그서열을 추가로 포함할 수 있으며, 단백질 정제용 태그서열은 이에 한정되는 것은 아니나, 그 예로 히스티딘-태그 서열 (His-tag), 인플루엔자 헤마글루티딘 단백질로부터 유래된 에피토프에 상응하는 HA-태그 및 FLAG-태그일 수 있으며, 바람직하게는 히스티딘-태그 서열이다.
본 발명에서 사용되는 벡터는 숙주 중에서 복제가능한 것이면 특별히 한정되지 않으며 당 업계에 알려진 임의의 벡터를 이용할 수 있다. 예컨대 플라스미드, 바이러스 벡터, 파지 입자, 또는 간단하게 잠재적 게놈 삽입물일 수 있다. 벡터는 적당한 숙주 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 숙주 게놈 내로 통합될 수 있다.
바람직한 일 실시태양으로 상기 핵산 서열은 도입되는 숙주 세포에서 잘 발현되도록 숙주 세포에 맞추어 코돈 최적화된 것일 수 있다.
본 발명에서 용어 "코돈 최적화"는 DNA에 의해 암호화된 폴리펩타이드를 변화시키지 않고서 숙주 유기체의 전형적인 코돈 활용을 반영하도록 상기 핵산 분자의 암호화 영역 또는 유전자 내의 코돈을 변화시키는 것을 지칭한다. 코돈 최적화는 공지의 기술로 수행될 수 있다.
또 하나의 양태로서, 본 발명은 상기 융합 폴리펩타이드를 포함하는 벡터로 형질전환된 숙주세포에 관한 것이다.
본 발명에서 용어 "형질전환" 또는 "도입"은 DNA를 숙주로 도입하여 DNA가 염색체외 인자로서 또는 염색체 통합완성에 의해 복제가능하게 되는 것을 의미한다. 본 발명의 벡터를 형질전환시키는 방법은 핵산을 세포 내로 도입하는 어떤 방법도 포함되며, 숙주세포에 따라 당 분야에서 공지된 바와 같이 적합한 표준 기술을 선택하여 수행할 수 있다. 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO4) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온 리포좀법, 및 초산 리튬-DMSO법 등이 있으나, 이에 제한되는 것은 아니다.
상기 숙주 세포로는 DNA의 도입효율이 높고, 도입된 DNA의 발현 효율이 높은 숙주를 사용하는 것이 좋은데, 원핵 및 진핵을 포함한 모든 미생물을 사용 가능하며, 바람직하게는 대장균이나 이에 제한되는 것은 아니다. 선택되는 대장균은 융합되는 LRR 단백질의 종류에 따라 선택가능한데, 예를 들어 LRR 단백질의 C-말단이 이황화결합을 가지고 있는 종류일 경우에 이의 발현을 도와주기 위해 대장균 유전체의 관련 효소에 변형이 가해진 균주를 선정하는 것이 효율적이다.
또 하나의 양태로서, 본 발명은 (a) 상기 벡터를 제조하는 단계; (b) 제조된 벡터를 숙주세포에 도입하는 단계; 및 (c) 상기 숙주세포로부터 융합 폴리펩타이드를 회수하는 단계를 포함하는, 수용성 및 접힘이 향상된 융합 폴리펩타이드를 생산하는 방법에 관한 것이다. 바람직한 일 실시태양으로 (d) 컬럼을 이용하여 융합 폴리펩타이드를 정제하는 단계를 추가적으로 포함할 수 있다.
또 하나의 양태로서, 본 발명은 (a) 상기 벡터를 제조하는 단계; (b) 제조된 벡터를 숙주세포에 도입하는 단계; 및 (c) 상기 숙주세포로부터 융합 폴리펩타이드를 발현하는 단계를 포함하는, 융합 폴리펩타이드의 수용성 및 접힘을 향상시키는 방법에 관한 것이다.
본 발명의 일 구현예에 따르면, 본 발명자들은 인터날린 B 단백질과 VLR 단백질의 반복 모듈을 정의한 후에 연속된 두 개의 모듈 구조들을 모두 분리하여 인터날린 B 단백질과 VLR 단백질의 부분 구조 라이브러리를 제작하였다. 두 단백질간의 부분 구조 라이브러리를 통해 모든 구조 쌍에 대해 구조 비교를 통하여 유사도 점수가 높은 쌍으로 정렬한 후 VLR 단백질 자체의 서열을 더 많이 포함하고 인터날린 B 단백질의 서열을 더 적게 포함시킬 수 있는 모듈 쌍을 최종적인 접합 위치로 선정하였다. 해당 반복 모듈 쌍의 중간을 기준으로 N-말단 방향은 인터날린 B 단백질을 C-말단 방향은 VLR 단백질의 서열을 갖는 새로운 융합 단백질을 설계하였다 (서열번호 5 및 6). 이 후 좀 더 안정적으로 결합할 아미노산을 예측하기 위해, 결합 단백질의 서열과 원래의 인터날린 B 단백질과 VLR 단백질의 구조 정보를 이용하여 최종적인 융합 구조 모델은 모델러 프로그램을 이용하여 최종 구조 모델을 선택하였고, 로제타 디자인 프로그램을 이용하여 에너지 함수 값이 가장 작도록 아미노산을 변이시킨 최종 서열 후보를 정하였다 (서열번호 7 및 8). 최종 설계된 서열을 바탕으로 DNA를 합성하여 대장균의 코돈 선호도에 따라 코돈최적화된 DNA 서열을 합성하였고 발현 및 정제를 위해 단백질의 C-말단 부위에 6개의 히스티딘을 붙여서 VLR의 C-말단에 포함된 이황화결합의 형성을 돕기 위해 Orgami B 대장균에 형질전환하여 His-태그를 이용하여 정제한 후 생산량을 분석한 결과 인터날린의 N-말단을 융합하기 이전보다 융합 이후에 생산량이 증가한 것을 확인하였다 (도 9). 또한, 인터날린-VLR 융합 단백질에 있어서, VLR의 컨센서스 모듈을 한 개 더 추가하여 제작한 융합 단백질 (서열번호 9 및 10)을 바탕으로 제작한 DNA를 대장균에서 발현시켰을 때 수용성으로 과량 발현되는 것이 유지되는 것을 확인하였으며 (도 12), N-말단 부위는 TLR4로부터 C-말단 부위는 VLR로부터 추출하여 융합된 하이브리드 형태의 TV3 단백질의 경우 VLR 반복 모듈을 링커로 사용하였을 경우 링커를 사용하지 않을 때보다 링커가 존재할 때 대장균에서 수용성 발현이 증가하는 것을 확인하였다 (도 14). 이러한 결과는 본 발명의 융합 폴리펩타이드를 코돈 최적화로 핵산서열을 설계하고 적합한 대장균 숙주세포에서 발현시킬 경우 대량으로 수용성 및 접힘이 향상된 융합 폴리펩타이드를 생산할 수 있을 뿐 아니라 융합 폴리펩타이드의 수용성 및 접힘을 향상시킬 수 있음을 시사하는 것이다.
본 발명의 인터날린 단백질의 N-말단 및 LRR 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드를 이용하여 LRR 패밀리 단백질을 수용성 형태로 대량생산하는 방법은 기존에 생산하기가 무척 까다로웠던 LRR 패밀리 단백질을, 특히 대장균 등 박테리아에서 수용성으로 많은 양의 단백질을 생산할 수 있도록 만든다. 이와 같이 본 발명은 LRR 패밀리 단백질을 다량으로 확보할 수 있도록 하여 LRR 패밀리 단백질을 이용한 연구개발이나 산업적, 의학적 활용에 큰 기여를 할 수 있을 것이다.
도 1은 장어 유래의 VLR 단백질의 변형체로 가운데 반복 모듈의 개수가 3개인 서열번호 1의 서열을 나타내며, 본 발명자들은 이를 Eb8VLRB.59로 명명하였다. 빨간색은 신호 서열을 노란색은 N-말단을 녹색은 세개의 반복 모듈을 파란색은 C-말단을 검정색은 줄기를 나타낸다.
도 2는 반복 모듈을 5개로 만든 서열번호 2를 나타내며, 본 발명자들은 이를 VLR5n으로 명명하였다. 이는 서열번호 1을 기반으로 N-말단의 신호 서열 부분과 C-말단의 줄기서열을 제거한 것으로 밑줄 친 곳은 결합이 설계된 곳을 나타낸다.
도 3은 컨센서스 설계를 통해 5개의 반복 모듈을 가진 서열번호 3을 나타내며, 본 발명자들은 이를 VLR5c로 명명하였다. 밑줄 친 곳은 컨센서스 서열로 일정하게 반복되는 서열을 나타낸 것으로 초록색은 반복 모듈을 나타낸다.
도 4는 서열번호 5의 인터날린 B 단백질의 N-말단과 VLR5n이 융합된 InlB-VLR5n 결합 단백질을 나타낸 것이다. 빨간색은 인터날린 부분을 검정색은 VLR 부분을 나타낸다.
도 5는 서열번호 6의 인터날린 B 단백질의 N-말단과 VLR5c가 융합된 InlB-VLR5c 결합 단백질을 나타낸 것이다. 빨간색은 인터날린 부분을 검정색은 VLR 부분을 나타낸다.
도 6은 서열번호 5의 InlB-VLR5n에 대해서 로제타 (Rossetta) 디자인 프로그램을 통해 재설계된 서열번호 7의 InlB-VLR5n-Rosseta 결합 단백질을 나타낸 것이다. 밑줄 친 부분은 로제타 계산을 통해 변형된 아미노산을 나타낸다.
도 7은 서열번호 6의 InlB-VLR5c에 대해서 로제타 디자인 프로그램을 통해 재설계된 서열번호 8의 InlB-VLR5c-Roseeta 결합 단백질을 나타낸 것이다. 밑줄 친 부분은 로제타 계산을 통해 변형된 아미노산을 나타낸다.
도 8은 본 발명의 LRR 단백질을 대장균에서 생산하기 위해 인터날린 B 단백질을 융합시키는 방법을 모식적으로 나타낸 그림이다.
도 9는 본 발명에 의해 설계된 인터날린이 융합된 VLR 단백질이 융합되지 않은 VLR 단백질에 비해 생산량이 증가한 것을 보여주는 폴리아크릴아미드 전기영동 사진이다. 벡터는 pET21a를 사용하여 숙주세포로 Origami B를 사용하여 5ml LB 배지에서 키운 후, IPTG (최종 0.5mM)로 단백질 발현을 유도하고 Ni-NTA 레진을 이용하여 정제한 결과 단백질을 발현하여 정제하기 전후를 비교하였을 때 각각 확연한 발현량의 차이를 보여준다. 1: 사이즈 마커, 2: InlB-VLR5n (정제 전), 3: InlB-VLR5c (정제 전), 4: VLR5n (정제 전), 5: VLR5c (정제 전), 6: 사이즈 마커, 7: VLR5n (정제 후), 8: VLR5c (정제 후), 9: InlB-VLR5n (정제 후), 10: InlB-VLR5c (정제 후), 11: 사이즈 마커.
도 10은 서열번호 7의 InlB-VLR5n-Rosseta를 바탕으로 인터날린 다음 부분에 VLR의 컨센서스 모듈을 하나 추가한 서열번호 9의 InlB-VLR6n을 나타낸 것이다. 빨간색은 인터날린을, 파란색은 추가한 모듈을, 검정색은 VLR 부분을 나타낸다.
도 11은 서열번호 8의 InlB-VLR5c-Rosseta를 바탕으로 인터날린 다음 부분에 VLR의 컨센서스 모듈을 하나 추가한 서열번호 10의 InlB-VLR6c를 나타낸 것이다. 빨간색은 인터날린을, 파란색은 추가한 모듈을, 검정색은 VLR 부분을 나타낸다.
도 12는 본 발명에 의해 설계된 인터날린이 융합된 VLR 단백질의 반복 모듈을 하나 증가시켰을 때 발현량을 보여주는 폴리아크릴아미드 전기영동 사진이다. (a)는 InlB-VLR6n을 (b)는 InlB-VLR6c 융합 단백질의 발현량을 나타낸다. 발현을 유도하지 않은 세포 (1) 및 발현을 유도한 세포 (2)의 전체 단백질의 비교로 발현이 얼마나 되는지 확인할 수 있으며, 불수용성 단백질 (3) 및 수용성 단백질 (5)의 비교로 수용성 단백질이 얼마나 발현되는지 확인할 수 있으며, 수용성으로 과량 발현되는 것이 유지됨을 확인할 수 있다. 각각 1: 발현 유도하지 않은 세포의 전체 단백질, 2: 발현 유도한 세포의 전체 단백질, 3: 불수용성 단백질, 4: 사이즈 마커, 5: 수용성 단백질, 6 내지 8: 단백질 정제 후 분획.
도 13은 본 발명에 의해 설계된 인터날린이 VLR을 링커로 사용하여 융합된 융합 단백질이 기존 단백질에 비해 수용성 단백질 발현량이 증가한 것을 보여주는 폴리아크릴아미드 전기영동 사진이다. (a) 1: TV3 불수용성 부분-발현유도 않은 것, 2: TV3 불수용성 부분-발현 유도한 것, 3: TV3 수용성 부분-발현 유도 않은 것, 4: TV3 수용성 부분-발현 유도한 것, 5: 사이즈 마커; (b) 1: 사이즈 마커, 2: InlB_TV3 불수용성 부분-발현 유도 않은 것, 3: InlB_TV3 불수용성 부분-발현 유도한 것, 4: InlB_TV3 수용성 부분-발현 유도 않은 것, 5: InlB_TV3 수용성 부분-발현 유도한 것; (c) 1: 사이즈 마커, 2: InlB_VLR_TV3 불수용성 부분-발현유도 않은 것, 3: InlB_VLR_TV3 불수용성 부분-발현 유도한 것, 4: InlB_VLR_TV3 수용성 부분-발현 유도 않은 것, 5: InlB_VLR_TV3 수용성 부분-발현 유도한 것.
이하 실시예를 통하여 본 발명을 더욱 상세하게 설명하기로 한다. 이들 실시예는 단지 본 발명을 예시하기 위한 것으로, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않으며 다양한 응용 및 수정이 가능하다.
실시예 1: 인터날린 단백질 N-말단 및 VLR 단백질의 융합 단백질의 제조 및 대장균에서 과량 발현 확인
<1-1> 인터날린 단백질 N-말단 및 VLR 단백질의 융합 단백질 (인터날린-VLR 융합 단백질)의 설계 및 제조
발명의 구성 요소로서 리스테리아 (Listeria monocytogenes) 유래의 인터날린 B 단백질과 장어 유래의 VLR 단백질의 변형체를 이용하였다. VLR 단백질은 가운데 반복모듈의 개수가 3개인 Eb8VLRB.59 (서열번호 1 및 도 1)를 기반으로 우선 N-말단 중에 신호서열 (signal sequence) 부분과 C-말단의 줄기(stalk) 부분을 제거하고, 자연계에 존재하는 것으로 알려진 다른 모듈 서열을 두 개 첨가하여 반복모듈의 개수를 5개 (서열번호 2 및 도 2)로 만들었다. 이와 같이, 모듈의 개수를 늘린 것은 모듈 조절의 가능성을 확인하기 위한 목적이 포함된다.
또 다른 골격으로는 수많은 VLR 단백질의 서열들 중에서 진화적으로 반복모듈에 유지되는 아미노산을 골라내는 컨센서스 (consensus) 설계를 통해 5개의 반복모듈을 가진 단백질을 설계하였다 (서열번호 3 및 도 3). 이때, N-말단과 C-말단은 상기에서 제조한 반복모듈의 개수가 5개인 것 (서열번호 2 및 도 2)을 이용하였다. 서열번호 3에 나타낸 바와 같이 하나의 모듈 안에 존재하는 24개의 아미노산 중에서 18개는 진화적으로 보존된 서열로 고정하였고, 나머지 6개의 부분만 진화적인 보존도에 따라 다양한 아미노산을 배정하였다. 두 골격 서열은 추가적으로 다른 단백질과 결합을 하도록 15 개의 아미노산을 변형하였다 (도 2의 서열번호 2에서 밑줄 친 곳과 동일한 부분이 아미노산의 변형 부분을 나타내는 것이며, 각 서열번호 3 내지 7에서도 동일한 위치이다).
인터날린 B 단백질의 N-말단을 VLR 단백질에 결합시키기 위해서 우선적으로 가장 적합한 결합자리를 찾았다. 두 단백질이 모두 루이신 풍부 단백질이지만 각 모듈의 길이가 다르고 그에 따른 구조를 안정화시키는 반복 모듈 패턴의 차이가 있기 때문에, 이를 최소화할 수 있는 방향으로 결합 자리를 찾는 방법을 개발하였다.
일단, 각 단백질들의 반복 모듈을 정의한 후에 연속된 두 개의 모듈 구조들을 모두 분리하여 루이신 풍부 단백질의 부분 구조 라이브러리를 만들었다. N-말단과 C-말단을 제외한 내부의 반복 모듈만을 고려했을 때 인터날린 B 단백질의 경우 7개의 반복 모듈에서 6개의 모듈 쌍이, VLR 단백질의 경우 5개의 반복모듈과 1개의 VLRe 모듈까지 총 6개의 모듈에서 5개의 모듈 쌍의 부분 구조를 만들었다. VLRe 모듈은 엄밀히 말하면 C-말단의 구성요소이지만, 앞의 반복모듈과 같은 24개의 아미노산을 가진 반복서열을 어느 정도 유지하고 있어 융합 후보로 함께 계산하였다. 각 모듈 쌍들은 N-말단에서부터의 순서에 따라 각각 Inl1 ~ Inl6, VLRn1 ~ VLRn5 및 VLRc1 ~ VLRc5 로 구분하였다. 이렇게 구성된 두 단백질의 부분 구조 라이브러리를 통해 모든 부분 구조 쌍에 대해 구조 비교 (총 30 쌍)를 통하여 가장 유사도가 높은 것을 찾았고 이 쌍을 기준으로 결합을 진행하였다. 예를 들어, 하기 표 1과 같이 후보로 선택된 모듈 쌍으로는 Inl4와 VLRn5 쌍이 유사도 점수 (Alignment score) 20으로 가장 높은 값을 가졌다. 이때 부분 구조 사이의 유사도는 단백질의 안정성을 유지하는 소수성 잔기들을 먼저 구조 정렬하고 나머지 서열들을 맞춘 뒤, 짝지어진 아미노산들의 진화적인 연관성 (BLOSUM62)을 점수로 환산하여 정의하였다. 이와 같이, 유사도에 의해 정렬된 모듈 쌍들 중에서 VLR 단백질 자체의 서열을 더 많이 포함하고 인터날린 단백질의 서열을 더 적게 포함시킬 수 있는 인터날린 2와 VLR 1 모듈 쌍을 최종적인 접합 위치로 정하였다. 이는 융합의 목적이 기존 LRR의 성질을 최대한 유지하면서 발현량을 늘리는 것이기 때문이다.
<인터날린 단백질과 VLR 단백질 모듈 간의 유사도 분석>
InlB VLRn 유사도 점수 InlB VLRc 유사도 점수
4 5 20 2 2 23
5 3 18 2 1 18
6 3 15 4 5 12
6 4 14 5 3 11
2 1 13 6 4 11
2 2 12 1 1 10
5 1 12 6 3 9
이렇게 찾은 부분 구조 쌍은 인터날린 B 단백질과 VLR 단백질 사이의 가장 유사한 연속 반복 모듈 쌍으로 판단할 수 있기 때문에 이 모듈 쌍을 기준으로 두 개의 단백질을 구조 정렬하여 맞춘 뒤, 해당 반복 모듈 쌍의 중간을 기준으로 왼쪽 (N-말단 방향)은 인터날린 B 단백질의, 오른쪽 (C-말단 방향)은 VLR 단백질의 서열을 갖는 새로운 결합 단백질을 설계하였다 (서열번호 5 및 6, 및 도 4 및 5).
좀 더 안정적으로 결합할 아미노산을 예측하기 위해, 결합 단백질의 서열과 원래의 인터날린 B 및 VLR 단백질의 구조 정보를 이용하여 최종적인 융합 구조 모델을 모델러 (Modeller, 버전 9v4) 프로그램을 이용하여 보다 정확하게 만들었다. 이 과정에서는 우선 모델러 프로그램의 자동모델 (automodel) 함수를 이용하여 초기 구조 모델을 만들었다. 그리고 이 초기 구조를 최적화하기 위해 분자 동역학 시뮬레이션과 에너지 안정화 과정을 반복적으로 수행했다 (모델러에서 제공하는 slow_large 최적화 프로토콜 이용). 이 과정을 통해 인터날린 B 단백질과 VLR 단백질 사이의 결합 부위를 안정하게 연결시켜주는 최종 구조 모델을 찾았다. 또한 서로 다른 단백질의 접합 부위에 위치하는 인터날린 B 단백질의 모듈은 바로 옆에 위치하는 VLR 단백질 모듈과의 상호작용을 고려하여 서열을 재설계하였다. 재설계 과정은 12개의 적합한 아미노산 위치를 선정하여 로제타 디자인 (Rosetta Design) 프로그램을 통하여 진행을 하였다. 12개의 아미노산 위치는 단백질의 안정성에 기여하는 소수성 잔기들과 진화적 보존성이 높은 잔기들은 고정시키고 나머지 단백질 표면 쪽의 친수성 잔기들에 대해서만 변이를 수행을 하였다. 변이된 위치는 인터날린 B 단백질의 모듈 패턴 (LPxLxxLxLxxNxIxDIxxLxx) 중 x 부분에 해당된다. 로제타 디자인 프로그램의 서열 설계과정에서는 단백질의 백본 (backbone)은 고정시키고 (fixed backbone model) 각 측쇄 (side chain)의 로타머 (rotamer) 검색을 최적화 (MC minimization for each rotamer search) 시키면서 적절한 서열 조합을 찾게 된다. 이 과정에서 100번의 독립적인 시행을 통해서 100개의 서열 후보를 찾았고, 이 중에서 가장 에너지 함수 값이 작은 것을 최종 서열 후보로 정하였다 (서열번호 7 및 서열번호 8, 도 6 및 7). 이와 같은 인터날린 N-말단과 VLR의 최종 융합 모델을 설계하는 방법에 대한 대략적인 모식도를 도 8에 나타냈다.
<1-2> 대장균에서 수용성 융합 단백질의 대량 발현 확인
상기 실시예 <1-1>에서 최종 설계된 아미노산 서열 (서열번호 7 및 서열번호 8, 도 6 및 7)을 바탕으로 DNA를 합성하였다. DNA 서열은 기존의 리스테리아나 장어의 DNA 서열을 따르지 않고, 대장균의 코돈 선호도에 따라 새롭게 DNA 서열을 설계하여 합성하였다. 합성된 DNA는 발현과 정제를 쉽게 하기 위해 단백질의 C-말단 부위에 6개의 히스티딘을 붙이는 pET21a 벡터 (Qiagen)로 옮겨서 클로닝 하였다. 클로닝된 벡터는 VLR의 C-말단에 포함된 이황 결합의 형성을 돕기 위해 Origami B (Novagen)대장균에 형질전환하였다. 상기 벡터가 형질전환된 대장균을 흡광도 (OD600) 0.5가 될 때까지 키운 후, IPTG (Isopropyl β-D-1-thiogalactopyranoside)를 최종 0.5mM 농도가 되도록 넣고, 18℃에서 20시간 동안 배양하여 인터날린-VLR 융합 단백질을 생산하도록 하였다. 20시간 후에 세포를 깨고 세포 안에서 생산된 인터날린-VLR 융합 단백질의 양을 비교 확인하였다. 생산량이 적은 원래의 단백질은 단백질 끝에 붙은 His-tag를 이용하여 Ni-NTA 레진을 통해 정제하여 농축 후 생산량을 분석하였다.
그 결과, 도 9에 나타낸 것처럼 인터날린의 N-말단을 융합하기 이전보다 융합 이후에 생산량이 크게 증가한 것을 알 수 있었다. 인터날린 융합 후 생산량은 100ml 배양시 10mg 정도였다. 이러한 결과는 본 발명의 방법에 의해 인터날린을 융합시킨 LRR 단백질의 경우 수용성 단백질을 과량으로 발현시킬 수 있다는 것을 시사하는 점이다.
실시예2 : 인터날린 - VLR 융합 단백질에 반복 모듈을 추가한 단백질의 설계 및 발현 확인
<2-1> 인터날린-VRL 융합 단백질에 반복 모듈을 추가한 단백질의 설계
인터날린-VLR 융합 단백질을 다양한 종류 및 크기의 질병 타깃 단백질에 대한 결합 단백질로 이용하려면 결합면적을 조절하기 위해 반복 모듈의 개수를 증감하는 것이 필요하다. 이에 반복 모듈을 추가하여 결합면적을 넓게 하는 변이를 단백질에 가했을 때도 인터날린 N-말단이 VLR 단백질을 안정하게 발현시키는지 확인하기 위한 반복모듈을 하나 추가한 단백질을 설계하는 실험을 수행하였다.
상기 실시예 <1-1>에서 제조한 인터날린이 융합된 골격구조인 서열번호 7과 서열번호 8을 바탕으로 인터날린 다음 부분에 VLR의 컨센서스 모듈을 하나씩 추가하여 서열번호 9와 서열번호 10을 설계하였다 (도 10 및 11).
<2-2> 대장균에서 반복 모듈을 추가한 융합 단백질의 수용성 대량 발현 확인
상기 실시예 <1-1>에서 제조한 서열번호 9 및 10을 바탕으로 DNA를 합성하여 실시예 <1-2>과 동일한 방법으로 대장균에서 발현시켰다.
그 결과, 수용성으로 과량 발현되는 것이 유지되는 것을 확인하였다 (도 12). 생산량은 1L 배양시 20mg 정도였다. 이와 같은 결과는 본 발명의 융합 단백질에 VLR의 반복 모듈을 증가시켜도 과량 발현에 영향이 없음을 시사하는 결과이며, 이는 본 발명의 융합 단백질 및 그 생산 방법으로 다양한 질병의 타겟 단백질에 결합하는 다양한 치료제의 개발이 가능하다는 것을 나타낸다.
실시예3 : TV3 단백질에 인터날린의 N-말단을 융합한 융합 단백질의 설계 및 대장균에서 수용성 발현 확인
<3-1> 인터날린 N-말단 및 TV3 단백질의 융합 단백질의 설계
인터날린의 N-말단이 다른 LRR 패밀리 단백질에 공통적으로 적용 가능한지를 확인하기 위해 TV3 단백질에 인터날린 N-말단을 융합시킨 융합 단백질을 설계하였다. TV3 단백질은 LRR 단백질의 일종인 톨유사수용체-4 (TLR4)의 단백질 구조를 밝히기 위해 융합되어 만들어진 단백질로서, N-말단 부위는 TLR4로부터 C-말단 부위는 VLR로부터 추출하여 융합된 구조로 이루어진 단백질이다. 이 단백질은 곤충세포에서 발현되어 단백질의 3차 구조를 얻는데 이용되었으나, 생산량이 적어 응용하기에 어려움이 있으며, 대장균 등에서는 불용성인 상태로만 얻어지고 있는 단백질이다.
본 발명자들은 인터날린 단백질의 N-말단과 TV3 연결부위를 더욱 잘 이어주기 위해 링커 모듈을 사용하는 방법을 개발하기 위한 실험을 수행하였다.
TV3 단백질의 반복 모듈은 24개 또는 그 이상의 아미노산으로 이루어져 있는데 반해 인터날린 단백질의 반복 모듈은 22개의 아미노산으로 이루어져 있다. 따라서 두 개의 반복 모듈은 단백질 안정성을 유지하는 소수성 아미노산들의 위치에 차이가 있고 이 차이는 안정된 단백질 생산에 방해가 될 수 있다. 이 문제를 극복하기 위해 상기 실시예 <1-1>의 방법으로 설계한 인터날린과 VLR 융합 단백질을 이용하였다. VLR 단백질의 경우 TV3 단백질과 비슷하게 반복 모듈의 개수가 24개이며 인터날린 단백질과 결합하여 발현이 잘 되었으므로 이 결합의 경우 구조적 안정성이 높다고 판단하였다. 따라서 VLR 단백질 모듈을 하나 더 포함한 인터날린 N-말단 서열을 TV3 N-말단 부분의 반복 모듈 (24개)에 결합하는 설계를 시도하였다. 이와 같은 방법을 통해, 서로 크기가 다른 반복 모듈들을 결합시키는데 있어서 구조적인 안정성을 유지하고 융합 단백질의 발현량을 증가시키는 효과를 기대하였다.
이를 위해 상기 실시예 <1-1>의 방법으로 설계한 인터날린 단백질과 VLR 융합 단백질 서열 (서열번호 8, 도 7)로부터 인터날린의 N-말단 서열과 바로 옆에 연결되어 있는 VLR 단백질의 반복 모듈 서열 (24개 아미노산)까지와 TV3 단백질의 원래의 서열을 최대한 유지하면서 VLR 단백질의 반복 모듈과 같은 크기 (24개 아미노산)를 갖는 부분이 결합하도록 결정하였다. 즉 TV3 단백질의 53-100 부분을 상기 실시예 <1-1>에서와 같은 연속된 두 개의 부분 구조로 정하였고 이를 인터날린과 VLR 융합 구조의 정해진 결합 위치에 구조 정렬을 하여 결합 구조 초기 모델을 만들었다. 이렇게 정렬된 위치로부터 왼쪽 (N-말단)은 인터날린-VLR (모듈 1개)을 오른쪽 (C-말단)은 TV3 (76-끝)의 서열을 이용하여 새로운 서열을 설계하였고, 상기 실시예 <1-1>과 같은 과정을 통해 안정된 구조 모델을 모델러 프로그램을 통해 얻었다. 또한 서열 최적화 과정으로 결합 부위의 서열 중 컨센서스 정보와 일치하지 않는 부분의 아미노산은 컨센서스 서열로 치환하였다. 즉, 컨센서스 정보는 진화적으로 유사한 서열 검색을 통해 해당 위치에 진화적으로 보존되어 가장 많이 나타나는 아미노산 정보를 담고 있고, 이를 근거로 단백질 안정성에 관여하는 소수성 아미노산들을 컨센서스 서열로 치환하여 주었다 (서열번호 12, 도 13, 밑줄 부분은 치환된 부분을 나타냄). 이 과정에서는 상기 실시예 <1-1>과 같이 로제타 디자인 프로그램을 이용하여 친수성 잔기들에 대한 최적화는 수행하지 않았고 컨센서스 정보만을 이용하였다. 이와 같이 융합 단백질 중간에 들어간 하나의 VLR 단백질의 반복 모듈은 링커 (linker)로 작용하며, 이는 인터날린 단백질의 N-말단과 TV3 단백질 사이를 구조의 흐트러짐 없이 이어주는 역할을 한다. 이로써, 링커단백질로 연결된 인터날린 N-말단과 융합된 LRR 단백질을 설계하였다.
<3-2> 인터날린 N-말단 및 TV3 단백질 간의 링커 모듈을 이용한 융합 단백질의 대장균에서의 수용성 발현 확인
TV3의 DNA 서열은 대장균에 부족한 t-RNA에 대한 코돈을 가지고 있으므로, 이에 해당하는 tRNA 등을 보충해줄 Rosetta gami B (Novagen) 대장균을 이용하여 단백질을 발현시켰다. 발현을 위한 방법은 상기 실시예 <1-2>와 동일하며 대장균만이 Rosetta gami B (Novagen)로 상이하다.
그 결과, 인터날린을 융합하기 이전과는 달리 수용성 부분에 단백질이 생산되는 것을 확인하였다 (도 14). 기존에 수용성 단백질이 전혀 발현되지 않던 것에 비해 많은 개선이 있었으며, 1L 배양액에서 6mg 정도의 순수한 단백질을 얻어낼 수 있었다. 중간에 들어간 하나의 VLR 단백질의 반복 모듈은 링커로 작용하여 인터날린 단백질의 N-말단과 TV3 단백질 사이를 구조의 흐트러짐 없이 이어주는 데 중요한 역할을 하며, 이러한 링커가 없을 경우에는 인터날린-TV3 융합 단백질은 수용성으로 발현되지 않는다는 것도 도 4를 통해 알 수 있었다. 이러한 결과는 링커를 연결하는 방법을 사용한 융합 단백질의 설계에 의해 수용성 단백질을 대량 생산할 수 있는 가능성이 있음을 시사하는 것이다.
서열목록 전자파일 첨부

Claims (21)

  1. 인터날린 단백질의 N-말단 및 LRR (Leucine rich repeat) 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드로서,
    상기 인터날린 단백질의 N-말단은 서열번호 14의 아미노산 서열 및 하기의 반복 모듈 패턴으로 구성되는 것인 융합 폴리펩타이드:
    [LxxLxxLxLxxN]
    여기서, L은 알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린 또는 트립토판; N은 아스파라진, 글루타민, 세린, 시스테인 또는 트레오닌; x는 친수성 아미노산임.
  2. 제1항에 있어서, 상기 인터날린 단백질은 인터날린 A, 인터날린 B, 인터날린 C, 인터날린 H 및 인터날린 J로 이루어진 군에서 선택된 것인 융합 폴리펩타이드.
  3. 제1항에 있어서, 상기 LRR 패밀리 단백질은 가변 임파구 수용체 (Variable lymphocyte repeat; VLR), 톨유사수용체 (Toll-like receptor; TLR), TV3, U2A 및 리보뉴클레아제 억제제 (RI)로 이루어진 군에서 선택된 것인 융합 폴리펩타이드.
  4. 삭제
  5. 제1항에 있어서, 상기 인터날린 단백질의 N-말단 및 LRR 패밀리 단백질이 링커 (linker)를 통해 연결된 것인 융합 폴리펩타이드.
  6. 삭제
  7. 삭제
  8. 제1항에 있어서, 상기 인터날린 단백질의 N-말단은 서열번호 13인 융합 폴리펩타이드.
  9. 제1항에 있어서, 상기 융합 폴리펩타이드는 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10 또는 서열번호 12로 기재되는 아미노산 서열로 구성되는 것인 융합 폴리펩타이드.
  10. (a) 인터날린 단백질의 반복 모듈과 LRR 패밀리 단백질의 반복 모듈간의 유사도가 가장 높은 순으로 정렬하는 단계;
    (b) 상기 (a) 단계의 정렬된 반복 모듈 중 유사도가 가장 높은 모듈을 선정하는 단계;
    (c) 상기 (b) 단계에서 선정된 모듈 중 인터날린 단백질의 반복 모듈이 N-말단에 위치하고, LRR 패밀리 단백질의 반복 모듈을 C-말단에 위치하도록 설계하는 단계;
    (d) 상기 (c) 단계에서 설계된 융합 폴리펩타이드의 결합에너지를 계산하여 인터날린 단백질과 LRR 패밀리 단백질의 결합 부위가 안정된 최적의 융합 폴리펩타이드를 선정하는 단계; 및
    (e) 상기 (d) 단계에서 선정된 융합 폴리펩타이드에 포함된 인터날린 단백질의 반복 모듈 중 표면 친수성 잔기들을 변형시켜서 에너지 함수 값을 최소화하는 최종 서열 조합을 선정하는 단계를 포함하는, 제1항의 융합 폴리펩타이드를 제조하는 방법으로서,
    상기 반복 모듈은 하기의 반복 모듈 패턴으로 표시되는 것인 방법:
    [LxxLxxLxLxxN]
    여기서, L은 알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린 또는 트립토판; N은 아스파라진, 글루타민, 세린, 시스테인 또는 트레오닌; x는 임의의 아미노산임.
  11. 제10항에 있어서, 상기 (c) 단계는 반복 모듈을 추가 또는 제거하는 단계를 추가로 포함하는 것인 방법.
  12. 제10항에 있어서, 상기 (c) 단계는 인터날린 단백질과 LRR 패밀리 단백질을 링커로 연결시키는 단계를 추가로 포함하는 것인 방법.
  13. 삭제
  14. 삭제
  15. 제1항의 융합 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 벡터.
  16. 제15항에 있어서, 상기 핵산 서열은 코돈 최적화된 것인 벡터.
  17. 제15항에 있어서, 상기 벡터는 단백질 정제용 태그서열을 추가적으로 포함하는 것인 벡터.
  18. 제15항 내지 제17항 중 어느 한 항의 벡터로 형질전환된 숙주세포.
  19. (a) 제15항 내지 제17항 중 어느 한 항의 벡터를 제조하는 단계;
    (b) 제조된 벡터를 숙주세포에 도입하는 단계; 및
    (c) 상기 숙주세포로부터 융합 폴리펩타이드를 회수하는 단계를 포함하는, 수용성 및 접힘이 향상된 융합 폴리펩타이드를 생산하는 방법.
  20. 제19항에 있어서, (d) 컬럼을 이용하여 융합 폴리펩타이드를 정제하는 단계를 추가적으로 포함하는 방법.
  21. (a) 제15항 내지 제17항 중 어느 한 항의 벡터를 제조하는 단계;
    (b) 제조된 벡터를 숙주세포에 도입하는 단계; 및
    (c) 상기 숙주세포로부터 융합 폴리펩타이드를 발현하는 단계를 포함하는, 융합 폴리펩타이드의 수용성 및 접힘을 향상시키는 방법.
KR1020100018735A 2010-03-02 2010-03-02 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법 KR101219628B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100018735A KR101219628B1 (ko) 2010-03-02 2010-03-02 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100018735A KR101219628B1 (ko) 2010-03-02 2010-03-02 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법

Publications (2)

Publication Number Publication Date
KR20110099600A KR20110099600A (ko) 2011-09-08
KR101219628B1 true KR101219628B1 (ko) 2013-01-10

Family

ID=44952434

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100018735A KR101219628B1 (ko) 2010-03-02 2010-03-02 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법

Country Status (1)

Country Link
KR (1) KR101219628B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150135700A (ko) * 2014-05-23 2015-12-03 한국과학기술원 상피세포 성장인자 수용체의 세포외 도메인과 결합하는 신규 폴리펩타이드
KR20210100945A (ko) * 2020-02-07 2021-08-18 한국과학기술원 보체 단백 분해 산물 C3a와 결합할 수 있는 신규한 폴리펩타이드 및 이의 용도

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120107741A (ko) * 2011-03-22 2012-10-04 한국생명공학연구원 패혈증 단백질 치료제의 효능 분석 및 스크리닝 방법
WO2013129852A1 (ko) * 2012-02-27 2013-09-06 한국과학기술원 신규한 인터루킨-6에 대한 리피바디 및 그 용도
KR101356075B1 (ko) * 2012-02-27 2014-02-12 한국과학기술원 인터루킨-6와 결합할 수 있는 신규한 폴리펩타이드
KR101443839B1 (ko) * 2012-07-27 2014-09-26 광주과학기술원 펩타이드의 타겟 친화도 개선방법
KR101624702B1 (ko) 2014-08-01 2016-05-27 한국과학기술원 보체 단백질 C5a와 결합할 수 있는 신규한 폴리펩타이드 및 그 용도
KR20160080832A (ko) 2014-12-29 2016-07-08 주식회사 레고켐 바이오사이언스 리피바디 유도체-약물 복합체, 그 제조방법 및 용도
KR101713944B1 (ko) 2015-06-19 2017-03-09 한국과학기술원 신규한 혈관내피세포 성장인자와 결합할 수 있는 폴리펩타이드 및 이의 용도

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Infect Immun. 1997 Dec;65(12):5309-19. *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150135700A (ko) * 2014-05-23 2015-12-03 한국과학기술원 상피세포 성장인자 수용체의 세포외 도메인과 결합하는 신규 폴리펩타이드
KR101587622B1 (ko) 2014-05-23 2016-01-22 한국과학기술원 상피세포 성장인자 수용체의 세포외 도메인과 결합하는 신규 폴리펩타이드
US10364293B2 (en) 2014-05-23 2019-07-30 Korea Advanced Institute Of Science And Technology Polypeptide binding to extracellular domain of epidermal growth factor receptor
KR20210100945A (ko) * 2020-02-07 2021-08-18 한국과학기술원 보체 단백 분해 산물 C3a와 결합할 수 있는 신규한 폴리펩타이드 및 이의 용도
WO2021158092A3 (ko) * 2020-02-07 2021-09-30 한국과학기술원 보체 단백 분해 산물 c3a와 결합할 수 있는 신규한 폴리펩타이드 및 이의 용도
KR102390931B1 (ko) 2020-02-07 2022-04-26 한국과학기술원 보체 단백 분해 산물 C3a와 결합할 수 있는 신규한 폴리펩타이드 및 이의 용도

Also Published As

Publication number Publication date
KR20110099600A (ko) 2011-09-08

Similar Documents

Publication Publication Date Title
KR101219628B1 (ko) 인터날린 단백질의 n-말단 및 lrr 패밀리 단백질이 융합된 수용성 융합 폴리펩타이드 및 이의 제조 방법
JP2021019595A (ja) 非天然コンセンサスアルブミン結合ドメイン
US10378005B2 (en) Recombinant factor H and variants and conjugates thereof
CN108912221A (zh) 用于生产重组融合蛋白的辅助蛋白、编码基因、重组融合蛋白、重组表达载体及制备方法
CN105246503A (zh) Pcsk9的新颖结合蛋白
CN103874501A (zh) Cd40l-特异性tn3-衍生的支架及其使用方法
JPWO2017069158A1 (ja) イムノグロブリン結合ポリペプチド
KR102106773B1 (ko) 목적 단백질의 수용성 및 발현량 증가를 위한 융합 태그 및 이의 용도
KR20220165747A (ko) 표적 rna의 편집방법
KR101587622B1 (ko) 상피세포 성장인자 수용체의 세포외 도메인과 결합하는 신규 폴리펩타이드
US7771970B2 (en) Process for preparation of polypeptides of interest from fusion polypeptides
US10287342B2 (en) Polypeptide for binding to complement protein C5A, and use of same
KR102120335B1 (ko) 노로 바이러스 백신을 생산하기 위한 재조합 발현 벡터
Baumann et al. Identification of a potential modification site in human stromal cell‐derived factor‐1
CN108623690A (zh) 一种促血小板生成素的融合蛋白及其制备方法和应用
KR102140557B1 (ko) 단백질-단백질 결합체를 형성 매개 펩타이드 및 이를 이용한 단백질-단백질 결합체 형성 방법
WO2009148194A1 (ja) 真核細胞において組換えタンパク質を細胞外に放出させるためのポリヌクレオチド
JP2008520208A (ja) タンパク質骨格およびその使用
CN105838686B (zh) 具有催化活性的人猪嵌合尿酸氧化酶
CN106674352B (zh) 抗肿瘤蛋白内皮抑素的衍生物及应用
KR20120088097A (ko) Lrr 융합단백질의 설계 방법
CN109384849A (zh) 一种促血小板生成素的融合蛋白及其制备方法和应用
WO2012048856A1 (en) Proinsulin with helper sequence
CN104945488B (zh) 一种具有免疫球蛋白结合能力的多肽
RU2512527C2 (ru) ИСКУССТВЕННЫЙ ГЕН, КОДИРУЮЩИЙ ХИМЕРНЫЙ БЕЛОК АНГИОГЕНИНА ЧЕЛОВЕКА, ХИМЕРНАЯ ПЛАЗМИДА pJZZ-A, ОБЕСПЕЧИВАЮЩАЯ ЭКСПРЕССИЮ ГЕНА ХИМЕРНОГО БЕЛКА АНГИОГЕНИНА ЧЕЛОВЕКА В Escherichia coli И ШТАММ Escherichia coli BL21(DE3)/pJZZ-A-ПРОДУЦЕНТ РЕКОМБИНАНТНОГО ХИМЕРНОГО БЕЛКА АНГИОГЕНИНА ЧЕЛОВЕКА

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160427

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181218

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 8