KR20060071397A - 4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노,히드록시 치환된 카르복실산 에스테르의 효소적 제조 방법 - Google Patents
4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노,히드록시 치환된 카르복실산 에스테르의 효소적 제조 방법 Download PDFInfo
- Publication number
- KR20060071397A KR20060071397A KR1020067002920A KR20067002920A KR20060071397A KR 20060071397 A KR20060071397 A KR 20060071397A KR 1020067002920 A KR1020067002920 A KR 1020067002920A KR 20067002920 A KR20067002920 A KR 20067002920A KR 20060071397 A KR20060071397 A KR 20060071397A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- gly
- val
- lys
- optionally substituted
- Prior art date
Links
- 0 *OC(CC(CC#N)O)=O Chemical compound *OC(CC(CC#N)O)=O 0.000 description 4
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/002—Nitriles (-CN)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/02—Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 4-할로-3-히드록시부티르산 유도체의 할로히드린 디할로게나아제-촉매 전환에 의한 4-치환된 3-히드록시부티르산 유도체의 제조방법 및 제조용 조성물을 제공한다. 본 발명은 추가로 4-할로-3-케토부티르산 유도체의 케토리덕타아제-촉매 전환에 의한 4-할로-3-히드록시부티르산 유도체의 제조방법 및 제조용 조성물을 제공한다. 본 발명은 또한 이웃자리 시아노, 히드록실 치환된 카르복실산 에스테르의 제조 방법 및 제조용 조성물을 제공한다.
Description
관련 출원의 상호 참고
본 출원은 35 U.S.C. §119(e) 규정하에 U.S.S.N. 60/402,436(2002. 8. 9. 출원)의 우선권을 주장하고 있는, U.S.S.N. 10/639,159(2003. 8. 11. 출원)의 CIP 출원이며, 상기 두 특허 출원은 그 전체로 본 출원에 참고문헌으로 포함된다.
저작권에 관한 통지
본 특허 문서의 공개 내용 중 일부는 저작권으로 보호되는 대상을 포함한다. 저작권자는 특허청에서 특허가 출원되고 등록되는 과정에서 발생하는 특허 문서나 특허 공개 내용이 누군가에 의해 팩스로 복사되는 것에 반대하지 않았으나, 기타 모든 저작권에 관한 권리를 보유한다.
본 발명은 4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 제조하기 위한 신규한 효소적 방법 및 조성물에 관한 것이다.
4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르는 약제의 합성에 있어 상업적으로 중요한 중간체이다. 비라세미 키랄성의 4-치환된 3-히드록시부티르산 에스테르는 아토르바스타틴, 플루바스타틴, 로수바스타틴 및 이타바스타틴과 같은 HMG-CoA 리덕타아제 저해제의 합성에 있어 유용할 수 있다. 예를 들어, (R)-4-시아노-3-히드록시부티르산의 에스테르 및 (3R,5R)-6-시아노-3,5-디히드록시헥산산의 에스테르는 콜레스테롤 저하제인 아토르바스타틴의 생산에 있어 중요한 중간체이다. 특정한 4-치환된 3-히드록시부티르산 에스테르를 제조하는 방법이 알려져 왔다. [Isbell, et al., Carbohydrate Res., 72:301 (1979)]에서는 트레오닌의 일수화물 칼슘 염을 브롬화수소와 반응시켜 트레오닌의 디브로모 유도체(이후 이웃자리 브로모히드린으로 전환됨)를 생산함으로써, (R)-4-시아노-3-히드록시부티르산 에스테르를 합성하는 방법을 보고한다. 브로모히드린의 히드록실기는 시안화나트륨과 반응시키기 전에 보호된다. [Id. Acta Chem. Scand., B37, 341 (1983)]은 시안화나트륨과 반응시키기 전에 보호기로 히드록시기를 보호하는 것이 요구되는, 4-브로모-3-히드록시부티레이트에서 4-시아노-3-히드록시부티레이트를 제조하는 방법을 보고한다. 4-시아노-3-히드록시부티레이트 에스테르를 합성하는 최근의 경로는 히드록실기의 보호없이, 4-브로모 또는 시아노-3-히드록시부티레이트 에스테르를 시아나이드염과 비촉매적으로 화학 반응시키는 것을 포함한다. 그러나, 염기성 시아나이드 음이온(생성물로부터 특히 제거하기 어려움) 에 의해 생성되는 염기성 조건하에서는 부산물이 형성된다. 4-시아노-3-히드록시부티레이트 에스테르은 고비등점 액체이므로, 이러한 부산물로부터 4-시아노-3- 히드록시부티레이트 에스테르를 분리하기 위해서는 진공 분별 증류가 요구된다. 증류 조건은 부가적인 부산물을 생성시키는 경향이 있으며, 완전한 증류는 다소 곤란하다.
4-시아노-3-히드록시부티르산 에스테르의 합성에 있어 출발 물질로 4-클로로-3-히드록시부티르산 에스테르를 사용하는 것은 4-브로모-3-히드록시부티르산 에스테르를 사용하는 것보다 경제적이나, 브로모 치환체에 비해 클로로 치환체가 낮은 반응성을 가지기 때문에, 시아나이드염과의 반응에 있어 보다 촉성 조건(forcing condition)을 요구한다. 4-클로로-3-히드록시부티레이트 에스테르의 시안화가 알칼리 시아나이드로 고온에서 진행되는 동안, 이러한 촉성 조건이 실질적인 부산물의 형성을 초래하며, 이러한 부산물 형성은 대규모의 분리 및 정제 과정을 요구하게 하여 추가적인 수율 소실을 초래한다. 미국 특허 제5,908,953호는 반응하지 않는 출발 물질 이외에, (R)-4-시아노-3-히드록시부티르산의 조(crude) 저급 알킬 에스테르가 히드록시아크릴레이트, 시아노아크릴레이트, 3-시아노부티로락톤, 3-히드록시부티로락톤, γ-크로토노락톤, 3-시아노-4-히드록시부티레이트 저급 알킬 에스테르, 3,4-디시아노부티레이트 저급 알킬 에스테르 및 고비등점을 가지는 비특정된 화합물을 함유할 수 있음을 공개한다. 또한, 미국 특허 제5,908,953호는 10 Torr에서 50~160℃의 비등점을 가지는 용매의 존재하에, 조 혼합물을 증류시키는 것을 포함하는 (R)-4-시아노-3-히드록시부티르산의 저급 알킬 에스테르의 정제 방법을 공개한다. 이러한 증류 방법을 사용하면, 반응하지 않은 출발 물질의 분해가 최소화될 수 있으며, 그렇지 않은 경우 (R)-4-시아노-3-히드록시부티르산 저급 알킬 에스 테르 생산에 있어서 상당한 총소실을 초래한다고 밝히고 있다. 미국 특허 제6,140,527호는 4-히드록시크로톤산 에스테르와 같은 탈수화된 부산물을 화학적 반응으로 제거하여, 성분들을 수용성으로 하거나 추출가능하게 하는 것을 포함하는 (R)-4-시아노-3-히드록시부티르산의 조 저급 알킬 에스테르를 처리하는 대안적인 방법에 대해 공개한다. 그러나, 이러한 방법이 쉽게 이용가능한 출발 물질을 사용하고 있음에도, 이러한 방법은 수율이 현저히 소실되고 생성물 정제가 요구되므로 상업적으로 바람직하지 않다. 따라서, 보다 온화한 조건하에서 비라세미 키랄성의 4-치환된 3-히드록시부티르산 에스테르를 제조하는 보다 효율적인 방법이 바람직할 것이다.
할로히드린 디할로게나아제(또한, 할로알콜 디할로게나아제 또는 할로히드린 수소-할라이드 리아제로도 언급됨)는 이웃자리 할로히드린으로부터 양자 및 할라이드 이온으로 할로겐화수소를 제거하여 해당 에폭시드를 생성하는 반응을 촉매화한다. 이 효소는 또한 역반응도 촉매화한다. [Nagasawa et al., Appl . Microbiol . Biotechnol., vol. 36 (1992) pp. 478-482]은 기타 이웃자리 할로히드린 중에서 4-클로로-3-히드록시부티로니트릴에 대한 특정 할로히드린 수소-할라이드 리아제의 활성을 공개한다. [Nakamura et al., Biochem . Biophys. Research Comm. vol. 180 (1991) pp. 124-130] 및 [Tetrahedron vol. 50 (1994) pp 11821-11826]에서는 특정 에폭시드를 시아나이드와 반응시켜 해당 베타-히드록시니트릴을 생성하는 과정을 촉매화하는 할로히드린 수소-할라이드 리아제의 활성을 공개한다. 이러한 참고문헌 및 미국 특허 제5,210,031호에서, [Nakamura et al.]은 특정 할로히드린 수소-할라 이드 리아제의 존재하에, 에피할로히드린을 알칼리 시아나이드와 반응시켜 해당 4-할로-3-히드록시-부티로니트릴을 생성하는 과정을 공개한다. 미국 특허 제5,166,061호에서, [Nakamura et al.]은 탈할로겐화 효소의 존재하에 1,3-디할로-2-프로판올을 알칼리 시아나이드와 반응시켜, 해당 4-할로-3-히드록시부티로니트릴을 생성하는 과정을 공개한다. [Tetrahedron vol. 50 (1994) pp 11821-11826]에서, [Nakamura et al.]은 정제된 할로히드린 수소-할라이드 리아제를 사용하여, 1,3-디클로로-2-프로판올을 시아나이드와 반응시켜 4-클로로-3-히드록시부티로니트릴을 생성하는 과정을 공개한다.
[Lutje-Spelberg et al., Org. Lett., vol. 2 (2001) pp 41-43]에서는, 특정 산화스티렌을 아지드와 반응시켜 해당 1-페닐-2-아지도-에탄올을 생성하는 과정을 촉매화하는 할로히드린 디할로게나아제의 활성을 공개한다.
발명의 개요
한 양태에서, 본 발명은 4-할로-3-히드록시부티르산 에스테르 또는 아미드로부터 4-시아노-3-히드록시부티르산 에스테르 또는 아미드를 제조하는 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함한다:
(a) 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택됨); 및
(b) 4-할로-3-히드록시부티르산 에스테르 또는 아미드로부터 4-시아노-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 충분한 조건 하에서, 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 할로히드린 디할로게나아제 및 시아나이드와 접촉시키는 단계.
본 발명의 추가의 양태에서, 단계(a)의 4-할로-3-히드록시부티르산 에스테르 또는 아미드는 하기 단계를 포함하는 방법에 의해 제공된다:
4-할로-3-케토부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선됨); 및
4-할로-3-케토부티르산 에스테르 또는 아미드로부터 4-할로-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 충분한 조건 하에서, 4-할로-3-케토부티르산 에스테르 또는 아미드를 케토리덕타아제, 보조인자, 및 보조인자 재생 시스템과 접촉시키는 단계.
다른 양태에서, 본 발명은 4-할로-3-케토부티르산 에스테르로부터 4-시아노-3-히드록시부티르산 에스테르를 제조하는 방법에 관한 것으로서, 상기 방법은 하기를 포함한다:
(a) 4-할로-3-케토부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선됨); 및
4-할로-3-케토부티르산 에스테르 또는 아미드로부터 4-할로-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 충분한 조건 하에서, 4-할로-3-케토부티르산 에스테르 또는 아미드를 케토리덕타아제, 보조인자, 및 보조인자 재생 시스템과 접촉시키는 단계.
다른 구체예에서, 본 발명은 4-할로-3-히드록시부티르산 에스테르 또는 아미드로부터 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드를 제조하는 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함한다:
(a) 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택됨); 및
(b) 4-할로-3-히드록시부티르산 에스테르 또는 아미드로부터 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 충분한 조건 하에서, 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 할로히드린 디할로게나아제 및 친핵체와 접촉시키는 단계.
추가의 구체예에서, 본 발명은 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드를 제조하는 방법에 관한 것으로서, 상기 방법은 하기를 포함한다:
(a) 4-할로-3-케토부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선됨); 및
(b) 4-할로-3-케토부티르산 에스테르 또는 아미드로부터 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 충분한 조건 하에서, 4-할로-3-케토부티르산 에스테르 또는 아미드를 케토리덕타아제, 보조인자, 보조인자 재생 시스템, 친핵체, 및 할로히드린 디할로게나아제와 접촉시키는 단계.
다른 양태에서, 본 발명은 하기를 포함하는 조성물에 관한 것이다:
(a) 할로히드린 디할로게나아제;
(b) 친핵체; 및
(c) 4-할로-3-히드록시부티르산 에스테르 또는 아미드.
본 발명은 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르로부터 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 추가적인 관련 방법 뿐만 아니라, 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르의 제조에 유용한 조성물을 추가로 제공한다.
도면의 간단한 설명
도 1 은 실시예 21에 기술된 바와 같이, 에틸 4-클로로-3-히드록시-부티레이트를 할로히드린 디할로게나아제 (HHDH)의 존재 또는 부재 하의 수용액 상에서 시아나이드와 다양한 pH 에서의 시험 반응에서 측정된 에틸 4-클로로-3-히드록시부티레이트 (클로로히드린) 및 에틸 4-시아노-3-히드록시부티레이트 (시아노히드린)의 양을 나타낸다.
도 2 는 p15A 복제 시발점 (p15 ori), lacI 억제제, T5 프로모터, T7 리보솜 결합 부위 (T7g10), 및 클로람페니콜 내성 유전자 (camR)을 포함하는 본 발명의 3944 bp 발현 벡터 (pCK110700)를 나타낸다.
도 3 은 p15A 복제 시발점 (p15 ori), lacI 억제제, CAP 결합 부위, lac 프로모터 (lac), T7 리보솜 결합 부위 (T7g10 RBS), 및 클로람페니콜 내성 유전자 (camR)를 포함하는 본 발명의 4036 bp 발현 벡터 (pCK110900)를 나타낸다.
도 4 는 실시예 25 내지 29 에 기술된 다양한 할로히드린 디할로게나아제 효소의 존재 하에 에틸 (S)-4-클로로-3-히드록시부티레이트와 수성 시안화수소산의 반응에 대한 % 전환율 대 시간을 나타낸 것이다.
발명의 상세한 설명
본 발명은 해당 4-할로-3-히드록시부티르산 에스테르 및 아미드 기질로부터 다양한 4-치환된 3-히드록시부티르산 에스테르 및 아미드를 제조하기 위한 효소적 방법 및 조성물을 제공한다. 본 발명은 또한 이웃자리 할로, 히드록시 치환된 카르복실산으로부터 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 제조하기 위한 방법 및 조성물을 제공한다.
I. 4-할로-3- 히드록시부티르산 유도체의 할로히드린 디할로게나아제 -촉매 전환
본 발명은 4-할로-3-히드록시부티르산 에스테르 또는 아미드로부터 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드를 제조하는 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함한다:
(a) 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택됨); 및
(b) 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 적절한 조건 하에서, 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 할로히드린 디할로게나아제 및 친핵체와 접촉시키는 단계.
현저하게, 본 발명의 방법은 부산물 형성이 최소화되는 4-치환된 3-히드록시부티르산 에스테르 및 아미드의 제조 방법을 제공한다.
본 발명의 수행에서의 사용을 위해 적합한 친핵체는 4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질의 할로 치환체를 대체할 수 있는 것들이다. 본 발명에서 이용되는 전형적인 친핵체는 음이온성 친핵체이다. 예시적인 친핵체는 시아나이드 (CN-), 아지드 (N3 -), 및 나이트라이트 (ONO-)를 포함한다.
특정 구체예에서, 본 발명은 4-할로-3-히드록시부티르산 에스테르 또는 아미드로부터 할로히드린 디할로게나아제-촉매 반응을 통해 4-시아노-3-히드록시부티르산 에스테르 또는 아미드를 제조하는 방법을 제공하며, 상기 방법은 하기 단계를 포함한다:
(a) 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 제공하는 단계;
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택됨); 및
(b) 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-시아노-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위한 반응 혼합물을 형성하기에 적합한 조건 하에서, 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 할로히드린 디할로게나아제 및 시아나이드와 접촉시키는 단계.
본원에서, 용어 "시아나이드" 는 시아나이드 음이온 (CN-), 시안화수소산 (HCN), 및 이의 혼합물을 지칭한다. 시아나이드는 시아나이드염, 전형적으로는 알칼리염 (예를 들어, NaCN, KCN, 등)의 형태, 시안화수소산 (기체 또는 용액상)의 형태, 또는 이의 혼합물로 제공될 수 있다.
본 발명의 실시에 사용되는 4-할로-3-히드록시부티르산 에스테르 및 아미드는 본원에 기술된 방법, 또는 대안적으로 당업자에게 잘 공지된 방법을 사용하여 제조될 수 있다. 이러한 방법들은, 예를 들어, 미국 특허 제 5,891,685 호; Hallinan, et al., Biocatalysis and Biotransformation, 12:179-191 (1995); Russ . Chem . Rev ., 41:740 (1972); Kataoka, et al., Appl . Microbiol . Biotechnol ., 48:699-703 (1997); 및 미국 특허 제 5,430,171 호에 기술된다.
본 발명의 실시에서 사용된 적절한 4-할로-3-히드록시부티르산 에스테르 및 아미드 기질은 각각 하기 구조 IA 및 1B 를 갖는 것들이다:
식 중,
X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐이고;
R1, R2, R3, R4, 및 R6 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 및 임의 치환된 아릴알콕시로 이루어진 군으로부터 선택되며;
R5 는 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택되며;
R7 및 R8 은 각각 독립적으로 수소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택된다.
"임의 치환된" 은 본원에서 수소를 일가 라디칼로 치환하는 것을 지칭한다. 적절한 치환기는, 예를 들어, 히드록실, 알킬, 저급 알킬, 알콕시, 저급 알콕시, 알케닐, 저급 알케닐, 니트로, 아미노, 시아노, 할로겐 (즉, 할로), 티오, 등을 포함한다. 기타 적절한 치환기는 카르복시 (즉, 카르복실레이트 또는 카르복실산 기), 카르보알콕시 (즉, 에스테르 기), 카르바미드 (즉, 아미드 기), 및 아실 (즉, 케톤을 형성)을 포함한다.
용어 "저급 알킬" 은 비치환되거나, 예를 들어, 하나 이상의 할로, 히드록실 또는, 예를 들어, 메틸, 에틸, 프로필, 이소프로필, n-부틸, i-부틸, t-부틸, 트리플루오로메틸, 등을 포함하는 기타 기들로 치환되는 1 내지 약 6개의 탄소 원자를 갖는 분지형 또는 직쇄형 알킬기를 지칭하는 것으로 본원에서 사용된다. 용어 "시클로알킬" 은 하나 이상의 고리 원자가 헤테로원자이고, 기타 원자들이 탄소 원자인, 3 내지 약 6 개의 탄소 원자를 갖는 헤테로시클릭 알킬 부분 뿐만 아니라 3 내지 약 6 개의 탄소 원자를 갖는 카르보시클릭 알킬 부분을 지칭한다. "헤테로원자" 는 본원에서 산소, 질소, 또는 황을 지칭한다.
용어 "저급 알케닐" 은 하나 이상의 이중 결합 및 2 내지 약 6개의 탄소 원자를 갖는 분지형 또는 직쇄형 기를 지칭한다. 본 발명의 실시에서 사용된 저급 알케닐 기는 예를 들어, 할로, 히드록실, 저급 알킬, 등을 포함하는 본원에 기술된 기로 임의 치환될 수 있다.
본원에서, 용어 "저급 알콕시" 는 R 이 저급 알킬 또는 저급 알케닐인 -OR을 지칭한다. 본 발명의 실시에서 사용된 적절한 저급 알콕시기는 메톡시, 에톡시, t-부톡시, 트리플루오로메톡시, 등을 포함한다. 용어 "아릴옥시" 는 본원에서 R이 아릴인 RO- 를 지칭한다. 본원에서, 용어 "아릴" 은 3 내지 약 14 개의 골격 탄소 또는 헤테로원자를 갖는 모노시클릭 및 폴리시클릭 방향족 기를 지칭하며, 카르보시클릭 아릴기 및 헤테로시클릭 아릴기 모두를 포함한다. 카르보시클릭 아릴기는 방향족 고리 내에 모든 고리 원자가 탄소인 아릴기이다. 헤테로시클릭 아릴기는 탄소 원자인 고리 원자의 잔존물과 함께 방향족 고리 내의 고리 원자와 같이 1 내지 약 4 개의 헤테로원자를 갖는 아릴기이다. 본 발명의 치환체로서 사용된 예시적인 아릴기는, 예를 들어, 페닐, 피리딜, 피리미디닐, 나프틸, 등을 포함한다.
용어 "아릴알킬" 은 아릴기로 치환된 알킬기이다. 예시적인 아릴알킬기는 벤질, 피콜릴, 등을 포함한다. 치환된 아릴알킬기는 아릴알킬기의 아릴 또는 알킬 부분, 또는 아릴 및 알킬 모두가 치환될 수 있다. 본원에서, 용어 "아릴알콕시" 는 R이 아릴알킬인 RO- 를 지칭한다.
용어 "시클로알콕시" 는 본원에서 R이 임의 치환된 C3-C8 시클로알킬인 RO- 를 지칭한다. 용어 "아미노" 는 -NH2 기를 지칭하는 것으로 사용된다. 용어 "저급 알킬아미노" 는 본원에서 R이 수소 또는 저급 알킬이고, R' 는 저급 알킬인 -NRR'기를 지칭한다. 용어 "시클로알킬아미노" 는 본원에서 R이 3 내지 약 8 개의 탄소 원자를 갖는 임의 치환된 이가 지방족 라디칼이어서, N 및 R 이 시클릭 구조, 예를 들어, 피롤리디노, 피페리디노, 등을 형성하는 -NR 기를 지칭한다.
본 발명의 실시에서 사용될 수 있는 화합물 IA 의 구체적인 4-할로-3-히드록시부티르산 에스테르는 에틸 4-클로로-3-히드록시부티르산 에스테르 (즉, X는 염소, R1, R2, R3, R4, 및 R6 은 수소이고, R5 은 에틸), 메틸 4-클로로-3-히드록시부티르산 에스테르 (즉, X는 염소, R1, R2, R3, R4 및 R6 은 수소이고 R5 은 메틸), 에틸 4-브로모-3-히드록시부티르산 에스테르 (즉, X는 브롬, R1, R2, R3, R4, 및 R6 은 수소이고 R5 는 에틸), 메틸 4-브로모-3-히드록시부티르산 에스테르 (즉, X는 브롬, R1, R2, R3, R4, 및 R6 는 수소이고, R5 는 메틸), t-부틸-4-클로로-3-히드록시부티르산 에스테르 (즉, X는 염소, R1, R2, R3, R4, 및 R6 은 수소이고, R5 는 t-부틸), t-부틸-4-브로모-3-히드록시부티르산 에스테르 (즉, X는 브롬, R1, R2, R3, R4, 및 R6 은 수소이고, R5 는 t-부틸), 및 t-부틸-4-요오도-3-히드록시부티르산 에스테르 (즉, X는 요오드, R1, R2, R3, R4, 및 R6 은 수소이고, R5 는 t-부틸)를 포함한다. 특정 구체예에서, 하나 이상의 R1, R2, R3, R4, 및 R6 은 저급 알킬, 예컨대, 예를 들어, 메틸, 에틸, 또는 프로필이다.
본 발명의 실시에서 사용될 수 있는 화합물 IB의 적절한 4-할로-3-히드록시부티르산 아미드는 4-클로로-3-히드록시부티르 아미드 (즉, X는 염소, R1, R2, R3, R4, R6, R7, 및 R8 은 수소), 4-브로모-3-히드록시부티르 아미드 (즉, X는 브롬, 및 R1, R2, R3, R4, R6, R7, 및 R8은 수소), 및 4-요오도-3-히드록시부티르 아미드 (즉, X는 요오드, R1, R2, R3, R4, R6, R7, 및 R8 은 수소)를 포함한다. 특정 구체예에서, 하나 이상의 R1, R2, R3, R4, 및 R6 은 저급 알킬, 예컨대, 예를 들어, 메틸, 에틸, 또는 프로필이다.
4-할로-3-히드록시부티르산 에스테르 및 아미드 기질의 4-할로 치환체는 바람직하게는 염소 및 브롬으로부터 선택된다. 4-클로로-3-히드록시부티르산 에스테르 및 아미드 기질이 특히 바람직하다.
본 발명의 방법에 의해 제조된 4-치환된-3-히드록시부티르산 에스테르 및 아미드는 각각 하기 구조 IIA 및 IIB를 갖는 것들을 포함한다:
식 중,
R1, R2, R3, R4, R5, R6, R7, 및 R8 구조 IA 및 IB 에 대해 정의된 바와 같고;
Nu 는 -CN, -N3, 및 -ONO 로 이루어진 군으로부터 선택된다.
화합물 IA의 구조를 갖는 4-할로-3-히드록시부티르산 에스테르 기질이 시아나이드 및 할로히드린 디할로게나아제와 반응하는 경우, 하기 화합물 III의 구조를 갖는 4-시아노-3-히드록시부티르산 에스테르 생성물이 제조된다:
식 중, R1, R2, R3, R4, R5, 및 R6 은 구조 IA 에 대해 정의된 바와 같다.
할로히드린 디할로게나아제는 친핵체의 존재 하에 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 해당 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 촉매시키기 위해 본 발명의 실시에서 사용된다. 용어 "할로히드린 디할로게나아제" 및 "HHDH" 는 본 발명의 방법에서, 각각 시아나이드와 같은 친핵체의 존재 하에서 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르 또는 아미드의 이웃자리 시아노, 히드록실 치환된 카르복실산 에스테르 또는 아미드로의 전환, 예컨대, 예를 들어, 4-할로-3-히드록시부티르산 에스테르 및/또는 아미드의 4-친핵체 치환된-3-히드록시부티르산 에스테르 및/또는 아미드로의 전환을 촉매하는 효소를 지칭하는 것으로 본원에서 상호 교환적으로 사용된다. 적절한 할로히드린 디할로게나아제는 자연발생적인 (야생형) 할로히드린 디할로게나아제 뿐만 아니라, 인간의 조작에 의해 발생된 비자연발생적인 할로히드린 디할로게나아제를 포함한다. 예시적인 자연발생적 및 비자연발생적인 할로히드린 디할로게나아제 및 할로히드린 디할로게나아제를 코딩하는 폴리뉴클레오타이드는 본원에 기술된 것들을 포함한다.
자연발생적인 할로히드린 디할로게나아제를 코딩하는 유전자는 아그로박테리움 라디오박터 AD1 (hheC ), 아그로박테리움 투메파시엔스 ( halB ), 코리네박테리움 종. (hheA 코딩하는 Ia 및 hhB 코딩하는 Ib), 아트로박터 종. (hheA AD2), 및 미코박 테리움 종. GP1 (hheB GP1 )에서 확인되었다. 문헌[van Hylckama Vlieg, J.E.T., L. Tang, J.H. Lutje Spelberg, T. Smilda, G.J. Poelarends, T. Bosma, A.E.J. van Merode, M.W. Fraaije & Dick B. Janssen, "Halohydrin Dehalogenases are structurally and mechanistically related to short-chain dehydrogenases/reductases(2001) Journal of Bacteriology, 183:5058-5066]을 참조한다 (임의 배열의 이러한 할로히드린 디할로게나아제에 대한 아미노산 서열을 제공).
이러한 자연발생적인 할로히드린 디할로게나아제는 어느 정도 특징화되어 있다. 아그로박테리움 라디오박터 AD1의 HHDH 는 28 kD 서브유닛의 동형사중체이다. 코리네박테리움 종. N-1074 두 개의 HHDH 효소를 생산하는데, 이중 하나는 28 kD 서브유닛 (Ia)으로 이루어지는 반면, 나머지 하나는 35 및/또는 32 kD (Kb)의 관련 서브유닛으로 이루어진다. 일부 소스로부터의 HHDH 는 산화 조건 하, 서브유닛의 해리를 초래하는 방법에서 쉽게 불활성화되며, pH 8 내지 9 의 광범위한 pH 최적값 및 50℃의 최적 온도 (Tang, Enz . Microbiol . Technol . (2002) 30:251-258; Swanson, Curr . Opinion Biotechnol . (1999) 10:365-369).를 가진다. HHDH 촉매된 에폭시드 형성을 위한 최적의 pH는 8.0 내지 9.0 이며 최적 온도는 45 내지 55℃ 범위이다 (Van Hylckama Vlieg, et al., J. Bacteriol . (2001) 183:5058-5066; Nakamura, et al., Appl . Environ . Microbiol . (1994) 60:1297-1301; Nagasawa, et al., Appl . Microbiol . Biotechnol . (1992) 36:478-482). 역반응, 클로라이드에 의한 개환을 위한 최적 pH 는 두 종류의 코네박테리움(Cornebacterium ) 종. N-1074 효소에 대해 보고되었으며 7.4 (Ia) 또는 5 (Ib)이다. 아그로박테리움 라디오박터 AD1로부터 할로히드린 디할로게나아제를 코딩하는 폴리뉴클레오타이드는 본원에서 서열번호 13, 15, 및 17 로서 제공된다. 서열번호 13, 15, 및 17 에 해당하는 폴리뉴클레오타이드는 동일한 아미노산 서열 (번역된 서열은 서열번호 14, 16, 및 18 로서 제공된다)을 코딩하는 변이체이다.
비자연발생적인 할로히드린 디할로게나아제는 공지된 방법, 예를 들어, 돌연변이 생성, 방향적 진화(directed evolution) 등을 이용하여 제조될 수 있다. 일부 예시적 방법이 이하에 기술된다. 효소들은 실시예 4 에 기술된 방법을 이용하여 활성에 대해 쉽게 스크리닝될 수 있다. 이러한 스크리닝 방법은 또한 기타 자연발생적인 할로히드린 디할로게나아제를 확인하는데에 쉽게 적용될 수 있다. 적절한 비자연발생적인 할로히드린 디할로게나아제는 서열번호 24 (HHDH B-03), 26 (HHDH C-04), 28 (HHDH E-01), 30 (S01056858), 32 (HHDH 2G5), 34 (HHDH Mz1.1A5), 36 (HHDH cys1.10), 38 (HHDH cys2.12), 74 (HHDH B-12), 76 (HHDH Mz1/4H6), 78 (HHDH F-04), 80 (HHDH A-08), 82 (HHDH G9), 84 (HHDH F9), 86 (HHDH H10), 88 (HHDH A1), 90 (HHDH A-03), 92 (HHDH E-03), 94 (HHDH S00827801), 96 (HHDH S00890554), 98 (HHDH S00994580), 100 (HHDH S01018044), 102 (HHDH S01035939), 104 (HHDH S01009684), 106 (HHDH S00817219), 108 (HHDH S00708827), 110 (HHDH S00772501), 112 (HHDH S01035968), 및 114 (HHDH S01040430)에 해당하는 것들을 포함한다. 이러한 할로히드린 디할로게나아제를 코딩하는 예시적인 폴리뉴클레오타이드 서열은 각각 서열번호 23, 25, 27, 29, 31, 33, 35, 37, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 및 113 에 해당하는 것들이다. 본 발명의 실시에서의 사용에 적절한 추가의 비자연발생적인 할로히드린 디할로게나아제는 "Improved Halohydrin Dehalogenases and Related Polynucleotide" (Attorney Docket No. 0353.110US, 2003/08/11 출원, 미국 출원 일련번호 60/494,382)이라는 제목의 출원, 및 "Improved Halohydrin Dehalogenases and Related Polynucleotide" (Attorney Docket No. 0353.210US, 2004/02/18 출원, 미국 출원 일련번호 ____________ )이라는 제목의 출원에 제공되며, 상기 모두는 그 전체가 본원에 참조로서 포함된다.
본 발명의 실시에서의 사용을 위해 적절한 할로히드린 디할로게나아제는, 자연발생적 또는 비자연발생적이건 간에, 실시예 4 에 기술된 방법 및 해당 이웃자리 할로, 히드록실 치환된 기질 및 친핵체를 이용하여 당업자에 의해 쉽게 확인될 수 있다. 본 발명의 실시에서 사용된 할로히드린 디할로게나아제는 실시예 4 에 기술된 분석에서 전형적으로 약 1 μmol/min/mg 이상의 활성을 나타낸다. 본 발명의 실시에서 사용된 할로히드린 디할로게나아제는 약 10 μmol/min/mg 이상, 및 때로는 약 102 μmol/min/mg 이상, 및 약 103 μmol/min/mg 이하 또는 이상의 활성을 나타낸다.
할로히드린 디할로게나아제는 정제된 효소, 세포 추출물, 세포 용해물, 또는 할로히드린 디할로게나아제를 코딩하는 유전자로 형질 전환된 전세포의 형태로 반응 혼합물에 제공될 수 있다. 할로히드린 디할로게나아제를 코딩하는 유전자로 형질 전환된 전세포 및/또는 이의 세포 추출물 및/또는 이의 세포 용해물은 고체 (예를 들어, 동결 건조, 분무 건조, 등) 또는 반고체 (예를 들어, 미정제 페이스트)를 포함하는 여러 다른 형태로 사용될 수 있다. 세포 추출물 또는 세포 용해물은 침전 (암모늄 설페이트, 폴리에틸렌이민, 열 처리 등)에 의해 부분 정제될 수 있으며, 동결 건조 이전에 탈염 공정을 수반한다 (예를 들어, 한외여과, 투석, 등). 임의의 세포 준비는 공지된 가교제, 예컨대, 예를 들어, 글루타르알데히드를 이용한 가교 또는 고체상으로의 부동태화 (예를 들어, Eupergit C, 등)에 의해 안정화될 수 있다.
고체 반응물 (예를 들어, 효소, 염 등)은 분말 (예를 들어, 동결 건조, 분무 건조, 등), 용액, 에멀젼, 현탁액, 등을 포함하는 여러 다른 형태로 제공될 수 있다. 반응물은 당업자에게 공지된 방법 및 장비를 이용하여 쉽게 동결 건조 또는 분무 건조될 수 있다. 예를 들어, 단백질 용액은 소분취액으로 -80℃에서 동결될 수 있으며, 이후 예비 냉각시킨 동결 건조 챔버에 첨가하고, 이어서 진공을 적용시킨다. 샘플로부터 물을 제거한 후, 진공의 방출 및 동결 건조된 샘플의 회복 전에 온도를 2시간 동안 4℃ 로 상승시켰다.
4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질의 해당 4-친핵체 치환된-3-히드록시부티르 에스테르 또는 아미드 생성물로의 전환을 수행함에 있어서,기질은 보통 용매 중에서 할로히드린 디할로게나아제 및 친핵체와 접촉된다. 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 수행하는데 있어서 적절한 용매는, 물, 유기 용매 (예를 들어 에틸 아세테이트, 부틸 아세테이트, 1-옥탄올, 헵탄, 옥탄, 메틸 t-부틸 에테르 (MTBE), 톨루엔, 등), 이온성 액체 (예를 들어, 1-에틸 4-메틸이미다졸륨 테트라플루오로보레이트, 1-부틸-3-메틸이미다졸륨 테트라플루오로보레이트, 1-부틸-3-메틸이미다졸륨 헥사플루오로포스페이트, 등), 및 수성 공용매 시스템 등을 포함하는 공용매 시스템을 포함한다. 바람직한 용매는 물 및 수성 공용매 시스템을 포함하는 수성 용매이다.
예시적인 수성 공용매 시스템은 물 및 하나 이상의 유기 용매를 가진다. 일반적으로, 수성 공용매 시스템의 유기 용매 성분은 본 발명의 방법에서 사용되는 효소 촉매를 완전히 불활성시키지 않게끔 선택된다. 적절한 공용매 시스템은 실시예 4 에 기술된 효소 분석을 이용하여, 후보 용매 시스템들 중 해당 기질과의 효소 활성을 측정함으로써 쉽게 확인될 수 있다.
수성 공용매 시스템의 유기 용매 성분은 단일 액체상인 경우 수성 성분과 혼화될 수 있고, 또는 두가지 액체 상인 경우에는 부분적으로 수성 성분과 혼화될 수 있거나 그렇지 않을 수도 있다. 보통, 수성 공용매 시스템이 사용되는 경우, 유기 용매 중에 분산된 물, 또는 그 반대의 이상(biphasic)으로 선택된다. 일반적으로, 수성 공용매 시스템이 사용되는 경우, 수성상으로부터 쉽게 분리될 수 있는 유기 용매를 사용하는 선택하는 것이 바람직하다. 일반적으로, 공용매 시스템 중의 물 대 유기 용매의 비율은 보통 약 90:10 내지 약 10:90 (v/v) 유기 용매:물, 및 80:20 및 20:80 (v/v) 유기 용매:물이다. 공용매 시스템은 반응 혼합물에 첨가 이전에 미리 형성될 수 있거나, 반응 용기 중에서 현장 제조될 수 있다.
수성 용매 (물 또는 수성 공용매 시스템)는 pH-완충 또는 비완충될 수 있다. 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환은 약 5 이상의 pH 에서 수행될 수 있다. 일반적으로, 상기 전환은 약 10 이하의 pH, 보통 약 5 내지 약 10 범위의 pH 에서 수행된다. 전형적으로, 상기 전환은 약 9 이하의 pH, 보통 약 5 내지 약 9 범위의 pH 에서 수행된다. 바람직하게는, 상기 전환은 약 8 이하의 pH, 보통 약 5 내지 약 8 범위, 보다 바람직하게는 약 6 내지 약 8의 pH 에서 수행된다. 상기 전환은 ㄸ또rrㅎ한 약 7.8 이하, 또는 7.5 이하의 pH 에서 수행될 수 있다. 대안적으로는 상기 전환은 중성 pH, 즉, 약 7 에서 수행될 수 있다.
상기 전환 동안, 반응 혼합물의 pH 는 변할 수 있다. 반응 혼합물의 pH 는 전환 동안 산 또는 염기를 첨가하여 목적하는 pH 또는 목적하는 pH 범위 내에서 유지될 수 있다. 대안적으로, pH 변화는 완충액을 포함하는 수성 용매를 이용하여 조절될 수 있다. 목적하는 pH 범위를 유지하기 위한 적절한 완충액은 당업계에 공지되어 있으며, 예를 들어, 포스페이트 완충액, 트리에탄올아민 완충액, 등을 포함한다. 완충액 및 산 또는 염기 첨가의 조합도 사용될 수 있다.
상기 기술한 바와 같이, 4-시아노-3-히드록시부티르산 유도체로의 전환이 요구되는 경우, 시아나이드는 시아나이드염의 형태, 전형적으로 알칼리 염 (예를 들어, NaCN, KCN, 등), 시안화수소산 (기체 또는 용액상)의 형태, 또는 이의 혼합물로 제공될 수 있다. 시안화수소산은 약산이다. pKa의 일부 pH 단위 내의 수용액에서 (물 중 pKa = 9.1), 시아나이드는 평형 농도의 CN-및 HCN 로서 존재한다. 약 9 미만의 pH 값에서, 시아나이드는 우세하게 HCN 로서 존재한다.
시아나이드가 시아나이드염에 의해 제공되는 경우, 반응 혼합물은 목적하는 pH를 제공하기 위해 전형적으로 완충 또는 산성화될 수 있거나 두 경우 모두 해당될 수 있다. 염기성 시아나이드 염 용액의 산화를 위한 적절한 산으로는 유기산, 예를 들어 카르복실산, 설폰산, 포스폰산, 등, 무기산, 예를 들어 할로겐화수소산 (예컨대 염산), 황산, 인산, 등, 산성염, 예를 들어 디수소포스페이트 염 (예를 들어 KH2PO4), 바이설페이트 염 (예를 들어 NaHSO4) 등 뿐만 아니라, 시안화수소산도 포함한다. 시아나이드염을 산성화시키는 데 사용되는 산 또는 산염은 생성된 용액 중 완충액을 제공하기 위해서도 선택될 수 있다. 예를 들어, 인산 또는 디수소포스페이트 염을 이용한 산성화는 포스페이트 완충액(약 pH 6-8) 범위의 HCN 포스페이트 완충 용액을 제공하기 위해 사용될 수 있다.
시아나이드가 시안화수소산에 의해 제공되며 이렇게 해서 생성된 더 높은 pH 가 요구되는 경우, 반응 혼합물은 보통 완충되거나 목적하는 pH 를 제공하기 위해 염기를 첨가하여 덜 산성화된다. 시안화수소산의 중화를 위한 적절한 염기는 유기 염기, 예를 들어 아민, 알콕시드 등, 및 무기 염기, 예를 들어, 히드록시드염 (예를 들어 NaOH), 카르보네이트염 (예를 들어 NaHCO3), 바이카르보네이트염 (예를 들어 K2CO3), 염기성 포스페이트 염 (예를 들어 K2HPO4, Na3PO4) 등 뿐만 아니라, 시아나이드염이 있다.
시아나이드가 우세하게는 HCN으로서 존재하는 약 9 미만의 pH 에서, 반응식 (1)은 비완충된 수성 반응 혼합물 중에서 4-할로-3-히드록시부티르산 에스테르와HCN 와의 할로히드린 디할로게나아제 촉매 반응을 기술한다.
약산 (pKa ~9)인 시안화수소산의 소비 및 강산 (pKa <0)인 할로겐화수소산의 방출은, 수성 할로겐화수소산(H+ + X-)이 중화되지 않는다면, 반응 혼합물의 pH 를 낮추게 된다. 반응 혼합물의 pH 는 완충액이 제공된 완충액 능력까지 할로겐화수소산을 중화시키는 표준 완충액 기술에 의해, 또는 전환 동안 동시에 염기를 첨가함으로써 목적하는 수준에서 유지될 수 있다. 이러한 첨가는 반응 혼합물 pH 를 모니터링하면서 수동으로 수행할 수 있거나, 보다 편리하게는, pH 스탯으로서 자동 적정기를 이용하여 수행할 수 있다. 부분적 완충액 능력 및 염기 첨가의 조함도 공정 제어를 위해 사용될 수 있다.
pH 가 전환 동안 완충액 또는 염기의 첨가로서 유지되는 경우, 수성 할로겐화수소산보다 수성 할라이드염이 전체 공정 동안의 생성물이다. 예를 들어, 반응식 (2) 는 수성 수산화나트륨 (Na+ + OH-) 이 초기 pH 를 약 9 미만으로 유지하기 위해 반응 동안 첨가되는 경우의 총 반응을 나타낸다.
생성되는 할로겐화수소산을 중화시키기 위해 염기로서 시아나이드염이 첨가되는 구체예에서, 중화는 HCN 를 재생시키고 반응 혼합물 중의 pH 뿐만 아니라 총 시아나이드 농도 (HCN + CN-)를 유지한다. 이는 전환율이 시아나이드 농도가 감소함에 다라 감소하지 않는다면 유리할 수 있다. 예를 들어, 반응식 (3)은 수성 시안화나트륨 (Na+ + CN-) 이 초기 pH 를 유지하기 위해 반응 동안 첨가되는 경우의 총 반응을 나타낸다. 시아나이드가 반응 혼합물 중 HCN 으로서 우세하게 존재하며, HCN 농도는 총 전환이 첨가된 염기성 시아나이드염을 소비하면서 유지된다.
염기의 첨가가 4-할로-3-히드록시부티레이트 에스테르 또는 아미드의 4-시아노-3-히드록시부티르산 에스테르 또는 아미드로의 할로히드린 디할로게나아제-촉매 반응 동안 방출된 할로겐화수소산을 중화시키는 데 사용되는 경우, 전환의 진행은 pH 조절을 위해 첨가된 염기의 양에 의해 모니터될 수 있다. 보통 전환 동안에 비완충된 또는 부분적으로 완충된 반응 혼합물에 첨가된 염기는 수용액에 첨가된다.
친핵체가 반응 용액의 초기 pH 보다 현저하게 미만인 pKa 를 가지는 강산의 컨쥬게이트 음이온인 경우, 친핵체는 우세하게는 이의 음이온 형태로 존재하여, HCN과는 달리, 양이온이 이의 반응 상에 방출되지 않는다. 따라서, 이러한 친핵체들의 반응에서 반응 혼합물의 pH는 화학량론적 완충액 또는 염기의 첨가 없이 유지될수 있다. 예를 들어, 아지드의 컨쥬게이트 산, 히드라조산은 4.7 의 pKa를 가지며 나이트라이트의 컨쥬게이트 산, 아질산은, 3.3 의 pKa를 가진다. 따라서, 중성 pH 에서, 이러한 친핵체는 우세하게는 각각 이들의 음이온 형태, N3 -및 ONO- 로 존재한다. 즉, 중성 반응 혼합물은 각각 수성 아지드 및 나이트라이트 염을 포함한다. 이러한 혼합물 중 이들의 반응은 할라이드 음이온을 방출하여 수성 할로겐화수소산이 아닌 수성 할라이드염을 형성한다.
당업자는 예를 들어 실시예 4 의 방법에 의해 측정되는 HHDH의 활성에 기초한 HHDH, 4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질 및 친핵체의 양, 목적하는 생성물의 양 등을 쉽게 결정할 수 있다. 예시를 위해, 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 양은 약 10 mg 내지 약 30 g 의 할로히드린 디할로게나아제를 사용하여 약 10 내지 약 500 g/L의 범위일 수 있다. 친핵체의 화학량론적 양은 쉽게 결정될 수 있다. 추가의 예시적 실시예들이 본원에 제공된다.
본 발명의 HHDH-촉매 전환을 수행하기 위한 적절한 조건은 HHDH, 4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질, 및 친핵체를 실험적 pH 및 온도에서 접촉시키는 것과 예를 들어, 본원에 제공된 실시예에 기술된 방법을 이용한 생성물을 검출하는 것을 포함하는 통상의 실험에 의해 바로 최적화될 수 있는 다양한 ㅈ조건들을 포함한다. 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 HHDH-촉매 전환은 전형적으로 약 15℃ 내지 약 75℃의 온도 범위에서 수행된다. 보다 전형적으로, 상기 반응은 약 20℃ 내지 약 55℃, 및 전형적으로 약 20℃ 내지 약 45℃ 범위의 온도에서 수행된다. 상기 반응은 실온 조건 하에서 수행될 수도 있다.
4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 HHDH-촉매 전환은 일반적으로 기질 전환의 완료 또는 완료 근접까지 진행되는 것이 허용된다. 기질의 생성물로의 전환은 기질 및/또는 생성물을 검출함으로써 공지된 방법을 이용하여 모니터될 수 있다. 적절한 방법은 기체 크로마토그래피, HPLC, 등을 포함한다. 반응 혼합물에서 생성된 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드의 수율은 일반적으로 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 및 약 90% 이상일 수도 있다.
4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드는 반응 혼합물로부터 수집될 수 있고 실시예에 기술된 방법 뿐만 아니라 당업자에게 공지된 방법을 이용하여 임의 정제될 수 있다.
본 발명의 바람직한 4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질은 키랄성, 3-위치에서 입체성이며, 라세미 또는 비라세미일 수 있다. 본 발명의 방법에서 사용되는 특정 할로히드린 디할로게나아제 효소는 입체성 3-위치에서 절대 입체화학을 보유하면서 키랄성의 기질을 4-시아노-3-히드록시부티르산 에스테르 또는 아미드로 전환시킨다. 비라세미 키랄성의 4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질은 실질적으로 동일한, 입체순도 손실이 거의 없거나 전혀 없는 비라세미 4-시아노-3-히드록시부티르산 에스테르 또는 아미드로 전환될 수 있다. 실시예는 높은 거울상 이성질체 순도를 제공하는 본 발명의 구체예를 보여준다 (입체화학을 나타내기 위한 규정에 기인하여, (S)로서 나타나는 에틸 4-클로로-3-히드록시부티레이트의 거울상 이성질체 및 (R)로서 나타나는 에틸 4-시아노-3-히드록시부티레이트 거울상 이성질체는 3-위치에서 동일한 입체배위를 가진다).
본 발명의 기타 구체에에서, 특정 할로히드린 디할로게나아제 효소는 키랄성의 4-할로-3-히드록시부티르산 에스테르 또는 아미드 기질의 하나의 입체 이성질체에 대해 입체 특이적일 수 있다. 이러한 입체 특이적 효소를 이용하는 본 발명의 방법은 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 입체 이성질체 혼합물의 하나의 입체 이성질체, 예를 들어 라세미 혼합물을 반응시키면서, 기타의 입체 이성질체는 실질적으로 비반응 상태로 하여, 혼합물의 반응 속도의 해결을 제공한다.
본 발명의 추가의 현저한 특징은 발생된 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드 생성물의 순도가 진공 증류와 같은 광범위한 정제 과정의 필요없이 아주 높다는 점이다. 전형적으로, 본 발명의 방법에 따라 생성된 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드 생성물의 순도는 약 80% 이상, 보통 약 90% 이상, 및 보통 약 95% 이상이다. 생성물 순도는 통상적인 방법 예컨대 HPLC 또는 기체 크로마토그래피로 특정될 수 있다.
II
.
할로히드린의
케토리덕타아제
-촉매 제조
본 발명은 추가로 하기 단계에 의해 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 생성하는 효소적 방법을 제공한다:
(a) 4-할로-3-케토부티르산 에스테르 또는 아미드를 제공하는 단계
(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택됨),
(b) 4-할로-3-케토부티르산 에스테르 또는 아미드를 4-할로-3-히드록시부티르산 에스테르 또는 아미드로 전환시키기 위한 반응 혼합물을 형성하기에 적절한 조건 하에서, 4-할로-3-케토부티르산 에스테르 또는 아미드를 케토리덕타아제, 보조인자, 및 보조인자 재생 시스템과 접촉시키는 단계.
용어 "케토리덕타아제" 및 "KRED" 는 본 발명의 방법에서 4-할로-3-케토부티르산 에스테르 또는 아미드의 해당 4-할로-3-히드록시부티르산 에스테르 또는 아미드로의 환원을 촉매하는 효소를 지칭하는 것으로서 본원에서 상호 교환적으로 사용된다. 이러한 효소적 활성은 하기 실시예 4 에 기술된 것과 같은 분석에서 검출될 수 있다.
본원에서, 용어 "보조인자" 는 해당 반응을 촉매하는 효소와의 조합으로 작동하는 비단백질성 화합물을 지칭한다. 본 발명의 실시에서 사용되는 적절한 보조 인자는 NADP+ (니코틴아미드-아데닌 디뉴클레오타이드 포스페이트), NADPH (즉, 니코틴아미드 아데닌 디뉴클레오타이드 포스페이트의 환원형), NAD+ (즉, 니코틴아미드 아데닌 디뉴클레오타이드), 및 NADH (즉, NAD+의 환원형), 등을 포함한다. 산화된 보조 인자는 보조 인자 재생 시스템으로 환원시켜 재생된다.
본 발명의 방법에서, 케토리덕타아제는 보조 인자의 환원형에 의해 4-할로-3-케토부티르산 에스테르 또는 아미드의 환원을 촉매한다. 반응식 (4)는 명칭 NAD(P)H로 대안물로서 대표되는, NADH 또는 NADPH에 의한 4-할로-3-케토부티르산 에스테르의 케토리덕타아제-촉매 환원을 기술한다.
4-할로-3-케토부티르산 에스테르 또는 아미드의 4-할로-3-히드록시부티르산 에스테르 또는 아미드로의 환원을 수행하기 위해 적절한 케토리덕타아제는 자연발생적인 케토리덕타아제 뿐만 아니라, 인간의 조작에 의해 발생된 비자연발생적인 케토리덕타아제를 포함한다. 예시적인 자연발생적인 및 비자연발생적인 케토리덕타아제 및 케토리덕타아제를 코딩하는 폴리뉴클레오타이드는 본원에 기술된 것들을 포함한다.
자연발생적인 KRED 효소는 광범위한 범위의 박테리아 및 효모에서 찾을 수 있다. 일부 자연발생적인 KRED 유전자 및 효소 서열은 칸디다 매그놀리에(Candida magnoliae) (Genbank Acc. No. JC7338; GI:11360538), 칸디다 파라실로시스(Candida parapsilosis ) (Genbank Ac. No. BAA24528.1; GI:2815409), 스포로볼로마 이세스 살미콜러(Sporobolomyces salmicolor ) (Genbank Acc. No. AF160799; GI 6539734)와 같이 문헌에 보고되어 있다. 칸디다 매그놀리에의 케토리덕타아제를 코딩하는 폴리뉴클레오타이드 서열은 서열번호 1 (CR2-5), 3 (CR1-2), 5 (CR1-3), 및 7 (CR2-4)로서 제공된다. 서열번호 1 (CR2-5), 5 (CR1-3), 및 7 (CR2-4)은 C. 마그 놀리에 단백질 (서열번호 2, 6, 및 8)을 코딩하는 변이체이다. 서열번호 3 (CR1-2)은 하나의 아미노산을 변화시켜 C. 마그놀리에 단백질과는 상이한 변이체를 코딩한다(서열번호 4). β-케토 에스테르의 효소적 환원은 로도코커스 에리스로폴리스(Rhodococcus erythropolis ) (Peters, Appl . Microbiol . Biotechnol . (1992) 38:334-340; Zelinski, J. Biotechnol . (1994) 33:283-292)의 카르보닐 리덕타아제, 스포로보로마이세스 살리모니콜러(Sporoboromyces salmonicolor ) AKU 4429 (Shimizu, Biotechnol . Lett . (1990) 12:593-596; Appl . Environ . Microbiol. (1990) 56:2374-2377)의 알데히드 리덕타아제에 대해 보고되었다. 효소 예컨대 S. 세레비시에(cerevisiae) (J. Org . Chem . (1991) 56:4778; Biosci . Biotech . Biochem. (1994) 58:2236), 스포로보로마이세스 살리모니콜러 (Biochim . Biophys . Acta (1992) 1122:57), 스포로보로마이세스 종. (Biosci . Biotech . Biochem . (1993) 57:303; Japanese patent publication JP2566960), 칸디다 알비칸스(Candida albicans ) (Biosci . Biotech . Biochem . (1993) 57:303), 칸디다 마세도니엔시스(Candida macedoniensis ) (Arch . Biochem . Biophys . (1992) 294-469), 게오 트리키움 칸디덤(Geotrichium candidum ) (Enzyme Microbiol . Technol . (1992) 14:731)으로부터 유래된 것들은 에틸 4-클로로-3-아세토아세테이트 (ECAA)의 환원을 위해 사용되었다. 미국 특허 제 6,168,935 호는 글리세롤 디히드로게나아제 (Tetrahedron Lett . (1988) 29:2453), 터모아나에로비움 브로키(Thermoanaerobium brockii) (JACS (1985) 107:4028)의 알콜 디히드로게나아제 (ADH), 또는 설포로버 스 솔파타리쿠스(Sulfolobus solfataricus ) (Biotechnol . Lett . (1991) 13:31) 또는 수도모나스(Pseudomonas ) 종. (U.S. Pat. No. 5,385,833; J. Org . Chem . (1992) 57:1526)의 사용을 기술한다.
적절한 비자연발생적인 케토리덕타아제는 실시예 4 에 기술된 방법을 이용한 활성 스크린을 수반하는 돌연변이 생성, 방향적 진화, 등의 공지된 방법을 적용시켜 즉시 확인될 수 있다. 예를 들어, 이러한 방법은 본원에 기술된 것들을 포함하는 자연발생적인 케토리덕타아제에 바로 적용될 수 있다. 예시적인 비자연발생적인 케토리덕타아제는 본원에 서열번호 40 (KRED krh133c), 42 (KRED krh215), 44 (KRED krh267), 46 (KRED krh287), 48 (KRED krh320), 50 (KRED krh326), 52 (KRED krh408), 54 (KRED krh417), 56 (KRED krh483), 58 (KRED krh476), 60 (KRED krh495), 114 (KRED S01040430), 116 (KRED S01091361), 118 (KRED S01091625), 및 120 (KRED S01094648)로서 제공된다. 이들을 코딩하는 폴리뉴클레오타이드 서열은 본원에서 각각 서열번호 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 113, 115, 117, 및 119 로서 제공된다. 본 발명의 실시에서 사용을 위해 적절한 추가의 비자연발생적인 케토리덕타아제는 "Improved Ketoreductase Polypetides and Related Polynucleotide" (Attorney Docket No. 0190.110US/15077US01, 2003/08/11 출원, 미국 출원 일련번호 60/494,195)이라는 제목의 출원, 및 "Improved Ketoreductase Polypetides and Related Polynucleotide" (Attorney Docket No. 0190.210US/15077US02)이라는 제목의 출원에 제공되며, 상기 모두는 그 전체가 본원에 참조로서 포함된다.
본 발명의 실시에서 사용되는 케토리덕타아제는 보통 해당 4-할로-3-케토부티르산 에스테르 또는 아미드 기질을 사용하여, 실시예 4 에 기술된 분석에서 약 1 μmol/min/mg 이상의 활성을 나타낸다. 본 발명의 실시에서 사용되는 케토리덕타아제는 약 1 μmol/min/mg 이상 내지 약 10 μmol/min/mg 의 활성, 및 때로 약 102 μmol/min/mg 이상, 약 103 μmol/min/mg 이하 또는 그 이상의 활성을 나타낸다.
본 발명의 실시에서 사용되는 4-할로-3-케토부티르산 에스테르 및 아미드는 바로 구매할 수 있거나 공지된 방법을 이용하여 합성할 수 있다. 예시적인 4-할로-3-케토부티르산 에스테르 기질은 하기 구조 IV 를 가지는 것들을 포함한다:
식 중,
X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐이고;
R1, R2, R3, R4, 및 R5 는 구조 1A 에 대해 기술된 바와 같이 선택된다.
본 발명의 실시에서 사용될 수 있는 특정 4-할로-3-케토부티르산 에스테르는 에틸 4-클로로-3-케토부티르산 에스테르 (즉, X는 염소, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 에틸), 메틸 4-클로로-3-케토부티르산 에스테르 (즉, X는 염소, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 메틸), 에틸 4-브로모-3-케토부티르산 에스테르 (즉, X는 브롬, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 에틸), 에틸 4-요오도-3-케토부티르산 에스테르 (즉, X는 요오드, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 에틸), 메틸 4-브로모-3-케토부티르산 에스테르 (즉, X는 브롬, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 메틸), 메틸 4-요오도-3-케토부티르산 에스테르 (즉, X는 요오드, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 메틸), t-부틸-4-클로로-3-케토부티르산 에스테르 (즉, X는 염소, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 t-부틸), t-부틸-4-브로모-3-케토부티르산 에스테르 (즉, X는 브롬, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 t-부틸), 및 t-부틸-4-요오도-3-케토부티르산 에스테르 (즉, X는 요오드, R1, R2, R3, 및 R4 는 각각 수소이고, R5 는 t-부틸)을 포함한다. 특정 구체예에서, R1, R2, R3, 및 R4 중 하나 이상은 저급 알킬, 예컨대, 예를 들어, 메틸, 에틸, 또는 프로필이다.
KRED-촉매 전환 중 화합물 IV의 구조를 갖는 4-할로-3-케토부티르산 에스테르 기질이 환원되는 경우, 하기 구조 V를 갖는 4-할로-3-히드록시부티르산 에스테르가 생성된다:
식 중, X, R1, R2, R3, R4 및 R5 는 구조 IV에 대해 기술된 바와 같다.
본 발명의 케토리덕타아제-촉매 환원에 의해 제조된 4-할로-3-히드록시부티르산 에스테르 또는 아미드는 이후 본 발명의 할로히드린 디할로게나아제-촉매 전환에서 바로 사용될 수 있다. 예를 들어, 구조 V에 해당하는 4-할로-3-히드록시부티르산 에스테르는 하기 구조 VI를 가지는 4-시아노-3-히드록시부티르산 에스테르를 생성하기 위해, 시아나이드의 존재 하에 HHDH에 의한 전환을 위한 기질로서 사용될 수 있다:
식 중, R1, R2, R3, R4, 및 R5는 화합물 V 에 대해 기술된 바와 같다.
용어 "보조인자 재생 시스템"은 본 명세서에서 보조인자의 산화된 형태로(예를 들어, NADP를 NADPH로) 환원시키는 반응에 관여하는 한 셋트의 반응물을 나타낸다. 4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 환원 반응에 의해 산화되는 보조인자는 보조인자 재생 시스템에 의해 환원된 형태로 재생된다. 보조인자 재생 시스템은 수소 당량을 환원시키고, 보조인자의 산화된 형태를 환원시킬 수 있는 화학량론적 환원제를 포함한다. 보조인자 재생 시스템은 환원제의 의해 보조인자의 산화된 형태를 환원시키는 과정을 촉매화하는 촉매, 예를 들어, 효소 촉매를 더 포함할 수 있다. NAD 또는 NADP로부터 각각 NADH 또는 NADPH를 재생시키는 보조인자 재생 시스템은 당업계에 공지되어 있으며, 본 발명에 사용될 수 있다.
본 발명 수행시 사용되는 적절한 보조인자 재생 시스템에는 글루코스 및 글루코스 디히드로게나아제, 포르메이트 및 포르메이트 디히드로게나아제, 글루코스-6-포스페이트 및 글루코스-6-포스페이트 디히드로게나아제, 이소프로필 알콜 및 2차 알콜 디히드로게나아제, 포스피트 및 포스피트 디히드로게나아제, 분자 수소 및 히드로게나아제 등이 포함되며, 보조인자로 NADP/NADPH 또는 NAD/NADH와 함께 사용될 수 있다. 히드로게나아제를 사용한 전자화학적 재생법 또한 보조인자 재생 시스템으로 사용될 수 있다. 예를 들어, 참고문헌으로 본 명세서에 포함된 미국 특허 제5,538,867호 및 제6,495,023호를 참고하라. 금속 촉매 및 환원제(예를 들어, 분자 수소 도는 포르메이트)를 포함하는 화학적 보조인자 재생 시스템 또한 적절하다. 예를 들어, 참고문헌으로 본 명세서에 포한된, PCT 공보 WO 2000053731를 참고하라.
용어 "글루코스 디히드로게나아제" 및 "GDH"는 본 명세서에서 D-글루코스 및 NAD 또는 NADP를 글루콘산 및 NADH 또는 NADPH으로 각각 전환시키는 반응을 촉매화하는 NAD 또는 NADP-의존성 효소를 나타내기 위해 호환적으로 사용된다. 반응식 (5)는 글루코스에 의한 NAD 또는 NADP의 글루코스 디히드로게나아제-촉매 환원 반응을 나타낸다.
본 발명 수행시 사용하기 적절한 글루코스 디히드로게나아제는, 천연적으로 발생되는 글루코스 디히드로게나아제, 및 비천연적으로 발생되는 글루코스 디히드로게나아제 모두가 포함된다. 천연적으로 발생되는 글루코스 디히드로게나아제를 코딩하는 유전자는 문헌에 보고된 바 있다. 예를 들어, 바실러스 서브틸리스(Bacillus subtilis) 61297 GDH 유전자를 대장균에서 발현시키는 경우, 원래 숙주에서 생산된 효소와 동일한 물리화학적 성질을 나타낸다고 보고된 바 있다(Vasantha, et al., Proc . Natl . Acad . Sci . USA (1983) 80:785). 바실러스 서브틸리스 GDH 유전자의 유전자 서열(Genbank Acc. No. M12276에 대응됨)은 [Lampel, et al.]에 의해 보고된 바 있으며(J. Bacteriol . (1986) 166:238-243), 이의 수정된 형태(Genbank Acc. No. D50453에 대응됨)는 [Yamane, et al.]에 의해 보고된 바 있다(Microbiology (1996) 142:3047-3056). 또한, 천연적으로 발생되는 GDH 유전자에는, 바실러스 세레우스(B. cereus) ATCC 14579 유래의 GDH를 코딩하는 유전자(Nature (2003) 423:87-91; Genbank Acc. No. AE017013 ) 및 바실러스 메가테리움(B. megaterium) 유래의 GDH를 코딩하는 유전자(Eur . J. Biochem . (1988) 174:485-490, Genbank Acc. No. X12370; J. Ferment . Bioeng . (1990) 70:363-369, Genbank Acc. No. GI216270)가 포함된다. 바실러스 종 유래의 글루코스 디히드로게나아제는 본 명세서에서 서열번호: 10 및 12로 제공된다(이는 각각 서열번호: 9 및 11에 해당하는 폴리뉴클레오타이드 서열에 의해 코딩됨).
비천연적으로 발생되는 글루코스 디히드로게나아제는 공지된 방법, 예를 들어, 돌연변이유발법, 방향성 진화법 등에 의해 생성될 수 있다. 적절한 활성을 가지는 GDH 효소는, 천연적으로 발생된 것이든 비천역적으로 발생된 것이든지, 실시예 4에 서술된 분석법을 사용하여 쉽게 확인될 수 있다. 예시적인 비천연적으로 발생되는 할로히드린 디할로게나아제는 본 명세서에서 서열번호: 62(GDH 2313), 64(GDH 2331), 66(GDH 2279), 68(GDH 2379), 122(GDH S01024744), 124(GDH S01052992), 및 126(GDH S01063714)으로 제공된다. 이들을 코딩하는 폴리뉴클레오타이드 서열은 본 명세서에서 각각 서열번호: 61, 63, 65, 67, 121, 123, 및 125으로 제공된다. 본 발명 수행시 사용하기 적절한 비천연적으로 발생되는 글루코스 디히드로게나아제의 추가적인 예는 특허 출원 명칭 "Improved Glucose Dehydrogenase Polypeptides and Related Polynucleotides"(Attorney Docket No. 0352.110US/15076US01에 해당함, 2003. 8. 11. 출원, U.S. 출원 일련번호 제60/494,300호로 할당됨), 및 특허 출원 명칭 "Improved Glucose Dehydrogenase Polypeptides and Related Polynucleotides"(Attorney Docket No. 0352.210US/15076US02에 해당함, 2004. 2. 18. 출원, U.S. 출원 일련번호 제____호로 할당됨)에 제공되며, 이 두 출원은 그 전체로서 본 명세서에 참고문헌으로 포함된다.
본 발명 수행시 사용되는 글루코스 디히드로게나아제는 실시예 4에서 사용된 분석법에서 약 10 μmol/min/mg 이상의 활성을 나타내며, 때때로 약 102 μmol/min/mg 이상 또는 약 103 μmol/min/mg 이상, 약 104 μmol/min/mg 또는 그 이상의 활성을 나타낼 수 있다.
글루코스 및 글루코스 디히드로게나아제가 보조인자 재생 시스템으로 사용되는 경우, 4-할로-3-케토부티르산 에스테르 또는 아미드가 케토리덕타아제 및 NADH 또는 NADPH에 의해 환원됨에 따라, 결과 NAD 또는 NADP는 글루코스 디히드로게나아제의 의해 글루코스가 글루콘산으로 이중 환원됨으로써 환원된다. 총 반응은 반응식 (4)와 (5)을 합친 반응식 (6)으로 나타낸다:
4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 환원반응은 일반적으로 용매 중에서 수행된다. 용매는 공용매 시스템, 예를 들어, 수성 공용매 시스템일 수 있다. 이러한 전환반응을 수행하기에 적절한 용매(공용매 시스템 포함)는 전술한 4-할로-3-히드록시부티르산 에스테르 및 아미드를 4-시아노-3-히드록시부티르산 에스테르 및 아미드로 HHDH-촉매 전환하는데 사용되는 용매와 동일하다.
수성 용매(물 또는 수성 공용매 시스템)는 pH-완충되거나 완충되지 않을 수 있다. 4-할로-3-케토부티르산 에스테르 또는 아미드를 4-할로-3-히드록시부티르산 에스테르 또는 아미드로 전환시키는 반응은 약 5 또는 그 이상의 pH에서 수행될 수 있다. 일반적으로, 상기 전환 반응은 약 10 또는 그 이하의 pH에서, 통상 약 5 내지 약 10의 pH에서 수행된다. 전형적으로, 상기 전환 반응은 약 9 또는 그 이하의 pH에서, 통상 약 5 내지 약 9의 pH에서 수행된다. 바람직하게, 상기 전환 반응은 약 8 또는 그 이하의 pH에서, 통상 약 5 내지 약 8의 pH에서, 바람직하게는 약 6 내지 약 8의 pH에서 수행된다. 선택적으로, 상기 전환 반응은 중성 pH, 즉, 약 7에서 수행될 수 있다.
글루코스/글루코스 디히드로게나아제 보조인자 재생 시스템이 사용되는 경우, 반응식 (6)에서 나타내는 바와 같이, 글루콘산(pKa = 3.6)의 동시 생성은, 결과 수성 글루콘산이 달리 중화되지 않는 한 반응 혼합물의 pH를 낮추어 준다. 반응 혼합물의 pH는 표준 완충액 기술에 의해(이때, 완충액이 부여된 완충액 능력까지 글루콘산을 중화시킴), 또는 전환 과정과 동시에 염기를 첨가함으로써, 소정의 수치로 유지될 수 있다. 완충에 적절한 완충액 및 과정, 및 전환 과정 중에 염기를 첨가하는 경우에 적절한 염기 및 과정은 4-할로-3-히드록시부티레이트 에스테르 및 아미드를 4-시아노-3-히드록시부티레이트 에스테르 및 아미드로 HHDH-촉매 전환하는 경우에 대해 전술한 것과 동일하다.
보조인자 재생을 위해 글루코스/글루코스 디히드로게나아제를 사용한, 4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 환원반응에서, 전환반응시 염기의 첨가에 의해 또는 완충액에 의해 pH가 유지되는 경우, 총 반응 생성물은 수성 글루콘산 보다는 수성 글루코네이트 염이다. 예를 들어, 반응식 (7)은 수성 수산화나트륨(Na+ + OH-)이 pH를 유지하기 위해 반응 과정에 첨가되는 경우 총 반응을 나타낸다:
글루코스/글루코스 디히드로게나아제 보조인자 재생 시스템을 사용한, 4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 환원반응 동안 방출되는 클루콘산을 중화시키기 위해 염기가 첨가되는 경우, 전환반응은 pH를 유지하기 위해 첨가된 염기의 양에 의해 모니터링될 수 있다. 전형적으로, 전환과정 중에 완충되지 않거나 부분적으로 완충된 반응 혼합물에 첨가되는 염기는 수용액 중에 존재하는 상태로 첨가된다.
용어 "포르메이트 디히드로게나아제" 및 "FDH"는 본명세서에서 포르메이트 및 NAD 또는 NADP를 이산화탄소 및 NADH 또는 NADPH로 각각 전환시키는 반응을 촉매화하는 NAD 또는 NADP-의존성 효소를 나타내기 위해 호환적으로 사용된다. 본 발명 수행시 사용되기 적절한 포르메이트 디히드로게나아제에는 천연적으로 발생되는 포르메이트 디히드로게나아제, 및 비천연적으로 발생되는 포르메이트 디히드로게나아제 모두가 포함된다. 포르메이트 디히드로게나아제는 서열번호: 70(Pseudomonas sp.) 및 72(Candida boidinii)에 해당하는 것이 포함되며, 이들은 각각 서열번호: 69 및 71에 해당하는 폴리뉴클레오타이드 서열에 의해 코딩된다. 본 발명 수행시 사용되는 포르메이트 디히드로게나아제는, 천연적으로 발생된 것이든 비천연적으로 발생된 것이든지간에, 약 1 μmol/min/mg 이상의 활성, 때때로 약 10 μmol/min/mg 이상, 또는 약 102 μmol/min/mg 이상의 활성, 약 103 μmol/min/mg 또는 그 이상의 활성을 나타낼 수 있으며, 실시예 4에 서술된 분석법으로 활성을 쉽게 분석할 수 있다.
본원에서, 용어 "포르메이트"는 포르메이트 음이온(HCO2 -), 포름산(HCO2H), 및 이의 혼합물을 나타낸다. 포르메이트는 염의 형태로, 전형적으로 알칼리 또는 암모늄 염(예를 들어, HCO2Na, KHCO2NH4 등)의 형태로, 포름산의 형태로, 전형적으로 수성 포름산의 형태로, 또는 이의 혼합물의 형태로 제공될 수 있다. 포름산은 온화한 산이다. 포르메이트의 pKa(물 중 pKa = 3.7)로 나타낸 다양한 pH 단위 이내의 수용액 중에서, 포르메이트는 평형 농도에서 HCO2 -와 HCO2H 모두로 존재한다. 약 4 이상의 pH에서, 포르메이트는 유세하게 HCO2 -로 존재한다. 포르메이트가 포름산으로 제공되는 경우, 반응 혼합물은 전형적으로 완충되거나, 소정의 pH(전형적으로 약 5 또는 그 이상)를 제공하기 위해 염기를 첨가하여 덜 산성이 되게 한다. 포름산의 중화에 적절한 염기는 시안화수소산의 중화에 대해 전술한 것과 동일하다.
포르메이트가 우세하게 HCO2 -로 존재하는 약 5 이상의 pH 값의 경우, 반응식 (8)은 포르메이트에 의한 NAD 또는 NADP의 포르메이트 디히드로게나아제-촉매 환원반응을 나타낸다.
포르메이트 및 포르메이트 디히드로게나아제가 보조인자 재생 시스템으로 사용되는 경우, 4-할로-3-케토부티르산 에스테르 또는 아미드가 케토리덕타아제 및 NADH 또는 NADPH에 의해 환원됨에 따라, 결과 NAD 또는 NADP는 포르메이트 디히드로게나아제에 의해 포르메이트가 이산화탄소로 이중 산화됨으로써 환원된다. 총 반응은 반응식 (4) 및 (8)을 합친 반응식 (9)로 표시된다:
반응식 (9)는 포르메이트/포르메이트 디히드로게나아제 보조인자 재생 시스템이 약 5 이상의 pH를 가지는 수용액 중에서 4-할로-3-케토부티르산 에스테르 또는 아미드를 환원시키는데 사용되는 경우, 용액중 양자가 소비되어, 달리 완충되거나 재산성화되지 않는 한 반응 혼합물의 pH를 증가시킨다는 사실을 보여준다. 반응 혼합물의 pH는 표준 완충 기술에 의해(이때, 완충액이 부여된 완충 용량까지 양자를 방출함), 또는 전환 과정과 동시에 산을 첨가함으로써, 소정의 수치로 유지될 수 있다. pH를 유지하기 위해 반응 과정 중에 첨가되는 적절한 산에는, 유기산, 예를 들어, 카르복실산, 설폰산, 포스폰산 등, 무기산, 예를 들어, 할로겐화수소산(예를 들어, 염산), 황산, 인산 등, 산성 염, 예를 들어 디히드로겐포스페이트 염(예를 들어, KH2PO4), 비설페이트 염(예를 들어, NaHSO4) 등이 포함된다. 포름산이 특히 바람직하며, 이로써 포르메이트 농도 및 용액의 pH가 유지된다. 예를 들어, 반응식 (10)은 약 5 이상의 초기 pH를 유지하기 위해 반응 과정 중에 포름산(HCO2H)이 첨가된 경우의 총 과정을 나타낸다. 반응 혼합물 중에 포르메이트가 우세하게 HCO2 -로 존재하는 경우, HCO2 - 농도는 총 전환반응에서 첨가된 포름산이 소비되는 동안 유지된다.
포르메이트/포르메이트 디히드로게나아제 보조인자 재생 시스템을 사용한, 4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 환원반응 동안 pH를 유지하기 위해 산을 첨가하는 경우, 전환반응은 pH를 유지하기 위해 첨가된 산의 양에 의해 모니터링될 수 있다. 전형적으로, 전환과정 중에 완충되지 않거나 부분적으로 완충된 반응 혼합물에 첨가되는 산은 수용액 중에 존재하는 상태로 첨가된다.
본 발명의 방법 수행시, 초기에 보조인자의 산화된 형태 또는 환원된 형태가 제공될 수 있다. 전술한 바와 같이, 보조인자 재생 시스템은 산화된 보조인자를 이의 환원된 형태로 전환시키며, 환원된 형태는 이후 케토리덕타아제 기질(즉, 4-할로-3-케토부티르산 에스테르 또는 아미드)을 해당 할로히드린으로 환원시키는데 사용된다.
할로히드린 디할로게나아제와 함께, 보조인자 재생 시스템의 효소 및 케토리덕타아제가, 4-할로-3-케토부티르산 에스테르 또는 아미드를 정제된 효소, 세포 추출물, 세포 용해물, 또는 보조인자 재생 시스템의 효소 및 케토리덕타아제를 코딩하는 유전자(들)로 형질전환된 전체 세포의 형태로 전환시키기 위한 반응 혼합물에 제공될 수 있다. 이 효소를 코딩하는 유전자는 숙주 세포에 별개로 형질전환되거나, 동일한 숙주 세포에 함께 형질전환될 수 있다. 예를 들어, 한 구체예에서, 한 셋트의 숙주 세포를 케토리덕타아제를 코딩하는 유전자(들)로 형질전환하고, 기타 셋트의 숙주 세포를 보조인자 재생 시스템 효소(예를 들어, GDH, FDH, 등)로 형질전환할 수 있다. 두 셋트의 형질전환된 세포를 전체 세포 또는 이로부터 유래된 세포 용해물 또는 세포 추출물 형태의 반응 혼합물에 함께 사용할 수 있다. 선택적으로, 숙주 세포를 케토리덕타아제와 보조인자 재생 시스템 효소 모두를 코딩하는 유전자로 형질전환하여, 각각의 세포가 케토리덕타아제와 보조인자 재생 시스템 효소 모두를 발현하도록 할 수도 있다. 추가의 구체예에서, 숙주 세포를 케토리덕타아제, 보조인자 재생 시스템 효소, 및 할로히드린 디할로게나아제를 코딩하는 유전자로 형질전환할 수 있다. 이러한 세포는 전체 세포, 세포 용해물 또는 세포 추출물 형태의 효소를 제공하기 위한 본 발명의 방법에 사용될 수 있다. HHDH-촉매법의 반응 혼합물에 대해 서술한 바와 같이, 고체 반응물(즉, 효소, 염, 보조인자 재생 시스템, 보조인자 등)은 다양한 상이한 형태로, 예를 들어, 분말(예를 들어, 동결건조된 분말, 분무건조된 분말 등), 용액, 유화액, 현탁액 등의 형태로 제공될 수 있다.
환원 단계에 사용되는 반응물의 양은 소정의 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 양과 수반하여 사용되는 케토리덕타아제 기질의 양에 따라 일반적으로 상이하다. 이하 가이드라인은 사용되는 케토리덕타아제, 보조인자, 및 보조인자 재생 시스템의 양을 결정하는데 사용될 수 있다. 일반적으로, 4-할로-3-케토부티르산 에스테르 및 아미드는 약 10 내지 500 g/l의 농도로 사용되며, 약 10 mg 내지 약 5 g의 케토리덕타아제 및 약 25 mg 내지 약 5 g의 보조인자가 사용된다. 본 기술 분야의 당업자라면 소정의 생산 수치 및 생산 규모에 따라 이들의 양을 어떻게 조정하는지를 쉽게 이해할 것이다. 보조인자 재생 시스템의 적절한 양이 사용되는 보조인자 및/또는 케토리덕타아제의 양에 기초한 반복적인 실험에 의해 쉽게 결정될 수 있다. 일반적으로, 환원제(예를 들어, 글루코스, 포르메이트)는 케토리덕타아제 기질이 실질적으로 완전하게 또는 거의 완전하게 전환되도록, 케토리덕타아제 기질의 동몰량 수치 이상의 수치로 사용된다.
반응물의 첨가 순서는 중요하지 않다. 반응물은 함께 동시에 용매(예를 들어, 단일상 용매, 2상 수성 공용매 시스템 등)에 첨가될 수 있거나, 선택적으로 반응물 중 일부를 분리하여 첨가하고 일부는 다른 시점에 함께 첨가할 수도 있다. 예를 들어, 보조인자 재생 시스템, 보조인자, 케토리덕타아제, 및 케토리덕타아제 기질을 먼저 용매에 첨가할 수 있다.
혼합 효율을 개선시키기 위해, 수성 공용매 시스템이 사용되는 경우, 보조인자 재생 시스템, 케토리덕타아제, 및 보조인자를 먼저 일반적으로 수성상에 첨가하여 혼합한다. 그 후, 유기상을 첨가하여 혼합할 수 있으며, 이후 케토리덕타아제 기질을 첨가한다. 선택적으로, 케토리덕타아제 기질을 수성상에 첨가하기에 앞서, 유기상에 예비 혼합할 수도 있다.
4-할로-3-히드록시부티르산 에스테르 및 아미드의 할로히드린 디할로게나아제-촉매 전환반응을 위해, 본 발명의 4-할로-3-케토부티르산 에스테르 및 아미드의 케토리덕타아제-촉매 환원반응을 수행하기에 적절한 조건에는, 본 기술 분야의 당업자의 지식에 의해 쉽게 결정할 수 있는 다양한 조건이 포함된다. 케토리덕타아제-촉매 환원 단계를 수행하는데 적절한 온도는 약 15℃ 내지 약 75℃이다. 일반적으로, 반응은 약 20℃ 내지 약 55℃의 범위의 온도, 바람직하게는 약 20℃ 내지 약 45℃ 범위의 온도에서 수행된다. 반응은 또한 상온 조건하에서 수행될 수도 있다.
할로히드린 디할로게나아제-촉매 반응에서처럼, 케토리덕타아제-촉매 반응은 당업계에 공지된 방법을 사용하여 기질이 실질적으로 완전하게 또는 거의 완전하게 전환되었음이 확인될 때까지 진행된다. 할로히드린 디할로게나아제-촉매 반응에서처럼, 케토리덕타아제-촉매 반응의 진행은 pH 변화를 측정하기 위해 첨가된 염기 또는 산의 양을 모니터링함으로써 모니터링될 수 있으며, 그렇지 않은 경우 전술한 바와 같은 특정 보조인자 재생 시스템이 사용될 수 있다.
4-할로-3-케토부티르산 에스테르 또는 아미드 기질의 케토리덕타아제-촉매 환원반응은 4-할로-3-히드록시부티르산 에스테르 또는 아미드 생성물의 3-위치에 새로운 입체성 탄소를 발생시킨다. 전형적으로, 4-할로-3-히드록시부티르산 에스테르 또는 아미드가 3-위치에서 상대적으로 높은 입체선택성을 가지고 생성된다. 따라서, 4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 환원반응에 의해 생성된 4-할로-3-히드록시부티르산 에스테르 및 아미드는 전형적으로 키랄성이며 비라세미성이다. 본 발명에 사용되는 케토리덕타아제 반응은 전형적으로 바람직하게는 약 90% 이상의 e.e., 일반적으로 약 95% 이상의 e.e., 전형적으로 약 99% 이상의 e.e.를 가지는, 비라세미, 키랄성의 4-할로-3-히드록시부티르산 에스테르를 생성한다. 실시예는 99% 이상의 e.e.를 가지는 에틸 (S)-4-클로로-3-히드록시부티레이트를 제공하는 구체예를 설명한다.
본원에서, 용어 "거울상이성질체 과량" 또는 "e.e."는 주된 거울상이성질체(F(+))와 소수의 거울상이성질체(F(-))의 몰분획 또는 중량 분획간의 절대값 차이를 나타내며(즉, │F(+) - F(-)│), 여기서, F(+) + F(-) = 1. % e.e.는 100 ×│F(+) - F(-)│이다. 거울상이성질체 조성물은 이하 실시예 6에 서술된 기체 크로마토그래피법을 사용하거나 당업계에 공지된 방법을 사용하여 쉽게 분석될 수 있다.
전술한 바와 같이, 이러한 비라세미 키랄성의 4-할로-3-히드록시부티르산 에스테르 또는 아미드가 본 발명의 할로히드린 디할로게나아제-촉매 반응에서 기질로 사용되는 경우, 결과 4-치환된-4-히드록시부티르산 에스테르 또는 아미드는 입체순도가 거의 소실되지 않거나 입체순도가 전혀 소실되지 않으면서 실질적으로 동일하게 비라세미성을 가진다. 이러한 비라세미 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 생성 반응에 있어서의 높은 입체특이성 및 이들을 해당 비라세미 4-시아노-3-히드록시부티르산 에스테르 또는 아미드로 할로히드린 디할로게나아제-촉매 전환하는 경우의 높은 입체정확도는 함께 4-할로-3-케토부티르산 에스테르 또는 아미드로부터 높은 e.e로 비라세미 4-시아노-3-히드록시부티르산 에스테르 또는 아미드를 총생산하는데 있어 특히 유용한 방법을 제공한다.
본 발명의 추가적으로 중요한 특징은 생성되는 키랄성의 생성물의 수율이 매우 높다는 것이다. 전형적으로, 본 발명의 방법에 따라 생성된 4-할로-3-히드록시부티르산 에스테르 또는 아미드 및 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드 생성물의 수율은 약 70% 이상이며, 일반적으로 약 80% 이상, 전형적으로는 약 90% 이상이며, 약 95% 이상일 수도 있다. 생성물 수율의 계산은 반응 혼합물 중에 형성된 생성물의 양 및 제공된 초기 기질의 양에 의존한다. 생성물인 4-할로-3-히드록시부티르산 에스테르 또는 아미드는 임의적으로 할로히드린 디할로게나아제와의 접촉 이전에 정제될 수 있다. 본원에서, 용어 "정제된"은 분리 과정이 혼합물에 적용되어 혼합물 중 기타 성분들에 비해 한 성분의 농도가 증가하는 과정을 의미한다. 본 발명에 사용되는 적절한 정제 방법에는 예를 들어, 여과법, 고체 또는 액체상 추출법, 증류법 등이 포함된다.
4-할로-3-히드록시부티르산 에스테르 또는 아미드가 케토리덕타아제 반응 혼합물로부터 정제되는 경우, 이를 할로히드린 디할로게나아제 및 친핵체와 함께 용매(예를 들어, 단일상 용매, 2상 수성 공용매 시스템)에 첨가한다.
III
.
단일 반응 용기 중에서 4-할로-3-
케토부티르산
에스테르/아미드의 4-
친핵체
치환된-3-히드록시부티르산 에스테르/아미드로의
효소적
전환
본 발명은 단일 반응 용기 내에서 4-할로-3-케토부티르산 에스테르 및 아미드를 해당 4-친핵체 치환된-3-히드록시부티르산 에스테르 및 아미드로 전환하는 방법을 제공하며, 이 방법은 4-할로-3-케토부티르산 에스테르 또는 아미드를 케토리덕타아제, 보조인자, 보조인자 재생 시스템, 친핵체, 및 할로히드린 디할로게나아제와 접촉시켜 반응시켜, 4-할로-3-케토부티르산 에스테르 또는 아미드를 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로 전환시키기 위한 반응 혼합물을 생성하는 것을 포함한다.
기계학적으로, 단일-용기법은 4-할로-3-케토부티르산 에스테르 또는 아미드의 케토리덕타아제-촉매 전환을 통해 진행되어 현장에서 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 제공하고, 결과적으로 4-할로-3-히드록시부티르산 에스테르 또는 아미드를 해당 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로 할로히드린 디할로게나아제-촉매 전환시킨다. 현저하게, 케토리덕타아제-촉매 반응에 의해 생성된 4-할로-3-히드록시부티르산 에스테르 또는 아미드는 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 전환을 위해 할로히드린 디할로게나아제 및 친핵체(예를 들어, 시아나이드 등) 과 접촉하기 이전에 분리 또는 회수되지 않는다.
4-할로-3-케토부티르산 에스테르 또는 아미드를 4-친핵체 치환된-3-히드록시부티르산 에스테르 또는 아미드로 전환시키는데 있어 적절한 반응물(기질, 효소, 보조인자), 용매, pH, 온도, 및 기타 반응 조건 및 과정은 4-할로-3-히드록시부티르산 에스테르 및 아미드를 해당 4-친핵체 치환된-3-히드록시부티르산 에스테르 및 아미드로 할로히드린 디할로게나아제-촉매 전환하는 전술한 반응 조건 및 과정과 동일하다.
글루코스 및 글루코스 디히드로게나아제를 보조인자 재생 시스템으로 사용하고, 생성된 클루콘산 및 할로겐화수소산 모두를 중화시키고 반응 혼합물의 초기 pH(초기 pH는 약 5 내지 약 9임)를 유지시키는 반응 과정 중 2 당량의 염기를 첨가하는 경우, 단일-용기 반응에서의 총 반응은 반응식 (2)와 (7)을 합친 반응식 (11)로 표현된다. 이때, 수성 수산화나트륨이 염기로 사용된다.
기타 단일-용기 총 반응 반응식은 분리하여 수행되는 반응에 대해 전술한 할로히드린 디할로게나아제-촉매 반응(예를 들어, 시아나이드염을 염기로 사용) 및/또는 케토리덕타아제 반응(예를 들어, 포르메이트 및 모르메이트 디히드로게나아제를 보조인자 재생 시스템으로 사용)을 수행하기 위한 기타 선택사항을 표현하는 반응식을 합쳐서 얻을 수 있다.
또한, 동일한 단일-용기 결과가 먼저 케토리덕타아제 반응을 전술한 바와 같이 분리하여 수행한 후, 할로히드린 디할로게나아제 및 시아나이드를 케토리덕타아제 반응 혼합물에 첨가하고, 케토리덕타아제 반응 성분의 존재하에 할로히드린 디할로게나아제 반응을 수행함으로써, 얻어질 수 있음을 이해할 것이다.
4-할로-3-케토부티르산 에스테르를 4-시아노-3-히드록시부티르산 에스테르로 전환시키는 단일-용기 반응에 대한 구체예는 실시에 24에 서술되어 있다.
IV. 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노 , 히드록시 치환된 카르복실산 에스테르로의 할로히드린 디할로게나아제 촉매 전환
4-할로-3-히드록시부티르산 에스테르 기질에 추가하여, I 부분에서 서술된 것과 동일한 조건을 사용하여, 할로히드린 디할로게나아제가 기타 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르 기질을 이의 해당 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로 전환시키는 반응을 촉매화하는데 사용될 수 있음이 밝혀졌다. 따라서, 본 발명은 또한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르로부터 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 생성하는 방법을 제공하며, 이 방법은 다음의 단계를 포함한다:
(a) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 제공하는 단계(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택됨);
(b) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물을 형성하기에 적절한 조건 하에서 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 할로히드린 디할로게나아제 및 시아나이드와 접촉시키는 단계.
본원에서 사용될 때, "이웃자리 할로, 히드록시 치환된"이란 이웃하는 탄소 상에서의 할로겐 및 히드록시기 치환을 의미한다. "이웃자리 시아노, 히드록시 치환된"이란 본원에서 이웃하는 탄소 상에서의 시아노(C≡N) 및 히드록시기 치환을 의미하는 것으로 사용된다. 본 발명의 실시에 사용하기 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 4-할로-3-히드록시부티르산 에스테르가 아닌 것을 포함한다. 부수적으로, 이들 방법에 의하여 생성되는 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르 생성물은 4-시아노-3-히드록시부티르산 에스테르가 아닌 것을 포함한다.
본 발명의 바람직한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르 기질은 키랄이고, 히드록시-치환 탄소에서 입체성이며, 라세미체 또는 비라세미체일 수 있다. 이들 구체예에서, 본 발명 방법에 사용되는 어떤 할로히드린 디할로게나아제 효소는 키랄 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르 기질을 상응하는 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로 전환시키며, 입체성 히드록시-치환 탄소에서 절대 입체화학을 보유한다. 비라세미 키랄 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르 기질은 실질적으로 동일하게 입체순도의 손실이 거의 또는 전혀 없는 비라세미 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르 생성물로 전환될 수 있다.
본 발명의 실시에 사용되는 이웃자리 할로, 히드록시 치환된 카르복실산은 화학식 VII의 것들을 포함하며, 이것은 해당 화학식 VIII을 갖는 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 제공한다.
상기 식들에서,
X, R1, R2, R5, 및 R6은 화학식 IA에 대하여 정의한 바와 같고,
n은 0 또는 1 내지 9(경계값 포함)이며,
각 Mn은 독립적으로 -C(=O)-(즉, 카르보닐) 또는 -CRn'Rn "-(여기서, Rn' 및 Rn "는 각각 독립적으로 수소, 플루오르, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 임의 치환된 아릴, 히드록시, 니트로, 아미노, 시아노, 카르복시(즉, 카르복실레이트 또는 카르복실산기), 카르보알콕시(즉, 에스테르기), 카바미드(즉, 아미드기), 및 아실(즉, 케톤 형성)로 구성된 군에서 선택됨)로부터 선택된다.
적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 n=1인 화학식 VII을 가지며, 앞에서 개시한 4-할로-3-히드록시부티르산 에스테르를 포함한다.
다른 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 n=0인 화학식 VII, 따라서 하기 화학식 IX를 가지며, 이것은 해당 하기 화학식 X을 갖는 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 제공한다.
상기 화학식들에서, X, R1, R2, R5, 및 R6은 화학식 VII에서 정의된 바와 같다.
화학식 IX를 갖는 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 4-할로-2-히드록시프로피온산 에스테르를 포함한다. 화학식 VII 및 IX에 대하여, X은 일반적으로 염소 또는 브롬, 바람직하게는 염소이다. 화학식 VII 내지 X에 대하여, R1, R2, R5, 및 R6은 바람직하게는 각각 독립적으로 수소 또는 저급 알킬이다.
다른 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 n이 2∼9(경계값 포함)인 화학식 VII을 가진다. n은 일반적으로 2∼8(경계값 포함), 더 일반적으로는 2∼7(경계값 포함), 통상적으로는 2∼6(경계값 포함)이다. n=2인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 5-할로-4-히드록시펜탄산 에스테르를 포함한다. n=3인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 6-할로-5-히드록시헥산산 에스테르를 포함한다. n=4인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 7-할로-6-히드록시헵탄산 에스테르를 포함한다. n=5인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 8-할로-7-히드록시옥탄산 에스테르를 포함한다. n=6인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 9-할로-8-히드록시노난산 에스테르를 포함한다. n=7인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 10-할로-9-히드록시데칸산 에스테르를 포함한다. n=8인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 11-할로-10-히드록시운데칸산 에스테르를 포함한다. n=9인 적당한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 12-할로-11-히드록시도데칸산 에스테르를 포함한다.
바람직한 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 하기 화학식 XI의 6-할로-5-히드록시-3-옥소헥산산 에스테르 및 하기 화학식 XIII의 6-할로-3,5-디히드록시헥산산 에스테르이며, 각각 화학식 XII 및 XIV를 갖는 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 제공한다.
상기 화학식들에서, X, R1, R2, R5, 및 R6은 화학식 VII에 대하여 정의한 바와 같고, R1', R1 ", R2', R2 ", R3' 및 R3 "은 화학식 VII의 Rn' 및 Rn "에 대하여 정의한 바와 같으며, R1, R2, R6, R1', R1 ", R2 ", R3' 및 R3 "은 각각 독립적으로 수소 또는 저급 알킬인 것인 바람직하고, X는 일반적으로 염소 또는 브롬이다.
화학식 XI 또는 XIII의 바람직한 6-할로-5-히드록시-헥산산 에스테르에서 X는 Cl이다.
본 발명의 실시에 사용할 수 있는 화학식 XI의 특정 6-할로-5-히드록시-3-옥소헥산산 에스테르는 t-부틸 6-클로로-5-히드록시-3-옥소헥산산 에스테르(즉, X가 염소일 경우, R1, R2, R6, R1', R1 ", R2 ", R3', 및 R3 "은 수소이고 R5는 t-부틸임) 및 t-부틸 6-브로모-5-히드록시-3-옥소헥산산 에스테르(즉, X가 브롬일 경우, R1, R2, R6, R1', R1 ", R2 ", R3' 및 R3 "은 수소이고 R5는 t-부틸임)를 포함한다. 본 발명 방법에서 사용될 때, 이들 기질은 화학식 XII(여기서, R1, R2, R6, R1', R1 ", R2 ", R3' 및 R3 "은 수소이고 R5는 t-부틸임)을 갖는 해당 이웃자리 시아노, 히드록시 치환된 생성물을 생성시킨다.
본 발명의 실시에 사용할 수 있는 화학식 XIII의 특정 6-할로-3,5-디히드록시헥산산 에스테르는 t-부틸 6-클로로-3,5-디히드록시헥산산 에스테르(즉, X가 염소일 경우, R1, R2, R6, R1', R1 ", R2 ", R3' 및 R3 "은 수소이고 R5는 t-부틸임) 및 t-부틸 6-브로모-3,5-디히드록시헥산산 에스테르(즉, X가 브롬일 경우, R1, R2, R6, R1', R1", R2 ", R3' 및 R3 "은 수소이고 R5는 t-부틸임)를 포함한다. 본 발명 방법에서 사용될 때, 이들 6-할로-3,5-디히드록시헥산산 에스테르 기질은 화학식 XIV(여기서, R1, R2, R6, R1', R1 ", R2 ", R3' 및 R3 "은 수소이고 R5는 t-부틸임)을 갖는 이웃자리 시아노, 히드록시 치환된 생성물을 생성시킨다.
이웃자리 할로, 히드록시 치환된 카르복실산 에스테르 기질의 이웃자리 시아노 히드록시 치환된 카르복실산 생성물로의 전환을 촉매하는 적당한 할로히드린 디할로게나아제는 앞의 파트 I에 개시된 바와 같은 천연 발생 및 비천연 발생 할로히드린 디할로게나아제를 둘다 포함한다. 할로히드린 디할로게나아제는 실시예 4(파트 (3))에 개시된 분석을 사용하고 에틸 (S)-4-클로로-3-히드록시부티레이트로 해당 이웃자리 할로, 히드록시 치환된 카르복실산 기질을 치환하여 용이하게 확인할 수 있다. 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로 전환시키기 위한 반응 혼합물을 생성시키기에 적당한 조건(예컨대, 시아나이드 공급원, pH 조절 방법, 온도, 용매 및 공용매 시스템 등)은, 4-할로-3-히드록시부티르산 에스테르의 이의 해당 4-시아노-3-히드록시부티르산 에스테르(위 파트 I 참조)로의 전환과 동일하다. 6-할로-5-히드록시-3-옥소헥산산 에스테르(화학식 XI) 및 6-할로-3,5-디히드록시헥산산 에스테르(화학식 XIII)의 이의 해당 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르(즉, 각각 화학식 XII 및 XIV)로의 예시적인 전환 방법은 하기 실시예 32-41에 제공되어 있다.
V. 조성물
본 발명은 또한, 4-할로-3-히드록시부티르산 에스테르 또는 아미드의 4-친핵 치환된-3-히드록시부티르산 에스테르 또는 아미드로의 효소 전환에 유용한 조성물을 제공한다. 이들 조성물은 할로히드린 디할로게나아제, 4-할로-3-히드록시부티르산 에스테르 또는 아미드 및 친핵을 포함한다. 바람직한 조성물에서, 친핵은 시아나이드이다.
추가의 구체예에서, 본 발명은 케토리덕타아제, 보조인자 재생 시스템, 보조인자 및 할로히드린 디할로게나아제를 갖는 4-친핵 치환된-3-히드록시부티르산 에스테르 및 아미드를 제조하기에 유용한 조성물을 제공한다. 이들 조성물은 4-할로-3-케토부티르산 에스테르 또는 아미드를 더 포함할 수 있다.
앞서 개시한 케토리덕타아제, 보조인자 재생 시스템의 성분, 보조인자, 할로히드린 디할로게나아제, 4-할로-3-케토부티르산 에스테르 또는 아미드, 4-할로-3-히드록시부티르산 에스테르 또는 아미드 및 친핵을 이들 조성물에 사용할 수 있다.
본 발명은 또한, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의, 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르 또는 아미드로의 전환을 수행하기에 유용한 조성물을 제공한다. 이들 조성물은 할로히드린 디할로게나아제, 시아나이드, 및 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 포함한다.
본 발명 조성물은 고체(예컨대, 분말) 또는 액체(예컨대, 용액, 에멀션, 현탁액 등) 형태일 수 있다. 예컨대, 조성물은 동결 건조되거나 또는 분무 건조된 분말의 형태일 수 있다. 대안적으로, 조성물은 용매를 더 포함할 수 있다.
본 조성물은 예컨대 염, 산, 염기, 완충액, 용해제 등을 비롯한 pH 조절 성분 또는 가공 성분을 더 포함할 수 있다.
VI. 할로히드린 디할로게나아제, 케토리덕타아제 , 및 보조인자 재생 시스템 효소 및 해당 폴리뉴클레오타이드
본원에 개시된 구체적인 효소 및 폴리뉴클레오타이드 외에, 당업자라면 공지된 기술을, 본 발명의 실시에 사용하기 적당한 효소를 암호화하는 자연발생적 및 비자연발생적 폴리뉴클레오타이드의 발견에 용이하게 적용할 수 있음을 인지할 것이다. 예컨대 문헌[Ling 등, "Approaches to DNA mutagenesis: an overview," Anal . Biochem., 254(2):157-78 (1997); Dale 등, "Oligonucleotide-directed random mutagenesis using the phosphorothioate method," Methods Mol . Biol ., 57:369-74 (1996); Smith, "In vitro mutagenesis," Ann . Rev . Genet ., 19:423-462 (1985); Botstein, et al., "Strategies and applications of in vitro mutagenesis," Science, 229:1193-1201 (1985); Carter, "Site-directed mutagenesis," Biochem . J., 237:1-7 (1986); Kramer 등, "Point Mismatch Repair," Cell, 38:879-887 (1984); Wells 등, "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites," Gene, 34:315-323 (1985); Minshull, et al., "Protein evolution by molecular breeding," Current Opinion in Chemical Biology, 3:284-290 (1999); Christians 등, "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling," Nature Biotechnology, 17:259-264 (1999); Crameri 등, "DNA shuffling of a family of genes from diverse species accelerates directed evolution," Nature, 391:288-291; Crameri 등, "Molecular evolution of an arsenate detoxification pathway by DNA shuffling," Nature Biotechnology, 15:436-438 (1997); Zhang 등, "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening," Proceedings of the National Academy of Sciences , U.S.A., 94:45-4-4509; Crameri 등, "Improved green fluorescent protein by molecular evolution using DNA shuffling," Nature Biotechnology, 14:315-319 (1996); Stemmer, "Rapid evolution of a protein in vitro by DNA shuffling," Nature, 370:389-391 (1994); Stemmer, "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution," Proceedings of the National Academy of Sciences , U.S.A., 91:10747-10751 (1994); WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; 및 WO 01/75767]을 참조하시오. 이들 및 다른 공지된 방법은, 본원에 개시된 활성 및 다른 바람직한 특성, 예컨대 최적 온도 및/또는 pH 변화, 용매 내성 등을 갖는 다른 케토리덕타아제, 할로히드린 디할로게나아제 및 보조인자 재생 시스템 효소의 확인에, 예컨대 본원에 개시된 분석과 더불어 용이하게 적용될 수 있다. 예컨대, 케토리덕타아제는 돌연변이되거나 발달되어, 다른 것에 대하여 하나의 보조인자 유형을 선호하는(예컨대, NAD 대 NADP, 또는 반대) 케토리덕타아제를 스크린할 수 있는 라이브러리를 생성할 수 있다.
본 발명에 사용되는 효소를 암호화하는 폴리핵산 서열은, 발현을 위해 선택되는 숙주 유기체로부터의 최적 생성물을 위해 코돈 최적화할 수 있다. 당업자라면 광범위한 유기물에 대한 코돈 기호 정보를 제공하는 표 및 다른 참고문헌을 용이하게 이용할 수 있음을 인지할 것이다. 예컨대, 문헌[Henaut and Danchin, "Escherichia coli and Salmonella," Neidhardt, et al. eds., ASM Press, Washington, D.C. (1996) pp. 2047-2066] 참조.
본 발명의 실시에 사용되는 효소는 널리 공지된 분자생물학 기술을 사용하여 할로히드린 디할로게나아제, 케토리덕타아제 또는 보조인자 재생 시스템 효소를 암호화하는 폴리뉴클레오타이드를 함유하는 벡터를 숙주 세포내로 전환시켜 제조할 수 있다. 예컨대, 문헌[Berger and Kimmel, "Guide to Molecular Cloning Techniques", Methods in Enzymology, Volume 152, Academic Press, Inc., San Diego, CA; Sambrook, et al., "Molecular Cloning-A Laboratory Manual," 2nd Ed., Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989; 및 "Current Protocols in Molecular Biology," F.M. Ausubel, et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. 및 John Wiley & Sons, Inc. (supplemented through 1999)] 참조. 효소 제조 방법은 실시예 1 및 2에 예시되어 있다.
본 발명의 상기 및 다른 양상은 하기 비제한 실시예와 관련하여 더 잘 이해될 수 있다.
실시예
1:
할로히드린
디할로게나아제,
케토리덕타아제
, 및
글루코스
디할로게나아제
의
발현을 위한 발현 구조체의 구성
(1) 할로히드린 디할로게나아제( HHDH )
할로히드린 디할로게나아제를 위한 유전자는 아그로박테리움 종으로부터의 할로히드린 디할로게나제의 아미노산 서열에 기초하여 이. 콜리에서의 발현을 위하여 코돈 최적화되었다. 60-머 올리고머를 이용하여 상기 유전자를 합성하고, T5 프로모터의 조절하에서 발현 벡터 PCK110700(도 2에 나타남)내로 클로닝하였다. 상기 벡터를 이. 콜리 TOP10(캘리포니아주, 칼스바드에 소재하는 인비트로겐사)내로 형질전환시키고 표준 방법을 이용하여 이로부터 플라스미드 DNA를 제조하였다. 이어서 플라스미드 DNA를 표준 방법을 이용하여 발현 숙주인 이. 콜리 BL21(캘리포니아주 라욜라에 소재하는 스트라타젠사)내로 형질전환시켰다. 활성 HHDH를 발현하는 몇몇 클론이 발현 라이브러리에서 발견되었다. 이 클론으로부터의 유전자를 서열결정하였다(각각 서열 번호 14, 16 및 18의 폴리펩티드 서열을 암호하는 서열 번호 13(HHDH.1), 15(HHDH.2) 및 17(HHDH.16) 참조).
(2) 케토리덕타아제( KRED )
케토리덕타아제를 위한 유전자는 칸디다 마그놀리아이로부터의 케토리덕타아제의 아미노산 서열을 기초로 이. 콜리에서의 발현을 위해 코돈 최적화되었다. 이 유전자를 60-머 올리고머를 사용하여 합성하고 lac 프로모터 및 lacI 억제 유전자의 조절하에 발현 벡터 pCK110900(도 3에 나타냄)의 SfiI 클로닝 부위로 클론하였 다. 발현 벡터는 복제의 p15A 기원 및 클로람페니콜 내성 유전자를 함유한다. 플라스미드를 표준 방법을 사용하여 이.콜리 발현 숙주내로 형질전환하였다. 일부 클론은 발현된 활성 케토리덕타아제및 이의 유전자가 서열결정되어 DNA 서열을 확인한 것으로 밝혀졌다(서열 번호 1(케토리덕타아제1), 3(케토리덕타아제2), 5(케토리덕타아제3) 및 7(케토리덕타아제4) 참조, 이들은 각각 서열 번호 2, 4, 6 및 8의 폴리펩티드 서열을 암호화한다).
(3) 글루코스 디할로게나아제( GDH )
글루코스 디할로게나아제를 위한 유전자를 바실러스 서브틸리스 및 바실러스 메가테리움의 게놈 DNA 제조로부터 중합효소 연쇄 반응(PCR)을 사용하여 증폭시켰다. 증폭 반응을 위한 프라이머는 공개된 비. 서브틸리스 및 비. 메가테리움 글루코스 디할로게나아제 유전자 서열을 사용하여 설계하였고 하기와 같았다:
비. 바실러스 정방향 프라이머(서열 번호 19):
5'-GAATTCGCCCATATGTATCCGGATTTAAAAGG-3'
비. 서브틸리스 역방향 프라이머(서열 번호 20):
5'-TGGCCGGATCCTCATTAACCGCGGCCTGCCTGGA-3'
비. 메가테리움 정방향 프라이머(서열 번호 21):
5'-GAATTCGCCCATATGTATAAAGATTTAGAAGG-3'
비. 메가테리움 역방향 프라이머(서열 번호 22):
5'-GGCCGGATCCTCATTATCCGCGTCCTGCTTGGA-3'
PCR 생성물을 lac 프로모터 및 lacI 억제 유전자의 조절하에 발현 벡터 pCK110900(도 3에 나타냄)의 SfiI 클로닝 부위로 클론하였다. 발현 벡터는 복제의 p15A 기원 및 클로람페니콜 내성 유전자를 함유한다. 플라스미드를 표준 방법을사용하여 이. 콜리 발현 숙주내로 형질전환하였다. 일부 클론은 활성 GDH를 발현시키는 것으로 발견되었고, 유전자를 서열결정하여 서열을 확인하였다(서열 번호 9(글루코스 디할로게나아제 S06-3) 및 11(글루코스 디할로게나아제 M02-6) 참조, 이들은 각각 서열 번호 10 및 12의 폴리펩티드 서열을 암호화한다).
(4) 포르메이트 디할로게나아제( FDH )
포르메이트 디할로게나아제를 위한 유전자를 슈도모나스 종 균주 101(단백질 데이터베이스 수탁번호 2NAD_A) 및 칸디다 보이디니이(유전자은행 수탁번호 CAA09466)로부터의 포르메이트 디할로게나아제의 아미노산 서열을 기초로 이. 콜리에서의 발현을 위해 코돈 최적화하였다. 이 유전자를 60-머 올리고머를 사용하여 합성하고 lac 프로모터 및 lacI 억제 유전자의 조절하에 발현 벡터 pCK110900(도 3에 나타냄)의 SfiI 클로닝 부위로 클론하였다. 발현 벡터는 복제의 p15A 기원 및 클로람페니콜 내성 유전자를 함유한다. 플라스미드를 표준 방법을 사용하여 이. 콜리 발현 숙주내로 형질전환하였다. 클론은 발현된 활성 포르메이트 디할로게나아제 및 그 유전자가 서열결정되어 DNA 서열을 확인한 것으로 밝혀졌다(서열 번호 69 및 71 참조, 이들은 각각 서열 번호 70 및 72의 폴리펩티드 서열을 암호화한다).
실시예
2: 효소의 생성
(1) HHDH 효소:
통기되고 교반된 발효기에서, 0.528 g/L 암모늄 설페이트; 7.5 g/L 디포타슘 하이드로젠 포스페이트 트리하이드레이트; 3.7 g/L 포타슘 디하이드로젠 포스페이트; 2 g/L 타스톤-154 효모 추출물; 0.05 g/L 황화철; 및 2 g/L의 칼슘 클로라이드 디하이드레이트, 2.2 g/L 아연 설페이트 셉타하이드레이트, 0.5 g/L 망간 설페이트 모노하이드레이트, 1 g/L 황화구리 헵타하이드레이트, 0.1 g/L 소듐 보레이트 데카하이드레이트 및 0.5 g/L EDTA를 함유하는 3 ml/L의 미량 원소 용액을 함유하는 10.0L의 성장 배지를 30 ℃의 온도로 만들었다. 발효기에 실시예 1에 개시된 HHDH 폴리뉴클레오타이드를 함유하는 플라스미드를 가진 에스케리챠 콜리 BL21(캘리포니아주 라욜라 스트라타젠)의 후기 지수적 배양물을 접종하고, LB, 1% 글루코스(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니), 및 30 ㎍/ml 클로람페니콜(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니)을 함유하는 쉐이크 플라스크에서 0.5 내지 2.0의 600 nm에서의 출발 광학 밀도(OD600)로 성장시킨다. 발효기를 500-1500 rpm에서 교반하고 공기를 1.0-15.0 L/min으로 발효 용기에 공급하여 용해 산소 농도를 30% 포화 또는 그 이상으로 유지하였다. 배양물의 pH를 20% v/v 암모늄 하이드록사이드의 첨가에 의해 7.0으로 조절하였다. 배양물이 40의 OD600에 도달한 후, 온도를 25℃로 감소시키고 할로히드린 디할로게나제의 발현을 이소프로필-β-D-티오갈락토시드(IPTG)(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니)의 첨가에 의해 유도하여 1 mM의 최종 농도가 되게 하였다. 배양물을 추가로 15시간 동안 성장시켰다. 유도 후, 원심분리에 의해 세포를 수집하고 10 mM 포타슘 포스페이트 완충액(pH 7.0)으로 세척하였다. 세포 페이스트를 다운스트 림 회수 과정에 직접 사용하거나 사용때까지 -80℃에서 저장하였다.
(2) 케토리덕타아제 효소:
통기되고 교반된 발효기에서, 0.528 g/L 암모늄 설페이트; 7.5 g/L 디포타슘 하이드로젠 포스페이트 트리하이드레이트; 3.7 g/L 포타슘 디하이드로젠 포스페이트; 2 g/L 타스톤-154 효모 추출물; 0.05 g/L 황화철; 및 2 g/L의 칼슘 클로라이드 디하이드레이트, 2.2 g/L 아연 설페이트 셉타하이드레이트, 0.5 g/L 망간 설페이트 모노하이드레이트, 1 g/L 황화구리 헵타하이드레이트, 0.1 g/L 소듐 보레이트 데카하이드레이트 및 0.5 g/L EDTA를 함유하는 3 ml/L의 미량 원소 용액을 함유하는 10.0L의 성장 배지를 30℃의 온도로 만들었다.
발효기에 에스케리챠 콜리 W3110(pCR2-5)의 후기 지수적 배양물을 접종하고, LB, 1% 글루코스(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니), 및 30 ㎍/ml 클로람페니콜(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니)를 함유하는 쉐이크 플라스크에서 0.5 내지 2.0의 600 nm에서의 출발 광학 밀도(OD600)로 성장시킨다. 발효기를 500-1500 rpm에서 교반하고 공기를 1.0-15.0 L/min으로 발효 용기에 공급하고 배양물의 pH를 20% v/v 암모늄 하이드록사이드의 첨가에 의해 7.0으로 조절하였다. 배양물이 40의 OD600에 도달한 후, 온도를 25℃로 감소시키고 글루코스 디할로게나아제의 발현을 이소프로필-β-D-티오갈락토시드(IPTG)(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니)의 첨가에 의해 유도하여 1 mM의 최종 농도가 되게 하였다. 배양물을 추가로 15시간 동안 성장시켰 다. 유도 후, 원심분리에 의해 세포를 수집하고 10 mM 포타슘 포스페이트 완충액(pH 7.0)으로 세척하였다. 세포 페이스트를 다운스트림 회수 과정에 직접 사용하거나 사용때까지 -80℃에서 저장하였다.
(3) 글루코스 디할로게나아제 효소:
통기되고 교반된 발효기에서, 0.528 g/L 암모늄 설페이트; 7.5 g/L 디포타슘 하이드로젠 포스페이트 트리하이드레이트; 3.7 g/L 포타슘 디하이드로젠 포스페이트; 2 g/L 타스톤-154 효모 추출물; 0.05 g/L 황화철; 및 2 g/L의 칼슘 클로라이드 디하이드레이트, 2.2 g/L 아연 설페이트 셉타하이드레이트, 0.5 g/L 망간 설페이트 모노하이드레이트, 1 g/L 황화구리 헵타하이드레이트, 0.1 g/L 소듐 보레이트 데카하이드레이트 및 0.5 g/L EDTA를 함유하는 3 ml/L의 미량 원소 용액을 함유하는 10.0L의 성장 배지를 30℃의 온도로 만들었다.
발효기에 (pGDHS06 또는 pGDHM02)의 후기 지수적 배양물을 접종하고, LB, 1% 글루코스(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니), 및 30 ㎍/ml 클로람페니콜(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니)를 함유하는 쉐이크 플라스크에서 0.5 내지 2.0의 600 nm에서의 출발 광학 밀도(OD600)로 성장시킨다. 발효기를 500-1500 rpm에서 교반하고 공기를 1.0-15.0 L/min으로 발효 용기에 공급하고 배양물의 pH를 20% v/v 암모늄 하이드록사이드의 첨가에 의해 7.0으로 조절하였다. 배양물이 40의 OD600에 도달한 후, 온도를 25℃로 감소시키고 글루코스 디할로게나아제의 발현을 이소프로필-β-D-티오갈락토시드(IPTG)(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니)의 첨가에 의해 유도하여 1 mM의 최종 농도가 되게 하였다. 배양물을 추가로 15시간 동안 성장시켰다. 유도 후, 원심분리에 의해 세포를 수집하고 10 mM 포타슘 포스페이트 완충액(pH 7.0)으로 세척하였다. 세포 페이스트를 다운스트림 회수 과정에 직접 사용하거나 사용때까지 -80℃에서 저장하였다.
(4) 포르메이트 디할로게나아제
통기되고 교반된 발효기에, 3.5g/L의 NaNH4HPO4ㆍ4H2O, 7.5g/L의 K2HPO4ㆍ3H2O, 및 3.7g/L의 KH2PO4(Lageveen 등, 1988, Appl . Environ . Microbiol. 54:2924. (1988) 참조), 2g/L NH4Cl, 0.528g/L (NH4)2SO4, pH 7.0, 5 ml/L의 R2 미량 원소(Reisenberg 등. Appl . Microbiol . Biotechnol 1990 34:77 참조), 20ml/L의 수중 10% 효모 추출 용액, 5 ml/L의 1 M MgSO4, 40 ml/L의 수중 50% 글루코스 용액을 함유하는 10.0 L의 오토클레이브 최소 배지를 첨가하였다. 배지의 온도를 30℃로 하였다.
클로람페니콜을 농축 스톡 용액에 첨가하여 최종 농도를 30 ㎍/ml로 만들었다. 발효기에 에스케리챠 콜리 W3110(pFDHPs3 또는 PFDHCb13)의 배양물을 밤샘 접종하고, R2 미량 원소 용액, pH 7.0, 0.2% 효모 추출물, 1% 글루코스, 및 30 ㎍/ml 클로람페니콜을 포함하는 상기 최소 배지를 함유하는 쉐이크 플라스크에서 0.04 내지 0.1의 600 nm에서의 출발 광학 밀도(OD600)로 성장시킨다. 공기를 5.0 L/min으로 발효용기에 공급하였다. 농축된 수중 수산화칼륨 용액을 사용하여 배양물의 pH를 7.0으로 유지하였다. 배양물을 12-15의 OD600으로 생장시키고, 이 시점에서 50%의 글루코스, 6%의 암모늄 클로라이드 및 0.5%의 마그네슘 설페이트의 공급 용액을 초기화하고 최종 용존 산소 농도가 포화 공기의 30-40%가 되게 하였다. 공급물 펌프 속도는 배양기 중 용존 산소가 10 L/min의 공기 흐름 속도 및 600 rpm의 교반 속도에서 약 30%로 유지되도록 조절하였다. 배양물이 15의 OD600에 도달한 후, 수시간동안 공급 게획에 노출시키고, 1 mM의 IPTG를 첨가하여 포르메이트 디할로게나아제의 발현을 유도하였다. 배양물을 원심분리로 수거하기 전에 다시 8-18 시간 동안 생장시켰다.
실시예
3: 효소 제조
(1) 케토리덕타아제
세포 페이스트 1 부피 습윤 중량을 3 부피의 100 mM Tris/설페이트(pH 7.2)에 현탁시키고 소발 12BP에서 40분동안 5000 g에서 원심분리하여 세포 페이스트를 세척하였다. 세척된 세포 페이스트를 2 부피의 100 mM Tris/설페이트(pH 7.2)에 현탁시켰다. 상기 현탁액을 첫번째 통과를 위해서는 14,000 psig의 압력 그리고 두번째 통과를 위해서는 8,000 psig를 이용하여 두번 통과로 균질기를 통과시켜 세포로부터 세포내 KRED를 방출시켰다. 용해물을 실온으로 가온하고 이어서 최종 PEI 농도가 0.75% w/v가 될 때까지 10% w/v 폴리에틸렌이민(PEI) 용액(pH 7.2)을 용해물에 첨가하고 30분동안 교반하였다. 처리된 균질물을 60분동안 베크만 실험실 원심분리기에서 10,000 rpm에서 원심분리하였다. 상등액을 디캔팅하고, 얕은 용기에 분 배하고, -20 ℃에서 동결하고 동결건조하였다.
(2) 글루코스 디할로게나아제
세포 페이스트 1 부피 습윤 중량을 3 부피의 100 mM Tris/설페이트(pH 7.2)에 현탁시키고 소발 12BP에서 40분동안 5000 g에서 원심분리하여 세포 페이스트를 세척하였다. 세척된 세포 페이스트를 2 부피의 100 mM Tris/설페이트(pH 7.2)에 현탁시켰다. 상기 현탁액을 첫번째 통과를 위해서는 14,000 psig의 압력 그리고 두번째 통과를 위해서는 8,000 psig를 이용하여 두번 통과로 균질기를 통과시켜 세포로부터 세포내 HHDH를 방출시켰다. 균질물을 60분동안 베크만 실험실 원심분리기에서 10,000 rpm에서 원심분리하였다. 상등액을 디캔팅하고, 얕은 용기에 분배하고, -20 ℃에서 동결하고 동결건조하였다.
(3) 할로히드린 디할로게나아제
세포 페이스트 1 부피 습윤 중량을 3 부피의 100 mM Tris/설페이트(pH 7.2)에 현탁시키고 소발 12BP에서 40분동안 5000 g에서 원심분리하여 세포 페이스트를 세척하였다. 세척된 세포 페이스트를 2 부피의 100 mM Tris/설페이트(pH 7.2)에 현탁시켰다. 상기 현탁액을 첫번째 통과를 위해서는 14,000 psig의 압력 그리고 두번째 통과를 위해서는 8,000 psig를 이용하여 두번 통과로 균질기에 통과시켜 세포로부터 세포내 HHDH를 방출시켰다. 세포 용해물을 균질기를 통한 통과 사이에서 4 ℃로 냉각시켰다. 균질물을 60분동안 베크만 실험실 원심분리기에서 10,000 g 사이에서 원심분리하였다. 상등액을 디캔팅하고, 얕은 용기에 분배하고, -20 ℃에서 동결하고 분말로 동결건조하여 -80℃에서 저장하였다.
발효 후 제제의 품질을 평가하기 위하여, 발현된 할로히드린 디할로게나제 효소를 함유한 세포 용해물을 하기 프로토콜에 따라 분석하였다. 100 mM Tris-SO4, 100 mM NaCN, pH 8.0내의 맑은 세포 용해물 약 50 ㎕를 10 mM 에틸-(S)-4-클로로-3-하이드록시부티레이트(ECHB)(미주리주, 세인트루이스에 소재하는 시그마 케미컬 컴퍼니 또는 본원에 개시된 케토리덕타아제-촉매 방법에 따라 제조)와 혼합하였다. 전체 반응 부피는 0.2 ml이었다. 반응물을 실온에서 30분 내지 1시간동안 항온처리하였다. 반응물을 7 부피의 에틸 아세테이트로 추출하고 유기 층을 1.8 ml 가스 크로마토그래피(GC) 바이알에 제거하였다. 유기층을 에틸-(R)-4-시아노-3-하이드록시부티레이트 생성물의 존재하에서 GC에 의해 분석하였다. 생성된 생성물의 양은 동일한 조건하에서 제조되고 분석된 표준 곡선에 비교하여 결정하였다.
(4) 포르메이트 디할로게나아제
4℃에서 1 부피의 100 mM 트리에탄올아민(pH 7.0) 중에 세포 페이스트를 균질화시켜, 발현된 포르메이트 디할로게나아제를 함유하는 세포 용해물을 제조하였다. 세포 용해물을 균질기를 통한 통과 사이에서 4 ℃로 냉각시켰다. 세포 용해물을 4℃에서 원심분리하여 맑게 하였다. 맑은 용해물을 실시예 4에 개시된 바와 같이 분석하였다.
실시예
4: 효소 활성의 특성화
(1) 케토리덕타아제( KRED )
100 mM 인산칼륨 완충액(pH 7.0) 중 에틸 4-클로로-3-케토부티르산 에스테르(10 mM)의 용액에, 동일한 완충액 중에 미리 용해시킨 용액으로서 케토리덕타아제 효소를 첨가하였다. NADPH (1 mM 최종)를 첨가하여 반응을 개시하고, 반응후 340 nm에서의 흡수 감소를 측정하였다. 이 흡수는 NADPH 농도에 상응한다. 결과를 흡수 단위(NADPH) 대 시간으로서 플롯하고, 플롯의 기울기(흡수 단위/분)를 구하였다. 흡수 대 시간 플롯의 기울기를, NADPH 소광 계수를 사용하여 농도 단위로 변환시키고 케토리덕타아제의 활성을 μmol(소모된 NADPH)/min/mg(총 케토리덕타아제 촉매) 단위로 구하였다. 455 nm에서 방출을 측정하고 NADPH에 대하여 340 nm의 여기를 사용하는 형광 검출을 사용하여 측정을 실시할 수도 있다. 다른 대상 기질을 에틸 4-클로로-3-케토부티르산 에스테르로 치환하여 다른 기질에 대한 케토리덕타아제 활성을 평가할 수 있다.
(2) 글루코스 디할로게나아제( GDH )
100 mM 인산칼륨 완충액(pH 7.0) 중 50 mM 글루코스의 용액에 동일한 완충액 중에 미리 용해시킨 용액으로서 글루코스 디할로게나아제 효소를 첨가하였다, NADPH (1 mM 최종)를 첨가하여 반응을 개시하고, 반응후 340 nm에서의 흡수 또는 형광(여기 340 nm, 방출 455 nm) 증가를 측정하였다. 결과를 흡수 단위(NADPH) 대 시간으로서 플롯하고, 플롯의 기울기(흡수 단위/분)를 구하였다. 흡수 대 시간 플롯의 기울기를, NADPH 소광 계수를 사용하여 농도 단위로 변환시키고(상기 (1) 참조), 글루코스 디할로게나아제의 활성을 μmol(생성된 NADPH)/min/mg(총 글루코스 디할로게나아제 촉매) 단위로 구하였다.
(3) 할로히드린 디할로게나아제( HHDH )
300 mM 인산칼륨 중 에틸 (S)-4-클로로-3-히드록시부티레이트(10 mM)의 용액 에, 300 mM NaCN 완충액(pH 8.0)을 동일한 완충액 중에 미리 용해시킨 용액으로서 할로히드린 디할로게나아제 효소로 첨가하였다. 시간에 걸쳐, 혼합물의 분취량을 배출하고 에틸 아세테이트로 3회 추출하였다. 유기 층을 실시예 6에 개시된 바와 같이 가스 크로마토그래피(GC)로 분석하였다. 여러 시점에서 샘플을 취하고 생성물 시아노히드린, 에틸 (R)-4-시아노-3-히드록시부티레이트의 피크 영역을 시간의 함수로서 플롯하였다. 피크 영역을 에틸 (R)-4-시아노-3-히드록시부티레이트에 대하여 얻은 표준 곡선을 사용하여 농도 단위로 변환하였다. 할로히드린 디할로게나아제의 활성은 μmol(생성된 시아노히드린)/min/mg(총 할로히드린 디할로게나아제 촉매) 단위로 구하였다. 다른 친핵 및 대상 기재를 치환하여, 다른 친핵 및/또는 기재에 대한 할로히드린 디할로게나아제 활성을 평가할 수 있다.
(4) 포르메이트 디할로게나아제
100 mM 트리에탄올아민 완충액(pH 7.0) 중 150 mM 포르메이트의 용액에 동일한 완충액 중에 미리 용해시킨 용액으로서 포르메이트 디할로게나아제 효소를 첨가하였다, NADPH(2 mM 최종)를 첨가하여 반응을 개시하고, 반응후 340 nm에서의 흡수 또는 형광(여기 340 nm, 방출 455 nm) 증가를 측정하였다. 결과를 흡수 단위(NADPH) 대 시간으로서 플롯하고, 플롯의 기울기(흡수 단위/분)를 구하였다. 흡수 대 시간 플롯의 기울기를, NADPH 소광 계수를 사용하여 농도 단위로 변환시키고), 포르메이트 디할로게나아제의 활성을 μmol(생성된 NADPH)/min/mg(총 포르메이트 디할로게나아제 촉매) 단위로 구하였다.
실시예
5: 에틸 4-
클로로아세토아세테이트로부터
(에틸 (S)-4-
클로로
-3-
히드 록시부티레이트를
거쳐) 에틸 (R)-4-
시아노
-3-
히드록시부티레이트의
제조.
100 mM 인산칼륨 완충액, 500 mM NaCl, pH7(1 L)의 교반 용액에 실온에서 글루코스(160g, 830 mmole, 1.1 당량)를 첨가하였다. 여기에 케토리덕타아제 서열 번호 2 (0.9g), 글루코스 디할로게나아제 S06 서열 번호 10 (0.5 g) 및 NADP (0.5g)를 동결건조된 분말로서 첨가하였다. 일단 용해되면, 부틸 아세테이트(500 mL)를 첨가하여 에멀션을 형성하였다. 이 에멀션에 부틸 아세테이트(500 mL) 중 에틸 4-클로로아세토아세테이트(100g, 608 mmole)의 용액을 3시간에 걸쳐 적가하였다. Na2CO3(수중 2M, 총 약 160 mL)를 분배하는 자동 적정기에 의하여 pH를 6.8-7 사이로 유지하였다. 40 시간 후, 염기 자동 첨가를 중단하였고 가스 크로마토그래피에 의하면 잔잔류 출발 물질이 없었다. 층을 분리하고 수성 상을 에틸 아세테이트(500 mL)로 세척하였다. 합한 유기물을 무수 황산나트륨 상에서 건조시키고 여과하고 회전 증발기에서 증발시켜 대체로 순수한(~97%) 에틸 (S)-4-클로로-3-히드록시부티레이트를 얻었다.
300 mM 인산칼륨 완충액, 300 mM NaCN pH 8.0 (1L) 중 에틸 (S)-4-chloro3-히드록시부티레이트 (8.25 g, 50 mmoles)의 교반 용액에 30℃에서 할로히드린 디할로게나아제 서열 번호 14 (9 g)를 동결 건조된 분말로서 첨가하였다. 57 시간 후, 혼합물을 에틸 아세테이트(2회, 250 mL)로 세척하고 합한 유기물을 무수 황산나트륨 상에서 건조시켰다. 혼합물을 여과하고 회전 증발기 상에서 증발시켜, 하기 실시예 6에 개시된 용리 시간 데이터 및 가스 크로마토그래피를 사용하여 측정한 바에 의하면 대체로 순수한 에틸 (R)-4-시아노-3-히드록시부티레이트를 얻었다.
이 실시예는 4-시아노-3-히드록시부티르산 에스테르(에틸 (R)-4-시아노-3-히드록시부티레이트)를 4-할로-3-히드록시부티르산 에스테르(에틸 (S)-4-클로로-3-히드록시부티레이트)와 할로히드린 디할로게나아제 및 시아나이드(시아나이드 염으로 제공됨, NaCN)를 접촉시켜 제조하는 본 발명 방법을 나타낸다. 이것은 또한, 4-할로-3-히드록시부티르산 에스테르를 4-할로-3-케토부티르산 에스테르(에틸 4-클로로아세토아세테이트)와 케토리덕타아제, 보조인자(NADPH, NADP로서 제공됨) 및 보조인자 재생 시스템(글루코스 및 글루코스 디할로게나아제)을 접촉시켜 제조하는 본 발명 방법을 나타낸다. 이것은 또한 고가의 정제 절차 없이 고도의 순도 및 고도의 e.e.로 비키랄 에틸 4-클로로아세토아세테이트로부터 비라세미 키랄 에틸 (R)-4-시아노-3-히드록시부티레이트의 전체적인 제조를 나타낸다.
실시예
6: 에틸 (R)-4-
시아노
-3-
히드록시부티레이트의
특성화
실시예 5에서 제조된 에틸 4-시아노-3-(R)-히드록시부티레이트를, 100℃에서 1분, 10분 동안 5℃/분; 2분 동안 25℃/분; 이어서 200℃에서 2분의 프로그램을 사용하고 내경 0.25 ㎛, 길이 30 m의 Agilent HP-5 칼럼을 사용하는 불꽃 이온화(FID) 검출과 가스 크로마토그래피를 사용하여 분석하였다. 입구 및 출구 온도는 모두 300℃이고 유속은 2 ml/분이었다. 이들 조건하에, 에틸 (R)-4-시아노-3-히드록시부티레이트는 6.25분에서 용출되고, 에틸 (S)-4-클로로-3-히드록시부티레이트는 4.5분에서 용출되며, 에틸 4-클로로아세토아세테이트는 4.1분에서 용출된다.
종의 화학 순도는 가스 크로마토그래피 결과로부터의 적분 피크 면적을 사용하여 측정하였다.
에틸 (R)-4-시아노-3-히드록시부티레이트에 대한 할로히드린 디할로게나아제(HHDH)의 입체선택도는 165℃에서 25분 및 2 ml/분 유속의 프로그램을 사용하는 Restek gammaDex SA 칼럼(길이 30 m, 내경 0.32 ㎛)을 사용하여 FID 검출 및 가스 크로마토그래피에 의하여 측정하였다. 입구 및 출구 온도는 모두 230℃였다. 이들 조건하에, 에틸 (R)-4-시아노-3-히드록시부티레이트는 19.6분에서 용출되고, 에틸 (S)-4-시아노-3-히드록시부티레이트는 19.2분에서 용출된다.
실시예
7: 에틸 4-
클로로아세토아세테이트로부터
에틸 (S)-4-
클로로
-3-
히드록시부티레이트의
제조
기계적 교반기를 갖추고 pH 전극에 의한 자동 적정기 및 염기의 첨가를 위한 공급 튜브에 연결된 3-목 재킷 3L 플라스크에 트리에탄올아민(6.6 mL) 및 H20(492 mL)를 충전시켜 100 mM 트리에탄올아민 용액을 제조하였다. 37% HCl을 사용하여 pH를 7로 맞추었다. 플라스크 재킷으로 순환하는 물을 30℃로 고정하였다. 10분 후, 케토리덕타아제 서열 번호 2(5.7 g) 및 글루코스 디할로게나아제 S06 서열 번호 10(3.1 g) 분말을 첨가하였다. 10분 후, β-NAD(125 mg)를 첨가하고 생성 혼합물을 5분 동안 교반하였다. 이어서, 부틸 아세테이트(250 mL)를 채웠다. 부가 깔대기를 사용하여, 3 시간에 걸쳐, 2.4 M 에틸 4-클로로아세토아세테이트(250 mL, 100 g, 167 mL 의 부틸 아세테이트 중)를 서서히 첨가하였다. 15 시간에 걸쳐 2 M Na2CO3(152 mL)를 첨가하여 자동 적정기에 의하여 pH를 7로 유지하였다. 이어서, 반응 샘플의 가스 크로마토그래피는 생성물로의 완전한 전환을 나타내었다. 셀라이트 (16 g)를 첨가하고 반응 혼합물을 10분 동안 교반하였다. 셀라이트 패드를 통하여 용액을 여과하고 유기층을 분리하였다. 수성 층을 부틸 아세테이트(2 x 200 mL)로 추출하였다. 유기 층을 수거하고 용매를 진공하에 회전 증발에 의하여 제거하여 87 g의 에틸 (S)-4-클로로-3-히드록시부티레이트를 얻었다. 거울상이성체 과량은 실시예 8에서 에틸 (R)-4-시아노-3-히드록시부티레이트로 전환후 측정하였을 때 >99%였다.
실시예
8: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아노
-3-히드록시부티레이트의 제조
기계적 교반기를 갖추고 pH 전극에 의한 자동 적정기 및 염기의 첨가를 위한 공급 튜브에 연결된 3-목 재킷 3L 플라스크에 H20(1200 mL), NaCN(37.25 g) 및 NaH2PO4(125 g)을 충전시켜 용액의 pH를 7로 맞추었다. 물 순환기를 40℃로 설정하였다. 10분 후, 서열 번호 32의 할로히드린 디할로게나제를 세포 용해물(250 ml)로 첨가하였다. 반응 혼합물을 5분동안 교반시켰다. 첨가 깔때기를 이용하여, 에틸 (S)-4-클로로-3-하이드록시부티레이트(실시예 7로부터의 물질 45 g)를 1시간동안 천천히 첨가하였다. pH를 17시간에 걸쳐 10 M NaOH(27 mL)을 첨가하여 자동 적정기에 의해 7로 유지하였다. 이어서, 반응 샘플의 가스 크로마토그래피 결과 생성물로의 완전한 전환을 보여주었다. 셀라이트(16 g)를 플라스크에 첨가하고, 이어서 이 플라스크를 다이아프램 펌프에 연결하고, HCN을 제거하기 위하여 5M NaOH(200 ml)내로 배출물을 버블시켰다. 혼합물을 100 mm Hg 압력하에서 60℃로 가열하였다. 1 시간 후, 침지된 공기 버블러를 용액에 첨가하여 HCN의 제거를 도왔다. 3시간 후, HCN 검출기는 오프-가스에서 5 ppm 미만의 HCN을 나타냈다. 상기 혼합물을 실온으로 냉각시키고, 이어서 셀라이트 패드를 통해 여과시켰다. 여과물을 부틸 아세테이트(3 X 800 ml)로 추출하고 활성 목탄 패드를 통해 배합된 유기층을 여과하였다. 회전 증발에 의해 진공하에서 용매를 제거하여 28.5 g의 에틸 (R)-4-시아노-3-하이드록시부티레이트를 제공하였다. 순도는 HPLC에 의해 98%였으며 거울상이성체 과량은 99% 이상이었다(키랄 GC에 의해, S 입체이성체는 검출되지 않음).
실시예
9: 에틸 4-
클로로아세토아세테이트로부터
에틸 (S)-4-클로로-3-히드
록시부티레이트의
제조
pH 전극 및 염기 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 100 mL의 용기에 100 mM 트리에탄올아민 pH 7 완충액(25 mL) 중 글루코스 용액(7.5 g)을 채웠다. 이 용액에 케토리덕타아제 서열 번호 42 (100 mg); 50 mg GDH 서열 번호 66 및 NADP(6.25 mg)를 채웠다. 이어서 부틸 아세테이트(10 ml)를 채웠다. 이후, 부틸 아세테이트(10 mL) 중 에틸 4-클로로아세토아세테이트(6 g)를 채웠다. 7 시간에 걸쳐 자동 적정기로 4M NaOH(7.5 mL)를 첨가하여 pH를 7로 유지하였다. 반응 혼합물의 샘플을 동부피의 부틸 아세테이트로 추출하고, 유기 층을 GC로 분석하였다. 분석은 에틸 4-클로로아세토아세테이트의 에틸 (S)-4-클로로-3-히드록시부티레이트로의 99% 전환을 나타내었다.
실시예
10: 에틸 4-
클로로아세토아세테이트로부터
에틸 (S)-4-
클로로
-3-
히드록시부티레이트의
제조
400 mg의 케토리덕타아제 서열 번호 42를 사용하고 NADP 대신 NAD+(12.5 mg)를 첨가한 것을 제외하고 실시예 9와 동일하였다. 자동 적정기에 의한 NaOH 용액의 첨가는 11시간 후에 완결되었고 GC 분석은 에틸 4-클로로아세토아세테이트의 에틸 (S)-4-클로로-3-히드록시부티레이트로의 99% 전환을 나타내었다.
실시예
11: 에틸 4-
클로로아세토아세테이트로부터
에틸 (S)-4-
클로로
-3-
히드록시부티레이트의
제조
pH 전극 및 염기 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 100 mL의 용기에 수(30 mL)중 글루코스(12. g) 용액을 채웠다. 이 용액에 케토리덕타아제 서열 번호 42(100 mg); 50 mg GDH 서열 번호 66 및 NADP(6.25 mg)를 채웠다. 이어서, 부틸 아세테이트(10 ml)를 채웠다. 에틸 4-클로로아세토아세테이트(10 g)를 이후 하기와 같이 주사기 펌프를 통하여 채웠다: 1 mL를 신속히 채우고 이어서 나머지를 1 mL/hr의 속도로 채웠다. 18 시간에 걸쳐 자동 적정기로 4M NaOH를 첨가하여 pH를 7로 유지하였다. 교반을 중단하고 상을 분리하였다. 유기 층은 약간의 에멀션을 포함하였다. 유기 층을 분리하고 10 mL의 물로 세척하였다. 합한 수성 층을 20 mL의 부틸 아세테이트로 2회 추출하였다. 유기 추출물을 합하고 진공하에서 회전 증발시켜 물을 제거하였다. 추가의 부틸 아세테이트를 증발 동안 첨가하여 물의 제거를 도왔다. 물이 제거되었을 때, 부틸 아세테이트 용액을 플라스크내 고체로부터 디캔팅하였다. 진공하에 용매를 증발시켜 매우 고순도의 8.85 g의 에틸 (S)-4-클로로-3-히드록시부티레이트(수율 87.4%)를 얻었다.
실시예
12: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아 노
-3-히드록시부티레이트의 제조
pH 전극 및 염기 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 170 mL의 용기에 NaCN(1.5 g, 31 mmol) 및 물(50 mL)을 채웠다. 용기를 밀봉하고 헤드 공간을 질소로 탈기하였다. 농축 H2SO4(0.9 mL)를 첨가하여 pH를 7로 조절하였다. 반응 혼합물을 40℃로 가열하고 할로히드린 디할로게나아제 서열 번호 32(42 μL의 14M β-머캅토에탄올을 함유하는 10 mL 수중 1.2 g)의 용액으로 처리하였다. 이어서, 에틸 (S)-4-클로로-3-히드록시부티레이트(1.8 g, 10.8 mmol)를 주사기로 첨가하였다. 자동 적정기는 2M NaOH를 첨가하여 pH를 7로 유지하였다. 15 시간 후, 반응이 완결되었고 총 4.6 mL의 2M NaOH가 첨가되었다. 반응 혼합물의 샘플을 동 부피의 부틸 아세테이트로 추출하였다. 우기 추출물의 GC 분석은 에틸 (S)-4-클로로-3-히드록시부티레이트의 에틸 (R)-4-시아노-3-히드록시부티레이트로의 전환이 >99%임을 나타내었다.
실시예
13: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아노
-3-히드록시부티레이트의 제조
2M NaOH 대신 4M NaCN을 염기로서 사용한 것을 제외하고 실시예 12와 절차는 동일하였다. 8 시간 후, 반응이 완결되었고 총 2.3 mL의 4M NaCN이 첨가되었다. GC 분석에 의하면, 에틸 (S)-4-클로로-3-히드록시부티레이트의 에틸 (R)-4-시아노-3-히드록시부티레이트로의 전환은 >99%였다.
이 실시예는 반응 혼합물의 pH 및 시아나이드 농도 둘다를 유지하기 위하여 염기로서 알칼리 시아나이드를 사용하는 본 발명 방법을 나타낸다.
실시예
14: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아노
-3-히드록시부티레이트의 제조
pH 전극 및 염기(7.5 M NaOH) 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 250 mL의 용기에 물(83.5 mL) 및 0.7 g의 할로히드린 디할로게나아제 서열 번호 24를 채웠다. 혼합물을 30분 동안 교반하였다. 적정기를 가동시키고 pH 7을 유지하도록 설정하였다. 이어서, 25% 수성 HCN(9.26 ml, 8.6 g)을 20분에 걸쳐 채워 2.3% HCN 용액을 제조하였다. 혼합물을 10분 동안 40℃에서 가열한 다음 1 시간에 걸쳐 에틸 (S)-4-클로로-3-히드록시부티레이트(5 g)를 채웠다. 자동 적정기는 2M NaOH를 첨가하여 pH를 7로 유지하였다. 20 시간 후, 반응 샘플의 부틸 아세테이트 추출물의 GC 분석은 에틸 (S)-4-클로로-3-히드록시부티레이트의 에틸 (R)-4-시아노-3-히드록시부티레이트로의 전환이 95%임을 나타내었다.
이 실시예는 시아나이드 공급원으로서 수성 시안화수소산을 사용하는 본 발명 방법을 나타낸다.
실시예
15: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아노
-3-히드록시부티레이트의 제조
20 mL의 스크류-캡 바이알에 NaCN(250 mg) 및 NaH2PO4(830 mg)를 채웠다. 물(10 mL)을 채운 다음 할로히드린 디할로게나아제 서열 번호 32를 동결 건조된 분말(200 mg)로서 채웠다. 이어서, 에틸 (S)-4-클로로-3-히드록시부티레이트(300 mg)를 첨가하였다. 바이알에 캡을 씌우고 40℃ 오일조에서 가열하였다. 4 시간 후, 반응 샘플의 부틸 아세테이트 추출물의 GC 분석은 에틸 (S)-4-클로로-3-히드록시부티레 이트이 에틸 (R)-4-시아노-3-히드록시부티레이트로 54% 전환되었음을 나타내었다. 72 시간 후, GC 분석은 완전 전환을 나타내었다.
실시예
16: 에틸 (R)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (S)-4-
시아노
-3-히드록시부티레이트의 제조
(S)-거울상이성체 대신 에틸 4-클로로-3-히드록시부티레이트의 (R)-거울상이성체를 반응시키고 모든 반응 성분의 양을 반으로 한 것을 제외하고 실시예 15와 절차는 동일하였다. 1 시간의 반응 시간 후, GC 분석은 에틸 (R)-4-클로로-3-히드록시부티레이트가 에틸 (S)-4-시아노-3-히드록시부티레이트로 55% 전환되었음을 나타내었다.
앞의 실시예와 더불어 이 실시예는, 본 발명 방법을 사용하여 4-할로-3-히드록시부티르산 에스테르의 거울상이성체를 상응하는 4-시아노-3-히드록시부티르산 에스테르의 거울상이성체로 전환할 수 있음을 나타낸다.
실시예
17:
메틸
4-
클로로아세토아세테이트의
메틸
(S)-4-
클로로
-3-
히드록시부티레이트의
제조
에틸 4-클로로아세토아세테이트 대신 동몰량의 메틸 4-클로로아세토아세테이트를 반응시키고 사용한 효소는 케토리덕타아제 서열 번호 50 및 글루코스 디할로게나아제 서열 번호 62인 것을 제외하고 실시예 9와 절차는 동일하였다. 반응은 11 시간 후에 완결되었고 GC 분석은 >99% 메틸 (S)-4-클로로-3-히드록시부티레이트를 나타내었다. 부틸 아세테이트내로 추출하고 용매를 증발시켜 생성물을 분리하고 그 정체를 1H 및 13C NMR로 확인하였다.
실시예
18:
메틸
(S)-4-
클로로
-3-
히드록시부티레이트로부터
메틸
(R)-4-시아
노
-3-히드록시부티레이트의 제조
에틸 (R)-4-클로로-3-히드록시부티레이트 대신 동몰량의 메틸 (S)-4-클로로-3-히드록시부티레이트(실시예 17에 의하여 제조)를 반응시킨 것을 제외하고 실시예 16과 절차는 동일하였다. 1 시간의 반응 시간 후, GC 분석은 메틸 (R)-4-클로로-3-히드록시부티레이트가 메틸 (S)-4-시아노-3-히드록시부티레이트로 38% 전환되었음을 나타내었다. 생성물의 특징은 1H 및 13C NMR로 확인하였다.
실시예
19: 에틸 (S)-4-
브로모
-3-
히드록시부티레이트로부터
에틸 (R)-4-시아
노
-3-히드록시부티레이트의 제조
에틸 (R)-4-클로로-3-히드록시부티레이트 대신 동몰량의 에틸 (S)-4-브로모-3-히드록시부티레이트를 반응시킨 것을 제외하고 실시예 16과 절차는 동일하였다. 1 시간의 반응 시간 후, GC 분석은 에틸 (S)-4-브로모-3-히드록시부티레이트가 에틸 (S)-4-시아노-3-히드록시부티레이트로 90% 전환되었음을 나타내었다. 생성물의 특징은 1H 및 13C NMR로 확인하였다.
이 실시예는 4-할로-3-히드록시부티르산 에스테르의 할로 치환체가 브롬인 본 발명 방법을 나타낸다.
실시예
20: 에틸
아세토아세테이트로부터
에틸 3-
히드록시부티레이트의
제조
메틸 4-클로로아세토아세테이트 대신 동몰량의 에틸 아세토아세테이트를 반응시키고 200 mg의 케토리덕타아제 서열 번호 50 및 100 mg의 글루코스 디할로게나 아제 서열 번호 62를 사용한 것을 제외하고 실시예 17과 절차는 동일하였다. 반응은 6 시간 후에 완결되었다. 생성물은 부틸 아세테이트내로의 추출 및 용매 증발에 의하여 분리하고 1H 및 13C NMR에 의하여 특징을 확인하였다.
앞의 실시예들과 더불어, 이 실시예는 에틸 아세토아세테이트의 에틸 3-히드록시부티레이트로의 환원 활성을 갖는 케토리덕타아제 효소가, 본 발명 구체예에서 4-할로-3-케토부티르산 에스테르의 4-할로-3-히드록시부티르산 에스테르로의 전환에 유용함을 증명한다.
실시예
21: 에틸 4-
클로로
-3-
히드록시부티레이트와
시아나이드의
효소 및 비효소 테스트 반응의
pH
프로필
pH 측정기로 모니터링 하면서 85% 인산을 첨가하여 25 mg/mL 시안화나트륨을 함유하는 수용액을 pH 5.0, 6.0, 7.0, 7.5, 8.0, 8.5, 및 9.0으로 제조하였다. 5 mL의 각 용액을 별도의 20 mL 스크류 캡 바이알에 채웠다. 할로히드린 디할로게나아제 서열 번호 38(20 mg)을 각 바이알에 채우고, 이어서 에틸 (S)-4-클로로-3-히드록시부티레이트(50 mg, 0.30 mmole)를 채웠다. 비효소 반응 실험에서, 효소를 생략하는 것을 제외하고 절차는 동일하였다. 바이알에 캡을 씌우고 3 시간 동안 55℃ 오일조에서 가열한 다음 분리하여 실온으로 냉각시켰다. 각 반응 혼합물의 0.4 mL 샘플을 1 mL 부틸 아세테이트로 추출하고 추출물을 가스 크로마토그래피로 분석하였다.
각 바이알 중 기질 및 생성물의 분석량은 표 I에 나타내고 도 1에 pH에 대하여 그래프로 나타내었다. 양 경우, 클로로히드린은 에틸 (S)-4-클로로-3-히드록시 부티레이트를 의미하고, 시아노히드린은 에틸 (R)-4-시아노-3-히드록시부티레이트를 의미하며, 크로토네이트는 에틸 4-히드록시크로토네이트를 의미한다. 표에서, ND는 미검출을 의미한다.
최종 테스트 반응 혼합물의 pH를 재측정하였다. 클로로히드린이 시아노히드린으로 거의 완전히 전환되는 혼합물인, 초기 pH가 7 이상인 할로히드린 디할로게나아제 포함의 혼합물의 경우, 최종 혼합물 pH는 초기 pH보다 0.4 내지 0.6 pH 단위 아래였다. 다른 혼합물은 초기값으로부터 pH 변화가 훨씬 적음을 나타내었다.
이들 데이터는, 이들 반응 조건 및 시간에서, 에틸 4-클로로-3-히드록시부티레이트와 시아나이드의 측정가능한 비효소 반응이 8 미만의 임의의 테스트 pH에서 일어나지 않음을 나타낸다. 상기 pH 8에서, 에틸 4-시아노-3-히드록시부티레이트를 형성하는 시아나이드와의 비효소 반응 증가는 pH 증가로 일어나며 에틸 4-히드록시크로토네이트 부산물의 형성 증가를 동반하였다. 반대로, 할로히드린 디할로게나아제와의 효소 반응은 5를 초과하는 모든 테스트 pH에서 일어나며, 임의의 테스트 pH에서 에틸 4-히드록시크로토네이트의 형성은 검출되지 않는다. 또한, 8을 초과하는 pH에서의 효소 및 비효소 테스트 반응의 경우, GC-분석된 생성물의 총 몰수는 (에틸 4-클로로-3-히드록시부티레이트 반응물로서) 제공되는 초기 0.30 mmole로부터 감소하여 pH가 8을 초과하여 증가함에 따라 분석 불가능한 부산물의 형성이 증가됨을 나타낸다. 반응물 및 생성물은 8을 초과하는 pH에서 카르복실산 기로 점점 가수분해되고 생성되는 카르복실산은 GC로 분석되는 반응 혼합물 샘플의 추출물내로 추출되지 않는다. 실시예 22 참조.
실시예
22: 에틸 4-
시아노
-3-
히드록시부티레이트의
비효소
가수분해
pH 측정기로 모니터링 하면서 2M NaOH를 첨가하여 pH를 조절하고 40 mL 수중 0.48 g의 NaH2PO4를 용해시킴으로써 인산염 수용액을 pH 7.0, 7.5, 8.0, 8.5, 및 9.0에서 제조하였다. 5 mL의 각 용액을 별도의 20 mL 스크류 캡 바이알에 채웠다. 이어서 에틸 (R)-4-시아노-3-히드록시부티레이트 (46 mg, 0.29 mmol)를 첨가하였다다. 바이알에 캡을 씌우고 3 시간 동안 55℃ 오일조에서 가열한 다음 실온으로 냉각시켰다. 각 반응 혼합물 0.4 mL를 1 mL 부틸 아세테이트로 추출하고 추출물을 가스 크로마토그래피로 분석하였다. 외부 표준의 경우, pH 7.0 혼합물의 복제를 새로 제조하고 즉시 추출하였다. 각 바이알 중의 에틸 4-시아노-3-히드록시부티레이트의 분석량은 표 II에 나타낸다. 반응 샘플 추출물 중에서 가수분해 생성물은 검출되지 않았다. 이 에스테르를 가수분해한 카르복실산 생성물은 GC로 분석한 반응 샘플의 추출물내로 추출되지 않았다.
최종 테스트 혼합물의 pH를 재측정하였다. 초기 pH 8.0, 8.5, 및 9.0의 혼합물은 각각 최종 pH가 7.4였다. 초기 pH 7.5의 혼합물은 최종 pH가 7.3이고, 초기 pH 7의 혼합물은 불변이었다. 이것은 최고 pH 샘플에서 카르복실산이 생성되어 용액을 포스페이트 완충 범위내로 중화시킨다는 증거이다.
실시예 21과 더불어 이 실시예는 에틸 4-시아노-3-히드록시부티레이트가 8을 초과하는 pH에서 pH가 증가함에 따라 더 가수분해(이것은 에틸 4-클로로-3-히드록시부티레이트와 시아나이드의 비효소 반응에 의하여 발생될 수 있음)됨을 나타낸다.
실시예
23: 에틸 4-
클로로아세토아세테이트로부터
(에틸 (S)-4-클로로-3-히
드록시부티레이트를
거쳐) 에틸 (R)-4-
시아노
-3-
히드록시부티레이트의
제조
pH 전극 및 염기(4 M NaOH) 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 100 mL의 용기에 100 mM 트리에탄올아민 완충액, pH 7 중 글루코스(7.5 g) 용액(25 mL)을 채웠다. 이 용액에 케토리덕타아제 서열 번호 50(50 mg), 글루코스 디할로게나아제 서열 번호 62(20 mg) 및 NADP(1.5 mg)를 채웠다. 이어서, 부틸 아세테이트(10 ml) 및 추가의 부틸 아세테이트(10 mL) 중 에틸 4-클로로아세토아세테이트(6 g)를 채웠다. 13 시간에 걸쳐 교반 혼합물에 4M NaOH를 첨가하는 자동 적정기에 의하여 pH를 7로 유지하였다. 이어서, 30분 동안 상을 분리하고 에틸 (S)-4-클로로-3-히드록시부티레이트 중간체를 함유하는 유기 층(25 mL)을 제거하였다.
pH 전극 및 염기(2M NaOH) 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 170 mL의 용기에 시안화나트륨(1.5 g) 및 이어서 물(50 mL)을 채웠다. 용기를 밀봉하고 헤드 공간을 질소로 탈기하였다. 농축 황산(0.9 mL)을 사용하여 pH를 7로 조절하였다. 혼합물을 40℃로 가열하고, 42 uL의 14M β-머캅토에탄올을 함유하는 10 mL의 수중 할로히드린 디할로게나아제 서열 번호 32(1.2 g)의 용액으로 처리하였다. 이어서, 제1 단계로부터 얻은 에틸 (S)-4-클로로-3-히드록시부티레이트를 함유하는 유기 층(25 mL)을 주사기로 첨가하였다. 교반 혼합물에 2M NaOH를 첨가하는 자동 적정기에 의하여 pH를 7로 유지하였다. 15 시간 후, 에틸 (S)-4-클로로-3-히드록시부티레이트의 에틸 (R)-4-시아노-3-히드록시부티레이트로의 전환은, 5 mL의 염기(완전 전환의 경우 예상되는 15 mL)의 누적 첨가에 의하여 나타난 바에 의하면 33%였다.
실시예
24: 에틸 4-
클로로아세토아세테이트로부터
(에틸 (S)-4-
클로로
-3-
히드록시부티레이트를
거쳐) 에틸 (R)-4-
시아노
-3-
히드록시부티레이트의
제조
20 mL의 스크류 캡 바이알에 NaCN(125 mg, 2.55 mmol), NaH2PO4(415 mg, 3.46 mmol) 및 글루코스(750 mg, 3.8 mmol)를 첨가하였다. 물(5 mL), 이어서 NADP(2 mg), 케토리덕타아제 서열 번호 56(50 mg), 글루코스 디할로게나아제 서열 번호 62(50 mg), 및 할로히드린 디할로게나아제 서열 번호 32(100 mg)를 첨가하였다. 이어서, 0.5 mL 부틸 아세테이트 중 에틸 4-클로로-아세토아세테이트(24 mg, 0.15 mmol)를 첨가하였다. 바이알에 캡을 씌우고 30℃ 오일조에서 가열하였다. 1 시간 후, 반응 샘플의 부틸 아세테이트 추출물의 GC 분석은 에틸 4-클로로-아세토아세테이트가 에틸 (S)-4-클로로-3-히드록시부티레이트(96% 선택도) 및 에틸 (R)-4-시아노-3-히드록시부티레이트(4% 선택도)로 100% 전환되었음을 나타내었다. 이어서, 반응 바이알을 15 시간 동안 40℃로 가열하였다. 이어서, 부틸 아세테이트 추출물의 GC 분석은 2%의 에틸 (S)-4-클로로-3-히드록시-부티레이트가 남아 있고 출발 물질인 에틸 4-클로로아세테이트계 에틸 (R)-4-시아노-3-히드록시부티레이트의 전체 수율이 98%임을 나타내었다.
이 실시예는, 4-할로-3-케토부티르산 에스테르(에틸 4-클로로아세토아세테이트)를 케토리덕타아제, 보조인자(NADPH, NADP로서 제공), 보조인자 재생 시스템(글루코스 및 글루코스 디할로게나아제), 할로히드린 디할로게나아제 및 시아나이드(시아나이드 염에 의하여 제공됨, NaCN)와 접촉시켜(모든 반응물이 반응 혼합물 중에 동시에 존재함), 중간체인 4-할로-3-히드록시부티르산 에스테르(에틸 4-클로로-3-(S)-히드록시부티레이트)를 거쳐 4-시아노-3-히드록시부티르산 에스테르(에틸 4-시아노-3-(R)-히드록시부티레이트)를 생성시키는 본 발명 방법을 나타낸다.
실시예
25-29: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-시아노-3-히드록시부티레이트의 제조
실시예 25-29 각각에 대하여, pH 전극 및 염기 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 170 mL의 용기에 NaCN(1.5 g, 31 mmol) 및 물(50 mL)을 채웠다. 용기를 밀봉하고 농축 H2SO4(0.9 mL)을 첨가하여 pH를 7로 조절하였다. 반응 혼합물을 40℃로 가열하고, 할로히드린 디할로게나아제(10 mL 수중 0.4 g)로 처리하였다. 이들 실시예에 사용된 할로히드린 디할로게나아제는 하기 서열 번호에 주어진 폴리펩티드 서열을 가졌다:
실시예 25 서열 번호 32
실시예 26 서열 번호 94
실시예 27 서열 번호 96
실시예 28 서열 번호 98
실시예 29 서열 번호 100
이어서, 에틸 (S)-4-클로로-3-히드록시부티레이트(5.00 g, 30.1 mmol)를 주사기로 첨가하였다. 자동 적정기는 4M NaCN의 첨가에 의하여 pH를 7로 유지하였다. 반응의 진행은 첨가된 NaCN 용액의 누적 부피 대 시간을 기록함으로써 모니터링하였다.
도 4는 이들 실시예 각각에 대하여 에틸 (S)-4-클로로-3-히드록시부티레이트(첨가된 NaCN의 누적 당량으로부터 계산)의 전환% 대 시간을 나타낸다. 실시예 25는 아미노산 서열 서열 번호 32를 갖는 할로히드린 디할로게나아제를 사용하였고, 상기 천연 할로히드린 디할로게나아제의 아미노산 서열은 아그로박테리움 라디오박터 AD1 (hheC)에서 얻은 것이며, 이것은 서열 번호 31에 해당하는 신규한 핵산으로부터 발현된 것이다. 실시예 26-29의 전환% 대 시간을 실시예 25와 비교한 것은 본 발명의 신규한 할로히드린 디할로게나아제의 활성이 아그로박테리움 라디오박터 AD1 (hheC)로부터 얻은 천연 할로히드린 디할로게나아제보다 크다는 것을 나타낸다.
실시예
30: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아노
-3-히드록시부티레이트의 제조
할로히드린 디할로게나아제 서열 번호 104를 사용한 것을 제외하고 절차는 실시예 25-29와 동일하였다. 12 시간 후, NaCN 용액의 첨가로 반응을 완결하였고, GC 분석은 에틸 (S)-4-클로로-3-히드록시부티레이트의 에틸 (R)-4-시아노-3-히드록시부티레이트로의 전환이 >99%임을 나타내었다. 반응 혼합물을 냉각시키고 500 mL 3-목 플라스크에서 5 개의 다른 유사 생성 최종 반응 용액과 합하였다. 플라스크에 응축기 및 액체까지 연장된 질소 딥 튜브를 장치하고, 다이어그램 펌프에 연결하여 진공(500 mmHg)으로 하였다. 부식성 트랩을 사용하여 오프 가스 중의 HCN을 포획하였다. 반응 혼합물을 50℃로 가열하고 질소 블리드를 사용하여 HCN의 제거를 촉진하였다. 3 시간 후, HCN 제거를 완료하였다. 혼합물을 냉각시키고 원심분리 병으로 분할하였다. 300 mL의 부틸 아세테이트를 병 간에 분할하고, 이것에 캡을 씌우고 추출하는 동안 흔들었다. 혼합물을 30분 동안 8000 rpm에서 원심분리하였다. 층을 분리하고 수성 상을 300 mL의 부틸 아세테이트로 2회 더 추출하였다. 합한 부틸 아세테이트 추출물을 진공하에 증발시켜 19.6 g의 에틸 R-4-시아노-3-히드록시부트레이트(83% 수율)를 담황색 액체로서 얻었다.
실시예
31: 에틸 (S)-4-
클로로
-3-
히드록시부티레이트로부터
에틸 (R)-4-
시아노
-3-히드록시부티레이트의 제조
pH 전극 및 염기 첨가용 공급 튜브에 의하여 자동 적정기에 연결된 170 mL의 용기에 NaCN(1.5 g, 31 mmol) 및 물(50 mL)을 채웠다. 용기를 밀봉하고 농축 H2SO4(0.9 mL)을 첨가하여 pH를 7로 조절하였다. 반응 혼합물을 40℃로 가열하고, 할로히드린 디할로게나아제 서열 번호 100(10 mL 수중 0.4 g)으로 처리하였다. 이어서, 에틸 (S)-4-클로로-3-히드록시부티레이트(10.0 g, 60.2 mmol)를 주사기로 첨가하였다. 4M NaCN을 첨가하여 자동 적정기로 pH를 7로 유지하였다. 18 시간 후, NaCN 용액(더이상 염기는 첨가되지 않음, 14.6 mL 누적 첨가)의 첨가로 반응을 완결하였고, GC 분석은 에틸 (S)-4-클로로-3-히드록시부티레이트의 에틸 (R)-4-시아노-3-히드록시부티레이트로의 전환이 >99%임을 나타내었다. 반응 혼합물을 냉각시키고 250 mL 3-목 플라스크로 옮겼다. 플라스크에 응축기 및 액체까지 연장된 질소 딥 튜브를 장치하고, 다이어그램 펌프에 연결하여 진공(500 mmHg)으로 하였다. 부식성 트랩을 사용하여 오프 가스 중의 HCN을 포획하였다. 반응 혼합물을 50℃로 가열하고 질소 블리드를 사용하여 HCN의 제거를 촉진하였다. 3 시간 후, HCN 제거를 완료하였다. 혼합물을 냉각시키고 원심분리 병으로 옮겼다. 60 mL의 부틸 아세테이트를 병에 첨가하고, 이것에 캡을 씌우고 추출하는 동안 흔들었다. 혼합물을 30분 동안 10,000 rpm에서 원심분리하였다. 층을 분리하고 수성 상을 60 mL의 부틸 아세테이트로 2회 더 추출하였다. 합한 부틸 아세테이트 추출물을 진공하에 증발시켜 7.7 g의 에틸 R-4-시아노-3-히드록시부트레이트(81% 수율)를 얻었다.
실시예
32-36: t-부틸 (R)-6-
클로로
-5-히드록시-3-
옥소헥사노에이트로부터
t-부틸 (R)-6-
시아노
-5-히드록시-3-
옥소헥사노에이트의
제조
25 mg/mL 시안화나트륨(pH 7.2)을 함유하는 수용액을, 50 mL의 물에 1.25 g NaCN 및4.2 g NaH2PO4를 용해시켜 제조하였다. 실시예 32-36 각각에 대하여, 1 mL의 용액을 5 mL의 스크류 캡 바이알에 채웠다. 바이알에 할로히드린 디할로게나아제 분말(20 mg)을 첨가하고, 이어서 10 mg의 tert-부틸-(S)-6-클로로-5-히드록시-3-옥소-헥사노에이트(Julich Fine Chemicals)를 첨가하였다. 바이알에 캡을 씌우고 반응물을 12 시간 동안 실온에서 교반하였다. 반응 혼합물을 이후 1 mL MTBE로 추출하고 유기 층을 HPLC로 분석하였다. 각 실시예에서, tert -부틸-(R)-6- 클로로 -5-히드록시-3-옥소헥사노에이트는 완전 반응되었다. 각 실시예에 사용된 할로히드린 디할로게나아제의 폴리펩티드 서열 및 tert-부틸 (R)-6- 시아노 -5-히드록시-3- 옥소헥사노에이트의 분석 반응 수율은 하기와 같았다:
실시예 32 서열 번호 106 25%
실시예 33 서열 번호 108 15%
실시예 34 서열 번호 32 15%
실시예 35 서열 번호 74 10%
실시예 36 서열 번호 110 10%
실시예
37-41: t-부틸 (3R,5S)-6-
클로로
-3,5-디히드록시-3-
헥사노에이트로부터
t-부틸 (3R,5R)-6-
시아노
-3,5-
디히드록시헥사노에이트의
제조
28 mg/mL 시안화나트륨(pH 6.7)을 함유하는 수용액을, 50 mL의 물에 1.4 g NaCN 및 6 g NaH2PO4를 용해시켜 제조하였다. 실시예 37-41 각각에 대하여, 1 mL의 용액을 5 mL의 스크류 캡 바이알에 채웠다. 바이알에 할로히드린 디할로게나아제 분말(20 mg)을 첨가하고, 이어서 20 mg의 tert-부틸-(3R,5S)-6-클로로-3,5-디히드록시헥사노에이트(Chemistry--A European Journal (2001), 7(21), 4562-4571)를 첨가하였다. 바이알에 캡을 씌우고 반응물을 17 시간 동안 실온에서 교반하였다. 반응 혼합물을 이후 1 mL 에틸 아세테이트로 추출하고 유기 층을 HPLC로 분석하였다. 각 실시예에서, t-부틸 (3R,5R)-6-시아노-3,5-디히드록시헥사노에이트 및 미반응 t-부틸 (3R,5S)-6-클로로-3,5-디히드록시-3-헥사노에이트만이 검출되었다. 각 실시예에 사용된 할로히드린 디할로게나아제의 폴리펩티드 서열 및 ert-부틸-(3R,5S)-6-클로로-3,5-디히드록시헥사노에이트의 반응 수율은 하기와 같았다:
실시예 37 서열 번호 100 83%
실시예 38 서열 번호 108 65%
실시예 39 서열 번호 32 64%
실시예 40 서열 번호 74 63%
실시예 41 서열 번호 102 81%
할로히드린 디할로게나아제를 생략한 대조군 반응에서, 전환은 4%였다.
본 출원에 인용된 모든 공개공보, 특허, 특허 출원 및 다른 문헌은, 이들 각각이 모든 목적에 대하여 참고 문헌으로 인용된다고 지시된 것처럼, 동일한 범위의 모든 목적을 위해 그 전체가 본원에 참고문헌으로 인용되어 있다.
본 발명의 바람직한 구체예를 예시하였으나, 본 발명의 사상 및 범위로부터 일탈하지 않는 한 여러가지로 변화시킬 수 있음을 이해할 것이다.
SEQUENCE LISTING
<110> Davis, S. Christopher
Grate, John H.
Gray, David R.
Gruber, John M.
Huisman, Gjalt W.
Ma, Steven K.
Newman, Lisa M.
Sheldon, Roger
Wang, Li A.
<120> Enzymatic Processes for the Production
of 4-Substituted 3-Hydroxybutyric Acid Derivatives and
Vicinal Cyano, Hydroxy-substituted Carboxylic Acid Esters
<130> 0339.310WO
<140> PCT/US04/04819
<141> 2004-02-18
<150> US 10/639,159
<151> 2003-08-11
<150> US 60/402,436
<151> 2002-08-09
<160> 126
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Ketoreductase 1
KRED CR2-5
<220>
<221> CDS
<222> (1)...(852)
<400> 1
atg gca aag aat ttt agc aat gta gag tat ccc gca ccc ccc ccc gca 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat aca aag aat gag agc tta caa gta tta gat tta ttt aag tta aat 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
gga aaa gta gca agc ata aca gga agc agc agc gga ata gga tat gca 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
tta gca gag gct ttt gca caa gtc gga gca gat gta gca ata tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aat agc cat gat gca aca gga aaa gca gag gca tta gca aag aag tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
gga gta aag gta aag gca tat aaa gca aat gta agc agc agc gat gca 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtc aag caa aca ata gag caa caa ata aag gat ttt gga cat tta gat 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gta gta gca aat gca gga ata ccc tgg aca aag gga gca tat ata 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat caa gat gat gac aag cat ttt gac caa gta gta gat gta gac tta 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aag gga gta gga tac gta gca aag cat gca gga agg cat ttt agg gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
agg ttt gag aaa gag gga aaa aag gga gca tta gta ttt aca gca agc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg agc gga cat ata gta aat gtc ccc caa ttc caa gca aca tat aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gca gca aag gca gga gta agg cat ttt gca aag agc tta gca gtc gag 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gca ccc ttt gca agg gta aat agc gta agc ccc gga tat ata aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
aca gag ata agc gat ttc gtc ccc caa gag aca caa aat aag tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtc ccc tta gga agg gga gga gag aca gca gag tta gta gga 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gca tat tta ttc tta gca agc gat gca gga agc tat gca aca gga aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat ata ata gta gat gga gga tat aca tta ccc taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 2
<211> 283
<212> PRT
<213> Candida magnoliae
<400> 2
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 3
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Ketoreductase 2
KRED CR1-2
<220>
<221> CDS
<222> (1)...(852)
<400> 3
atg gca aag aat ttt agc aat gta gag tat ccc gca ccc ccc ccc gca 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat aca aag aat gag agc tta caa gta tta gat tta ttt aag tta aat 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
gga aaa gta gca agc ata aca gga agc agc agc gga ata gga tat gca 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
tta gca gag gct ttt gca caa gtc gga gca gat gta gca ata tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aat agc cat gat gca aca gga aaa gca gag gca tta gca aag aag tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
gga gta aag gta aag gca tat aaa gca aat gta agc agc agc gat gca 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtc aag caa aca ata gag caa caa ata aag gat ttt gga cat tta gat 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gta gca gca aat gca gga ata ccc tgg aca aag gga gca tat ata 384
Ile Val Ala Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat caa gat gat gac aag cat ttt gac caa gta gta gat gta gac tta 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aag gga gta gga tac gta gca aag cat gca gga agg cat ttt agg gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
agg ttt gag aaa gag gga aaa aag gga gca tta gta ttt aca gca agc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg agc gga cat ata gta aat gtc ccc caa ttc caa gca aca tat aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gca gca aag gca gga gta agg cat ttt gca aag agc tta gca gtc gag 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gca ccc ttt gca agg gta aat agc gta agc ccc gga tat ata aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
aca gag ata agc gat ttc gtc ccc caa gag aca caa aat aag tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtc ccc tta gga agg gga gga gag aca gca gag tta gta gga 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gca tat tta ttc tta gca agc gat gca gga agc tat gca aca gga aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat ata ata gta gat gga gga tat aca tta ccc taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 4
<211> 283
<212> PRT
<213> Candida magnoliae
<400> 4
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Ala Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 5
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Ketoreductase 3
KRED CR1-3
<220>
<221> CDS
<222> (1)...(852)
<400> 5
atg gca aag aat ttt agc aat gtg gag tat ccc gca ccc ccc ccc gca 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat aca aag aat gag agc tta caa gta tta gat tta ttt aag tta aat 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
gga aaa gta gca agc ata aca gga agc agc agc gga ata gga tat gca 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
tta gca gag gct ttt gca caa gtc gga gca gat gta gca ata tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aat agc cat gat gca aca gga aaa gca gag gca tta gca aag aag tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
gga gta aag gta aag gca tat aaa gca aat gta agc agc agc gat gca 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtc aag caa aca ata gag caa caa ata aag gat ttt gga cat tta gat 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gta gta gca aat gca gga ata ccc tgg aca aag gga gca tat ata 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat caa gat gat gac aag cat ttt gac caa gta gta gat gta gac tta 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aag gga gta gga tac gta gca aag cat gca gga agg cat ttt agg gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
agg ttt gag aaa gag gga aaa aag gga gca tta gta ttt aca gca agc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg agc gga cat ata gta aat gtc ccc caa ttc caa gca aca tat aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gca gca aag gca gga gta agg cat ttt gca aag agc tta gca gtc gag 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gca ccc ttt gca agg gta aat agc gta agc ccc gga tat ata aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
aca gag ata agc gat ttc gtc ccc caa gag aca caa aat aag tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtc ccc tta gga agg gga gga gag aca gca gag tta gta gga 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gca tat tta ttc tta gca agc gat gca gga agc tat gca aca gga aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat ata ata gta gat gga gga tat aca tta ccc taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 6
<211> 283
<212> PRT
<213> Candida magnoliae
<400> 6
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 7
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Ketoreductase 4
KRED CR2-4
<220>
<221> CDS
<222> (1)...(852)
<400> 7
atg gca aag aat ttt agc aat gta gag tat ccc gca ccc ccc ccc gca 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat aca aag aat gag agc tta caa gta tta gat tta ttt aag tta aat 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
gga aaa gta gca agc ata aca gga agc agc agc gga ata gga tat gca 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
tta gca gag gct ttt gca caa gtc gga gca gat gta gca ata tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aat agc cat gat gca aca gga aaa gca gag gca tta gca aag aag tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
gga gta aag gta aag gca tat aaa gca aat gta agc agc agc gat gca 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtc aag caa aca ata gag caa caa ata aag gat ttt gga cat tta gat 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gta gta gca aat gca gga ata ccc tgg aca aag gga gca tat ata 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat caa gat gat gac aag cat ttt gac caa gta gta gat gta gac tta 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aag gga gta gga tac gta gca aag cat gca gga agg cat ttt agg gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
agg ttt gag aaa gag gga aaa aag gga gca tta gta ttt aca gca agc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg agc gga cat ata gta aat gtc ccc caa ttc caa gca aca tat aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gca gca aag gca gga gta agg cat ttt gca aag agc tta gca gtc gag 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gca ccc ttt gca agg gta aat agc gta agc ccc gga tat ata aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
aca gag ata agc gat ttc gtc ccc caa gag aca caa aat aag tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtc ccc tta gga agg gga gga gag aca gca gag tta gta gga 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gca tat tta ttc tta gca agc gat gca gga agc tat gca aca gga aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat ata ata gta gat gga gga tat act tta ccc taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 8
<211> 283
<212> PRT
<213> Candida magnoliae
<400> 8
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 9
<211> 786
<212> DNA
<213> Bacillus sp.
<220>
<221> CDS
<222> (1)...(786)
<223> Synthetic construct
Glucose dehydrogenase S06-3
<400> 9
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg ccg tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg ata aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Ile Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg cca atc aat gct gaa aaa ttc gct gac cct aaa cag aaa gct gat 624
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc atc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa 786
Gln Ala Gly Arg Gly *
260
<210> 10
<211> 261
<212> PRT
<213> Bacillus sp.
<400> 10
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Ile Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 11
<211> 786
<212> DNA
<213> Bacillus sp.
<220>
<221> CDS
<222> (1)...(786)
<223> Synthetic construct
Glucose dehydrogenase M02-6
<400> 11
atg tat aaa gat tta gaa gga aaa gta gtt gtc ata aca ggt tca tct 48
Met Tyr Lys Asp Leu Glu Gly Lys Val Val Val Ile Thr Gly Ser Ser
1 5 10 15
acc ggt tta gga aaa gca atg gcg att cgt ttt gcg aca gaa aaa gct 96
Thr Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Ala Thr Glu Lys Ala
20 25 30
aaa gta gtt gtg aat tat cgt tcg aaa gaa gaa gaa gct aac agc gtt 144
Lys Val Val Val Asn Tyr Arg Ser Lys Glu Glu Glu Ala Asn Ser Val
35 40 45
tta gaa gaa att aaa aaa gtc ggc gga gag gca att gcg gtt aaa ggt 192
Leu Glu Glu Ile Lys Lys Val Gly Gly Glu Ala Ile Ala Val Lys Gly
50 55 60
gac gta aca gtt gag tct gac gtg atc aat tta gtt caa tct gct att 240
Asp Val Thr Val Glu Ser Asp Val Ile Asn Leu Val Gln Ser Ala Ile
65 70 75 80
aaa gaa ttt gga aag tta gat gtt atg att aat aac gca gga atg gaa 288
Lys Glu Phe Gly Lys Leu Asp Val Met Ile Asn Asn Ala Gly Met Glu
85 90 95
aat ccg gtt tca tct cat gaa atg tct tta agc gat tgg aat aaa gta 336
Asn Pro Val Ser Ser His Glu Met Ser Leu Ser Asp Trp Asn Lys Val
100 105 110
att gat acg aac tta acg gga gca ttt tta gga agc cgt gaa gcg att 384
Ile Asp Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gtg gaa aat gat att aag gga aca gtt att aat atg tcg 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Thr Val Ile Asn Met Ser
130 135 140
agt gtt cat gag aaa att cct tgg cca tta ttt gtt cat tac gca gca 480
Ser Val His Glu Lys Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggt ggc atg aag ctc atg act gaa aca ctt gca tta gaa tat 528
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gct cca aaa ggt att cgt gta aat aac att ggg ccg gga gcg att aat 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
aca ccg att aac gct gag aaa ttt gct gat cct aag cag cgc gca gat 624
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Arg Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tac atc gga gag ccg gaa gaa att 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gca gcg gtt gct gca tgg cta gct tct tca gaa gca agt tat gta aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Ser Glu Ala Ser Tyr Val Thr
225 230 235 240
ggg att acg ctc ttt gct gac ggc ggt atg aca cag tac cca tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
caa gca gga cgc gga taa 786
Gln Ala Gly Arg Gly *
260
<210> 12
<211> 261
<212> PRT
<213> Bacillus sp.
<400> 12
Met Tyr Lys Asp Leu Glu Gly Lys Val Val Val Ile Thr Gly Ser Ser
1 5 10 15
Thr Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Ala Thr Glu Lys Ala
20 25 30
Lys Val Val Val Asn Tyr Arg Ser Lys Glu Glu Glu Ala Asn Ser Val
35 40 45
Leu Glu Glu Ile Lys Lys Val Gly Gly Glu Ala Ile Ala Val Lys Gly
50 55 60
Asp Val Thr Val Glu Ser Asp Val Ile Asn Leu Val Gln Ser Ala Ile
65 70 75 80
Lys Glu Phe Gly Lys Leu Asp Val Met Ile Asn Asn Ala Gly Met Glu
85 90 95
Asn Pro Val Ser Ser His Glu Met Ser Leu Ser Asp Trp Asn Lys Val
100 105 110
Ile Asp Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Thr Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Lys Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Arg Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Ser Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 13
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH.1
<220>
<221> CDS
<222> (1)...(765)
<400> 13
atg agc acc gct atc gtc acc aac gtc aaa cat ttt ggt ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg ccg tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta ggg gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 14
<211> 254
<212> PRT
<213> Agrobacterium sp.
<400> 14
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 15
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH.2
<220>
<221> CDS
<222> (1)...(765)
<400> 15
atg agc acc gct atc gtc acc aac gtc aaa cat ttt ggt ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt caa gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg ccg tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta ggg gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga tta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 16
<211> 254
<212> PRT
<213> Agrobacterium sp.
<400> 16
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 17
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH.16
<220>
<221> CDS
<222> (1)...(765)
<400> 17
atg agc acc gct atc gtc acc aac gtc aaa cat ttt ggt ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg ccg tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 18
<211> 254
<212> PRT
<213> Agrobacterium sp.
<400> 18
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 19
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Synthetic primer
<400> 19
gaattcgccc atatgtatcc ggatttaaaa gg 32
<210> 20
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Synthetic primer
<400> 20
tggccggatc ctcattaacc gcggcctgcc tgga 34
<210> 21
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Synthetic primer
<400> 21
gaattcgccc atatgtataa agatttagaa gg 32
<210> 22
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
Synthetic primer
<400> 22
ggccggatcc tcattatccg cgtcctgctt gga 33
<210> 23
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016013-B-03
<220>
<221> CDS
<222> (1)...(765)
<400> 23
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aaa gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttc ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 24
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016013-B-03
<400> 24
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 25
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016015-C-04
<220>
<221> CDS
<222> (1)...(765)
<400> 25
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc cag gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct ctg gcg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Ala
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 26
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016015-C-04
<400> 26
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Ala
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 27
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016014-E-01
<220>
<221> CDS
<222> (1)...(765)
<400> 27
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gac ctg att gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Asp Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gac 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aaa cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aaa gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttc ctg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc att ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Ile Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 28
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016014-E-01
<400> 28
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Asp Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Ile Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 29
<211> 768
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016014-G-08
<220>
<221> CDS
<222> (1)...(765)
<400> 29
atg agc acc gct att gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg aaa ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Lys Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
ggt agc ttt aag cat aaa gat gaa ctg gaa gct ttt gct gaa gcc tac 144
Gly Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Ala Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg att gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cat gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly His Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cta gaa ttt cgg cca atc gat aaa tac gct gtc gag gat 288
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct cca caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Pro Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac tct tcg gct cga gct ggg gct agt gca cta gct aat gct cta tcg 480
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg ttc tat tac ccc act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Phe Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag att aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc gct ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Ala Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
tga 768
<210> 30
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016014-G-08
<400> 30
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Lys Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Gly Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Ala Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly His Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Pro Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Phe Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Ala Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 31
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH Mz1/2G5
<220>
<221> CDS
<222> (1)...(765)
<400> 31
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 32
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH Mz1/2G5
<400> 32
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 33
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH Mz1.1A5
<220>
<221> CDS
<222> (1)...(765)
<400> 33
atg agc ccc gct atc gtc act aac gtc aaa cat ttt ggt ggt atg ggt 48
Met Ser Pro Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
acc gct ctg agg ctg agc gaa gct ggt caa acc gtc gct tgc cat gat 96
Thr Ala Leu Arg Leu Ser Glu Ala Gly Gln Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg ccg tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 34
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH Mz1.1A5
<400> 34
Met Ser Pro Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Thr Ala Leu Arg Leu Ser Glu Ala Gly Gln Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 35
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH cys1.10
<220>
<221> CDS
<222> (1)...(765)
<400> 35
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct agt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 36
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH cys1.10
<400> 36
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 37
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH cys2.12
<220>
<221> CDS
<222> (1)...(765)
<400> 37
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct gcg cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Ala His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 38
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH cys2.12
<400> 38
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Ala His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 39
<211> 855
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh133c
<220>
<221> CDS
<222> (1)...(852)
<400> 39
atg gct aaa aac ttt agc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc agc tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cag gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat tat cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Tyr Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gat ggc ggc tac acg ctg ccg taa tga 855
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 40
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh133c
<400> 40
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Tyr Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 41
<211> 855
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh215
<220>
<221> CDS
<222> (1)...(855)
<400> 41
atg gct aaa aac ttt agc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc agc tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cag gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg att gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Ile Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat tat cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Tyr Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc ata aag ggc gcc ttg att ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Ile Lys Gly Ala Leu Ile Phe Thr Ala Ser
165 170 175
gtg tcg ggt cac atc gtt aac att ccg caa ttt cag gcg acc tac aat 576
Val Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gat ggc ggc tac acg ctg ccg taa tga 855
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro * *
275 280
<210> 42
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh215
<400> 42
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Ile Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Tyr Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Ile Lys Gly Ala Leu Ile Phe Thr Ala Ser
165 170 175
Val Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 43
<211> 855
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh267
<220>
<221> CDS
<222> (1)...(855)
<400> 43
atg gct aaa aac ttt agc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc agc tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cag gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aag cat ttt gac cag gtg att gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Ile Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ctt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Leu Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
acg tcg ggt cac atc gtt aac att ccg caa ttt cag gcg acc tac aat 576
Thr Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gat ggc ggc tac acg ctg ccg taa tga 855
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro * *
275 280
<210> 44
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh267
<400> 44
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Ile Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Leu Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Thr Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 45
<211> 855
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh287
<220>
<221> CDS
<222> (1)...(855)
<400> 45
atg gct aaa aac ttt agc aat gtc gaa tac cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg taa tga 855
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro * *
275 280
<210> 46
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh287
<400> 46
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 47
<211> 855
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh320
<220>
<221> CDS
<222> (1)...(855)
<400> 47
atg gct aaa aac ttt agc aat gtc gaa tac cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt tat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Tyr Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg taa tga 855
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro * *
275 280
<210> 48
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh320
<400> 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Tyr Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 49
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh326
<220>
<221> CDS
<222> (1)...(852)
<400> 49
atg gct aaa aac ttt agc aat gtc gaa tac cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cac ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 50
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh326
<400> 50
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 51
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh408
<220>
<221> CDS
<222> (1)...(852)
<400> 51
atg gct aaa aac ttt agc aat gtc gaa tac cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gct ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Ala Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt tcc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Ser Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aac 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 52
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh408
<400> 52
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Ala Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Ser Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 53
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh417
<220>
<221> CDS
<222> (1)...(852)
<400> 53
atg gct aaa aac ttt agc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac att ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtc cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gat ggc ggc tac acg ctg ccg taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 54
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh417
<400> 54
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 55
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh483
<220>
<221> CDS
<222> (1)...(852)
<400> 55
atg gct aaa aac ttt tcc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggc ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 56
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh483
<400> 56
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 57
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh476
<220>
<221> CDS
<222> (1)...(852)
<400> 57
atg gct aaa aac ttt tcc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa gac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asp Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gcg aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtt ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca cag aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 58
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh476
<400> 58
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asp Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 59
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh495
<220>
<221> CDS
<222> (1)...(852)
<400> 59
atg gct aaa aac ttt tcc aat gtc gaa tat cct gcc ccg ccg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
cat acc aaa gac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asp Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc agc tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gcc ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cag gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
att gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg att gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Ile Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat tat cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Tyr Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc ata aag ggc gcc ttg att ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Ile Lys Gly Ala Leu Ile Phe Thr Ala Ser
165 170 175
gtg tcg ggt cac atc gtt aac att ccg caa ttt cag gcg acc tac aat 576
Val Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gcc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggt cgt ggt ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gat ggc ggc tac acg ctg ccg taa 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 60
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED krh495
<400> 60
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Pro Pro Ala
1 5 10 15
His Thr Lys Asp Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Ser Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser Gln Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Ile Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Tyr Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Ile Lys Gly Ala Leu Ile Phe Thr Ala Ser
165 170 175
Val Ser Gly His Ile Val Asn Ile Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Ala Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 61
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2313
<220>
<221> CDS
<222> (1)...(789)
<400> 61
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg ccg tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg atg aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg acg atc aat gct gag aaa ttt gct gac cct aaa cag aaa gct gat 624
Thr Thr Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc atc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 62
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2313
<400> 62
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Thr Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 63
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2331
<220>
<221> CDS
<222> (1)...(789)
<400> 63
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg ccg tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg atg aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg cca atc aat gct gaa aaa ttc gct gac cct aaa cag aaa gct gat 624
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
gcc gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Ala Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc gtc acg tta ttc gcg gac ggc ggt atg aca cta tat cct tca ttc 768
Gly Val Thr Leu Phe Ala Asp Gly Gly Met Thr Leu Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 64
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2331
<400> 64
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
Ala Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Val Thr Leu Phe Ala Asp Gly Gly Met Thr Leu Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 65
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2279
<220>
<221> CDS
<222> (1)...(789)
<400> 65
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg ccg tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg atg aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg cca atc aat gct gaa aaa ttc gct gac cct aaa cag aaa gct gat 624
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
gcc gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Ala Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc gtc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Val Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 66
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2279
<400> 66
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
Ala Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Val Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 67
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2379
<220>
<221> CDS
<222> (1)...(789)
<400> 67
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg ccg tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg ctt aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Leu Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg cca atc aat gct gaa aaa ttc gct gac cct aaa cag aaa gct gat 624
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc atc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 68
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH 2379
<400> 68
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Leu Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Pro Ile Asn Ala Glu Lys Phe Ala Asp Pro Lys Gln Lys Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 69
<211> 1206
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
FDH FDHPs3
<220>
<221> CDS
<222> (1)...(1206)
<400> 69
atg gca aaa gtt cta tgt gtt cta tat gat gat ccg gtt gat ggt tat 48
Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr
1 5 10 15
ccg aaa acc tat gca cgt gat gat cta ccg aaa att gat cat tat ccg 96
Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro
20 25 30
ggt ggt cag acc cta ccg acc ccg aaa gca att gat ttt acc ccg ggt 144
Gly Gly Gln Thr Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly
35 40 45
cag cta cta ggt agc gtt agc ggt gaa cta ggt cta cgt aaa tat cta 192
Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Lys Tyr Leu
50 55 60
gaa agc aac ggt cat acc cta gtt gtt acc agc gat aag gac ggc cct 240
Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro
65 70 75 80
gac agc gtg ttc gag cgc gag cta gtg gac gcc gac gtg gtg att agc 288
Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser
85 90 95
cag cct ttc tgg cct gcc tat cta acc cct gag cgc att gcc aag gcc 336
Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala
100 105 110
aag aat cta aag cta gcc cta acc gcc ggc att ggc agc gac cat gtg 384
Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val
115 120 125
gac cta cag agc gcc att gac cgc aat gtg acc gtg gcc gag gtg acc 432
Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr
130 135 140
tat tgt aat agc att agc gtg gcc gag cat gtg gtg atg atg att cta 480
Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu
145 150 155 160
agc cta gtg cgc aat tat cta cct tcc cat gaa tgg gcg cgt aaa ggc 528
Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly
165 170 175
ggc tgg aac atc gcg gat tgc gtc tcc cat gcg tat gat ctg gaa gcg 576
Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala
180 185 190
atg cat gtc ggc acg gtc gcg gcg ggc cgt atc gcc ctg gcg gtc ctg 624
Met His Val Gly Thr Val Ala Ala Gly Arg Ile Ala Leu Ala Val Leu
195 200 205
cgt cgt ctg gcg ccg ttt gat gtc cat ctg cat tat acg gat cgt cat 672
Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Asp Arg His
210 215 220
cgt ctg ccg gaa tcg gta gaa aaa gaa tta aac tta acg tgg cat gcg 720
Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala
225 230 235 240
acg agg gaa gat atg tac cca gta tgt gat gta gta acg tta aac tgt 768
Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys
245 250 255
cca tta cat cca gaa acg gaa cat atg att aac gat gaa acg tta aaa 816
Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys
260 265 270
tta ttc aaa agg gga gcg tac att gtc aac acg gcg aga ggc aaa ttg 864
Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu
275 280 285
tgc gat aga gat gcg gtc gcg aga gcg ttg gaa tca ggc aga ttg gca 912
Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala
290 295 300
ggc tat gcg ggc gat gtc tgg ttt ccg caa ccg gcg ccg aaa gat cat 960
Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His
305 310 315 320
ccg tgg aga acg atg ccg tat aac ggc atg acg ccg cat att tca ggc 1008
Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly
325 330 335
acg acg ttg acg gcg caa gcg aga tat gct gcg ggc acg aga gaa att 1056
Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile
340 345 350
ttg gaa tgc ttt ttt gaa ggc aga cca atc cgt gac gaa tat ctg atc 1104
Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile
355 360 365
gtc cag ggt ggt gcc ctg gcc ggt acc ggt gcc cat tct tat tct aaa 1152
Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys
370 375 380
ggt aat gcc acc ggt ggt tct gaa gaa gcc aaa ttc aaa aaa gcc gtc 1200
Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Lys Phe Lys Lys Ala Val
385 390 395 400
taa tga 1206
* *
<210> 70
<211> 400
<212> PRT
<213> Pseudomonas sp. strain 101
<400> 70
Met Ala Lys Val Leu Cys Val Leu Tyr Asp Asp Pro Val Asp Gly Tyr
1 5 10 15
Pro Lys Thr Tyr Ala Arg Asp Asp Leu Pro Lys Ile Asp His Tyr Pro
20 25 30
Gly Gly Gln Thr Leu Pro Thr Pro Lys Ala Ile Asp Phe Thr Pro Gly
35 40 45
Gln Leu Leu Gly Ser Val Ser Gly Glu Leu Gly Leu Arg Lys Tyr Leu
50 55 60
Glu Ser Asn Gly His Thr Leu Val Val Thr Ser Asp Lys Asp Gly Pro
65 70 75 80
Asp Ser Val Phe Glu Arg Glu Leu Val Asp Ala Asp Val Val Ile Ser
85 90 95
Gln Pro Phe Trp Pro Ala Tyr Leu Thr Pro Glu Arg Ile Ala Lys Ala
100 105 110
Lys Asn Leu Lys Leu Ala Leu Thr Ala Gly Ile Gly Ser Asp His Val
115 120 125
Asp Leu Gln Ser Ala Ile Asp Arg Asn Val Thr Val Ala Glu Val Thr
130 135 140
Tyr Cys Asn Ser Ile Ser Val Ala Glu His Val Val Met Met Ile Leu
145 150 155 160
Ser Leu Val Arg Asn Tyr Leu Pro Ser His Glu Trp Ala Arg Lys Gly
165 170 175
Gly Trp Asn Ile Ala Asp Cys Val Ser His Ala Tyr Asp Leu Glu Ala
180 185 190
Met His Val Gly Thr Val Ala Ala Gly Arg Ile Ala Leu Ala Val Leu
195 200 205
Arg Arg Leu Ala Pro Phe Asp Val His Leu His Tyr Thr Asp Arg His
210 215 220
Arg Leu Pro Glu Ser Val Glu Lys Glu Leu Asn Leu Thr Trp His Ala
225 230 235 240
Thr Arg Glu Asp Met Tyr Pro Val Cys Asp Val Val Thr Leu Asn Cys
245 250 255
Pro Leu His Pro Glu Thr Glu His Met Ile Asn Asp Glu Thr Leu Lys
260 265 270
Leu Phe Lys Arg Gly Ala Tyr Ile Val Asn Thr Ala Arg Gly Lys Leu
275 280 285
Cys Asp Arg Asp Ala Val Ala Arg Ala Leu Glu Ser Gly Arg Leu Ala
290 295 300
Gly Tyr Ala Gly Asp Val Trp Phe Pro Gln Pro Ala Pro Lys Asp His
305 310 315 320
Pro Trp Arg Thr Met Pro Tyr Asn Gly Met Thr Pro His Ile Ser Gly
325 330 335
Thr Thr Leu Thr Ala Gln Ala Arg Tyr Ala Ala Gly Thr Arg Glu Ile
340 345 350
Leu Glu Cys Phe Phe Glu Gly Arg Pro Ile Arg Asp Glu Tyr Leu Ile
355 360 365
Val Gln Gly Gly Ala Leu Ala Gly Thr Gly Ala His Ser Tyr Ser Lys
370 375 380
Gly Asn Ala Thr Gly Gly Ser Glu Glu Ala Lys Phe Lys Lys Ala Val
385 390 395 400
<210> 71
<211> 1098
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
FDH FDHCb13
<220>
<221> CDS
<222> (1)...(1098)
<400> 71
atg aaa atc gta ctc gta ctc tac gat gca ggc aaa cac gca gca gat 48
Met Lys Ile Val Leu Val Leu Tyr Asp Ala Gly Lys His Ala Ala Asp
1 5 10 15
gaa gaa aaa ctc tac ggc tgc acg gaa aat aag ctg ggc att gca aat 96
Glu Glu Lys Leu Tyr Gly Cys Thr Glu Asn Lys Leu Gly Ile Ala Asn
20 25 30
tgg ctg aag gat cag ggc cac gaa ctg att acg acg tca gat aag gaa 144
Trp Leu Lys Asp Gln Gly His Glu Leu Ile Thr Thr Ser Asp Lys Glu
35 40 45
ggc ggt aat tcc gtc ttg gat caa cac atc ccc gat gct gat atc atc 192
Gly Gly Asn Ser Val Leu Asp Gln His Ile Pro Asp Ala Asp Ile Ile
50 55 60
atc aca aca ccc ttc cac ccc gct tac atc aca aaa gaa aga atc gat 240
Ile Thr Thr Pro Phe His Pro Ala Tyr Ile Thr Lys Glu Arg Ile Asp
65 70 75 80
aaa gct aaa aaa ttg aaa ttg gtc gtc gtc gct ggt gtc ggt tcc gat 288
Lys Ala Lys Lys Leu Lys Leu Val Val Val Ala Gly Val Gly Ser Asp
85 90 95
cac atc gat ttg gat tac atc aat caa aca ggt aaa aaa atc tcc gtc 336
His Ile Asp Leu Asp Tyr Ile Asn Gln Thr Gly Lys Lys Ile Ser Val
100 105 110
ttg gaa gtc aca ggt tcc aat gtc gtc tcc gtc gct gaa cac gtc gtc 384
Leu Glu Val Thr Gly Ser Asn Val Val Ser Val Ala Glu His Val Val
115 120 125
atg aca atg ttg gtc ttg gtc aga aat ttc gtc ccc gct cac gaa caa 432
Met Thr Met Leu Val Leu Val Arg Asn Phe Val Pro Ala His Glu Gln
130 135 140
atc atc aat cac gat tgg gaa gtc gct gct atc gct aaa gat gct tac 480
Ile Ile Asn His Asp Trp Glu Val Ala Ala Ile Ala Lys Asp Ala Tyr
145 150 155 160
gat atc gaa ggt aaa aca atc gct aca atc ggt gct ggt aga atc ggt 528
Asp Ile Glu Gly Lys Thr Ile Ala Thr Ile Gly Ala Gly Arg Ile Gly
165 170 175
tac aga gtc ttg gaa aga ttg gtc ccc ttc aat ccc aaa gaa ttg ttg 576
Tyr Arg Val Leu Glu Arg Leu Val Pro Phe Asn Pro Lys Glu Leu Leu
180 185 190
tac tac gat tac caa gct ttg ccc aaa gat gct gaa gaa aaa gtt ggt 624
Tyr Tyr Asp Tyr Gln Ala Leu Pro Lys Asp Ala Glu Glu Lys Val Gly
195 200 205
gct cgt cgt gtt gaa aac ata gaa gaa ttg gtt gct cag gct gat ata 672
Ala Arg Arg Val Glu Asn Ile Glu Glu Leu Val Ala Gln Ala Asp Ile
210 215 220
gtt acc gtt aac gct ccg ttg cac gct ggt acc aaa ggt ttg ata aac 720
Val Thr Val Asn Ala Pro Leu His Ala Gly Thr Lys Gly Leu Ile Asn
225 230 235 240
aaa gaa ttg ttg tca aaa ttt aaa aaa ggt gct tgg ttg ctt aac acc 768
Lys Glu Leu Leu Ser Lys Phe Lys Lys Gly Ala Trp Leu Leu Asn Thr
245 250 255
gct cgt ggt gct ata tgc gtt gct gaa gat gtt gct gct gct ttg gaa 816
Ala Arg Gly Ala Ile Cys Val Ala Glu Asp Val Ala Ala Ala Leu Glu
260 265 270
tca ggt cag ttg cgt ggt tac ggt ggt gat gtt tgg ttt ccg cag ccg 864
Ser Gly Gln Leu Arg Gly Tyr Gly Gly Asp Val Trp Phe Pro Gln Pro
275 280 285
gct ccg aaa gat cac ccg tgg cgt gat atg cgt aac aaa tac ggt gct 912
Ala Pro Lys Asp His Pro Trp Arg Asp Met Arg Asn Lys Tyr Gly Ala
290 295 300
ggt aac gct atg acc ccg cac tac tca ggt acc acc ttg gat gct cag 960
Gly Asn Ala Met Thr Pro His Tyr Ser Gly Thr Thr Leu Asp Ala Gln
305 310 315 320
acc cgt tac gct cag ggt acc aaa aac atc ctc gaa tcg ttt ttt acc 1008
Thr Arg Tyr Ala Gln Gly Thr Lys Asn Ile Leu Glu Ser Phe Phe Thr
325 330 335
ggt aaa ttt gat tat cgt cca cag gat atc atc ctc ctc aac ggt gaa 1056
Gly Lys Phe Asp Tyr Arg Pro Gln Asp Ile Ile Leu Leu Asn Gly Glu
340 345 350
tat gtt acc aaa gcc tat ggt aaa cac gat aaa aaa taa tga 1098
Tyr Val Thr Lys Ala Tyr Gly Lys His Asp Lys Lys * *
355 360
<210> 72
<211> 364
<212> PRT
<213> Candida boidinii
<400> 72
Met Lys Ile Val Leu Val Leu Tyr Asp Ala Gly Lys His Ala Ala Asp
1 5 10 15
Glu Glu Lys Leu Tyr Gly Cys Thr Glu Asn Lys Leu Gly Ile Ala Asn
20 25 30
Trp Leu Lys Asp Gln Gly His Glu Leu Ile Thr Thr Ser Asp Lys Glu
35 40 45
Gly Gly Asn Ser Val Leu Asp Gln His Ile Pro Asp Ala Asp Ile Ile
50 55 60
Ile Thr Thr Pro Phe His Pro Ala Tyr Ile Thr Lys Glu Arg Ile Asp
65 70 75 80
Lys Ala Lys Lys Leu Lys Leu Val Val Val Ala Gly Val Gly Ser Asp
85 90 95
His Ile Asp Leu Asp Tyr Ile Asn Gln Thr Gly Lys Lys Ile Ser Val
100 105 110
Leu Glu Val Thr Gly Ser Asn Val Val Ser Val Ala Glu His Val Val
115 120 125
Met Thr Met Leu Val Leu Val Arg Asn Phe Val Pro Ala His Glu Gln
130 135 140
Ile Ile Asn His Asp Trp Glu Val Ala Ala Ile Ala Lys Asp Ala Tyr
145 150 155 160
Asp Ile Glu Gly Lys Thr Ile Ala Thr Ile Gly Ala Gly Arg Ile Gly
165 170 175
Tyr Arg Val Leu Glu Arg Leu Val Pro Phe Asn Pro Lys Glu Leu Leu
180 185 190
Tyr Tyr Asp Tyr Gln Ala Leu Pro Lys Asp Ala Glu Glu Lys Val Gly
195 200 205
Ala Arg Arg Val Glu Asn Ile Glu Glu Leu Val Ala Gln Ala Asp Ile
210 215 220
Val Thr Val Asn Ala Pro Leu His Ala Gly Thr Lys Gly Leu Ile Asn
225 230 235 240
Lys Glu Leu Leu Ser Lys Phe Lys Lys Gly Ala Trp Leu Leu Asn Thr
245 250 255
Ala Arg Gly Ala Ile Cys Val Ala Glu Asp Val Ala Ala Ala Leu Glu
260 265 270
Ser Gly Gln Leu Arg Gly Tyr Gly Gly Asp Val Trp Phe Pro Gln Pro
275 280 285
Ala Pro Lys Asp His Pro Trp Arg Asp Met Arg Asn Lys Tyr Gly Ala
290 295 300
Gly Asn Ala Met Thr Pro His Tyr Ser Gly Thr Thr Leu Asp Ala Gln
305 310 315 320
Thr Arg Tyr Ala Gln Gly Thr Lys Asn Ile Leu Glu Ser Phe Phe Thr
325 330 335
Gly Lys Phe Asp Tyr Arg Pro Gln Asp Ile Ile Leu Leu Asn Gly Glu
340 345 350
Tyr Val Thr Lys Ala Tyr Gly Lys His Asp Lys Lys
355 360
<210> 73
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016514-B-12
<220>
<221> CDS
<222> (1)...(765)
<400> 73
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc cag gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt tcc cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Ser Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 74
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016514-B-12
<400> 74
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Ser Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 75
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH Mz1/4H6
<220>
<221> CDS
<222> (1)...(765)
<400> 75
atg agc acc gct atc gtc acc aac gtc aaa cat ttt ggt ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg ccg tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 76
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH Mz1/4H6
<400> 76
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 77
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016229-F-04
<220>
<221> CDS
<222> (1)...(765)
<400> 77
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agt gct ctg agg ctg tcg gag gct ggt cac acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gag gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gga ctg att gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Gly Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 78
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016229-F-04
<400> 78
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Gly Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 79
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016230-A-08
<220>
<221> CDS
<222> (1)...(765)
<400> 79
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tat cgt ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gaa cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 80
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016230-A-08
<400> 80
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 81
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016096-G9
<220>
<221> CDS
<222> (1)...(765)
<400> 81
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aaa gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttc ctg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc att atc gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Ile Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 82
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016096-G9
<400> 82
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Ile Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 83
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016097-F9
<220>
<221> CDS
<222> (1)...(765)
<400> 83
atg acc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Thr Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat atc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Ile Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc cag gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 84
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016097-F9
<400> 84
Met Thr Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Ile Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 85
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016097-H10
<220>
<221> CDS
<222> (1)...(765)
<400> 85
atg acc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Thr Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc cag gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt tcc cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Ser Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 86
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016097-H10
<400> 86
Met Thr Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Ser Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 87
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016099-A1
<220>
<221> CDS
<222> (1)...(765)
<400> 87
atg acc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Thr Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat atc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Ile Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc cag gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 88
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016099-A1
<400> 88
Met Thr Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Ile Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Gln Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 89
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016231-A-03
<220>
<221> CDS
<222> (1)...(765)
<400> 89
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct tca gaa ttt cag cca atc gat aaa tac gcc gtc gaa gat 288
Ile Phe Ala Ser Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tat cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 90
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016231-A-03
<400> 90
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Ser Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 91
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016231-E-03
<220>
<221> CDS
<222> (1)...(765)
<400> 91
atg agc acc gct atc gtc acc aac gtc aag cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac tat tat ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 92
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH P016231-E-03
<400> 92
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 93
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00827801
<220>
<221> CDS
<222> (1)...(765)
<400> 93
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa ggt ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Gly Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct agt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 94
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00827801
<400> 94
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Gly Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 95
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00890554
<220>
<221> CDS
<222> (1)...(765)
<400> 95
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cta gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Leu Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct agt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac tat tac ccc act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag att aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc acg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Thr Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 96
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00890554
<400> 96
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Thr Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 97
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00994580
<220>
<221> CDS
<222> (1)...(765)
<400> 97
atg agc acc gct att gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg att gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cta gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Leu Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct agt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac tat tac ccc act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag att aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc acg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Thr Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 98
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00994580
<400> 98
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Thr Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 99
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01018044
<220>
<221> CDS
<222> (1)...(765)
<400> 99
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aag cat aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cta gaa ttt cgg cca atc gat aaa tac gct gtc gag gat 288
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac tct tcg gct cga gct ggg gct agt gca cta gct aat gct cta tcg 480
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac tat tac ccc act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag att aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc gtc ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 100
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S0108044
<400> 100
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 101
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01035939
<220>
<221> CDS
<222> (1)...(765)
<400> 101
atg agc acc gct att gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aag cat aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg att gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cta gaa ttt cgg cca atc gat aaa tac gct gtc gag gat 288
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac tct tcg gct cga gct ggg gct agt gca cta gct aat gct cta tcg 480
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac tat tac ccc act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag att aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc gtc ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 102
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01035939
<400> 102
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 103
<211> 768
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01009684
<220>
<221> CDS
<222> (1)...(765)
<400> 103
atg agc act gcg att gtt act aac gtc aaa cat ttc ggt ggt atg ggg 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agt gcg ctg aaa ctg tcg gag gcc ggt cat aca gta gcg tgt cac gat 96
Ser Ala Leu Lys Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agt ttc aaa caa aag gac gaa ttg gaa gcc ttt gcg gaa act tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa ccg atg tca gaa cag gag cca gcg gag tta att gag 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gcg gtc acc agt gcc ttc ggc cag gtg gat gtc ctg gtt agc aac gac 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct ctg gaa ttc cag ccg att gac aag tat gcc gtc gaa gac 288
Ile Phe Ala Leu Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac cgt ggt gcg gta gaa gca ctg cag atc aag ccg ttc gcg ttg gtt 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Lys Pro Phe Ala Leu Val
100 105 110
aat gcc gta gct agt caa atg aaa aaa cgt aaa tca ggt cat att atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc att act agc gcg gct ccg ttt ggt cca tgg aag gag ctg tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tat agt agt gcg cgc gcc ggg gcc tcc gcg ttg gct aac gca ctg agt 480
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
aaa gaa tta ggt gag tat aat atc cct gtt ttc gcc att ggg cca aac 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tat ctg cac tca gaa gat agc cca tac tat tac cca acg gaa ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag atc aac cct gaa cat gtg gcg cat gtt aaa aaa gta aca gcc tta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cgt ctg ggt act caa aaa gaa ctt ggc gag ctg gtt gcg ttt ctc 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gct tct ggt agc tgc gat tac ttg acc ggc caa gtc ttc tgg tta gcc 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggt ggc ttt ccg gtg att gag cgc tgg cca ggt atg ccg gaa taa 765
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
tga 768
<210> 104
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01009684
<400> 104
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Lys Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Lys Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 105
<211> 774
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00817219
<220>
<221> CDS
<222> (1)...(765)
<400> 105
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gct ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt tcc cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Ser Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
tgaggatcc 774
<210> 106
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00817219
<400> 106
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Ser Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 107
<211> 774
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00708827
<220>
<221> CDS
<222> (1)...(765)
<400> 107
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gac ctg att gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Asp Leu Ile Glu
50 55 60
gct gtc acc agc gct tac ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aaa cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct act ccg ttc ggg cca tgg aaa gag cta tcg act 432
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct tgt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttc ctg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc ata ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Ile Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
tgaggatcc 774
<210> 108
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00708827
<400> 108
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Asp Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Tyr Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Thr Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Cys Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Ile Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 109
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00772501
<220>
<221> CDS
<222> (1)...(765)
<400> 109
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aaa cag aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cca gaa ttt cag cca atc gat aaa tac gct gtc gaa gat 288
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac act tcg gct cga gct ggg gct agt act cta gct aat gct cta tcg 480
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac ttc tac ccg act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
aag act aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc atg ata gaa cgt tgg ccc ggc atg ccc gaa taa 765
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu *
245 250
<210> 110
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S00772501
<400> 110
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys Gln Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Pro Glu Phe Gln Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Thr Ser Ala Arg Ala Gly Ala Ser Thr Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Phe Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Thr Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Met Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 111
<211> 762
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01035968
<220>
<221> CDS
<222> (1)...(762)
<400> 111
atg agc acc gct atc gtc acc aac gtc aaa cat ttt gga ggt atg ggt 48
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
agc gct ctg agg ctg agc gaa gct ggt cat acc gtc gct tgc cat gat 96
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
gaa agc ttt aag cat aaa gat gaa ctg gaa gct ttt gct gaa acc tac 144
Glu Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
cca cag ctg aaa cca atg agc gaa cag gaa cca gct gaa ctg atc gaa 192
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
gct gtc acc agc gct ttt ggt cag gtc gat gtc ctg gtc agc aac gat 240
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
atc ttt gct cta gaa ttt cgg cca atc gat aaa tac gct gtc gag gat 288
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
tac agg ggt gct gtc gaa gct ctg cag atc agg cca ttt gct cta gtg 336
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
aat gct gtg gct tcg caa atg aag aag cga aag tcg ggg cac atc atc 384
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
ttc atc act tcg gct gcc ccg ttc ggg cca tgg aag gag cta tcg act 432
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
tac tct tcg gct cga gct ggg gct agt gca cta gct aat gct cta tcg 480
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
aag gag cta gga gag tac aat atc ccg gtg ttc gct atc ggg ccg aat 528
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
tac cta cac tcg gag gat tcg ccg tac tat tac ccc act gag ccg tgg 576
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
aag att aat ccg gag cac gtg gct cac gtg aag aag gtg act gct cta 624
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
caa cga cta ggg act caa aaa gag ttg ggg gaa ttg gtg gca ttt ttg 672
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
gca tct ggc tct tgt gat tat ttg act ggc cag gtg ttt tgg ttg gca 720
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
ggc ggc ttt ccc gtc ata gaa cgt tgg ccc ggc atg ccc gaa 762
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 112
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
HHDH S01035968
<400> 112
Met Ser Thr Ala Ile Val Thr Asn Val Lys His Phe Gly Gly Met Gly
1 5 10 15
Ser Ala Leu Arg Leu Ser Glu Ala Gly His Thr Val Ala Cys His Asp
20 25 30
Glu Ser Phe Lys His Lys Asp Glu Leu Glu Ala Phe Ala Glu Thr Tyr
35 40 45
Pro Gln Leu Lys Pro Met Ser Glu Gln Glu Pro Ala Glu Leu Ile Glu
50 55 60
Ala Val Thr Ser Ala Phe Gly Gln Val Asp Val Leu Val Ser Asn Asp
65 70 75 80
Ile Phe Ala Leu Glu Phe Arg Pro Ile Asp Lys Tyr Ala Val Glu Asp
85 90 95
Tyr Arg Gly Ala Val Glu Ala Leu Gln Ile Arg Pro Phe Ala Leu Val
100 105 110
Asn Ala Val Ala Ser Gln Met Lys Lys Arg Lys Ser Gly His Ile Ile
115 120 125
Phe Ile Thr Ser Ala Ala Pro Phe Gly Pro Trp Lys Glu Leu Ser Thr
130 135 140
Tyr Ser Ser Ala Arg Ala Gly Ala Ser Ala Leu Ala Asn Ala Leu Ser
145 150 155 160
Lys Glu Leu Gly Glu Tyr Asn Ile Pro Val Phe Ala Ile Gly Pro Asn
165 170 175
Tyr Leu His Ser Glu Asp Ser Pro Tyr Tyr Tyr Pro Thr Glu Pro Trp
180 185 190
Lys Ile Asn Pro Glu His Val Ala His Val Lys Lys Val Thr Ala Leu
195 200 205
Gln Arg Leu Gly Thr Gln Lys Glu Leu Gly Glu Leu Val Ala Phe Leu
210 215 220
Ala Ser Gly Ser Cys Asp Tyr Leu Thr Gly Gln Val Phe Trp Leu Ala
225 230 235 240
Gly Gly Phe Pro Val Ile Glu Arg Trp Pro Gly Met Pro Glu
245 250
<210> 113
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01040430
<220>
<221> CDS
<222> (1)...(852)
<400> 113
atg gct aaa aac ttt tcc aat gtc gaa tat cct gcc ccg gcg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
cat acc aaa aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtt gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtc ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg gcc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Ala Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca cag aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggc ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc acg 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg tag 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 114
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01040430
<400> 114
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Ala Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 115
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01091361
<220>
<221> CDS
<222> (1)...(852)
<400> 115
atg gct aaa aac ttt tcc aat gtc gaa tat cct gcc ccg gcg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
cat acc aaa gac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asp Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agt cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gca ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Ala Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtc ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac att gtt aat gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg cag gaa aca caa aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggc ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc acg 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc gtt gtg gac ggc ggc tac acg ctg ccg tag 852
Asp Ile Val Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 116
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01091361
<400> 116
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
His Thr Lys Asp Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Ala Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Val Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 117
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01091625
<220>
<221> CDS
<222> (1)...(852)
<400> 117
atg gct aaa aac ttt tcc aat gtc gaa tat cct gcc ccg gcg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
cat acc aag aac gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agt cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtg gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gca ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Ala Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gag aaa gaa ggc aaa aag ggc gcc ttg gtc ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aat gtg ccg caa ttt cag gcg acc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gaa aca caa aat aga tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Arg Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggc ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc aca 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg tag 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 118
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01091625
<400> 118
Met Ala Lys Asn Phe Ser Asn Val Glu Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
His Thr Lys Asn Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Ala Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Thr Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Glu Thr Gln Asn Arg Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 119
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01094648
<220>
<221> CDS
<222> (1)...(852)
<400> 119
atg gct aaa aac ttt tcc aat gtc gga tat cct gcc ccg gcg cca gct 48
Met Ala Lys Asn Phe Ser Asn Val Gly Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
cat acc aaa agc gaa tca ctg cag gta ctg gat ctg ttc aaa ctg aac 96
His Thr Lys Ser Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
ggc aaa gtc gcg tct atc acc ggt agc aac tca ggc att ggt tac gcg 144
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
ctg gcc gaa gct ttt gcg cag gtt ggc gca gac gtt gcg atc tgg tat 192
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
aac agc cat gat gcc acc ggt aaa gca gag gcc ctg gct aaa aaa tat 240
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
ggc gta aaa gtc aag gct tat aaa gct aat gtc agc tcg agt gat gcg 288
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
gtg aaa cag act att gag cag cag atc aag gat ttt ggc cac ctg gac 336
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
ata gtt gtg gcg aac gca ggc atc cca tgg act aag ggt gca tac atc 384
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
gat cag gat gac gat aaa cat ttt gac cag gtg gtt gac gtc gac ctg 432
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
aaa ggc gta ggc tat gta gca aaa cat gcg ggt cgc cat ttt cgt gaa 480
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
cgt ttc gaa aaa gaa ggc aaa aag ggc gcc ttg gtc ttt acg gct tcc 528
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
atg tcg ggt cac atc gtt aac gtg ccg caa ttt cag gcg gcc tac aat 576
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Ala Tyr Asn
180 185 190
gcg gtc aag gca ggc gtg cgt cat ttc gca aag tcc ctg gcc gtg gaa 624
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
ttt gct cct ttc gca cgt gtt aac tct gta tct cct ggc tat att aat 672
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
acc gag atc tct gat ttc gtc ccg caa gga aca cag aat aaa tgg tgg 720
Thr Glu Ile Ser Asp Phe Val Pro Gln Gly Thr Gln Asn Lys Trp Trp
225 230 235 240
agc tta gtt cca ttg ggc cgt ggc ggg gaa act gcg gaa tta gtt ggt 768
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
gcc tac ctg ttc ctg gca agt gat gcg ggc tcc tac gcc acg ggc acg 816
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
gat atc att gtg gac ggc ggc tac acg ctg ccg tag 852
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro *
275 280
<210> 120
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
KRED S01094648
<400> 120
Met Ala Lys Asn Phe Ser Asn Val Gly Tyr Pro Ala Pro Ala Pro Ala
1 5 10 15
His Thr Lys Ser Glu Ser Leu Gln Val Leu Asp Leu Phe Lys Leu Asn
20 25 30
Gly Lys Val Ala Ser Ile Thr Gly Ser Asn Ser Gly Ile Gly Tyr Ala
35 40 45
Leu Ala Glu Ala Phe Ala Gln Val Gly Ala Asp Val Ala Ile Trp Tyr
50 55 60
Asn Ser His Asp Ala Thr Gly Lys Ala Glu Ala Leu Ala Lys Lys Tyr
65 70 75 80
Gly Val Lys Val Lys Ala Tyr Lys Ala Asn Val Ser Ser Ser Asp Ala
85 90 95
Val Lys Gln Thr Ile Glu Gln Gln Ile Lys Asp Phe Gly His Leu Asp
100 105 110
Ile Val Val Ala Asn Ala Gly Ile Pro Trp Thr Lys Gly Ala Tyr Ile
115 120 125
Asp Gln Asp Asp Asp Lys His Phe Asp Gln Val Val Asp Val Asp Leu
130 135 140
Lys Gly Val Gly Tyr Val Ala Lys His Ala Gly Arg His Phe Arg Glu
145 150 155 160
Arg Phe Glu Lys Glu Gly Lys Lys Gly Ala Leu Val Phe Thr Ala Ser
165 170 175
Met Ser Gly His Ile Val Asn Val Pro Gln Phe Gln Ala Ala Tyr Asn
180 185 190
Ala Val Lys Ala Gly Val Arg His Phe Ala Lys Ser Leu Ala Val Glu
195 200 205
Phe Ala Pro Phe Ala Arg Val Asn Ser Val Ser Pro Gly Tyr Ile Asn
210 215 220
Thr Glu Ile Ser Asp Phe Val Pro Gln Gly Thr Gln Asn Lys Trp Trp
225 230 235 240
Ser Leu Val Pro Leu Gly Arg Gly Gly Glu Thr Ala Glu Leu Val Gly
245 250 255
Ala Tyr Leu Phe Leu Ala Ser Asp Ala Gly Ser Tyr Ala Thr Gly Thr
260 265 270
Asp Ile Ile Val Asp Gly Gly Tyr Thr Leu Pro
275 280
<210> 121
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH S01024744
<220>
<221> CDS
<222> (1)...(789)
<400> 121
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg cca tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg atg aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg acg atc aat aag gag aaa ttt gct gac cct gaa cag aga gct gat 624
Thr Thr Ile Asn Lys Glu Lys Phe Ala Asp Pro Glu Gln Arg Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc atc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 122
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH S01024744
<400> 122
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Thr Ile Asn Lys Glu Lys Phe Ala Asp Pro Glu Gln Arg Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 123
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH S01052992
<220>
<221> CDS
<222> (1)...(789)
<400> 123
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct gct 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg cca tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggt ggg atg aag ctg atg aca aaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Met Lys Leu Met Thr Lys Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aat 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg acg atc aat aag gag aaa ttt gct gac cct gaa cag aga gct gat 624
Thr Thr Ile Asn Lys Glu Lys Phe Ala Asp Pro Glu Gln Arg Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tat atc ggc gaa ccg gat gag atc 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Asp Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc tgc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Cys Tyr Val Thr
225 230 235 240
ggc atc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 124
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH S01052992
<400> 124
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Ala
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Lys Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Thr Ile Asn Lys Glu Lys Phe Ala Asp Pro Glu Gln Arg Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Asp Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Cys Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
<210> 125
<211> 789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH S01063714
<220>
<221> CDS
<222> (1)...(789)
<400> 125
atg tat ccg gat tta aaa gga aaa gtc gtc gct att aca gga gct act 48
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Thr
1 5 10 15
tca ggg ctc gga aag gcg atg gcc att cgc ttc ggc aag gag cag gca 96
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
aaa gtg gtt atc aac tat tat agt aat aaa caa gat ccg aac gag gta 144
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
aaa gaa gag gtc atc aag gcg ggc ggt gaa gct gtt gtc gtc caa gga 192
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
gat gtc acg aaa gag gaa gat gta aaa aat atc gtg caa acg gca att 240
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
aag gag ttc ggc aca ctc gat att atg att aat aat gcc ggt ctt gaa 288
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
aat cct gtg cca tct cac gaa atg ccg ctc aag gat tgg gat aaa gtc 336
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
atc ggc acg aac tta acg ggt gcc ttt tta gga agc cgt gaa gcg att 384
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
aaa tat ttc gta gaa aac gat atc aag gga aat gtc att aac atg tcc 432
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
agt gtg cac gaa gtg att cct tgg cca tta ttt gtc cac tat gcg gca 480
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
agt aaa ggc ggg atg aag ctg atg aca gaa aca tta gcg ttg gaa tac 528
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
gcg ccg aag ggc att cgc gtc aat aat att ggg cca ggt gcg atc aac 576
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
acg acg atc aat aag gag aaa ttt gct gac cct gaa cag aga gct gat 624
Thr Thr Ile Asn Lys Glu Lys Phe Ala Asp Pro Glu Gln Arg Ala Asp
195 200 205
gta gaa agc atg att cca atg gga tat atc ggc gaa ccg gag gag atc 672
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
gcc gca gta gca gcc tgg ctt gct tcg aag gaa gcc agc tac gtc aca 720
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
ggc atc acg tta ttc gcg gac ggc ggt atg aca caa tat cct tca ttc 768
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
cag gca ggc cgc ggt taa tga 789
Gln Ala Gly Arg Gly * *
260
<210> 126
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic construct
GDH S01063714
<400> 126
Met Tyr Pro Asp Leu Lys Gly Lys Val Val Ala Ile Thr Gly Ala Thr
1 5 10 15
Ser Gly Leu Gly Lys Ala Met Ala Ile Arg Phe Gly Lys Glu Gln Ala
20 25 30
Lys Val Val Ile Asn Tyr Tyr Ser Asn Lys Gln Asp Pro Asn Glu Val
35 40 45
Lys Glu Glu Val Ile Lys Ala Gly Gly Glu Ala Val Val Val Gln Gly
50 55 60
Asp Val Thr Lys Glu Glu Asp Val Lys Asn Ile Val Gln Thr Ala Ile
65 70 75 80
Lys Glu Phe Gly Thr Leu Asp Ile Met Ile Asn Asn Ala Gly Leu Glu
85 90 95
Asn Pro Val Pro Ser His Glu Met Pro Leu Lys Asp Trp Asp Lys Val
100 105 110
Ile Gly Thr Asn Leu Thr Gly Ala Phe Leu Gly Ser Arg Glu Ala Ile
115 120 125
Lys Tyr Phe Val Glu Asn Asp Ile Lys Gly Asn Val Ile Asn Met Ser
130 135 140
Ser Val His Glu Val Ile Pro Trp Pro Leu Phe Val His Tyr Ala Ala
145 150 155 160
Ser Lys Gly Gly Met Lys Leu Met Thr Glu Thr Leu Ala Leu Glu Tyr
165 170 175
Ala Pro Lys Gly Ile Arg Val Asn Asn Ile Gly Pro Gly Ala Ile Asn
180 185 190
Thr Thr Ile Asn Lys Glu Lys Phe Ala Asp Pro Glu Gln Arg Ala Asp
195 200 205
Val Glu Ser Met Ile Pro Met Gly Tyr Ile Gly Glu Pro Glu Glu Ile
210 215 220
Ala Ala Val Ala Ala Trp Leu Ala Ser Lys Glu Ala Ser Tyr Val Thr
225 230 235 240
Gly Ile Thr Leu Phe Ala Asp Gly Gly Met Thr Gln Tyr Pro Ser Phe
245 250 255
Gln Ala Gly Arg Gly
260
Claims (27)
- 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르로부터 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 제조하는 방법으로서, 하기 단계를 포함하는 것인 방법:(a) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 제공하는 단계(여기에서 할로 치환체는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되며, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 4-할로-3-히드록시부티르산 에스테르가 아님); 및(b) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르로부터 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물을 형성하기에 적절한 조건 하에서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 할로히드린 디할로게나아제 및 시아나이드와 접촉시키는 단계.
- 제1항에 있어서, 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르는 비라세미 키랄성의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르인 방법.
- 제1항에 있어서, 시아나이드는 시안화수소산에 의해 제공되는 것인 방법.
- 제1항에 있어서, 시아나이드는 시아나이드염에 의해 제공되는 것인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 할로 치환체는 염소 및 브롬으로부터 선택되는 것인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 이웃자리 클로로, 히드록시 치환된 카르복실산 에스테르인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 저급 알킬 에스테르인 방법.
- 제1항에 있어서,(1) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지며,(2) 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지는 것인 방법:식 중, X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐이고;R1, R2, 및 R6 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 및 임 의 치환된 아릴알콕시로 이루어진 군으로부터 선택되며;R5 는 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택되며;각 Mn 은 독립적으로 -C(=O)- (즉, 카르보닐) 또는 -CRn'Rn "- 로부터 선택되며, 여기에서 Rn' 및 Rn " 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 임의 치환된 아릴, 히드록실, 니트로, 아미노, 시아노, 카르복시 (즉, 카르복실레이트 또는 카르복실산 기), 카르보알콕시 (즉, 에스테르 기), 카르바미드 (즉, 아미드 기), 및 아실 (즉, 케톤을 형성)로 이루어진 군으로부터 선택되며;n은 0 또는 2 내지 9의 정수(2, 9 포함)이다.
- 제8항에 있어서, n은 2 내지 8의 정수(2, 8 포함)인 방법.
- 제8항에 있어서, n은 3인 방법.
- 제1항에 있어서, 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르는 6-할로-5-히드록시헥산산 에스테르인 방법.
- 제1항에 있어서,(1) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지며,(2) 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지는 것인 방법.식 중, X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐이고;R1, R2, R3, R4, R6, R1', R1 ", R3', 및 R3 " 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임 의 치환된 아릴옥시, 및 임의 치환된 아릴알콕시로 이루어진 군으로부터 선택되며;R5 는 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택된다.
- 제1항에 있어서,(1) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지며,(2) 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지는 것인 방법:식 중, X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐이고;R1, R2, R3, R4, R6, R1', R1 ", R2 ", R3', 및 R3 " 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 및 임의 치환된 아릴알콕시로 이루어진 군으로부터 선택되며;R5 는 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택된다.
- 제1항에 있어서,(1) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지며,(2) 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지는 것인 방법:식 중, X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐 이고;R1, R2, 및 R6 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 및 임의 치환된 아릴알콕시로 이루어진 군으로부터 선택되며;R5 는 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택된다.
- 제1항에 있어서, 할로히드린 디할로게나아제는 자연발생적인 할로히드린 디할로게나아제인 방법.
- 제1항에 있어서, 할로히드린 디할로게나아제는 비자연발생적인 할로히드린 디할로게나아제인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물은 약 5 내지 약 9 범위의 pH 에서 유지되는 것인 방법.
- 제17항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물은 약 5 내지 약 8 범위의 pH 에서 유지되는 것인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물은 약 8 이하의 pH 에서 유지되는 것인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물은 pH 완충액을 추가로 포함하는 것인 방법.
- 제1항에 있어서, (c) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물을 약 5 이상의 pH 에서 유지하기에 충분하도록 염기를 첨가하는 단계를 추가로 포함하는 것인 방법.
- 제21항에 있어서, 염기는 히드록시드염, 카르보네이트염, 및 바이카르보네이트 염으로부터 선택되는 것인 방법.
- 제21항에 있어서, 염기는 시아나이드염으로부터 선택되는 것인 방법.
- 제1항에 있어서, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르의 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르로의 전환을 위한 반응 혼합물로부터 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 회수하는 단계를 추가로 포함하는 것인 방법.
- 제22항에 있어서, 이웃자리 시아노, 히드록시 치환된 카르복실산 에스테르를 정제하는 단계를 추가로 포함하는 것인 방법.
- (a) 할로히드린 디할로게나아제;(b) 시아나이드; 및(c) 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르를 포함하는 조성물로서, 단, 이웃자리 할로, 히드록시 치환된 카르복실산 에스테르는 4-할로-3-히드록시부티르산 에스테르가 아닌 것인 조성물.
- 제26항에 있어서,이웃자리 할로, 히드록시 치환된 카르복실산 에스테르가 하기 구조를 가지는 것인 방법:식 중, X는 염소, 브롬, 및 요오드로 이루어진 군으로부터 선택되는 할로겐이고;R1, R2, 및 R6 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 및 임의 치환된 아릴알콕시로 이루어진 군으로부터 선택되며;R5 는 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 아릴, 및 임의 치환된 아릴알킬로 이루어진 군으로부터 선택되며;각 Mn 은 독립적으로 -C(=O)- (즉, 카르보닐) 또는 -CRn'Rn "- 로부터 선택되며, 여기에서 Rn' 및 Rn " 은 각각 독립적으로 수소, 불소, 임의 치환된 저급 알킬, 임의 치환된 시클로알킬, 임의 치환된 저급 알케닐, 임의 치환된 아릴, 임의 치환된 아릴알킬, 아미노, 임의 치환된 저급 알킬아미노, 임의 치환된 시클로알킬아미노, 임의 치환된 저급 알콕시, 임의 치환된 시클로알콕시, 임의 치환된 아릴옥시, 임의 치환된 아릴, 히드록실, 니트로, 아미노, 시아노, 카르복시 (즉, 카르복실레이트 또는 카르복실산 기), 카르보알콕시 (즉, 에스테르 기), 카르바미드 (즉, 아미드 기), 및 아실 (즉, 케톤을 형성)로 이루어진 군으로부터 선택되며;n은 0 또는 2 내지 9의 정수(2, 9 포함)이다.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/639,159 US7125693B2 (en) | 2002-08-09 | 2003-08-11 | Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives |
US10/639,159 | 2003-08-11 | ||
US10/782,258 US7132267B2 (en) | 2002-08-09 | 2004-02-18 | Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives and vicinal cyano, hydroxy substituted carboxylic acid esters |
US10/782,258 | 2004-02-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060071397A true KR20060071397A (ko) | 2006-06-26 |
Family
ID=34221830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067002920A KR20060071397A (ko) | 2003-08-11 | 2004-02-18 | 4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노,히드록시 치환된 카르복실산 에스테르의 효소적 제조 방법 |
Country Status (10)
Country | Link |
---|---|
US (2) | US7132267B2 (ko) |
EP (1) | EP1660669A4 (ko) |
JP (1) | JP2007502111A (ko) |
KR (1) | KR20060071397A (ko) |
AU (1) | AU2004266100A1 (ko) |
BR (1) | BRPI0413498A (ko) |
CA (1) | CA2535353A1 (ko) |
MX (1) | MXPA06001718A (ko) |
NO (1) | NO20060544L (ko) |
WO (1) | WO2005018579A2 (ko) |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60336324D1 (de) | 2002-08-09 | 2011-04-21 | Codexis Inc | Enzymatische verfahren zur herstellung 4-substituierter 3-hydroxybuttersäure-derivate |
AU2004266100A1 (en) | 2003-08-11 | 2005-03-03 | Codexis, Inc. | Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives and vicinal cyano, hydroxy substituted carboxylic acid esters |
SG148180A1 (en) | 2003-08-11 | 2008-12-31 | Codexis Inc | Improved halohydrin dehalogenases and related polynucleotides |
EP1654354A1 (en) * | 2003-08-11 | 2006-05-10 | Codexis, Inc. | Improved ketoreductase polypeptides and related polynucleotides |
US7588928B2 (en) | 2003-08-11 | 2009-09-15 | Codexis, Inc. | Halohydrin dehalogenases and related polynucleotides |
US7541171B2 (en) | 2003-08-11 | 2009-06-02 | Codexis, Inc. | Halohydrin dehalogenases and related polynucleotides |
MXPA06001719A (es) * | 2003-08-11 | 2006-05-19 | Codexis Inc | Polipeptidos de glucosa deshidrogenasa mejorados, y polinucleotidos relacionados. |
AT502395B1 (de) * | 2005-07-27 | 2007-03-15 | Iep Gmbh | Oxidoreduktasen zur stereoselektiven reduktion von ketoverbindungen |
US8198069B2 (en) | 2005-12-21 | 2012-06-12 | Basf Se | Method of producing an optically enriched tertiary alcohol from an epoxide using halohydrin dehalogenase |
AT503486B1 (de) * | 2006-04-11 | 2008-05-15 | Iep Gmbh | Verfahren zur enantioselektiven reduktion von steroiden |
CN101528917B (zh) | 2006-10-02 | 2015-07-29 | 科德克希思公司 | 用于制备立体异构纯的他汀类及其合成中间体的组合物和方法 |
KR101502634B1 (ko) | 2007-02-08 | 2015-03-16 | 코덱시스, 인코포레이티드 | 케토 환원 효소 및 이의 용도 |
TWI488964B (zh) | 2007-03-16 | 2015-06-21 | Genomatica Inc | 用於1,4丁二醇及其前驅物之生物合成的組合物及方法 |
US7947483B2 (en) | 2007-08-10 | 2011-05-24 | Genomatica, Inc. | Methods and organisms for the growth-coupled production of 1,4-butanediol |
CN101784669B (zh) | 2007-08-24 | 2015-02-18 | 科德克希思公司 | 用于(r)-3-羟基四氢噻吩的立体选择性制备的改善的酮还原酶多肽 |
EP2198018B1 (en) | 2007-09-13 | 2013-11-20 | Codexis, Inc. | Ketoreductase polypeptides for the reduction of acetophenones |
DE102007044379A1 (de) * | 2007-09-17 | 2009-03-26 | Forschungszentrum Jülich GmbH | Kombinierter elektrochemischer und katalytischer Prozeß |
WO2009046153A1 (en) | 2007-10-01 | 2009-04-09 | Codexis, Inc. | Ketoreductase polypeptides for the production of azetidinone |
SI2329013T1 (sl) | 2008-08-27 | 2016-03-31 | Codexis, Inc. | Polipeptidi ketoreduktaze za proizvodnjo 3-aril-3-hidroksipropanamina iz 3-aril-3-ketopropanamina |
WO2010025287A2 (en) | 2008-08-27 | 2010-03-04 | Codexis, Inc. | Ketoreductase polypeptides for the production of 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine |
WO2010027710A2 (en) * | 2008-08-27 | 2010-03-11 | Codexis, Inc. | Ketoreductase polypeptides and uses thereof |
SI2329014T1 (sl) | 2008-08-29 | 2015-01-30 | Codexis, Inc. | Polipeptidi ketoreduktaze za stereoselektivno produkcijo (4s)-3(5s)-5(4-fluorofenil)-5-hidroksipentanoil)-4-fenil-1,3-oksazolidin -2-ona |
CA2735883C (en) | 2008-09-10 | 2020-05-05 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol |
US8187856B2 (en) * | 2008-12-18 | 2012-05-29 | Codexis, Inc. | Recombinant halohydrin dehalogenase polypeptides |
PL2438178T3 (pl) | 2009-06-04 | 2018-09-28 | Genomatica Inc | Mikroorganizmy do produkcji 1,4-butanodiolu i pokrewne sposoby |
KR20170080709A (ko) | 2009-06-04 | 2017-07-10 | 게노마티카 인코포레이티드 | 발효액 성분들의 분리 방법 |
US8796002B2 (en) | 2009-06-22 | 2014-08-05 | Codexis, Inc. | Polypeptides for a ketoreductase-mediated stereoselective route to alpha chloroalcohols |
WO2011022548A2 (en) | 2009-08-19 | 2011-02-24 | Codexis, Inc. | Ketoreductase polypeptides for the preparation of phenylephrine |
JP2013507145A (ja) | 2009-10-13 | 2013-03-04 | ゲノマチカ, インク. | 1,4−ブタンジオール、4−ヒドロキシブタナール、4−ヒドロキシブチリル−CoA、プトレシン及び関連化合物の生成のための微生物体並びに関連する方法 |
WO2011066076A1 (en) | 2009-11-25 | 2011-06-03 | Genomatica, Inc. | Microorganisms and methods for the coproduction of 1,4-butanediol and gamma-butyrolactone |
EP2510089B1 (en) | 2009-12-08 | 2015-10-21 | Codexis, Inc. | Synthesis of prazole compounds |
WO2011100265A2 (en) | 2010-02-10 | 2011-08-18 | Codexis, Inc. | Processes using amino acid dehydrogenases and ketoreductase-based cofactor regenerating system |
US8637286B2 (en) | 2010-02-23 | 2014-01-28 | Genomatica, Inc. | Methods for increasing product yields |
US8048661B2 (en) | 2010-02-23 | 2011-11-01 | Genomatica, Inc. | Microbial organisms comprising exogenous nucleic acids encoding reductive TCA pathway enzymes |
EP2566497B1 (en) | 2010-05-04 | 2015-07-29 | Codexis, Inc. | Biocatalysts for ezetimibe synthesis |
JP5500002B2 (ja) * | 2010-08-31 | 2014-05-21 | 株式会社デンソー | 炭化珪素半導体装置の製造方法 |
DK2649187T3 (da) | 2010-12-08 | 2018-01-29 | Codexis Inc | Biokatalysatorer og fremgangsmåder til syntesen af armodafinil |
CN102168117B (zh) * | 2011-01-12 | 2014-05-07 | 江苏阿尔法药业有限公司 | 一种制备(r)-4-氰基-3-羟基丁酸乙酯的方法 |
WO2012142302A2 (en) | 2011-04-13 | 2012-10-18 | Codexis, Inc. | Biocatalytic process for preparing eslicarbazepine and analogs thereof |
CN104053771B (zh) | 2011-11-18 | 2016-11-09 | 科德克希思公司 | 用于制备羟基取代的氨基甲酸酯的生物催化剂 |
WO2013170050A1 (en) | 2012-05-11 | 2013-11-14 | Codexis, Inc. | Engineered imine reductases and methods for the reductive amination of ketone and amine compounds |
CN111705028A (zh) | 2012-06-04 | 2020-09-25 | 基因组股份公司 | 制造4-羟基丁酸酯、1,4-丁二醇和相关化合物的微生物和方法 |
CN103014082B (zh) * | 2012-12-20 | 2014-08-27 | 苏州汉酶生物技术有限公司 | (r)-4-氰基-3-羟基丁酸乙酯的生物制备方法 |
WO2014075447A1 (zh) * | 2012-11-19 | 2014-05-22 | 苏州汉酶生物技术有限公司 | (r)-4-氰基-3-羟基丁酸乙酯的生物制备方法 |
CN106232619B (zh) | 2013-11-13 | 2022-09-09 | 科德克希思公司 | 工程化的亚胺还原酶和用于酮和胺化合物的还原胺化的方法 |
HUE053363T2 (hu) | 2014-11-25 | 2021-06-28 | Codexis Inc | Módosított iminreduktázok és eljárások keton- és aminvegyületek reduktív aminálására |
CN104651290B (zh) * | 2015-02-10 | 2018-01-02 | 浙江大学 | 工程菌及其在制备阿托伐他汀药物中间体中的应用 |
US10696953B2 (en) | 2015-02-10 | 2020-06-30 | Codexis, Inc. | Ketoreductase polypeptides for the synthesis of chiral compounds |
CN104673733B (zh) * | 2015-02-10 | 2018-02-13 | 浙江大学 | 工程菌及其在制备(r)‑6‑氰基‑5‑羟基‑3‑羰基己酸叔丁酯中的应用 |
CN104745557B (zh) * | 2015-03-05 | 2017-09-22 | 浙江工业大学 | 来源于嗜清洁细小杆菌卤醇脱卤酶突变体及其应用 |
EP3507272A1 (en) * | 2017-04-04 | 2019-07-10 | NNB Nutrition USA, LLC | Preparation of (r)-3-hydroxybutyric acid or its salts by one-step fermentation |
ES2975412T3 (es) | 2018-06-21 | 2024-07-05 | Fis Fabbrica Italiana Sintetici Spa | Proceso enzimático para la preparación de droxidopa |
CN109628511A (zh) * | 2019-01-16 | 2019-04-16 | 抚顺顺能化工有限公司 | 一种(r)-(-)-4-氰基-3-羟基丁酸乙酯的绿色环保制备方法 |
CN111138316A (zh) * | 2020-01-14 | 2020-05-12 | 营口德瑞化工有限公司 | 一种苯乙腈合成方法 |
CN112501235B (zh) * | 2020-11-19 | 2022-12-02 | 华东师范大学 | 一种利用单烯醇酮醋酸酯制备布瑞诺龙的方法 |
CN114875081A (zh) * | 2022-06-07 | 2022-08-09 | 湖北迅达药业股份有限公司 | 一种瑞舒伐他汀关键中间体的绿色工业化生产方法 |
WO2024150146A1 (en) | 2023-01-12 | 2024-07-18 | Novartis Ag | Engineered ketoreductase polypeptides |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3019450A1 (de) | 1980-05-21 | 1981-11-26 | Boehringer Mannheim Gmbh, 6800 Mannheim | Verfahren zur gewinnung von glucosedehydrogenase und hierfuer geeigneter mikroorganismus |
US4542098A (en) | 1983-05-06 | 1985-09-17 | Institut Francais Du Petrole | Production of glucose dehydrogenase and use of the resultant enzyme in the enzymatic synthesis of L-carnitine |
US4710468A (en) | 1983-10-24 | 1987-12-01 | Sigma-Tau Industrie Pharmaceutiche Riunite S.P.A. | Process for preparing L-carnitine and chemical intermediates employed therein |
US4877733A (en) | 1986-05-02 | 1989-10-31 | Toyo Jozo Kabushiki Kaisha | Glucose dehydrogenase and its production |
US5250415A (en) | 1987-04-08 | 1993-10-05 | Merck Patent Gesellschaft Mit Beschrankter Haftung | Process for the preparation of glucose dehydrogenase from Bacillus megaterium |
DE3711881A1 (de) | 1987-04-08 | 1988-10-27 | Merck Patent Gmbh | Verfahren zur herstellung von glucosedehydrogenase aus bacillus megaterium |
JP2566960B2 (ja) | 1987-06-08 | 1996-12-25 | 電気化学工業株式会社 | (R)−r−置換−β−ハイドロキシ酪酸エステルの製造法 |
JPH0286779A (ja) | 1988-09-22 | 1990-03-27 | Amano Pharmaceut Co Ltd | 改良型組換えdna、それを含む形質転換体及びそれを用いた耐熱性グルコースデヒドロゲナーゼの製造法 |
JP2742281B2 (ja) | 1988-12-29 | 1998-04-22 | 旭化成工業株式会社 | グルコース―6―リン酸デヒドロゲナーゼ遺伝子 |
JP2840722B2 (ja) | 1989-07-20 | 1998-12-24 | 日東化学工業株式会社 | 4‐ハロ‐3‐ヒドロキシブチロニトリルの製造法 |
US5210031A (en) | 1989-07-20 | 1993-05-11 | Nitto Chemical Industry Co., Ltd. | Process for the production of R(-)-4-halo-3-hydroxybutyronitrile |
JP2850515B2 (ja) | 1990-09-25 | 1999-01-27 | 東洋紡績株式会社 | グルコースデヒドロゲナーゼおよびその製造法 |
US5244796A (en) | 1990-10-12 | 1993-09-14 | Syracuse University | Cloned leuconostoc mesenteroides glucose-6-phosphate dehydrogenase genes and method of making glucose-6-phospate dehydrogenase |
JP3073037B2 (ja) | 1991-03-04 | 2000-08-07 | 三菱レイヨン株式会社 | ハロヒドリンエポキシダ−ゼ遺伝子を有する組換え体プラスミドおよび該プラスミドにより形質転換された微生物 |
US5385833A (en) | 1992-02-26 | 1995-01-31 | The Scripps Research Institute | Pseudomonas sp. ATCC No. 49794 alcohol dehydrogenase |
CA2117482C (en) | 1992-03-13 | 2005-02-15 | Maria-Regina Kula | New ketonic ester reductases, its preparation and use for enzymatic redox reactions |
US5413921A (en) | 1992-05-28 | 1995-05-09 | Ajinomoto Co., Ltd. | Method of the production of (s)-gamma-halogenated-γ-hydroxybutyric acid esters |
JP3171931B2 (ja) | 1992-06-02 | 2001-06-04 | 高砂香料工業株式会社 | (R)−(−)−4−シアノ−3−ヒドロキシ酪酸t−ブチルエステル及びその製造方法 |
JP3155107B2 (ja) | 1993-01-12 | 2001-04-09 | ダイセル化学工業株式会社 | 光学活性4−ハロ−3−ヒドロキシ酪酸エステルの製造方法 |
JPH08336393A (ja) | 1995-04-13 | 1996-12-24 | Mitsubishi Chem Corp | 光学活性なγ−置換−β−ヒドロキシ酪酸エステルの製造法 |
GB9512837D0 (en) | 1995-06-23 | 1995-08-23 | Zeneca Ltd | reduction of ketone groups |
US5891685A (en) | 1996-06-03 | 1999-04-06 | Mitsubishi Chemical Corporation | Method for producing ester of (S)-γ-halogenated-β-hydroxybutyric acid |
US5908953A (en) * | 1996-12-18 | 1999-06-01 | Mitsubishi Chemical Corporation | Method for producing (R)-4-cyano-3-hydroxybutyric acid lower alkyl ester |
JP3728045B2 (ja) | 1997-01-31 | 2005-12-21 | 三菱レイヨン株式会社 | ハロヒドリンより光学活性ジオールへの変換を触媒する新規なタンパク質 |
US6218156B1 (en) | 1997-02-07 | 2001-04-17 | Kaneka Corporation | Gene encoding carbonyl reductase, and methods for its use |
EP0879890A1 (en) | 1997-05-21 | 1998-11-25 | Rijksuniversiteit te Groningen | Enantioselective epoxide hydrolases and genes encoding these |
US6531308B2 (en) | 1997-11-04 | 2003-03-11 | Eli Lilly And Company | Ketoreductase gene and protein from yeast |
JPH11171850A (ja) | 1997-12-12 | 1999-06-29 | Kanegafuchi Chem Ind Co Ltd | 酪酸エステル誘導体の製造方法 |
KR100668575B1 (ko) | 1997-12-19 | 2007-01-17 | 워너-램버트 익스포트 리미티드 | 1,3-디올의 합성방법 |
JPH11187869A (ja) | 1997-12-25 | 1999-07-13 | Daicel Chem Ind Ltd | 新規な4−ハロアセト酢酸エステル還元酵素、該酵素の製造方法、及び該酵素を利用したアルコールの製造方法 |
JP4012299B2 (ja) | 1998-02-25 | 2007-11-21 | ダイセル化学工業株式会社 | ハロゲン置換を含む光学活性アルコールの製造方法 |
EP1077212B1 (en) | 1998-04-30 | 2003-08-20 | Kaneka Corporation | Process for producing 6-cyanomethyl-1,3-dioxane-4-acetic acid derivatives |
DE69917204T2 (de) | 1998-08-05 | 2005-06-23 | Kaneka Corp. | Verfahren zur herstellung optisch aktiver 2-(6-(hydroxymethyl)-1,3-dioxan-4-yl) -essigsäure-derivate |
JP2000236883A (ja) | 1998-12-21 | 2000-09-05 | Daicel Chem Ind Ltd | 新規なカルボニル還元酵素、該酵素の製造方法、該酵素をコードするdnaおよびこれを利用したアルコールの製造方法 |
WO2001004336A1 (de) | 1999-07-09 | 2001-01-18 | Forschungszentrum Jülich GmbH | Verfahren zur reduktion von keto-carbonsäuren und deren estern |
MXPA01007858A (es) | 1999-12-03 | 2003-07-14 | Kaneka Corp | Nueva reductasa de carbonilo, su gene y metodo para su uso. |
EP1158054A1 (en) | 2000-05-25 | 2001-11-28 | Rijksuniversiteit te Groningen | Enzymatic conversion of epoxides |
DE60105734T2 (de) * | 2000-10-31 | 2006-02-16 | Sumitomo Chemical Co. Ltd. | Verfahren zur Herstellung von 4-Cyano-4-Oxobuttersäureester und 4-Cyano-3-Hydroxybuttersäureester |
US20040248250A1 (en) | 2001-07-02 | 2004-12-09 | Takahisa Nakai | Method for modifying enzyme and oxidoreductive variant |
DE60336324D1 (de) | 2002-08-09 | 2011-04-21 | Codexis Inc | Enzymatische verfahren zur herstellung 4-substituierter 3-hydroxybuttersäure-derivate |
US7588928B2 (en) * | 2003-08-11 | 2009-09-15 | Codexis, Inc. | Halohydrin dehalogenases and related polynucleotides |
SG148180A1 (en) | 2003-08-11 | 2008-12-31 | Codexis Inc | Improved halohydrin dehalogenases and related polynucleotides |
AU2004266100A1 (en) | 2003-08-11 | 2005-03-03 | Codexis, Inc. | Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives and vicinal cyano, hydroxy substituted carboxylic acid esters |
MXPA06001719A (es) | 2003-08-11 | 2006-05-19 | Codexis Inc | Polipeptidos de glucosa deshidrogenasa mejorados, y polinucleotidos relacionados. |
EP1654354A1 (en) | 2003-08-11 | 2006-05-10 | Codexis, Inc. | Improved ketoreductase polypeptides and related polynucleotides |
US7541171B2 (en) | 2003-08-11 | 2009-06-02 | Codexis, Inc. | Halohydrin dehalogenases and related polynucleotides |
-
2004
- 2004-02-18 AU AU2004266100A patent/AU2004266100A1/en not_active Abandoned
- 2004-02-18 US US10/782,258 patent/US7132267B2/en not_active Expired - Lifetime
- 2004-02-18 EP EP04712399A patent/EP1660669A4/en not_active Withdrawn
- 2004-02-18 CA CA002535353A patent/CA2535353A1/en not_active Abandoned
- 2004-02-18 KR KR1020067002920A patent/KR20060071397A/ko not_active Application Discontinuation
- 2004-02-18 BR BRPI0413498-2A patent/BRPI0413498A/pt not_active IP Right Cessation
- 2004-02-18 JP JP2006523171A patent/JP2007502111A/ja not_active Withdrawn
- 2004-02-18 MX MXPA06001718A patent/MXPA06001718A/es not_active Application Discontinuation
- 2004-02-18 WO PCT/US2004/004819 patent/WO2005018579A2/en active Application Filing
-
2006
- 2006-02-02 NO NO20060544A patent/NO20060544L/no not_active Application Discontinuation
- 2006-08-10 US US11/502,745 patent/US7807423B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
AU2004266100A1 (en) | 2005-03-03 |
MXPA06001718A (es) | 2006-05-19 |
US20070161094A1 (en) | 2007-07-12 |
US7807423B2 (en) | 2010-10-05 |
US7132267B2 (en) | 2006-11-07 |
BRPI0413498A (pt) | 2006-10-17 |
US20040214297A1 (en) | 2004-10-28 |
EP1660669A4 (en) | 2008-10-01 |
CA2535353A1 (en) | 2005-03-03 |
NO20060544L (no) | 2006-03-13 |
EP1660669A2 (en) | 2006-05-31 |
JP2007502111A (ja) | 2007-02-08 |
WO2005018579A3 (en) | 2005-04-14 |
WO2005018579A2 (en) | 2005-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7132267B2 (en) | Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives and vicinal cyano, hydroxy substituted carboxylic acid esters | |
US7125693B2 (en) | Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives | |
US8980592B2 (en) | Process for the enantioselective enzymatic reduction of hydroxy keto compounds | |
Yamamoto et al. | Synthesis of ethyl (R)-4-chloro-3-hydroxybutanoate with recombinant Escherichia coli cells expressing (S)-specific secondary alcohol dehydrogenase | |
JP7221350B2 (ja) | ヒドロキシ-l-ピペコリン酸の製造方法 | |
CN105624125B (zh) | 醛酮还原酶及其在合成(2s,3r)-2-苯甲酰氨甲基-3-羟基丁酸酯中的应用 | |
Ni et al. | Highly stereoselective reduction of prochiral ketones by a bacterial reductase coupled with cofactor regeneration | |
CN105567652B (zh) | 一种酮还原酶及其在不对称合成手性羟基化合物中的应用 | |
WO2007028729A1 (en) | Nocardia globerula alcohol dehydrogenase and use thereof | |
JP4118687B2 (ja) | Arthrobacter crystallopoietes(アリスロバクテリア クリスタロポイテス)DSM20117株由来のD−カルバモイラーゼ | |
US20080145904A1 (en) | Method For Producing Primary Alcohols | |
JP6844073B1 (ja) | (1r,3r)−3−(トリフルオロメチル)シクロヘキサン−1−オール及びその中間体の製造法 | |
JP5001631B2 (ja) | 4−ハロ−3−ヒドロキシブチロニトリルの工業的製造方法 | |
RU2486239C2 (ru) | Полипептиды для энантиоселективного ферментативного восстановления промежуточных соединений | |
JP4601049B2 (ja) | バチルス・サチルス由来のエポキシドハイドロラーゼを発現する微生物およびそれを用いたエポキシドハイドロラーゼの製造方法 | |
JP2005027552A (ja) | 新規な光学活性2−ヒドロキシメチル−3−アリールプロピオン酸の製造方法 | |
JP2024138888A (ja) | カルバミン酸アリール-2-テトラゾリルエチルエステルの製造方法 | |
JP2003284579A (ja) | 2−ケト酪酸の製造方法 | |
JP2012090537A (ja) | 改良型ハロヒドリンエポキシダーゼ | |
JPWO2005044973A1 (ja) | 新規アセトアセチルCoA還元酵素および光学活性アルコールの製造方法 | |
JP2012228221A (ja) | 改良型ハロヒドリンエポキシダーゼ | |
JP2006180751A (ja) | Dl−メチオニンの製造法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |