CA3198478A1

CA3198478A1 - Tetrahydrocannabinolic acid (thca) synthase variants, and manufacture and use thereof

Info

Publication number: CA3198478A1
Application number: CA3198478A
Authority: CA
Inventors: Jasleen BAINES; Oleg TYURIN; Malcolm J. Kavarana; Mingyang Sun
Original assignee: Teewinot Life Sciences Corp
Current assignee: Teewinot Life Sciences Corp
Priority date: 2020-11-13
Filing date: 2021-11-11
Publication date: 2022-05-19
Also published as: WO2022103938A1

Abstract

Provided herein is a recombinant vector that comprises a promoter, a secretion tag gene of interest (GOI), and optionally a purification and/or a detection tag. The GOI comprises a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 or a polynucleotide sequence with at least 90%, 95%, 98%, 99% or 99.9% identity with any one of SEQ ID NOs: 2-57. Also, disclosed are the sequences of polypeptides that result from expression of a GOI by a host expression system, and a method of producing cannabinoid compounds.

Description

Tetrahydrocannabinolic acid (THCA) Synthase Variants, and Manufacture and Use Thereof CROSS-REFERENCE TO RELATED APPLICATIONS
The present application claims priority under 35 U.S.C. 119(e) to U.S.
Provisional Patent Application 63/113,240, filed November 13, 2020, which is herein incorporated by reference in its entirety.
BACKGROUND
Cannabinoids, the terpenophenolic compounds found in Cannabis sativa, have proven therapeutic potential. For example, cannabidiol (CBD) is a potent antioxidant and anti-inflammatory compound and may provide protection against acute and chronic neurodegeneration. It is found in high concentrations in hemp and acts as a high-affinity GC-adrenergic receptor agonist, a moderate-affinity 5-HT1A receptor antagonist, and a low-affinity CB1 receptor antagonist. CBD may also have anti-depressant activity.
Cannabichromene (CB C) possesses anti-inflammatory, anti-fungal, and anti-viral properties.
Thus, cannabinoids are regarded as promising therapeutic agents for the treatment of various diseases.
The varins are a class of cannabinoids that are structurally different from the classical cannabinoids (e.g., Tetrahydrocannabinol (THC), CBD, Cannabigerol (CBG), or CBC and their corresponding carboxylic acids). The varins have a 3-carbon propyl side chain instead of a pentyl (5-carbon) side chain attached to the aromatic ring. Many of the varins are found in very low amounts in the Cannabis plant. Tetrahydrocannabivarin (THCV) is one widely studied cannabinoid varin compounds. THCV can function as an antagonist of THC
at CBI
receptors and thus attenuate the psychoactive effects of THC. THCV is being evaluated as a potential therapeutic for the treatment for type 2 diabetes, by increasing insulin sensitivity and improving glucose tolerance in patients with type-2 diabetes (Wargent et at., Nutr Diabetes., May; 3(5) e68 (2013)). THCV has also shown promise for the treatment of epilepsy and in reducing tremors associated with Parkinson's disease.
However, traditional chemical synthesis of many cannabinoids, particularly the low abundance varins is either suboptimal, non-existing, and/or does not permit the cost-effective manufacture of cannabinoids in high yields and at commercial scales. Thus, there is a need to develop a more effective system for industrial-scale manufacture of cannabinoid compounds.
Bio-catalysis provides one cost-effective method for producing many cannabinoids found in the Cannabis plant. The process requires contacting a cannabinoid synthase enzyme with a substrate of the enzyme to produce cannabinoids and the low abundance varins at commercial scale and in pharmaceutical grade purity. While existing protocols, such as the one described in U.S. Patent 10,336,978 is focused on using cannabinoid synthase enzymes, namely, THCA
synthase and CBDA synthase found in the Cannabis plant, for the bio-catalytic manufacture of cannabinoids, the focus of this application is on mutants of THCA synthase that have improved yields and enhanced kinetic rates compared to the plant (botanical) THCA synthase enzyme.
SUMMARY OF THE INVENTION
In one aspect, the present invention provides a recombinant vector that comprises a promoter, secretion tag, gene of interest (GOT), and optionally a purification and/or a detection tag, wherein the gene of interest comprises a polynucleotide sequence encoding a polypeptide with at least 90%, 95%, 98%, or 99.9% sequence identity to the sequence as set forth in any one of SEQ ID NOs: 84-139.
In another aspect, the present invention provides a polynucleotide comprising the polynucleotide sequence as set forth in any one of SEQ ID NO: 2-57, or a polynucleotide comprising a polynucleotide sequence comprising at least 90%, 95%, 98%, 99%, or 99.9%
sequence identity to the sequence as set forth in any one of SEQ ID NOs: 2-57.
In some aspects, the present invention provides a polypeptide comprising the amino acid sequence of any one of SEQ ID NOs: 84-139 or a polypeptide comprising an amino acid sequence having at least 90%, 95%, 98%, or 99.9% sequence identity to a sequence as set forth in any one of SEQ ID NOs: 84-139.
In other aspects, the present invention provides a gene of interest operably linked to a promoter which is a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
In one aspect, the present invention provides a promoter having a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99% sequence identity to the sequence of SEQ ID NOs: 71-80.

-2-In another aspect, the present invention provides a promoter that is a constitutive promoter or an inducible promoter. In one embodiment, the promoter is selected from a group consisting of an alcohol oxidase 1 promoter (pA0X1), an alcohol oxidase 2 promoter (pA0X2), a dihydroxyacetone kinase promoter (pDAK), an S-hydroxymethyl-glutathione hydrolase promoter (pFGH), an NADtdependent formylglutathione dehydrogenase promoter (pFDH), a fructose 1,6-bisphosphate aldolase promoter (pFBA2), a peroxisomal membrane signal receptor PT S1 promoter (pPEX5), a peroxi som al protein Pex8p promoter (pPEX8), an alcohol dehydrogenase 2 promoter (pADH2) and a peroxin Pex14p promoter (pPEX14).
In some aspects, present invention provides a recombinant vector comprising a secretion tag as set forth in any one of SEQ ID NOs. 58-67 and 154 or a secretion tag whose sequence is at least 90%, 95%, 98%, 99%, or 100% identical to SEQ ID NOs: 58-67 and 154.
In other aspects, the present invention provides a recombinant vector comprising a purification/detection tag as set forth in any one of SEQ ID NOs: 68-70 and 153. In one embodiment, the purification/detection tag is selected from the group consisting of a human influenza hemagglutinin (HA) tag, a His 6 tag and an HN tag.
In one aspect, the present invention provides a host expression system comprising a recombinant vector that comprises a promoter, secretion tag, gene of interest (GOT), and optionally a purification and/or a detection tag.
In another aspect, the present invention provides a host expression system comprising a microbial cell, a yeast cell, a plant cell, or an animal cell.
In some aspects, the present invention provides a host expression system comprising a yeast cell is selected from the group consisting of Pichia pastor's, Pichia angusta, Pichia Pichia methanolica, Pichia inositovera, Hansenula polytnotpha, Candida boidinii, and Yarrowia In one aspect, the present invention provides a method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants. In another embodiment, the invention provides a method for producing a cannabinoid by contacting a cannabinoid precursor with an enzyme that is expressed by the recombinant vector of this disclosure.
BRIEF DESCRIPTION OF THE DRAWINGS

-3 -FIG. 1 shows the expression cassette for a recombinant vector according to one embodiment of the invention.
FIGs. 2A-2I show the high-pressure liquid chromatography (HPLC) plots of select cannabinoids from the enzymatic assay as well as those of cannabinoid references standards.
DETAILED DESCRIPTION
It is to be understood that the invention is not limited to methodologies, protocols, cell lines, animal species or genera, compounds, polymers, and reagents described, as such may vary. It is also to be understood that the terminology used herein is for the purpose of describing particular embodiments only and is not intended to limit the scope of the present invention, which will be limited only by the appended claims.
Terms as set forth hereinafter are generally to be understood in their common sense unless indicated otherwise.
Unless otherwise defined, scientific and technical terms used herein have the meanings that are commonly understood by those of ordinary skill in the art. In the event of any latent ambiguity, definitions provided herein take precedent over any dictionary or extrinsic definition. Unless otherwise required by context, singular terms shall include pluralities and plural terms shall include the singular. The use of "or" means "and/or" unless stated otherwise.
The use of the term "including," as well as other forms, such as "includes"
and "included," is not limiting.
That the disclosure may be more readily understood, select terms are defined below.
The articles "a- and "an- are used herein to refer to one or to more than one (i.e., to at least one) of the grammatical object of the article. By way of example, "an element" means one element or more than one element.
"About" as used herein when referring to a measurable value such as an amount, a temporal duration, and the like, is meant to encompass variations of 20% or 10%, more preferably 5%, even more preferably 1%, and still more preferably 0.1% from the specified value, as such variations are appropriate to perform the disclosed methods.
The term "comprising" or "comprises" is intended to mean that the compositions and methods include the recited elements, but do not exclude others. -Consisting essentially of,"
when used to define compositions and methods, shall mean excluding other elements of any essential significance to the combination. For example, a composition consisting essentially

-4-of the elements as defined herein would not exclude other elements that do not materially affect the basic and novel characteristic(s) of the claimed invention.
"Consisting of' shall mean excluding more than a trace amount of other ingredients and substantial method steps recited. Embodiments defined by each of these transition terms are within the scope of this invention.
The term "isolated" means altered or removed from the natural state. For example, a nucleic acid or a peptide naturally present in a living animal is not "isolated," but the same nucleic acid or peptide partially or completely separated from the coexisting materials of its natural state is "isolated." An isolated nucleic acid or protein can exist in substantially purified form, or can exist in a non-native environment such as, for example, a host cell.
As used herein, the term "precursor- refers to a compound that participates in a chemical reaction that produces another compound. In one embodiment, the cannabinoid precursor refers to a compound that participates in a reaction to produce another compound.
For example, CBGA is a precursor to THCA, CBDA, and CBCA. In another example, CBGVA is a precursor to THCVA, CBDVA, and CBCVA.
The terms "nucleic acid" and "polynucleotide" as used herein are interchangeable.
Nucleic acids and polynucleotides are polymers of nucleotides.
The nucleic acids of the present disclosure may include naturally occurring bases including adenine, guanine, cytosine, thymidine, and uracil. The sequences of nucleic acids may also contain modified bases. Examples of such modified bases include aza-and deaza-adenine, guanine, cytosine, thymidine and uracil; and xanthine and hypoxanthine. In one embodiment, the polynucleotide or nucleic acid molecule is a complementary DNA
(cDNA).
A polypeptide, in one embodiment, may include various structural forms of the primary protein. For example, a polypeptide of the disclosure may be in the form of acidic or basic salts or in neutral form. In addition, individual amino acid residues may be modified by oxidation or reduction. The proteins and polypeptides of the present disclosure may also include truncations, analogs and homologs of the proteins and polypeptides, as described herein, having substantially the same function as the proteins or polypeptides of the present disclosure, such as having THCA synthase activity.

-5-The term "sequence identity" or "identity" refers to the maximum correspondence relation of the amino acid or nucleotide residues in the two sequences that are aligned for comparison. The length for identity comparison may extend to the full length of a nucleotide or polypeptide sequence, or a fragment of a nucleotide or polypeptide sequence that is at least about nine residues, at least about 20 to 24 residues, at least about 28 to 32 residues, and preferably at least about 36 or greater than 36 residues. Several different algorithms known in the art that can be used to measure sequence identity.
In one embodiment, the sequence identity is in a range from about 50% to about 99.9%, about 55% to about 99.9%, about 60% to about 99.9%, about 65% to about 99.9%, about 70% to about 99.9%, about 75% to about 99.9%, about 80% to about 99.9%, about 85% to about 99.9%, about 90% to about 99.9%, and about 95% to about 99.9%.
In one embodiment, the sequence identity between two polynucleotides or two polypeptides is about 99.5%, about 98.5%, about 97.5%, about 96.5%, about 95.5%, about 94.5%, about 93.5%, about 92.5%, about 91.5%, about 90.5%, about 89.5%, about 88.5%, about 87.5%, about 86.5%, about 85.5%, about 84.5%, about 84.5%, about 83.5%, about 82.5%, about 81.5%, or about 80.5%.
In one embodiment, the sequence identity between two polynucleotides or two polypeptides is about 99%, about 98%, about 97%, about 96%, about 95%, about 94%, about 93%, about 92%, about 91%, about 90%, about 89%, about 88%, about 87%, about 86%, about 85%, about 84%, about 83%, about 82%, about 81%, or about 80%.
In one embodiment, the sequence identity between two polynucleotides or two polypeptides is about 99.9%, about 99.8%, about 99.7%, about 99.6%, about 99.5%, about 99.4%, about 99.3%, about 99.2%, about 99.1%, or about 99%.
The term -cannabinoid product" or -cannabinoid compound" is intended to mean any simple or complex substance or compound of natural, semi-synthetic, or synthetic origin, which can act on or modulate the activity of a cannabinoid receptor in a subject. In some embodiments, the cannabinoid product is an agonist of a cannabinoid receptor.
In some embodiments, the cannabinoid product is an antagonist of a cannabinoid receptor. In yet another embodiment, the cannabinoid product is an inverse-agonist or an inverse-antagonist of a cannabinoid receptor. In one embodiment, the cannabinoid product comprises phytocannabinoids, endogenous cannabinoids (endocannabinoids), bio-synthetic

-6-cannabinoids, or synthetic cannabinoids. In one embodiment, the cannabinoid product comprises a pentyl side chain on the aromatic ring. Certain cannabinoids have a propyl side chain. In this application, this class of cannabinoids may be referred to as "varin."
Ranges: throughout this disclosure, various aspects of the embodiments can be presented in a range format. It should be understood that the description in range format is merely for convenience and brevity and should not be construed as an inflexible limitation.
Accordingly, the description of a range should be considered to have specifically disclosed all the possible subranges as well as individual numerical values within that range. For example, description of a range such as from 1 to 6 should be considered to have specifically disclosed subranges such as from I to 3, from 1 to 4, from 1 to 5, from 2 to 4, from 2 to 6, from 3 to 6 etc., as well as individual numbers within that range, for example, 1, 2, 2.7, 3, 4, 5, 5.3, and 6.
This applies regardless of the breadth of the range. Unless otherwise explicitly stated to the contrary, a range that is disclosed also includes the endpoints of the range.
The present invention relates to mutants of THCA synthase as well as recombinant vectors that comprises a polynucleotide sequences that code for THCA synthase mutants.
The THCA synthase mutants of the invention have advantages over THCA synthase found in the cannabis plant. For instance, the mutant THCA synthases described here have better catalytic output compared to THCA synthase in the cannabis plant. In one embodiment, the catalytic activity of the mutant THCA synthases are at least 1-50 fold greater, at least 5-fold greater, at least 10-fold greater, at least 15-fold greater, at least 20-fold greater, at least 25-fold greater, at least 30-fold greater, at least 35-fold greater, at least 40-fold greater, or at least 45-fold greater, than the catalytic activity of the native THCA synthase from the cannabis plant.
In some embodiment, for certain mutants, the catalytic activity is between 5-10 fold greater than the catalytic activity of THCA synthase enzyme from the cannabis plant. In one embodiment the catalytic activity of the mutants is between 11-15 fold greater, between 16-20 fold greater, between 21-25 fold greater, between 26-30 fold greater, between 31-35 fold greater, between 36-40 fold greater, between 41-45 fold greater, or between 46-50 fold greater than the catalytic activity of native THCA synthase from the cannabis plant.
In other embodiments, for certain mutants, the catalytic activity is about 5 to about 10 fold greater than the catalytic activity of a THCA synthase having the sequence of SEQ ID

-7-

8 NO: 83 or THCA synthase of the cannabis plant (e.g., native THCA synthase from a wild-type cannabis plant). In one embodiment, the catalytic activity of the mutant is about 11 to about 15 fold greater, about 16 to about 20 fold greater, about 21 to about 25 fold greater, about 26 to about 30 fold greater, about 31 to about 35 fold greater, about 36 to about 40 fold greater, about 41 to about 45 fold greater, or about 46 to about 50 fold greater than the catalytic activity of a THCA synthase having the sequence of SEQ ID NO: 83 or THCA
synthase of the cannabis plant (e.g., native THCA synthase from a wild-type cannabis plant).
Non-limiting cannabinoid products include tetrahydrocannabinol (THC), cannabidiol (CBD), olivetol, cannabinol (CBN), cannabigerol (CBG), cannabichromene (CBC), cannabicyclol (CB CL), nabilone, tetrahydrocannabinolic acid (THCA), cannabichromenic acid (CBCA), cannabicyclol carboxylic acid (CBCLA), cannabigerolic acid (CBGA), cannabidiolic acid (CBDA), cannabinolic acid (CBNA), tetrahydrocannabivarin (THCV), cannabivarin (CBV), cannabidivarin (CBDV), cannabigerovarin (CBGV), cannabichromevarin (CBCV), cannabicyclovarin (CBCLV), cannabicyclovarinic acid (CBCLVA), cannabigerovarinic acid (CBGVA), tetrahydrocannabivarinic acid (THCVA), cannabichrome varinic acid (CBCVA), cannabidivarinic acid (CBDVA), as well as the prodrugs and pharmaceutically acceptable salts of these cannabinoids.
Exemplary prodrugs include alkyl ethers, haloalkyl ethers, alkyl esters, haloalkyl esters, and aromatic esters, for example CBD difluoromethyl ether or CBD methyl ether.
As used herein, the term -cannabinoid varin compound- refers to cannabinoid compounds comprising a propyl side chain attached to an aromatic ring. In one embodiment, the cannabinoid varin compound is psychoactive. In another embodiment, the cannabinoid varin compound is non-psychoactive. Non-limiting examples of cannabinoid varin compounds include tetrahydrocannabivarin (THCV), cannabivarin (CBV), cannabidivarin (CBDV), cannabigerovarin (CBGV), cannabichromevarin (CB CV), cannabicyclovarin (CBCLV), cannabicyclovarinic acid (CBCLVA), cannabigerovarinic acid (CB OVA), tetrahydrocannabivarinic acid (THCVA), cannabichromevarinic acid (CBCVA), and cannabidivarinic acid (CBDVA), as well as natural or synthetic molecules that have a basic cannabinoid varin structure and are modified synthetically to provide a cannabinoid analog.
The polynucleotide of interest can be cloned into a vector of interest to produce a construct. In an embodiment, the vector is an expression vector. Examples of expression vectors include but are not limited to cosmids, plasmids, or modified viruses (e.g. replication defective retroviruses, adenoviruses, and adeno-associated viruses), so long as the vector is compatible with the host cell used. The expression vectors are suitable for transformation of a host cell, which means that the expression vectors contain a polynucleotide of the application and regulatory sequences selected on the basis of the host cells to be used for expression. "Operably linked" is intended to mean that the nucleic acid is linked to regulatory sequences in a manner which allows expression of the nucleic acid In some embodiments, the isolated and/or purified nucleic acid molecules, polynucleotides or vectors, constructs or in vitro expression systems comprising these isolated and/or purified nucleic acid molecules, may be used to create transgenic or recombinant organisms or recombinant cells (e.g. optionally cells of recombinant organisms) that produce polypeptides with cannabinoid synthase activity and/or modulated levels of polypeptides with cannabinoid synthase activity.
In some embodiments, a polynucleotide comprising a sequence encoding a polypeptide described herein, or a vector comprising the polynucleotide, can be codon-optimized e.g., for use in a particular host cell, such as, for example, a bacterial or plant cell.
Figure 1 schematically shows an expression cassette used for the manufacture of a THCA
synthase enzyme. In one embodiment, the expression cassette comprises a gene of interest (GOT) comprising the sequence as set forth in any one of nucleotide sequences of SEQ ID
NOs: 2-57 are operably linked to a secretion tag according SEQ ID NOs: 58-67 and 154, which in turn is operably linked to a promoter sequence as set forth in any one of SEQ ID
NOs: 71-80. The expression cassette is inserted into the yeast genome and is used to express a cannabinoid synthase enzyme. In some cases, a purification/detection tag as set forth in any one of SEQ ID NOs: 68-70 and 153 is operably linked downstream of the gene of interest to enable purification and/or detection of the protein expressed by the gene of interest.
In one embodiment, the disclosure also provides a recombinant vector comprising a polynucleotide sequence for the gene of interest (GOT) as set forth in any one of SEQ ID
NOs: 2-57. In one embodiment, the disclosure also provides a recombinant vector comprising a polynucleotide sequence with at least 90%, 95%, 98%, or 99.9% identity with any one of SEQ ID NOs: 2-57.

-9-In one embodiment, a polynucleotide comprising the polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide of SEQ ID NOs. 84-139. In one embodiment, the polynucleotide sequence encodes a polypeptide with at least 90%, 95%, 98%, or 99.9% identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the polynucleotide sequence is operably linked to a regulatory sequence for the transcription and translation of the gene of interest (GOT).
Suitable regulatory sequences may be derived from a variety of sources, including bacterial, fungal, viral, mammalian, or insect genes (for example, see the regulatory sequences described in Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990), incorporated herein by reference in its entirety). Selection of appropriate regulatory sequences is dependent on the host cell chosen, as discussed below, and may be readily accomplished by one of ordinary skill in the art. Examples of such regulatory sequences include: a transcriptional promoter and enhancer or RNA polymerase binding sequence, a ribosomal binding sequence, including a translation initiation signal.
Additionally, depending on the host cell chosen and the vector employed, other sequences, such as an origin of replication, additional DNA restriction sites, enhancers, and sequences conferring inducibility of transcription may be incorporated into the expression vector.
In one embodiment, the regulatory sequence is a promoter. The promoter is functional in the host cell or host expression system. In another embodiment, the promoter is a constitutive promoter or an inducible promoter. In one embodiment, the promoter is selected from a group consisting of an alcohol oxidase 1 promoter (pA0X1), an alcohol oxidase 2 promoter (pA0X2), a dihydroxyacetone kinase promoter (pDAK), an S-hydroxymethyl-glutathione hydrolase promoter (pFGH), a NAD - dependent formylglutathione dehydrogenase promoter (pFDH), a peroxin Pex14p promoter (pPEX14p), a fructose 1,6-bisphosphate aldolase promoter (pFBA), a peroxisomal membrane signal receptor PTS1 promoter (pPEX5), an alcohol dehydrogenase 2 promoter (pADH2), and a peroxisomal protein Pex8p promoter (pPEX8).
In one embodiment, the promoter is a polynucleotide of SEQ ID NOs: 71-80 or a polynucleotide that has at least 90%, 95%, 98%, or 99% identity with any one of SEQ ID
NOs: 71-80.

-10-For some embodiments, the promoter is a polynucleotide that has at least 99%
identity to a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
According to one embodiment, the promoter is a polynucleotide that has at least 98%
identity to a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
In one embodiment, the promoter is a polynucleotide that has at least 97%
identity to a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
In one embodiment, the promoter is a polynucleotide that has at least 96%
identity to a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
In one embodiment, the promoter is a polynucleotide that has at least 95%
identity to a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
In one embodiment, the promoter is a polynucleotide that has at least 90%, 91%, 92%, 93%, 94%, or 95% identity to a polynucleotide as set forth in any one of SEQ
ID NOs: 71-80.
In one embodiment, the promoter is a polynucleotide sequence selected from a group consisting of SEQ ID NOs: 71-80.
In one embodiment, the vector encodes a polynucleotide for a secretion peptide. In one embodiment, the secretion peptide is encoded by a polynucleotide sequence of SEQ ID
NOs: 58-67 and 154 or having at least 90%, 95%, 98%, 99%, or 100% identity with a polynucleotide as set forth in any one of SEQ ID NOs: 58-67 and 154.
In one embodiment, the secretion peptide is encoded by a polynucleotide sequence having at least 99% identity with any one of SEQ ID NOs: 58-67 and 154.
In one embodiment, the secretion peptide is encoded by a polynucleotide sequence having at least 98% identity with any one of SEQ ID NOs: 58-67 and 154.
In one embodiment, the secretion peptide is encoded by a polynucleotide sequence having at least 97% identity with any one of SEQ ID NOs: 58-67 and 154.
In one embodiment, the secretion peptide is encoded by a polynucleotide sequence having at least 96% identity with any one of SEQ ID NOs: 58-67 and 154.
In one embodiment, the secretion peptide is encoded by a polynucleotide sequence having at least 95% identity with any one of SEQ ID NOs: 58-67 and 154.
In one embodiment, the secretion peptide is encoded by a polynucleotide sequence having at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, or at least 95%
identity with any one of SEQ ID NOs: 58-67 and 154.

-11-In one embodiment, the secretion tag is encoded by a polynucleotide sequence that represents a codon optimized version of SED ID NO: 58. In some embodiments, the sequence for the codon optimized polynucleotide sequence is as follows (SEQ ID NO:
154):
AT GAGAT T CCCAT COAT OTT CACT GCT GT T T T GT T CGCT GCT T CT TCCGCT T T GGCT
GCT CCAGT TAACACTACT
ACT GAGGACGAGACT GOT CAGAT T CCAGCT GAAGCT GT TAT T GGT TACT CCGACT T GGAAGGT
GACT TCGACGT T
GCT GT T T T GCCAT T CT CCAACT CCACTAACAACGGT T T GT T GT T CAT CAACACTACAAT
CGCT T C GATT GCT GCT
AAAGAAGAGGGAGTTTCCTTGGAGAAGAGAGAGGCTGAAGCT
In another embodiment, the secretion peptide comprises a polypeptide sequence as set forth in any one of SEQ ID NOs: 140-149 or a polypeptide sequence having at least 90%, 95%, 98%, 99%, or 100% identity with any one of SEQ ID NOs: 140-149.
In one embodiment, the secretion peptide comprises a polypeptide sequence having at least 99% identity with any one of SEQ ID NOs: 140-149.
In one embodiment, the secretion peptide comprises a polypeptide sequence having at least 98% identity with any one of SEQ ID NOs: 140-149.
In one embodiment, the secretion peptide comprises a polypeptide sequence having at least 97% identity with any one of SEQ ID NOs: 140-149.
Tn one embodiment, the secretion peptide comprises a polypeptide sequence having at least 96% identity with any one of SEQ ID NOs: 140-149.
In one embodiment, the secretion peptide comprises a polypeptide sequence having at least 95% identity with any one of SEQ ID NOs: 140-149.
In one embodiment, the secretion peptide comprises a polypeptide sequence having at least 90% identity, at least 91% identity, at least 92% identity, at least 93%
identity, or at least 94% identity with any one of SEQ ID NOs: 140-149.
In one embodiment, the vector encodes a polynucleotide for a purification and/or a detection tag. In another embodiment, the purification and/or detection tag is selected from the group consisting of a human influenza hemagglutinin (HA) tag, a His 6 tag, and an HN
tag. In one embodiment, the purification tag is encoded by a polynucleotide sequence as set forth in any one of SEQ ID NOs: 68-70 and 153. In another embodiment, the purification tag encodes a polypeptide as set forth in any one of SEQ ID NOs: 150-152.
In one embodiment, the recombinant vector is a plasmid. Exemplary plasmids include the pPIC 3.5 and pL, represented by SEQ ID NOs: 81 and 82 respectively.

-12-In one embodiment, the disclosure relates to a polynucleotide for the GOT as set forth in any one of SEQ ID NO: No: 2-57. In another aspect, the disclosure relates to a polynucleotide of the GOT comprising a sequence having at least 90%, 95%, 98%, 99%, or 99.9% identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the polynucleotide comprises a sequence having at least 99.9%
identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the polynucleotide comprises a sequence having at least 98%

identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the polynucleotide comprises a sequence having at least 97%

identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the polynucleotide comprises a sequence having at least 96%

identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the polynucleotide comprises a sequence having at least 95%

identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the polynucleotide comprises a sequence having at least 90%, at least 91%, at least 92%, at least 93%, or at least 94% identity with any one of SEQ ID NOs:
2-57.
In another aspect, the polynucleotide for the gene of interest (GOT) is selected from SEQ ID NOs: 2-57.
In one embodiment, a polynucleotide of SEQ ID NOs: 2-57 encodes a polypeptide of SEQ ID NOs: 84-139. In one embodiment, a polynucleotide sequence having 90%, 95%, 98%, or 99.9% identity to SEQ ID NOs: 2-57 encodes a polypeptide with a sequence having at least at least 90%, 95%, 98%, or 99.9% identity with any one of SEQ ID NOs:
84-139.
In one embodiment, the polypeptide has 99.9% identity to a polypeptide of SEQ
ID
NOs: 84-139.
In another embodiment, the polypeptide has 98% identity to a polypeptide of SEQ ID
NOs: 84-139.
In another embodiment, the polypeptide has 97% identity to a polypeptide of SEQ ID
NOs: 84-139.
In another embodiment, the polypeptide has 96% identity to a polypeptide of SEQ ID
NOs: 84-139.

-13-In another embodiment, the polypeptide has 95% identity to a polypeptide of SEQ ID
NOs: 84-139.
In one embodiment, the polypeptide has 90% identity, 91% identity, 92%
identity, 93% identity, or 94% identity to a polypeptide of SEQ ID NOs: 84-139.
In another aspect, the present invention provides a polypeptide comprising the amino acid sequence of any one of SEQ ID NOs: 84-139 or an amino acid sequence comprising at least 90% identity, 91% identity, 92% identity, 93% identity, or 94% identity to a polypeptide of SEQ ID NOs: 84-139.
In some embodiments, a polypeptide of the present invention comprises an alteration at one or more (e.g., several) amino acids in the polypeptide, wherein at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 119,20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 162, 164, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 193, 194, 195, 196, 197, 198, 199, 200, or more amino acids are altered. In one embodiment, the alteration is relative to the reference polypeptide of SEQ ID NO: 83, wherein the alteration comprises one or more substitutions, insertions, deletions, and/or additions in the polypeptide relative to the reference polypeptide of SEQ ID NO. 83.
In other embodiments, the invention includes an isolated, recombinant, substantially pure, or non-naturally occurring polypeptide having THCA synthase activity, wherein the polypeptide comprises an amino acid sequence comprising at least about 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%
or 100% sequence identity to any one of SEQ ID NOs: 84-139. In one embodiment, the polypeptide does not comprise the sequence of SEQ ID NO: 83. In another embodiment, the THCA synthase activity is at least about 2 to about 30-fold greater than the activity of a naturally occurring cannabis synthase or a synthase having the sequence of SEQ
ID NO: 83.

-14-The recombinant vector of the disclosure may also contain a selectable "marker gene", which facilitates the selection of host cells transformed or transfected with a recombinant cassette of the application. Examples of selectable marker genes are genes encoding for proteins such as G418 and hygromycin which confer resistance to certain drugs, fl-galactosidase, chloramphenicol acetyltransferase, firefly luciferase, or an immunoglobulin or portion thereof such as the Fc portion of an immunoglobulin, optionally IgG.
Transcription of the selectable marker gene is monitored by changes in the concentration of the selectable marker protein such as fl-galactosidase, chloramphenicol acetyltransferase, or firefly luciferase. If the selectable marker gene encodes a protein conferring antibiotic resistance, such as neomycin, resistance transformant cells can be selected with G418. Cells that have incorporated the selectable marker gene will survive, while the other cells die. In another embodiment, the selectable marker is introduced to the host expression system on a separate vector from the recombinant vector of interest.
The recombinant vectors of the disclosure can be introduced into a host cell or a host expression system to produce a transformed host cell. Prokaryotic and/or eukaryotic cells can be transformed with nucleic acid by, for example, electroporation or calcium chloride-mediated transformation. For example, the vector can be introduced into mammalian cells via conventional techniques such as calcium phosphate or calcium chloride co-precipitation, DEAE-dextran mediated transfection, lipofectin, viral mediated methods, electroporation or microinjection. Suitable methods for transforming and transfecting cells can be found in Sambrook et al. (Molecular Cloning: A Laboratory Manual, 3rd Edition, Cold Spring Harbor Laboratory Press, 2001), and other laboratory textbooks.
Suitable host cells include a wide variety of eukaryotic cells and prokaryotic cells.
For example, the nucleic acids and proteins of the disclosure may be expressed in plant cells, yeast cells or mammalian cells. In one embodiment, plant cells are of the genus Cannabis, for example Cannabis saliva L, Cannabis indica Lam, and Cannabis ruderalis Janisch, especially Cannabis sativa. Microorganisms are preferably bacteria (e.g.
Escherichia coil) or yeast (e.g. Saccharomyces cerevisiae, Pichia pastor's). Insect cells are preferably Spodoptera frugiperda cells. The eukaryotic cell, in one embodiment, is a yeast cell.
Therefore, in another aspect, the disclosure provides a host expression system comprising the recombinant vector as disclosed herein. In one embodiment, the host

-15-expression system comprises a microbial cell, a yeast cell, a plant cell, or an animal cell. In another embodiment, the host expression system comprises a yeast cell. In one embodiment, the yeast comprises one or more of Pichia pastoris, Pichia angusta, Pichia Pichia methanol/ca, Pichia inositovera, Hansenula polymorpha, Candida boidinii, and Yarrowia hpolytica.
Accordingly, also provided herein is a recombinant cell comprising the recombinant vector or the polynucleotide of this disclosure. In one embodiment, the recombinant cell results in production of the polypeptide of this disclosure.
In another embodiment, the present disclosure provides a method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants, which comprises expressing the recombinant vector as disclosed above in the host expression system.
In one embodiment, a method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57.
In an embodiment, the method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence having at least 90%, 95%, 98%, or 99.9% identity with any one of SEQ ID NOs: 2-57.
In an embodiment, the method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence with at least 99.9% identity with any one of SEQ ID
NOs: 2-57.
In an embodiment, the method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence with at least 98% identity with any one of SEQ ID NOs:
2-57.
In an embodiment, the method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence with at least 95% identity with any one of SEQ ID NOs:
2-57.
In an embodiment, the method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence with at least 90%identity with any one of SEQ ID NOs:
2-57.

-16-In an embodiment, the method of producing a Tetrahydrocannabinolic acid (THCA) synthase or its variants comprises expressing the recombinant vector with a polynucleotide sequence with at least 85%, 86%, 87%, 88% or 89% identity with any one of SEQ ID NOs: 2-57.
According to an embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide of SEQ ID
NOs: 84-139 or a polypeptide with at least 90%, 95%, 98%, or 99% identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide with at least 99.9%
identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide with at least 98%
identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide with at least 95%
identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide with at least 90%
identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide with at least 85%, 86%, 87%, 88% or 89% identity with any one of SEQ ID NOs: 84-139.
In one embodiment the recombinant vector comprises a promoter of SEQ ID NO: 71 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 2.
One embodiment provides a recombinant vector comprising a promoter of SEQ ID
NO: 75 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 2.

-17-In one embodiment the recombinant vector comprises a promoter of SEQ ID NO: 71 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 3.
In one embodiment the recombinant vector comprises a promoter of SEQ ID NO: 75 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 3.
One embodiment provides a recombinant vector comprising a promoter of SEQ ID
NO: 71 operably linked to a secretion tag of SEQ ID NO: 58 operably linked to the gene of interest of SEQ ID NO: 8.
In one embodiment the recombinant vector comprises a promoter of SEQ ID NO: 75 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 8.
One embodiment provides a recombinant vector comprising a promoter of SEQ ID
NO: 71 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 9.
In one embodiment the recombinant vector comprises a promoter of SEQ ID NO: 71 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 9 which is operably linked to a purification/detection tag of SEQ ID
NO: 68.
In one embodiment the recombinant vector comprises a promoter of SEQ ID NO: 73 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 9 which is operably linked to a purification/detection tag of SEQ ID
NO: 68.
One embodiment provides a recombinant vector comprising a promoter of SEQ ID
NO: 75 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 9 and which is operably linked to a purification/detection tag of SEQ ID NO: 68.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 18.

-18-In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 20.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 28.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 28.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 28.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 29.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 29.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 29.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 30.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 3 L
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 32.

-19-One embodiment comprises a recombinant vector with a promoter of SEQ ID NO: 75 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 32.
In one embodiment, the recombinant vector comprises a promoter of SEQ ID NO:

operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 33.
One embodiment provides a recombinant vector comprising a promoter of SEQ ID
NO: 75 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 33.
One embodiment provides a recombinant vector comprising a promoter of SEQ ID
NO: 71 operably linked to a secretion tag of SEQ ID NO: 58 which is operably linked to the gene of interest of SEQ ID NO: 34.
In one embodiment, a method for producing a cannabinoid compound comprises reacting a cannabinoid precursor with an enzyme that is expressed by a host expression system comprising a recombinant vector that has a promoter operably linked to a secretion tag that is operably linked to a GOT, wherein the cannabinoid precursor is a compound of Formula I:
OH
Ri Formula I, wherein Ri is H, ¨COOH, or an ester of the carboxylic acid and R2 is a linear or branched CH3, C2H5, C3117, C4H9, C51111, Colin, C71115 or C1117group.
In one embodiment, the recombinant vector comprises a GOT having a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57.
In an embodiment, the recombinant vector comprises a polynucleotide sequence with at least 90%, 95%, 98%, or 99.9% identity with any one of SEQ ID NOs: 2-57.
In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide as set forth in any one of SEQ
ID NOs: 84-139.

-20-In one embodiment, the recombinant vector with a polynucleotide sequence as set forth in any one of SEQ ID NOs: 2-57 encodes a polypeptide with at least 90%, 95%, 98%, or 99.9% identity with any one of SEQ ID NOs: 84-139.
In one embodiment, the cannabinoid compound produced by a method described in this application is isolated and/or purified using chemical purification protocols well known in the art. In one embodiment, R2 is C3H7 or C5f110. In one embodiment, R2 is C3H7 and Ri is -COON or and ester. In one embodiment, R2 is C5H11 and Ri is -COOH or and ester, for example a Cl-C10 alkyl ester, an optionally substituted aryl or benzyl ester.
In another embodiment, the cannabinoid precursor is CBGVA, CBGA, and ester of CBGA or CBGVA, or derivatives and analogs of CBGA and CBGVA.
EXPERIMENTAL EXAMPLES
The invention is further described in detail by reference to the following experimental examples. These examples are provided for purposes of illustration only, and are not intended to be limiting unless otherwise specified. Thus, the invention should in no way be construed as being limited to the following examples, but rather, should be construed to encompass any and all variations which become evident as a result of the teaching provided herein.
Without further description, it is believed that one of ordinary skill in the art can, using the preceding description and the following illustrative examples, make and utilize the compounds of the present invention and practice the claimed methods. The following working examples, therefore, specifically point out the preferred embodiments of the present invention, and are not to be construed as limiting in any way the remainder of the disclosure.
Example 1 Molecular cloning An array of promoters was employed to drive the expression of the native and mutant THCA synthase enzymes. The suitable promoters include, but are not limited to:
alcohol oxidase 1 promoter (pA0X1), alcohol oxidase 2 promoter (pA0X2), NADtdependent formylglutathione dehydrogenase promoter (pFDH), peroxin Pex14p promoter (pPEX14), S-hydroxymethyl-glutathione hydrolase promoter (pFGH), dihydroxyacetone kinase promoter (pDAK), fructose 1,6-bisphosphate aldolase promoter (pFBA2), peroxisomal protein Pex8p

-21 -promoter (pPEX8), peroxisomal membrane signal receptor PTS1 promoter (pPEX5) and alcohol dehydrogenase 2 promoter (pADH2). In one embodiment, the pA0X1 promoter was cloned to the standard plasmid pPIC3.5 (Invitrogen) with the BglII and EcoRI
restriction sites, yielding a derivative called plasmid pL. DH5alpha E. coil strain was used for cloning and plasmid amplification. Transformation was performed according to a standard heat-shock protocol as known in the art.
In order to get the enzyme to secrete into the culture medium, a secretion peptide was fused to the 5' of the GOT (gene of interest) in frame. Suitable secretion tags include but are not limited to a-MF (alpha mating factor from S. cerevisiae yeast), HSP150 (Heat shock protein 150 from P. pastoris yeast), combination of pre-a-MF (19 amino acids from a-MF) and the pro-region of HSP150, combination of pre-a-MF and a double repeat of the pro-region of HSP150, SUC2 (invertase from S. cerevisiae), PHOI (acid phosphatase from S.
cerevisiae), PIR1 (55 amino acids from Protein with internal repeats 1, from P. pastor's), 0ST1 (dolichyl-diphosphooligosaccharide protein glycotransferase subunit 0ST1), 0ST1 fused to the pro-region of the a-MF secretion peptide (20-85 amino acids of the a-MF
secretion peptide) and DDDK (first 18 amino acids from protein A0A68487.1:GenBank accession No. from P. pastoris).
In one embodiment, the secretion tag, and the gene for THCA synthase or its mutants were synthesized as one construct. In another embodiment, a PCR based method was used to fuse the desired secretion tag to the codon optimized gene of THCA synthase and mutants of this enzyme. The genes for the THCA synthase and its mutants were chemically synthesized (Thermo Fisher Scientific, USA), and sequences of these constructs were verified with Sanger sequencing (Eurofins Genomics).
To process a secretion tagged construct (i.e., cleavage of the signal peptide from the nascent peptide chain), the cleavage recognition amino acid sequence (lysine-arginine) of Kex2 protease was introduced downstream of each secretion peptide. Thus, all secretion peptides were flanked with a lysine-arginine (KR) or lysine-lysine (KK) pair at the C-terminus, upstream of the respective GOT. To increase efficiency of cleavage by Kex2 protease, the amino acid pairs LE (leucine-glutamic acid) or ME (Methionine-glutamic acid) were cloned upstream of KR or KK flanks. Downstream of KR or KK cleavage site an EAEA

-22-repeat (glutamic acid-alanine-glutamic acid-alanine) was cloned, which is processed (sequentially cleaved) by the aminopeptidyl peptidase.
Transformation into yeast strain Plasmids were linearized (cut) within their promoter sequence using SacI/BamH1/another restriction enzyme, depending on the promoter used. The linearized plasmids were transformed individually into the GS115 strain of the yeast, Pichia pastoris.
Following transformation, the yeast cells was plated onto YPD (Yeast Extract¨Peptone¨
Dextrose) plates containing geneticin (G418 > 0.25mg/m1) to enable 'antibiotic resistance' based selection of the transformed yeast colonies. The successful integration of the respective GOT was subsequently verified using colony PCR. Figure 1 schematically illustrates the construct containing the GOT and its integration within the yeast genome.
Colony screening and growth experiment with the shaking flasks Selected clones (colonies) were streaked from the transformation plates into fresh YPD plates containing geneticin (G418? 0.25mg/m1) to obtain monoclonal colonies. Each monoclonal colony was then subjected to serial plating onto YPD plates with increasing geneticin concentration (up to 3 mg/ml) to obtain a set of clones with variable gene copy number with respect to the gene of interest. Subsequently, at least 10 such monoclonal colonies were chosen to be individually tested in shake flask studies. Note that glycerol stocks were also made for these selected monoclonal colonies using standard procedure to enable long term storage at -80 C.
Shake flask studies were initiated with at least 10 monoclonal colonies for each new construct in parallel with appropriate reference control(s). Each individual colony (grown as a biomass on YPD plates) was inoculated into a shake flask containing 10mls of BMGY
(Buffered Glycerol-complex) medium and incubated for 24 hours at 30 C, with shaking at 270 rpm. After 24-hours the cultures were induced for 3 consecutive days with a daily dose of either a final concentration of 0.2% potassium formate + 0.5-1% sorbitol or 0.25-1%
methanol. In some cases, a daily double dose of 0.2% potassium formate + 0.5-1% sorbitol was fed to the cultures.
Enzyme assay At the end of 70-72 hours, shake flask cultures of cells were subjected to centrifugation at 10,000g for five minutes. The supernatant was collected and the activity of

-23 -the enzyme in the supernatant was measured using an HPLC based enzyme assay.
In one embodiment, the activity of the enzyme in the supernatant was measured by setting up the reaction mixture that included 125 1 of 200mM sodium citrate buffer (pH 4.8), 50 -100u1 of the supernatant and 25 ul of a 554 M solution of Cannabigerolic acid (CBGA) in DMSO.
Following incubation at 30 C for 30 mins, the reaction was stopped by the addition of 250 ul of 100% methanol (1:1 MeOH: vol. of reaction mixture). The stopped reaction was then centrifuged at 14000 rpm for 15 mins and the supernatant analyzed by HPLC. In one embodiment the supernatant comprising the enzyme is incubated with a substrate, for example, CBGA or CBGVA for 1-16 hours, preferably for 1-15 hours, preferably for 1-14 hours, preferably for 1-13 hours, preferably for 1-12 hours, preferably for 1-11 hours, preferably for 1-10 hours, preferably for 1-9 hours, preferably for 1-8 hours, preferably for 1-7 hours, preferably for 1-6 hours, preferably for 1-5 hours, preferably for 1-4 hours, preferably for 1-3 hours, or preferably for 1-2 hours.
HPLC
HPLC was performed on the Agilent 1260 Infinity II system. Mobile Phase A
refers to water with 0.1% formic acid while the mobile Phase B refers to acetonitrile with 0.1%
formic acid. Each new run on the HPLC starts with a one-hour equilibration at 25% A and 75% B. To ensure that the system was thoroughly cleaned and there was no carryover, prior to the analysis of a new set of samples the column was cleaned by injecting pure methanol followed by an injection of DMSO. Such a cleaning routine was carried out once every 20 samples. The injection volume was set at 20 ul and the flow rate of the mobile phase was set at 400 ul/min. Samples were analyzed using the following gradient:
= 0.0 min 25%A, 75%B, = 5.00 min: 4%A, 96%B, = 5.01 min: 0%A, 100%B, and = 6.00 min: 0%A, 100%B.
IA of 0.01 mg/mL of A8-THC (Cerilliant T-032 at 1 mg/mL diluted with 100%
methanol) was added as an internal standard to each sample and mixed five times within the injector compartment prior to loading onto the column. Calibration curves for CBGA
(Cerilliant C-142 at Img/mL diluted with 100% methanol), CBDA (Cerilliant C-144 at 1 mg/mL diluted with 100% methanol), and A9-THCA-A (Cerilliant T-093 at 1 mg/mL

-24-diluted with 100% methanol) were generated separately and were used to calculate the amount of CBGA, CBDA and/or A9-THCA-A produced in a test sample by an enzyme of the present disclosure. Prior to, and following each injection, the injection needle was washed for 3 seconds with 100% Me0H. The column chamber was set to a temperature of 30.0 0.8 C while the Diode Array Detector (DAD) was set to scan from 190 nm to 400 nm with data primarily collected at 269 nm with a peak width of 5 Hz (>0.05 min). Data was analyzed using Agilent OpenLab CDS running on Windows 10. The results of samples tested are summarized in Table 1.
The sequences of this disclosure are provided with the Reference sequence numbered as SEQ ID NO: 1 or 83.
Table 1 shows enzyme assay data.
Table 1 Enzyme activty relative to SEQ
SEQ ID Nos.
ID 83 (reference) > 5 fold 84 - 86, 90, 91, 100 - 103, 106 - 116 <5 fold 87 - 89, 92 - 99, 104 and 105 Not determined 117 - 139 Table 2 correlates the SEQ ID numbers of the polynucleotide sequences for various accessory elements used to produce the THCA synthase mutants according to this disclosure to the SEQ ID numbers of their corresponding polypeptide (protein) sequences.
Table 2 DNA SEQ Corresponding ID No. Protein SEQ Accessory Element ID No.
SEQ ID NO: 58 SEQ ID NO: 140 Secretion peptide alpha-1VIF (alpha mating factor from S.
cerevisiae yeast) SEQ ID NO: 59 SEQ ID NO: 141 Secretion peptide HSP150 (Heat shock protein 150 from P.
pastoris yeast) SEQ ID NO: 60 SEQ ID NO: 142 Secretion peptide: combination of pre region of alpha -MF (19 amino acids from alpha -MF) and pro-region of HSP150 from P.
pasloris SEQ ID NO: 61 SEQ ID NO: 143 Secretion peptide: combination of pre region of alpha -MF and double repeat of pro-region of HSP150 SEQ lD NO: 62 SEQ ID NO: 144 Secretion peptide SUC2 (invertase from S. cerevisiae) SEQ ID NO: 63 SEQ ID NO: 145 Secretion peptide PHO1 (acid phosphatase from S. cerevisiae) SEQ ID NO: 64 SEQ ID NO: 146 Secretion peptide PIR1 (55 amino acids from Protein with internal repeats 1, from P. pastoris SEQ ID NO: 65 SEQ ID NO: 147 Secretion peptide OST1 (dolichyl-diphosphooligosaccharide protein glycotransferase subunit OST1) SEQ ID NO: 66 SEQ ID NO: 148 Secretion peptide OST1 fused to pro-region of alpha -MF secretion peptide (20-85 amino acids of alpha -MF secretion peptide) SEQ ID NO: 67 SEQ ID NO: 149 Secretion peptide DDDK (first 18 amino acids from protein with access number A0A68487.1 from P. pastoris) SEQ ID NO: 68 SEQ ID NO: 150 Human influenza hemagglutinin (HA) tag or 153 SEQ ID NO: 69 SEQ ID NO: 151 6X Histidine tag SEQ ID NO: 70 SEQ ID NO: 152 HN tag SEQ ID NO: 71 Not applicable Promoter pA0X1 (alcohol oxidasc 1) SEQ ID NO: 72 Not applicable Promoter pA0X2 (alcohol oxidase 2) SEQ ID NO: 73 Not applicable Promoter pFDH (NAD+-dependent formylglutathione dchydrogenase) SEQ ID NO: 74 Not applicable Promoter pPEX14 (peroxin Pexl4p) SEQ ID NO: 75 Not applicable Promoter pFGH (S-hydroxymethyl-glutathione hydrolase) SEQ ID NO: 76 Not applicable Promoter pDAK (dihydroxyacctonc kinasc) SEQ ID NO: 77 Not applicable Promoter pFBA (fructose 1,6-bisphosphate aldolase) SEQ ID NO: 78 Not applicable Promoter pPEX5 (peroxisomal membrane signal receptor PTS1) SEQ ID NO: 79 Not applicable Promoter pADH2 (alcohol dehydrogenase 2) SEQ ID NO: 80 Not applicable Promoter pPEX8 (peroxisomal protein Pex8p) SEQ ID NO: 81 Not applicable Plasmid pPIC 3,5 SEQ ID NO: 82 Not applicable Plasmid pL
SEQ ID NO: 1 ( REFERENCE THCA synthase ) AACCCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAAC GT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T CT OTT
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACTCCCAAACT
GCTTGGGTTGAAGCTGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T COAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GC TAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TAC GT T T
CCCAGAACCCAAGA
TT CC CT TACT T CAAC TACACACACT T C CACT TCCC TAACAC TAAC CACC CT T CC
CCAAACAAT TACACACAC C CT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GCCAC CACAT CAT CAT CAC CAT CAC
TAA
SEQ ID NO: 2 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CGAACAAC GT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT CT CCT T OTT GAACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACAC TAC T
CCAAAGCCCT T COT TAT COT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T CT OTT
C CAAGAAGGT T

GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACATTTCCCAGGTT C
OCT T C GT T
GT T GT T GAC CT TAGAAACAT GCACT C CAT CAAGAT C GAC GT T CACTCCCAAACT GCTT
GGGTT GAAGCAGGT GCT
AC GT T GGGT GAAGTTTACTACT GGAT CAAC GAGAAGAAC GAGAAC CT CT C CT T C CC GGGT
GGT TACT GT CCAACC
GT T GGT GT T GGT GGT CACTTTT CT GGT GGT GGTTACGGT GCTT T GAT GAGAAACTACGGACTT
GCT GCT GACAAC
AT CAT CGACGCT CACI T GGT TAAC GT T GACGGTAAGGITTT GGACAGAAAGT C CAT
GGGAGAGGACT T GT T CT GG
GCTATT C GT GGT GGT GGT GGT GAGAACTT C GGTAT TAT T GCT G CT T GGAAGAT CAAGCTT
GT T GCT GT T C C CT CC
AAGT C CAC TAT CT T CT CC GT TAAGAAAAACAT GGAAAT C CAC G GT T T GGTTAAGTT GT T
TAACAAGT GGCAGAAC
AT T GCTTACAAGTACGACAAGGACTT GGTTTT GAT GACT CACT T CAT CAC TAAGAACAT CACT GA
CAAC CAC GGT
AAGAACAAAACTACT GT T CAC GGT TACT T CT C T T C CAT OTT C CAC GGT GGT GT T GATT
C CT T GGTT GAT T T GAT G
AACAAGT CT T T CC CAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGTT CAGTT GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACTT CAACACT GC CAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCTTT CT C CAT TAAGT T GGAC TAC GT TAAGAAGC CAAT CC CAGAGACT GCTAT
GGTTAAGATTTTGGAGAAG
TT GTAC GAAGAGGAC GT T GGT GCT GGTAT GTAC GT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT C C GAG
T CCGCTATT C C GT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACAT CAACT GGGTTAGAT C C GT T TACAACT T CAC TACT C CT TAC GT T T
CC CA GAAC C CAAGA
TT GGCGTACTT GAACTACAGAGACTT GGACTT GGGCAAGAC TAAC CAC GC GT CC C CAAACAAT TA
CACACAGGCT
AGAAT CT GGGGT GAAAAG TACT T CGGAAAGAACTTTAACAGAT T GGTTAAGGTTAAGACTAAGGTT
GACCCTAAC
AAC T T CT T CAG GAAC GAG CAGT C CAT C C CAC CAT T GGT CAATTAA
SEQ ID NO: NO: 3 AACGCAAGAGAAAACTT CT T GAAGT GT T T T T C CAAG CACAT CGGGAATAGGGGAAACGTATACACT
CAG CAC GAC
CAGTT GTACAT GT C CT T GT T GAACT CCACAAT CCAGAACTT GAGATT CAT CT CC GACACTACT
C CAAAGC C CT T G
GT TAT C GT TACT C C CT CCAACAACGCT CACAT CCAGGCTACTAT CT T GT GT T
CCAAGAAGGTT GGATTGCAGAT C
AGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT C CTACAT T T CC CAGGT T C C CT T C
GT T GT T GT T GAC CT T
AGAAACAT GCACT C CAT CAAGAT C GAC GT T CACT CCCAAACT G CT T GGGT T GAAAGCGGT
GCTAC GT T GGGT GAA
GT T TACTACT GGAT CAAC GAGAAGAAC GAGAAC CT CT C CT T CC C GGGT GGT TACT GT C
CAAC C GT T GGT GT T GGT
GGT CACI T T T CT GGT GGT GGT TAC GOT OCT T T GAT GAGAAACTAC GGACT T GCT
GCTGACAACAT CAT C GAC GCT
CACTT GGT TAAC GT T GACGGTAAGGTTTT GGACAGAAAGT C CAT GGGAGAGGACTT GT T CT
GGGCTATT C GT GGT
GGT GGT GGT GAGAACTT C GGTAT TAT T GCT GC T T GGAAGAT CAAGCTT GT T GCT GT T C
C CT CCAAGT CCACTAT C
TTCTCCGTTAAG]AAAACATGGAAATCCACGGTTTGGTTAAGTTGTTTAACAAGTGCCAGAACATTGCTTACAAG
TACGACAAGGACTT GGTTTT GAT GACT CAC T T CAT CAC TAAGAACAT CAC T GACAAC CAC
GGTAA GAACAAAAC T
ACT GT T CAC GGT TAC T T CT CT T C CAT CT T C CAC GGT GGT GT T GAT T CCT T
GGTT GAT T T GAT GAACAAGT CT T T C
CCAGAGTT GGGCAT CAAGAAAACT GACT GTAAAGAGTT CAGTT GGAT CGACACAACAAT CT T C TA
CAGT GGT GT T
GTAAACTT CAACACT GCCAACTTTAAGAAAGAGAT CTT GT T GGACAGGT C C GC T
GGTAAAAAGACAGCT T T CT CC
AT TAAGT T GGAC TAC GT TAAGAAGC CAAT CCCAGAGACT GC TAT GGTTAAGATTTT GGAGAAGTT
GTACGAAGAG
GAC GT T GGT GC T GGTAT GTAC GT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT C C
GAGT C CGCTATTCCG
T T CC CACAC C GAGC T GGTAT CAT GTACGAGTT GT GGTACAC T G CT T CT T GGGAGAAG
CAAGAG GA CAAC GAAAAG
CACAT CAACT GGOTTAGAT C C GT T TACAAC T T CAC TAC T C CT TAC CT T T CC CAGAAC
C CAAGAT T GGCGTACTT
AACTACAGAGACTT GGACTT GGGCAAGAC TAAC CAC GC GT CCC CAAACAATTACACACAGGCTAGAATCT
GGGGT
GAAAAGTACTT CGGAAAGAACTTTAACAGATT GGTTAAGGTTAAGACTAAGGTT GAC C C TAACAAC T T
CT T CAGG
AAC GAG CAGT C CAT C C CAC CAT T GGT CAATTAA
SEQ ID NO: NO: 4 AAC GCAAGAGAAAAC T T CT T GAAGT GT T T T T C CAAG CACAT CC
CGAACAACGTAGCTAACCCTAAGTTGGT GTAC
ACT CAG CAC GAC CAGT T GTACAT GT CAT T GC T GAACT CCACAAT CCAAAACCT GAGATT CAT
CT C C GATAC TAC G
C CAAAGC C GC TAGTAAT T GT GACTCCCTCCAATAACT CCCACAT C CAGGC TAC TAT CTT GT GT
T C CAAGAAGGTT
GGATT GCAAATAAGAACAAGAT CCGGT GGT CAT GAC GC T GAAGGCAT GT CCTACATTTCCCAGGTT C
CC T T C GT T
GTAGTT GACCTTAGAAACAT GCACAG CAT CAAGAT C GAC GT T CAC T C C CAAACAGC T T
GGGTT GAAGCAGGT GC T
AC GC T T GOT GAAGT GTACTACT GOAT CAACGAGAAGAAT GAGAAC C TAT CCTTCCCCGGT
GGTTACT CT CCAACA
GT T GGT GT T GGCGGT CAC T T TAGT GGT GGT GGATACGGT GC T T T GAT GAGAAAT TAT
GGAC TAGCAGCT GACAAC
AT CAT C GAT GCACACCTT GTAAAC GT T GACGGTAAGGTT CTAGACAGGAAGAGTAT GGGT
GAGGACCTTTTCT GG
GC TAT T C GT GGT GGT GGT GGT GAGAACTT CGGTAT CAT T GC T G CAT GGAAGATAAAGC T
GGTT GC T GT GC CCT CC
AAGT C CAC TAT CTTCT CC GT CAAAAAAAACAT GGAAATACAC G GT T T GGT TAAGT TAT T
TAACAAGT GGCAAAAC
AT T GCATACAAGTAC GACAAG GAT T T GGTAC T TAT GAC T CAC T T CAT CAC TAAGAACAT
CAC T GA CAAC CAC GGC
AAGAACAAGACTACT GTACAC GGT TAC T T CT C TAGTATAT T C CAC GGT GGT GT T GAT T C
CT TAGT T GAT T T GAT G
AACAAGAGC T T CC CAGAGC T T GGCAT CAAGAAAACT GACT GTAAAGAGTT CAGTT GGAT
CGACACTACAAT CT T C
TACTCCGGTGTTGTAAACTTCAACACAGCCAACTTTAAAAAAGAGATCTTGTTGGACAGATCCGCTGGAAAAAAG

ACAGCT T T CT CAAT TAAGT T GGAC TAC GT GAAGAAGCCAAT CC CAGAGACT GCAAT GGT
TAAGAT T CTT GAGAAG
T TATAC GAAGAGGACGTAGGT GCT GGCAT GTACGT T T T GTACC CT TACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCCT T CCCACACAGGGCT GGTAT CAT GTACGAGT TAT GGTACACT
GCTAGTTGGGAGAAGCAAGAG
GACAAC GAAAAGCACAT CAACT GGGT TAGAAGT GT T TACAACT
TCACAACTCCTTACGTTTCCCAGAACCCAAGA
CT T GCGTACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCGT CC CCCAACAAT
TACACACAGGCT
CGTAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGGT
TAGTTAAGGTTAAGACCAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGAGTAT CCCT CCAT T GGT CAAT TAA
SEQ ID NO: 5 AAC GCAAGAGAAAACT T CT T GCAAT GT T T T T CCGCT CACAT CC CAAACAAC GT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT CT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T COAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT GCTT GGGT
T GAAT CT GGT GCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGCAAAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGT T CT GT T T T GGACAGACAGT CCAT GGGT
GAGGACT T GT T CT GO
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CCAAT CCACT GACT GTAAAGAGT T CT CCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGCAAC CAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGAGGCAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 6 AACGCAAGAGAAAACT T CCT T CAAT GT T T T T CCGCT CACAT CC CGAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T OTT GAACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACGT T COOT GAAGT T TACTACT GOAT CAACGAGCAAAACGAGAACCT CT CCT T C CCGGGT GGT
TACT CT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAGCGT T T T GGACAGACAGT CCAT
GGGAGAGGACT T GT T CT GO
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CCAAT CCACT GACT CTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGCAAC CAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGAGGCAC TAAC CACGCGT CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 7 AACGCAAGAGAAAACT T CT T GCAAT GT T T T T CCGCT CACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACT T GAAT CGTAT CT C TAT CGACGT T CACT CCCAAACT GCTT
GGGT T GAAT CT GGT T CT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGCAAAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAAGTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCTAT CT T GGT TAACGT T GACGGT T CT GT T T T GGACAGACAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T TACGCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GAC GAAGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CTTT CCCAGAGT T GGGTAT CCAAT CCACT GACT GTAAAGAGT T CT CCT GOAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGCAAC CAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTACTCCATTCCCACACAG'AGCTGGTAT TAT GTACG'AGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAG'AG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAACTACAGAGACT T GGACT T GGGT GGTACTAAC CAC GCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT TAAC TAA
SEQ ID NO: 8 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T C.ACT CCCAAACT
GCTTGGGTTGAAGCTGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CA.CT GACAAC CACGGT
AAGAACAAGA.CTACT GT T CACGGT TACT T CT C T T COAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 9 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T OTT GGACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAGCTGGTGCT
ACT T T COOT GAA.GT T TACTACT GOAT CAA.CGAGAA.GAA.CGAGAA.CTT GT COT T C CCAGGT
GOT TACT GT CCAA.CT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC

ATTGCTTACAAGTACGACAAGGACTTGGTTTTGATGACTCACT TCATCACTAAGAACATCACTGACAACCACGGT
AAGAACAAGACTACTGTTCACGGTTACTTCTCTTCCATCTTCCACGGTGGTGTTGATTCCTTGGTTGATTTGATG
AACAAGTCTTTCCCAGAGTTGGGTATCAAGAAAACTGACTGTAAAGAGTTCTCCTGGATCGACACAACAATCTTC
TACT CCGGT GTT GTTAACTT CAACACT GCTAACTTTAAGAAAGAGAT CTT GTT GGACAGAT CCGCT
GGTAAAAAG
ACTGCTTTCTCCAT TAAGTTGGACTACGT TAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAG
TT GTACGAAGAGGACGTT GGT GCT GGTAT GTACGTTTT GTACC CATACGGT GGTAT CAT
GGAAGAAATCT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT TGTGGTACACT
GCTTCTTGGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT TCACTACTCCTTACGTTTCCCAGAACCCAAGA
TTGGCTTACTTGAACTACAGAGACTTGGACTTGGGTAAGACTAACCACGCTTCCCCAAACAATTACACACAGGCT
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACTTCTTCAGAAACGAGCAGTCCATCCCACCATTGGTCAATTAA
SEQ ID NO: 10 AACGCAAGAGAAAACTT CTT GAAGT GTTTTT CCAAGCACAT CC CAAACAACGTT
GCTAACCCTAAGTTGGTTTAC
ACTCAGCACGACCAGTTGTACATGTCCTTGTTGAACTCCACAATCCAGAACTTGAGATTCATCTCCGACACTACT
CCAAAGCCATT GGTTAT CGTTACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CTT GT GTT C
CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACATTT CCCAGGTT
CCATT CGTT
GTTGTTGACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAAGCTGGTGCT
ACTTT GGGT GAAGTTTACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCTT C CCAGGT GGTTACT
GT CCAACT
GTTGGTGTTGGTGGTCACTTTTCTGGTGGTGGTTACGGTGCTT TGATGAGAAACTACGGATTGGCTGCTGACAAC
AT CAT CGACGCT CACTT GGTTAACGTT GACGGTAAGGTTTT GGACAGAAAGT CCAT GGGT
GAGGACTTGTT CT GG
GCTATTAGAGGTGGTGGTGGTGAGAACTTCGGTATTATTGCTGCTTGGAAGATCAAGTTGGTTGCTGTTCCATCC
AAGT CCACTAT CTT CT CCGTTAAGAAAAACAT GGAAAT CCACGGTTT GGTTAAGTT GTTTAACAAGT
GGCAGAAC
ATTGCTTACAAGTACGACAAGGACTTGGTTTTGATGACTCACT TCATCACTAAGAACAGCGGAAACACTGTTCAC
GGTTACTTCTCTTCCATCTTCCACGGTGGTGT TGATTCCTTGGTTGATTTGATGAACAAGTCTTT CCCAGAGTTG
GGTATCAAGAAAACTGACTGTAAAGAGTTCTCCTGGATCGACACAACAATCTTCTACTCCGGTOTTGTTAACTTC
AACACTGCTAACTTTAAGAAAGAGATCTTGTTGGACAGATCCGCTGGTAAAAAGACTGCTTTCTCCATTAAGTTG
GACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGACGTTGGT
GCT GGTAT GTACGTTTT GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT CCGCTATT
CCATTCCCACAC
AGAGCT GGTAT TAT GTACGAGTT GT GGTACACT GCTT CTT
GGGAGAAGCAAGAGSACAACGAAAAGCACAT CAAC
TGGGTTAGATCCGTTTACAACTTCACTACTCCTTACGTTTCCCAGAACCCAAGATTGGCTTACTTGAACTACAGA
GACTT GGACTT GGGTAAGACTAACCACGCTT CCCCAAACAAT TACACACAGGCTAGAAT CT GGGGT
GAAAAGTAC
TT CGGAAAGAACTTTAACAGATT GGTTAAGGT TAAGACTAAGGTTGACCCTAACAACTTCTTCAGAAACGAGCAG

TCCATCCCACCATTGGTCAATTAA
SEQ ID NO: 11 AACGCAAGAGAAAACTT CTT GAAGT GTTTTT CCAAGCACAT CC CAAACAACGTT
GCTAACCCTAAGTTGGTTTAC
ACTCAGCACGACCAGTTGTACATGTCCTTGTTGAACTCCACAATCCAGAACTTGAGATTCATCTCCGACACTACT
CCAAAGCCATT GGTTAT CGTTACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CTT GT GTT C
CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACATTT CCCAGGTT
CCATT CGTT
GTTGTTGACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAAGCTGGTGCT
ACTTT GGGT GAAGTTTACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCTT C CCAGGT GGTTACT
GT CCAACT
GTTGGTGTTGGTGGTCACTTTTCTGGTGGTGGTTACGGTGCTTTGATGAGAAACTACGGATTGGCTGCTGACAAC
AT CAT CGACGCT CACTT GGTTAACGTT GACGGTAAGGTTTT GGACAGAAAGT CCAT GGGT
GAGGACTTGTT CT GG
GCTATTAGAGGTGGTGGTGGTGAGAACTTCGGTATTATTGCTGCTTGGAAGATCAAGTTGGTTGCTGTTCCATCC
AAGT CCACTAT CTT CT CCGTTAAGAAAAACAT GGAAAT CCACGGTTT GGTTAAGTT GTTTAACAAGT
GGCAGAAC
ATTGCTTACAAGTACGACAAGGACTTGGTTTTGATGACTCACT TCATCACTAAGAACAGCGGAAACACTGTTCAC
GGTTACTTCTCTTCCATCTTCCACGGTGGTGTTGATTCCTTGGTTGATTTGATGCAAAAGTCTTTCCCAGAGTTG
GGTAT CAAGAAAACTGACTGTAAAGAGTTCTCCTGGATCGACACAACAATCTTCTACTCCGGT GTTGTTAACTTC
AACACTGCTAACTTTAAGAAAGAGATCTTGTTGGACAGATCCGCTGGTAAAAAGACTGCTTTCTCCATTAAGTTG
GACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGACGTTGGT
GCT GGTAT GTACGTTTT GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT CCGCTATT
CCATTCCCACAC
AGAGCT GGTAT TAT GTACGAGTT GT GGTACACT GOTT CTT
GGGAGAAGCAAGAGGACAACGAAAAGCACAT CAAC
TGGGTTAGATCCGTTTACAACTTCACTACTCCTTACGTTTCCCAGAACCCAAGATTGGCTTACTTGAACTACAGA
GACTT GGACTT GGGTAAGACTAACCACGCTT CCCCAAACAAT TACACACAGGCTAGAAT CT GGGGT
GAAAAGTAC
TT CGGAAAGAACTTTAACAGATT GGTTAAGGT TAAGACTAAGGTTGACCCTAACAACTTCTTCAGAAACGAGCAG

TCCATCCCACCATTGGTCAATTAA

SEQ ID NO: 12 AAC GCAAGAGAAAAC T T CT T GAAGT GT T T T T C CAAG CACAT CC CAAACAAC GT T GC
TAAC C C TAAGT T GGT T TAC
ACT CAG CAC GAC CAGT T GTACAT CT C CT T GT T GAACT CCACAAT CCAGAACTT GAGATT
CAT CT C C GACAC TAC T
C CAAAGC CAT T GGT TAT C GT TAC T C CAT CCAACAACT CCCACAT C CAGGC TAC TAT CTT
GT GT T C CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GAC GC T GAAGGTAT GT CCTACATTTCCCAGGTT
C CAT T C GT T
GT T GT T GACTT GAGAAACAT GCACT C CAT CAAGAT C GAC GT T CAC T C C CAAAC T GC T
T GGGTT GAAGCT GGT GC T
AC T T T GGGT GAAGTTTACTACT GOAT CAACGAGAAGAACGAGAACTT CT CCTTCCCAGGT GGTTACT
CT CCAACT
GT T GGT GT T GGT GGT CAC T T T T CT GGT GGT GGTTACGGT GC T T T GAT
GAGAAACTACGGATT GGCT GCT GACAAC
AT CAT C GAC GC T CAC T T GGT TAAC GT T GACGGTAAGGTTTT GGACAGAAAGT C CAT GGGT
GAGGAC T T GT T CT GG
GC TAT TAGAGGT OCT GOT GOT GAGAACTT C GGTAT TAT T OCT GCT T GGAAGAT CAAGTT
GGTT OCT OTT C CAT CC
AAGT C CAC TAT CTTCT CC GT TAAGAAAAACAT GGAAAT C CAC G GT T T GGTTAAGTT GT T
TAACAAGT GGCAGAAC
AT T GC T TACAAG TAC GACAAG GAC T T GGTTTT GAT GACT CAC T T CAT CAC TAAGAACAT
CAC T GA CAAC CAC GGT
AAGAACAAGACTACT GT T CAC GGT TAC T T CT C T T C CAT CT T C CAC GGT GGT GT T
GAT T C CT T GGTT GAT T T GAT G
CAAAAGT CT T T CC CAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGTTCTCCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAAC T T CAACACT GC TAAC T T TAAGAAAGAGAT CTT GT T GGACAGAT
C C GC T GGTAAAAAG
ACT GC T T T CT C CAT TAAGT T GGAC TAC GT TAAGAAGC CAAT CC CAGAGACT GC TAT
GGTTAAGATTTTGGAGAAG
TT GTAC GAAGAGGAC GT T GGT GC T GGTAT GTAC GT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT C C GAG
T C C GC TAT T C CAT T CCCACACAGAGCT GGTAT TAT GTACGAGT T GT GGTACAC T GC T T
C T T GGGAGAAGCAAGAG
GACAACGAAAAGCACAT CAACT GGGTTAGAT C C GT T TACAAC T T CAC TAC T C CT TAC GT T
T CC CA GAAC C CAAGA
TT GGCTTACTT GAACTACAGAGACTT GGACTT GGGTAAGAC TAAC CAC GC T T CC C CAAACAAT TA
CACACAGGC T
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT T GGTTAAGGTTAAGACTAAGGTT
GACCCTAAC
AAC T T CT T CAGAAAC GAG CAGT C CAT C C CAC CAT T GGT CAATTAA
SEQ ID NO: 13 AAC GCAAGAGAAAAC T T CT T GAAGT GT T T T T C CAAG CACAT CC CAAACAAC GT T GC
TAAC C C TAAGT T GGT T TAC
ACT CAG CAC GAC CAGT T GTACAT GT C CT T GT T GAACT CCACAAT CCAGAACTT GAGATT
CAT CT C C GACAC TAC T
C CAAAGC CAT T GGT TAT C GT TAC T C CAT CCAACAACT CCCACAT C CAGGC TAC TAT CTT
GT GT T C CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GAC GC T GAAGGTAT GT CCTACATTTCCCAGGTT
C CAT T C GT T
GT T GT T GACT T GAGAAACAT GCACT C CAT CAAGAT C GAC GT T CAC T C C CAAAC T GC
T T GGGT T GAAGCT GGT GC T
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCTTCCCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CAC T T T T CT GGT GGT GGTTACGGT GC T T T GAT
GAGAAACTACGGATT GGCT GCT GACAAC
AT CAT C GAC GC T CAC T T GGT TAAC GT T GACGGTAAGGTTTT GGACAGAAAGT C CAT GGGT
GAGGAC T T GT T CT CO
GC TAT TAGAGGT GGT GGT GGT GAGAACTT C GGTAT TAT T GC T GCT T GGAAGAT CAAGTT
GGTT GC T GT T C CAT CC
AAGT C CAC TAT CTTCT CC GT TAAGAAAAACAT GGAAAT C CAC G GT T T GGTTAAGTT GT T
TAACAAGT GGCAGAAC
AT T GC T TACAAG TAC GACAAG GAC T T GGTTTT GAT GACT CAC T T CAT CAC TAAGAACAT
CAC T GA CAAC CAC GGT
AAGAACAAGACTACT OTT CAC GGT TAC T T CT C T T C CAT CT T C CAC GGT GGTT CT GATT
CCGCAGTT GAT T T GAT
CAAAAGT CT T T CC CAGAGT T GGGT CT CAAGAAAACT GACT GTAAAGAGTTCTCCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAAC T T CAACACT GC TAAC T T TAAGAAAGAGAT CTT GT T GGACAGAT
C C GC T GGTAAAAAG
ACT GC T T T CT C CAT TAAGT T GGAC TAC GT TAAGAAGC CAAT CC CAGAGACT GC TAT
GGTTAAGATTTTGGAGAAG
TT GTAC GAAGAGGAC GT T GOT OCT GGTAT GTAC GT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT C C GAG
T C C GC TAT T C CAT T CCCACACAGAGCT GGTAT TAT GTACGAGT T GT GGTACAC T GC T T
C T T GGGAGAAGCAAGAG
GACAACGAAAAGCACAT CAACT GGGTTAGAT C C GT T TACAAC T T CAC TAC T C CT TAC GT T
T CC CA GAAC C CAAGA
TT GGCTTACTT GAACTACAGAGACTT GGACTT GGGTAAGAC TAAC CAC GC T T CC C CAAACAAT TA
CACACAGGC T
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT T GGTTAAGGTTAAGACTAAGGTT
GACCCTAAC
AAC T T CT T CAGAAAC GAG CAGT C CAT C C CAC CAT T GGT CAATTAA
SEQ ID NO: 14 AAC GCAAGAGAAAAC T T CT T GAAGT GT T T T T C CAAG CACAT CC CAAACAAC GT T GC
TAAC C C TAAGT T GGT T TAC
ACT CAG CAC GAC CAGT T GTACAT CT C CT T OTT GAACT CCACAAT CCAGAACTT GAGATT CAT
CT C C GACAC TAC T
C CAAAGC CAT T GOT TAT C GT TAC T COAT CCAACAACT CCCACAT C CAGGC TAC TAT CTT
CT GT T C CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT OCT CAT CAC GC T GAAGGTAT CT CCTACATTTCCCAGGTT
C CAT T C GT T
GT T GT T GACTT GAGAAACAT GCACT C CAT CAAGAT C GAC GT T CAC T C C CAAAC T GC T
T GGGTT GAAGCT GGT GC T
AC T T T GGGT GAAGTTTACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCTTCCCAGGT GGTTACT
GT CCAACT
GT T GGT GT T GGT GGT CAC T T T T CT GGT GGT GGTTACGGT GC T T T GAT
GAGAAACTACGGATT GGCT GCT GACAAC
AT CAT C GAC GC T CAC T T GGT TAAC GT T GACGGTAAGGTTTT GGACAGAAAGT C CAT GGGT
GAGGAC T T GT T CT CO

GC TAT TAGAGGT GGT GGT GGT GAGAACTT C GGTAT TAT T GC T GCT T GGAAGAT CAAGTT
GGTT GC T GT T C CAT CC
AAGT C CAC TAT CTTCT CC GT TAAGAAAAACAT GGAAAT C CAC G GT T T GGTTAAGTT GT T
TAACAAGT GGCAGAAC
AT T GC T TACAAG TAC GACAAG GAC T T GGTTTT GAT GACT CAC T T CAT CAC TAAGAACAT
CAC T GA CAAC CAC GGT
AAGAACAAGACTACT GT T CAC GGT TAC T T CT C T T C CAT CT T C CAC GGT GOT OTT
GATT C CT T GGTT GAT T T GAT G
CAAAAGT CT T T CC CAGAGT T GGGTAT CAAGAAAACT GACAGCAAAGAGTTCTCCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAAC T T CAACACT GC TAAC T T TAAGAAAGAGAT CTT GT T GGACAGAT
C C GC T GGTAAAAAG
ACT GC T T T CT C CAT TAAGT T GGAC TAC GT TAAGAAGC CAAT CC CAGAGACT GC TAT
GGTTAAGATTTTGGAGAAG
T T GTAC GAAGAGGAC GT T GGT GC T GGTAT GTAC GT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT C C GAG
T C C GC TAT T C CAT T CCCACACAGAGCT GGTAT TAT GTACGAGT T GT GGTACAC T GC T T
C T T GGGAGAAGCAAGAG
GACAACGAAAAGCACAT CAACT GGGTTAGAT C C GT T TACAAC T T CAC TAC T C CT TAC GT T
T CC CA GAAC C CAAGA
TT GGCTTACTT GAACTACAGAGACTT GGACTT GGGTAAGAC TAAC CAC GC T T CC C CAAACAAT TA
CACACAGGC T
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT T GGTTAAGGTTAAGACTAAGGTT
GACCCTAAC
AACTTCTT CAGAAAC GAG CAGT C CAT C C CAC CAT T GGT CAATTAA
SEQ ID NO: 15 AAC GCAAGAGAAAAC T T CT T GAAGT GT T T T T C CAAG CACAT CC CAAACAAC GT T GC
TAAC C C TAAGT T GGT T TAC
ACT CAG CAC GAC CAGT T GTACAT CT C CT T GT T GAACT CCACAAT CCAGAACTT GAGATT
CAT CT C C GACAC TAC T
C CAAAGC CAT T GGT TAT C GT TAC T C CAT CCAACAACT CCCACAT C CAGGC TAC TAT CTT
GT GT T C CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GAC GC T GAAGGTAT GT CCTACATTTCCCAGGTT
C CAT T C GT T
GT T GT T GACTT GAGAAACAT GCACT C CAT CAAGAT C GAC GT T CAC T C C CAAAC T GC T
T GGGTT GAAGCT GGT GC T
AC T T T GGGT GAAGTTTACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCTTCCCAGGT GGTTACT
GT CCAACT
GT T GGT GT T GGT GGT CAC T T T T CT GGT GGT GGTTACGGT GC T T T GAT
GAGAAACTACGGATT GGCT GCT GACAAC
AT CAT C GAC GC T CAC T T GGT TAAC GT T GACGGTAAGGTTTT GGACAGAAAGT C CAT GGGT
GAGGAC T T GT T CT GG
GC TAT TAGAGGT GGT GGT GGT GAGAACTT C GGTAT TAT T GC T GCT T GGAAGAT CAAGTT
GGTT GC T GT T C CAT CC
AAGT C CAC TAT CTTCT CC GT TAAGAAAAACAT GGAAAT C CAC G GT T T GGTTAAGTT GT T
TAACAAGT GGCAGAAC
AT T GC T TACAAG TAC GACAAG GAC T T GGTTTT GAT GACT CAC T T CAT CAC TAAGAACAT
CAC T GA CAAC CAC GGT
AAGAACAAGACTACT GT T CAC GGT TAC T T CT C T T C CAT CT T C CAC GGT GGT GT T
GAT T C CT T GGTT GAT T T GAT G
AACAAGT CT T T CC CAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGTTCTCCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAAC T T CAACACT GC TAAC T T TAAGAAAGAGAT CTT GT T GSACAGAT
C C GC T GGTAAAAAG
ACT GC T T T CT C CAT TAAGT T GGAC TAC GT TAAGAAGC CAAT CC CAGAGACT GC TAT
GGTTAAGATTTTGGAGAAG
TT GTAC GAAGAGGAC GT T GGT GC T GGTAT GTAC GT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT C C GAG
T C C GC TAT T C CAT T CCCACACAGAGCT GGTAT TAT GTACGAGT T GT GGTACAC T GC T T
C T T GGGAGAAGCAAGAG
GACAACGAAAAGCACAT CAACT GGGTTAGAT C C GT T TAC CAAT T CAC TAC T C CT TAC GT T
T CC CA SAAC C CAAGA
TT GGCTTACTT GAACTACAGAGACTT GGACTT GGGTAAGAC TAAC CAC GC T T CC C CAAACAAT TA
CACACAGGC T
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT T GGTTAAGGTTAAGACTAAGGTT
GACCCTAAC
AAC T T CT T CAGAAAC GAG CAGT C CAT C C CAC CAT T GGT CAATTAA
SEQ ID NO: 16 AAC GCAAGAGAAAAC T T CT T GAAGT GT T T T T C CAAG CACAT CC CAAACAAC GT T GC
TAAC C C TAAGT T GGT T TAC
ACT CAG CAC GAC CAGT T GTACAT GT C CT T GT T GAACT CCACAAT CCAGAACTT GAGATT
CAT CT C C GACAC TAC T
C CAAAGC CAT T GGT TAT C GT TAC T C CAT CCAACAACT CCCACAT C CAGGC TAC TAT CTT
GT GT T C CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GAC GC T GAAGGTAT GT CCTACATTTCCCAGGTT
C CAT T C GT T
GT T GT T GACTT GAGAAACAT GCACT C CAT CAAGAT C GAC GT T CAC T C C CAAAC T GC T
T GGGTT GAAGCT GGT GC T
AC T T T GGGT GAAGTTTACTACT GGAT CAACGAGAAGAACGAGAACTT CT CCTTCCCAGGT GGTTACT
CT CCAACT
GT T GGT GT T GGT GGT CAC T T T T CT GGT GGT GGTTACGGT GC T T T GAT
GAGAAACTACGGATT GGCT GCT GACAAC
AT CAT C GAC GC T CAC T T GGT TAAC GT T GACGGTAAGGTTTT GGACAGAAAGT C CAT GGGT
GAGGAC T T GT T CT GG
GC TAT TAGAGGT GGT GGT GGT GAGAACTT C GGTAT TAT T GC T GCT T GGAAGAT CAAGTT
GGTT GC T GT T C CAT CC
AAGT C CAC TAT CTTCT CC GT TAAGAAAAACAT GGAAAT C CAC G GT T T GGTTAAGTT GT T
TAACAAGT GGCAGAAC
AT T GC T TACAAG TAC GACAAG GAC T T GGTTTT GAT GACT CAC T T CAT CAC TAAGAACAT
CAC T GA CAAC CAC GGT
AAGAACAAGACTACT GT T CAC GGT TAC T T CT C T T C CAT CT T C CAC GGT GGT GT T
GATT C CT T GGTT GAT T T GAT G
CAAAAGT CT T T CC CAGAGT T GGGTAT CAAGAAAACT GACAGCAAAGAGT TCTCCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAAC T T CAACACT GC TAAC T T TAAGAAAGAGAT CTT GT T GGACAGAT
C C GC T GGTAAAAAG
ACT GC T T T CT C CAT TAAGT T GGAC TAC GT TAAGAAGC CAAT CC CAGAGACT GC TAT
GGTTAAGATTTTGGAGAAG
TT GTAC GAAGAGGAC GT T GGT GC T GGTAT GTAC GT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT C C GAG
T C C GC TAT T C CAT T CCCACACAGAGCT GGTAT TAT GTACGAGT T GT GGTACAC T GC T T
C T T GGGAGAAGCAAGAG
GACAACGAAAAGCACAT CAACT GGGTTAGAT C C GT T TAC CAAT T CAC TAC T C CT TAC GT T
T CC CA GAAC C CAAGA

TTGGCTTACTTGAACTACAGAGACTTGGACTTGGGTAAGACTAACCACGCTTCCCCAAACAATTACACACAGGCT
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACTTCTTCAGAAACGAGCAGTCCATCCCACCATTGGTCAATTAA
SEQ ID NO: 17 AACGCAAGAGAAAACTT CTT GAAGT GTTTTT CCAAGCACAT CC CAAACAACGTT
GCTAACCCTAAGTTGGTTTAC
ACTCAGCACGACCACTTGTACATGTCCTTGTTGAACTCCACAATCCAGAACTTGAGATTCATCTCCGACACTACT
CCAAAGCCATT GGTTAT CGTTACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CTT GT GTT C
CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACATTT CCCAGGTT
CCATT CGTT
GTTGTTGACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAAGCTGGTGCT
ACTTT GGGT GAAGTTTACTACT GOAT CAACGAGAAGAACGAGAACTT CT CCTT C CCAGGT GGTTACT
CT CCAACT
GTTGGTGTTGGTGGTCACTTTTCTGGTGGTGGTTACGGTGCTT TGATGAGAAACTACGGATTGGCTGCTGACAAC
AT CAT CGACGCT CACTT GGTTAACGTT GACGGTAAGGTTTT GGACAGAAAGT CCAT GGGT
GAGGACTTGTT CT GO
GCTATTAGAGGTGGTGGTGGTGAGAACTTCGGTATTATTGCTGCTTGGAAGATCAAGTTGGTTGCTGTTCCATCC
AAGT CCACTAT CTT CT CCGTTAAGAAAAACAT GGAAAT CCACGGTTT GGTTAAGTT GTTTAACAAGT
GGCAGAAC
ATTGCTTACAAGTACGACAAGGACTTGGTTTTGATGACTCACT TCATCACTAAGAACAGCGGAAACACTGTTCAC
GGTTACTTCTCTTCCATCTTCCACGGTGGTGTTGATTCCTTGGTTGATTTGATGCAAAAGTCTTTCCCAGAGTTG
GGTATCAAGAAAACTGACAGCAAAGAGTTCTCCTGGATCGACACAACAATCTTCTACTCCGGTOTTGTTAACTTC
AACACTGCTAACTTTAAGAAAGAGATCTTGTTGGACAGATCCGCTGGTAAAAAGACTGCTTTCTCCATTAAGTTG
GACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGACGTTGGT
GCT GGTAT GTACGTTTT GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT CCGCTATT
CCATTCCCACAC
AGAGCT GGTAT TAT GTACGAGTT GT GGTACACT GCTT CTT
GGGAGAAGCAAGAGGACAACGAAAAGCACAT CAAC
TGGGTTAGATCCGTTTACCAATTCACTACTCCTTACGTTTCCCAGAACCCAAGATTGGCTTACTTGAACTACAGA
GACTT GGACTT GGGTAAGACTAACCACGCTT CCCCAAACAAT TACACACAGGCTAGAAT CT GGGGT
GAAAAGTAC
TT CGGAAAGAACTTTAACAGATT GGTTAAGGT TAAGACTAAGGTTGACCCTAACAACTTCTTCAGAAACGAGCAG

TCCATCCCACCATTGGTCAATTAA
SEQ ID NO: 18 AACGCAAGAGAAAACTTCTTGAAGTGTTTTTCCAAGCACATCCCCAACAACGTT SCTAACCCTAAGTTGGTATAC
ACTCAGCACGACCAGTTGTACATGTCCTTGTTGGACTCCACAATCCAGAACTTGAGATTCATCTCCGACACTACT
CCAAAGCCCTT GGTTAT CGTTACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CTT GT GTT C
CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACATTT CCCAGGTT
CCCTT CGTT
GTTGTTGACCTTAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAAAGCGGTGCT
ACATT GGGT GAAGTTTACTACT GOAT CAACGAGAAGAACGAGAACCT CT COTT C CCCGGT GGTTACT
GT CCAACC
GTTGGTGTTGGTGGTCACTTTTCTGGTGGTGGTTACGGTGCTTTGATGAGAAACTACGGACTTGCTGCTGACAAC
AT CAT CGACGCT CACTT GGTTAACGTT GACGGTAAGGTTTT GGACAGAAAGT CCAT
GGGAGAGGACTTGTT CT GG
GCTATT COT COT COT COT COT CACAACTT CCCTATTATT OCT CCTTCGAACAT CAACCTT OTT OCT
OTT CCCT CC
AAGT CCACTAT CTT CT CCGTTAAGAAAAACAT GGAAAT CCACGGTTT GGTTAAGTT GTTTAACAAGT
GGCAGAAC
ATTGCTTACAAGTACGACAAGGACTTGGTTTTGATGACTCACT TCATCACTAAGAACATCACTGACAACCACGGT
AAGAACAAAACTACTGTTCACGGTTACTTCTCTTCCATCTTCCACGGTGGTGTTGATTCCTTGGTTGATTTGATG
AACAAGTCTTTCCCAGAGTTGGGCAT CAAGAAAACTGACTGTAAAGAGTTCAGTTGGATCGACACAACAATCTTC
TACAGTGGTGTTGTAAACTTCAACACTGCCAACTTTAAGAAAGAGATCTTGTTGGACAGGTCCGCTGGTAAAAAG
ACAGCTTTCTCCAT TAAGTTGGACTACGT TAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAG
TT GTACGAAGAGGACGTT GGT GCT GGTAT GTACGTTTT GTACC CATACGGT GGCAT CAT
GGAAGAAATCT CCGAG
T CCGCTATT CCGTT CCCACACCGAGCT GGTAT CAT GTACGAGT TGTGGTACACT
GCTTCTTGGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACTTCACTACTCCTTACGTTTCCCAGAACCCAAGA
TTGGCGTACTTGAACTACAGAGACTTGGACTTGGGCAAGACCAACCACGCATCCCCTAACAAT TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACTT CGGAAAGAACTTTAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACTTCTTCAGGAACGAGCAGTCCATCCCACCATTGGTCAATTAA
SEQ ID NO: 19 AACGCAAGAGAAAACTTCTTGAAGTGTTTTTCCAAGCACATCCCCAACAACGTT GCTAACCCTAAGTTGGTATAC
ACTCAGCACGACCAGTTGTACATGTCCTTGTTGAACTCCACAATCCAGAACTTGAGATTCATCTCCGACACTACT
CCAAAGCCCTT GGTTAT CGTTACT CCCT CCAACAACGCACACAT CCAGGCTACTAT CTT GT GTT C
CAAGAAGGTT
GGATT GCAGAT CAGAACAAGAT CCOGT GOT CAT GACGCT GAAGGTAT GT CCTACATTT CCCAGOTT
CCCTT COTT

GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GC
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCTTGGAAGAT CAAGCTT GT
T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGG'AAC G'AGCAGT CCAT CCCAC CAT T GOT CAAT TAA
SEQ ID NO: 20 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT CT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACTI GOT TAACGT T GACGOTAAGOTT T T GGACAGAAAGT CCAT
GOGAGAGGACT T GT T CT GO
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAG GACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAG GAAC GAG CAGT CCAT CCCAC CAT T GGT CAAT T AA
S EQ ID NO: 21 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT CT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT CT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT CCAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT CT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGT T CAGT T T T GGACAGACAAT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT COOT TAAGAAAAACAT GGAAAT CCACGGT TT GOT TAROT T GT T
TAACAAGT GOCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CT CTAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG

ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGCAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCGGTAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 22 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T OTT CGAGT CCT T OTT GAACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGT TT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACGT T GAAAT CCACGCT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCGTTCCCACACCGAGCTGGTACCGTTTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 23 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCACGACCAGT T OTT CGAGT CCT T OTT GGACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACACTACT
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGT TT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T COOT CAA= T TACTACT GOAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGCT CGT
TACT CT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GO
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACGT T GAAAT CCACGCT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCGTTCCCACACCGAGCTGGTACCGTTTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 24 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT CT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T

CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GOAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAAGTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACGGT GCTAT CCAC GAGTT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GAC GAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAGAAGAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 25 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T COT GOT GOT GOT GOT GAGAACT T CGGTAT TAT T OCT GOT T GGAAGAT CAAGCT T
OTT OCT OTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT OCT GGAACAGGCAGT GGAACCT T TAAGAAAGAGAT CT
TGTTGGACAGGTCCGCTGGTAAAAAGACAGCT
T T CT CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T
GGAGAAGT T GTAC
GAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT
C CGAGT CCGCT
AT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC
GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGAT T GGCG
TACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CCCCTAACAAT
TACACACAGGCTAGAAT C
TGGGGTGAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTTGACCCTAACAACTTC
T T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 26 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GOT TAT COT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT OTT
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GOT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GOAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T COT OCT OCT GOT GOT GAGAACT T CGGTAT TAT T OCT GOT T GGAAGAT CAAGCT T
OTT OCT OTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT OTT CACGGT TACT T CT C T T CCAT CT T CCACGGT GOT OTT GATT CCT
T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C

TACAGT GGT GGAACAGGCAGT GGAAC CAAGAAAGAGAT CT T GT T GGACAGGT CC GCT
GGTAAAAAGACAGCT T T C
T CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT TT T
GGAGAAGT T GTAC GAA
GAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT
CCGAGT CCGCTAT T
CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAACGAA
AAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CACTACT C CT TACGT T T CC
CAGAACCCAAGAT T GGCGTAC
TTGAACTACAGAGACTTGGACTTGGGCAAGACCAACCACGCAT CCCCTAACAAT TACACACAGGCTAGAAT CT
GG
GGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT T GGT TAAGGT TAAGAC TAAGGT T
GACCCTAACAACT T CT T C
AGGAACGAGCAGTCCATCCCACCATTGGTCAATTAA
SEQ ID NO: 27 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GGAGAT GGCACAGGTAAGAAAGAGAT CT T GT T GGACAGGT CCGCTAAAGGCAAGACAGCT
T T CT CC
AT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T GGAGAAGT
T GTACGAAGAG
GACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT CCGAGT
C CGCTAT T CCG
T T CCCACACCGAGCT GGTAT CAT GTAC GAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC GAAAAG
CACATCAACTGGGTTAGATCCGTTTACAACTTCACTACTCCTTACGTTTCCCAGAACCCAAGATT GGCGTACTTG
AAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CCC CTAACAAT TACACACAGGCTAGAAT
CT GGGGT
GAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTT GACCCTAACAACT T CT T
CAGG
AAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 28 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACATTGGGTGAAGTTTACTACTGGATCAACGAGAAGAACGAGAACCTCTCCTTCCCCGGTGGTTACTGTCCAACC
GTTGGTGTTGGTGGTCACTTTTCTGGTGGTGGTTACGGTGCTTTGATGAGAAACTACGGACTTGCTGCTGACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT CGACACAACAAT CT T
CTACAGT GGT GT T GTA
AACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT CCGCT GGTAAAAAGACAGCT
T T CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCGT T C
C CACACCGAGCT GGTAT CAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGC GTACT T GAAC
TACAGAGACTTGGACTTGGGCAAGACCAACCACGCATCCCCTAACAATTACACACAGGCTAGAAT CT GGGGT GAA

AAGTACTTCGGAAAGAACT T TAACAGAT T G GT TAAG GT T AAGAC TAAG GT T CAC C C
TAACAAC T T CT T CAGGAAC
GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 29 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGTATACACT CAG
CAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCCT T GGT TAT CGT TACT CCCT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT CT CCTACAT T T CC CAGGT T
CCCT T CGTT GT T GT T
GAC CT TAGAAACAT GCACT C CAT CAAGAT C GAC GT T CACT C C CAAACT GCT T GG GT T
GAAAGC GGT GCTACAT T G
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCTTCCCCGGT GGTTACT GT
CCAACCGT T GGT
GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGACT T
GCT GCT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT T T T GGACAGAAAGT CCAT GGGAGAGGACT T GT T CT
GGGCTAT T
CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT TGCTGCTTGGAAGATCAAGCTT GT T GCT GT T
CC CT CCAAGT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACAT CACT GACAAC
CACGGTAAGAAC
AAAACTACT GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T
GGT T GAT T T GAT GAACAAG
T CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT TCAGTTGGATCGACACAACAAT CT
T CTACAGT
GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT
TGTTGGACAGGTCCGCTGGTAAAAAGACAGCT
T T CT CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T
GGAGAAGT T GTAC
GAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT
C CGAGT CCGCT
AT T CCGT T CCCACACCG'AGCT GGTAT CAT GTACG'AGT T GT GGTACACT GCT T CT T
GGG'AGAAGCAAG'AGGACAAC
GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGAT T GGCG
TACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CCCCTAACAAT
TACACACAGGCTAGAAT C
TGGGGTGAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTTGACCCTAACAACTTC
T T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 30 AACGCAAGAGAAAACT T GT T GAAGT GT T T GT CCAAGCAC GACGGCACAGGAAAGACT GTATACACT
CAGCAC GAC
CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGATT CAT CT CC
GACACTACT CCAAAGCCCT T G
GT TAT CGT TACT CCCT CCAACAACGCAAAGAT CCAGGCTACTAT CTT GT GT T CCAAGAAGGT T
GGAT T GCAGAT C
AGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT T T CCCAGGT T CCCT T CGT T
GT T GTT GACCT T
AGAAACAT GCACT CCAT CAAGAT CGAC GT T CACT CCCAAACT GCT T GGGT T GAAAGCGGT
GCTACAT T GGGT GAA
GT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T CC CCGGT GGT TACT GT CCAACCGT
T GGT GT T GGT
GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGACT T GCT
GCTGACAACAT CAT CGACGCT
CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGAGAGGACT T GT T CT
GGGCTATT CGT GGT
GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GC T T GGAAGAT CAAGCT T GT T GCT GT T
CCCT CCAAGT CCACTAT C
T T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT
TGTTTAACAAGTGGCAGAACATTGCTTACAAG
TAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CACTAAGAACAT CACT GACAAC
CACGGTAAGAACAAAAC T
ACT GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T GGT T
GATT T GAT GAACAAGT CT T T C
CCAGAGTTGGGCATCAAGAAAACTGACTGTAAAGAGTTCAGTT GGAT CGACACAACAAT CT T CTACAGT GGT
GT T
GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT CCGCT
GGTAAAAAGACAGCT T T CT CC
AT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T GGAGAAGT
T GTACGAAGAG
G'ACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAG'AAAT CT
CCG'AGT C CGCTAT T CCG
T T CCCACACCGAGCT GGTAT CAT GTAC GAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC GAAAAG
CACATCAACTGGGTTAGATCCGTTTACAACTTCACTACTCCTTACGTTTCCCAGAACCCAAGATT GGCGTACTTG
AAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CCC CTAACAAT TACACACAGGCTAGAAT
CT GGGGT
GAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTT GACCCTAACAACT T CT T
CAGG
AAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 31 AACGCAAGAGAAAACT T GT T GAAGT GT T T GT CCAAGCACGGCGACGGAACAGGAAAGACT
GTATACACT CAGCAC
GAC CAGT T GTACAT CT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T CAT CT
CCGACAC TACT CCAAAGCCC
T T GGT TAT CGT TACT CCCT CCAACAACGCAAAGAT CCAGGCTACTAT CT T GT GT T
CCAAGAAGGT T GGAT T GCAG
AT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT T T CCCAGGT T CCCT T
CGT T GTT GT T GAC
CT TAGAAACAT GCACT CCAT CAAGAT CGACGT TCACTCCCAAACTGCTTGGGTT
GAAAGCGGTGCTACATTGGGT
GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T CCCCGGT GGT TACT GT CCAAC
CGTT GGT GT T
GGT GGT CACT T T T CT GGT GGT GGT TACGGT GC T T T GAT GAGAAACTACGGACT T GCT
GCT GACAACAT CAT CGAC
GCTCACTTGGTTAACGTTGACGGTAAGGTTTTGGACAGAAAGT CCAT GGGAGAGGACT T GT T CT GGGCTAT
T CGT
GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GC T GCT T GGAAGAT CAAGCT T GT T GCT GT
T CCCT C CAAGT CCACT
AT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGTT GT T TAACAAGT
GGCAGAACATT GCT TAC
AAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT CACT
GACAACCACGGTAAGAACAAA

ACTACT GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T GGT T
GAT T T GAT GAACAAGT CT
T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT CGACACAACAAT CT
T CTACAGTGGT
GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT CC GCT
GGTAAAAAGACAGCT T T C
T CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT TT T
GGAGAAGT T GTAC GAA
GAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGCAT CAT GGAAGAAAT CT
CCGAGT CCGCTAT T
CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAACGAA
AAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CACTACT C CT TACGT T T CC
CAGAACCCAAGAT T GGCGTAC
TTGAACTACAGAGACTTGGACTTGGGCAAGACCAACCACGCAT CCCCTAACAAT TACACACAGGCTAGAAT CT
GG
GGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT T GGT TAAGGT TAAGAC TAAGGT T
GACCCTAACAACT T CT T C
AG GAAC GAG CAG T C CAT C C CAC CAT T G GT CAAT TAA
SEQ ID NO: 32 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T G'ACCT TAG'AAACAT GCACT CCAT CAAG'AT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GOAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAAC GAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 33 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT OTT
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAAC GAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA

SEQ ID NO: 34 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACAACGT T
GCTAACCCTAAGTTGGTATAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCCT T GGT TAT CGT TACT CCCT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCCT T CGT T
GT T GT T GACCT TAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAAAGCGGTGCT
ACAT T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGGACCT CT CCT T C CCCGGT GGT
TACT GT CCAACC
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGACT T GCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT COAT
GGGAGAGGACT T GT T CT GG
GCTAT T CGT GGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGCT T
GT T GCT GTT CCCAAG
T CCT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAAACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
GCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGCAT CAAGAAAACT GACT GTAAAGAGT T CAGT T GGAT
CGACACAACAAT CT T C
TACAGT GGT GT T GTAAACT T CAACACT GCCAACT T TAAGAAAGAGAT CT T GT T GGACAGGT
CCGCT GGTAAAAAG
ACAGCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGCAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T CCGT T CCCACACCGAGCT GGTAT CAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCGTACT T GAAC TACAGAGACT T GGACT T GGGCAAGAC CAAC CACGCAT CC CCTAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGGAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 35 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT CGACACAACAAT CT T CTACT
C CGGT GT T GT T
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT
GCT T T CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT
GGGGT GAA
AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 36 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGT T TACACT CAG
CAC GAC CAGT T GTACAT GT CCT T OTT GGACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT GT CCTACAT T T CC CAGGT T
CCAT T CGTT GT T GT T
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACT T GT COTT CCCAGGT GGTTACT GT
CCAACT GT T GGT
GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGAT T
GGCT GCT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT TTTGGACAGAAAGTCCATGGGT GAGGACT T GT T CT
GGGCTAT T
AGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT T GCT
GT T CCAT CCAAGT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT

TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACCCCACACCTAACAC
TACT GT T CAC
GGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T GGT T GAT T T GAT
GAACAAGT CT T T CCCAGAGTTG
GGTAT CAAGAAAACT GACT GTAAAGAGT T CT C CT GGAT C GACACAACAAT CT T CTACT C C
GGT GT T GTTAACT T C
AACACT GCTAACT T TAAGAAAGAGAT OTT GT T GGACAGAT CCGCT GGTAAAAAGACT GCT T T CT
C CAT TAAGT T
GAC TACGT TAAGAAGCCAAT CCCAGAGACT GC TAT GGT TAAGAT T TT GGAGAAGT T GTAC
GAAGAGGACGT T GGT
GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT CCGCTAT T
CCAT T CCCACAC
AGAGCT GGTAT TAT GTAC GAGT T GT GGTACAC T GCT T CT T GGGAGAAGCAAGAG GACAAC
GAAAAGCACAT CAAC
T GGGT TAGAT CCGT T TACAACT T CACTACT CC T TAC GT T T CCCAGAACCCAAGAT T GGCT
TACT T GAACTACAGA
GACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT GGGGT
GAAAAGTAC
TTCGGAAAGAACTTTAACAGATTGGTTAAGGT TAAGACTAAGGT T GACCCTAACAACT T CT T CAGAAAC
GAGCAG
T CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 37 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGT T TACACT CAG
CAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCAT T GGT TAT CGT TACT CCAT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT CT CCTACAT T T CC CAGGT T
CCAT T CGTT GT T GOT
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACT T GT CCTTCCCAGGT GGTTACT GT
CCAACT GT T GGT
GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGAT T
GGCT GCT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT TTTGGACAGAAAGTCCATGGGT GAGGACT T GT T CT
GGGCTAT T
AGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT T GCT
GT T CCAT CCAAGT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACAT CACT GACAAC
CACGGTAAGAAC
AAGACTACT GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T
GGT T GAT T T GAT GAACAAG
T CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT C
GACACAACAAT CT T CTACT CC
GGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT
TGTTGGACAGATCCGCTGGTAAAAAGACTGCT
T T CT CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T
GGAGAAGT T GTAC
GAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT
C CGAGT CCGCT
AT T CCAT T CCCACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC
GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGAT T GGCT
TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT
TACACACAGGCTAGAAT C
TGGGGTGAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTTGACCCTAACAACTTC
T T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 38 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT CT CCT T OTT GGACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGGACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GC
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAAAG
T CCT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GNAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAG.AGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
T CCGCTAT T COAT T CCCACACAGAGCT GGTAT TA.TGTA.CGA.GT T GT GGTACA.CT GOTT CT T
GGGAGAAGCAAGA.G
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CA.GAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA

SEQ ID NO: 39 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GOAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT OCT GOT GOT GAGAACT T CGGTAT TAT T OCT GCT T GGAAGAT CAAGT T GGT
T OCT OTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACGCTAAAGAGT T CT CCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 40 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
SCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT OCT GOT OCT GAGAACT T CGGTAT TAT T OCT GOT T GGAAGAT CAAGT T GGT
T OCT OTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACAC TAAAGAGT T CT CCT GOAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACTTTAAGAAAGAGAT CTT GTT GGACAGAT CCGCT
GGTAAAAAG
ACTGCTTTCTCCATTAAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CA.GAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 41 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT OTT
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GOT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
OTT OTT GACT T GAGAAA.CAT COACT COAT CAA.GAT CGACGT T CACT CCCAAA.CT GOTT GGGT
T GAAT CAGGT OCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT COOT
GAGGACT T GT T CT CO
GCTAT TAGAGGT GOT GOT GOT GAGAACT T CGGTAT TAT T OCT GCT T GGAAGAT CAAGT T GGT
T OCT OTT CCAT CC

AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACCCTAAAGAGT T CT OCT GOAT
CGACACAACAAT OTT C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACT GGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 42 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT COAT CCAACAACT CCCACAT CCAGGCTACTAT OTT GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACGT CAAAGAGT T CT OCT GOAT
CGACACAACAAT OTT C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAG.AGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGC.4ACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAC.;AAAT CT CCGAC.4 TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CA.GAAAC GAGCAGT COAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 43 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCATT GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT COAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GACAACT T CGGTAT TAT T GOT GCT T GGAAGAT CAAGT T GGT
T GOT GTT COAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT OTT CACGGT TACT T CT OTT COAT OTT CCACGGT GOT OTT GATT CCT T
GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT COT GGAT
CGACACAACAAT OTT C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT CCAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
TT GTACGAA.GAGGACGT T GOT GOT GGTAT GTACGT T T T GTACC CATACGGT GGTA.T CAT
GGAA.GAAA.T CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAACGAAAAGCACATCAACTGGGTTAGATCCGTTTACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT

AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC C.AT T GGT CAAT TAA
SEQ ID NO: 44 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T COAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT COAT CAAGAT CGACGT T CACT CCCAAACT GOTT GGGT
T GAAT CAGGT GCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCA.T CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT C CT GGAT C GACACAACAAT CT T
CTACT C C GGT GT T GOT
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT
GCT T T CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT
GGGGT GAA
AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT C CAT C C CAC CAT T GGT CAAT TAA
SEQ ID NO: 45 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GOT
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT COAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GAC GCTAAAGAGT T CT C CT GGAT C GACACAACAAT CT T
CTACT C C GGT GT T GOT
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT
GCT T T CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACTTGGACTTGGGTAAGACTAACCACGCTTCCCCAAACAATTACACACAGGCTA.GAAT CT GGGGT
GAA
AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT CCA.T CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 46 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GOT GAACT CCACAAT CCAGAACT T GAGAT T CAT
CT C CGACAC TAC T
CCAAA.GCCAT T GGT TAT CGT TACT CCAT CCAA.CAA.CT CCCACAT CCAGGCTACTAT CT T GT
GT T C CAAG.A.AGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC

AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GACAC TAAAGAGT T CT CCT GGAT CGACACAACAAT CT T CTACT
C CGGT GT T GT T
AACT T CAACACT CCTAACT T TAACAAAGAGAT CT T GT T GGACACAT CCCCT GGTAAAAACACT
CCT T T CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GCCT TACT T GAAC
TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT
GGGGT GAA
AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT C CAT C C CAC CAT T GGT CAAT TAA
SEQ ID NO: 47 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT CT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GACCCTAAAGAGT T CT CCT GGAT CGACACAACAAT CT T CTACT C
CGGT GT T GT T
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT
GCTTT CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACTTGGACTTGGGTAAGACTAACCACGCTTCCCCAAACAATTACACACAGGCTAGAAT CT GGGGT GAA

AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT C CAT C C CAC CAT T GGT CAAT TAA
SEQ ID NO: 48 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAACT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GAC GT CAAAGAGT T CT C CT GGAT C GACACAACAAT CT T
CTACT C C GGT GT T GT T
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT
GOT T T CT COAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGCT TACT T GAAC

TACAGAGACTTGGACTTGGGTAAGACTAACCACGCTTCCCCAAACAATTACACACAGGCTAGAAT CT GGGGT GAA

AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT C CAT C C CAC CAT T GGT CAAT TAA
SEQ ID NO: 49 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGT T TACACT CAG
CAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCAT T GGT TAT CGT TACT CCAT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGATCAGACAGATCCGGTGGTCATGACGCTGAGGTATGTCCTACATTTCCCAGGTTCCATTCGTTGTTGTT
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACT T GT CCTTCCCAGGT GGTTACT GT
CCAACT GT T GGT
GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGAT T
GGCT GCT GACAACAT CAT C
GACGCT CACTI' GGT TAACGT T GACGGTAAGGT T TT GGACAGAAAGT CCAT GGGT GAGGACT T GT
T CT GGGCTAT T
AGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT T GCT
GT T CCAT CCAAGT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACAT CACT GACAAC
CACGGTAAGAAC
AAG'ACTACT GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T
GGT T G'AT T T GAT G'AACAAG
T CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT C
GACACAACAAT CT T CTACT CC
GGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT
TGTTGGACAGATCCGCTGGTAAAAAGACTGCT
T T CT CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T
GGAGAAGT T GTAC
GAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT
C CGAGT CCGCT
AT T CCAT T CCCACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC
GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGAT T GGCT
TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT
TACACACAGGCTAGAAT C
TGGGGTGAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTTGACCCTAACAACTTC
T T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 50 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGT T TACACT CAG
CAC GAC CAGT T GTACAT CT CCT T GT T CAACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCAT T GGT TAT CGT TACT CCAT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT GT CCTACAT T T CC CAGGT T
CCAT T CGTT GT T GT T
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACT T GT CCTTCCCAGGT GGTTACT GT
CCAACT GT T GGT
GT T GGT GGT CACI T T T CT GGT GGT GGT TAOGGT GCT T T GAT GAGAAACTACGGAT T
GGCT GOT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT TTTGGACAGAAAGTCCATGGGT GAGGACT T GT T CT
GGGCTAT T
AGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT T GCT
GT T CCAT CCAAGT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCASAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACAT CACT GACAAC
CACGGTAAGAAC
AAGACTACT GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T
GGT T GAT T T GAT GAACAAG
T CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT C
GACACAACAAT CT T CTACT CC
GGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT
TGTTGGACAGATCCGCTGGTAAAAAGACTGCT
T T CT CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T
GGAGAAGT T GTAC
GAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT
C CGAGT CCGCT
AT T CCAT T CCCACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC
GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGAT T GGCT
TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAAC GAT
TACACACAGGCTAGAAT C
TGGGGTGAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTTGACCCTAACAACTTC
T T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 51 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC CAC CAGT T GTACAT CT CCT T GT T GAACT CCACAAT COAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGGACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT

GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAAAG
T CCT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACI' T CAT CAC TAAGAACAT
CACT GACAAC CACGGT
AAGAACAAGACTACT GT T CACGGT TACT T CT C T T CCAT CT T CCACGGT GGT GT T GATT
CCT T GGT T GAT T T GAT G
AACAAGT CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT
CGACACAACAAT CT T C
TACT CCGGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT
CCGCT GGTAAAAAG
ACT GCT T T CT COAT TAAGT T GGAC TAC GT TAAGAAGCCAAT CC CAGAGACT GCTAT GGT
TAAGAT T T T GGAGAAG
T T GTACGAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACC CATACGGT GGTAT CAT
GGAAGAAAT CT CCGAG
TCCGCTATTCCATTCCCACACAGAGCTGGTAT TAT GTACGAGT T GT GGTACACT GCTT CT T
GGGAGAAGCAAGAG
GACAAC GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGA
T T GGCT TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CC CCAAACAAT
TACACACAGGCT
AGAAT CT GGGGT GAAAAGTACT T CGGAAAGAACT T TAACAGAT
TGGTTAAGGTTAAGACTAAGGTTGACCCTAAC
AACT T CT T CAGAAAC GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 52 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGT T TACACT CAG
CAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCAT T GGT TAT CGT TACT CCAT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT GT CCTACAT T T CC CAGGT T
CCAT T CGTT GT T GOT
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACT T GT CCTTCCCAGGT GGTTACT GT
CCAACT GT T GGT
GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGAT T
GGCT GCT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT TTTGGACAGAAAGTCCATGGGT GAGGACT T GT T CT
GGGCTAT T
AGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT T GCT
GT T CCAT CCAAGT CC
AC TAT CT T CT CCM' TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACCCCACACCTAACAC
TACT GT T CAC
GGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T GGT T GAT T T GAT
GAACAAGT CT T T CCCAGAGTTG
GGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GOAT CGACACAACAAT CT T CTACT CCGGT
OTT GTTAACT T C
AACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT GCT T T CT
C CAT TAAGT T G
GAC TACGT TAAGAAGCCAAT CCCAGAGACT GC TAT GGT TAAGAT T TT GGAGAAGT T GTAC
GAAGAGGACGT T GGT
GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT CCGCTAT T
CCAT T CCCACAC
AGAGCT GGTAT TAT GTAC GAGT T GT GGTACAC T GCT T CT T GGGAGAAGCAAGAG GACAAC
GAAAAGCACAT CAAC
T GGGT TAGAT CCGT T TACAACT T CACTACT CC T TAC GT T T CCCAGAACCCAAGAT T GGCT
TACT T GAACTACAGA
GACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT GGGGT
GAAAAGTAC
TTCGGAAAGAACTTTAACAGATTGGTTAAGGT TAAGACTAAGGT T GACCCTAACAACT T CT T CAGAAAC
GAGCAG
T CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 53 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGGACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GO
GCTAT TAGAGGT GOT GOT GOT GAGAACT T CGGTAT TAT T OCT GCT T GGAAGAT CAAGT T GGT
T OCT OTT CCAAAG
T CCT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT C CT GOAT C GACACAACAAT CT T
CTACT C COOT OTT OTT
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT
GCT T T CT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
OTT GOT OCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC

AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T CCCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACTTGGACTTGGGTAAGACTAACCACGCTTCCCCAAACAATTACACACAGGCTAGAAT CT GGGGT GAA

AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT T
CAGAAAC
GAGCAGT CCA.T CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 54 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GGT T TACACT CAG
CAC GAC CAGT T GTACAT GT CCT T OTT GAACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
COAT T GGT TAT CGT TACT COAT CCAACAACGCACACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT GT CCTACAT T T CC CAGGT T
CCAT T CGTT GT T GOT
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGGACT T GT CCTTCCCAGGT GGTTACT GT
CCAACT GT T GGT
OTT GGT GGT CACT T T T CT GGT GOT GGT TACGGT GCT T T GAT GAGAAACTACGGAT T GGCT
GCT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT TTTGGACAGAAAGTCCATGGGT GAGGACT T GT T CT
GGGCTAT T
AGAGGT GGT GGT GGT GAGAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT T GCT
GT T CCAAAGT CCT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACAT CACT GACAAC
CACGGTAAGAAC
AAGACTACT GT T CACGGT TACT T CT CT T CCAT COT CCACGGT GGT OTT GATT CCT T GGT T
GAT T T GAT GAACAAG
T CT T T CCCAGAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT C
GACACAACAAT CT T CTACT CC
GGT GT T GT TAACT T CAACACT GCTAACT T TAAGAAAGAGAT CT
TGTTGGACAGATCCGCTGGTAAAAAGACTGCT
T T CT CCAT TAAGT T GGAC TACGT TAAGAAGCCAAT CCCAGAGACT GCTAT GGT TAAGAT T T T
GGAGAAGT T GTAC
GAAGAGGACGT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT
C CGAGT CCGCT
AT T CCAT T CCCACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T
GGGAGAAGCAAGAGGACAAC
GAAAAGCACAT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T T
CCCAGAACCCAAGAT T GGCT
TACT T GAAC TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT
TACACACAGGCTAGAAT C
TGGGGTGAAAAGTACTTCGGAAAGAACTTTAACAGATTGGTTAAGGTTAAGACTAAGGTTGACCCTAACAACTTC
T T CAGAAAC GAGCAGT C CAT C C CAC CAT T GGT CAAT TAA
SEQ ID NO: 55 AACGCAAGAGAAAA.CT T CT T GAAGT GT T T T T CCAAGCACAT CC CCAACGCTAAC CCTAAGT T
GOT T TACA.CT CAC;
CAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACTT GAGAT T CAT CT
CCGACAC TACT CCAAAG
CCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GTT
CCAAGAAGGTT GGAT T G
CAGAT CAGAACAAGAT CCGGT GGT CAT GACGC T GAAGGTAT GT CCTACAT T T CC CAGGT T
CCAT T CGTT GOT GT T
GACTTGAGAAACATGCACTCCATCAAGATCGACGTTCACTCCCAAACTGCTTGGGTTGAATCAGGTGCTACTTTG
GGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGGACT T GT COTT CCCAGGT GGTTACT GT
CCAACT GT T GGT
GOT GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT GAGAAACTACGGAT T GGCT
GCT GACAACAT CAT C
GACGCTCACTTGGTTAACGTTGACGGTAAGGT TTTGGACAGAAAGTCCATGGGT GAGGACT T GT T CT
GGGCTAT T
AGAGGT GOT GOT GOT GAGAACT T CGGTAT TAT T OCT GCT T GGAAGAT CAAGT T GOT T GCT
OTT CCAAAGT CCT CC
AC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT T T GGT TAAGT T GT T TAACAAGT
GGCAGAACAT T GCT
TACAAGTAC GACAAGGACT T GGT T T T GAT GAC T CACT T CAT CACTAAGAACCCCACACCTAACAC
TACT GT T CAC
GGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCT T GGT T GAT T T GAT
GAACAAGT CT T T CCCAGAGTTG
GGTAT CAAGAAAACT GACT GTAAAGAGT T CT CCT GGAT CGACACAACAAT CT T CTACT CCGGT GT
T GTTAACT T C
AACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGAT CCGCT GGTAAAAAGACT GCT T T CT
C CAT TAAGT T G
GAC TACGT TAAGAAGCCAAT CCCAGAGACT GC TAT GGT TAAGAT T TT GGAGAAGT T GTAC
GAAGAGGACGT T GGT
GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT CCGCTAT T
CCAT T CCCACAC
AGAGCT GGTA.T TAT GTAC GAGT T GT GGTACAC T GCT T CT T GGGAGAAGCAAGAG GACAAC
GAAAAGCACAT CAAC
T GGGT TAGAT CCGT T TACAACT T CACTACT CC T TAC GT T T CCCAGAACCCAAGAT T GGCT
TACT T GAACTACAGA
GACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT GGGGT
GAAAAGTAC
TTCGGAAAGAACTTTAACAGATTGGTTAAGGT TAAGACTAAGGT T GACCCTAACAACT T CT T CAGAAAC
GAGCAG
T CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 56 AA.CGCAA.GAGAPLAA.CT T CT T GAA.GT GT T T T T CCAA.GCA.CA.T CC CAAA.CAA.CGT T
GCTAACCCTAA.GTTGGTTTA.0 ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GGACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT CCAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACT CCCAAACT
GCTTGGGTTGAATCAGGTGCT

ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT GGGT
GAGGACT T GT T CT GG
GCTAT TAGAGGT GGT GGT GGT GACAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T CACGGT TACT T CT CT T CCAT CT T CCACGGT GGT GT T GAT T CCTT GGT T GAT T T
GAT GAACAAGT CT T T CCCA
GAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT C CT GOAT C GACACAACAAT CT T
CTACT C C GGT GT T GT T
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGATCCGCT GGTAAAAAGACT GCT
T TCT COAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAC GAGT T GT GGTACACT GCT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAC
AT CAACT GGGT TAGAT CCGT T TAGAACT T CAC TACT OCT TACGT T TCGCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT
GGGGT GAA
AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT TCAGAAAC

GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 57 AACGCAAGAGAAAACT T CT T GAAGT GT T T T T CCAAGCACAT CC CAAACAACGT T
GCTAACCCTAAGTTGGTTTAC
ACT CAGCAC GAC CAGT T GTACAT GT CCT T GT T GAACT CCACAAT CCAGAACT T GAGAT T
CAT CT C CGACAC TAC T
CCAAAGCCAT T GGT TAT CGT TACT COAT CCAACAACT CCCACAT CCAGGCTACTAT CT T GT GT T
C CAAGAAGGT T
GGAT T GCAGAT CAGAACAAGAT CCGGT GGT CAT GACGCT GAAGGTAT GT CCTACAT TT CCCAGGT
T CCAT T CGT T
GT T GT T GACT T GAGAAACAT GCACT CCAT CAAGAT CGACGT T CACTCCCAAACT
GCTTGGGTTGAATCAGGTGCT
ACT T T GGGT GAAGT T TACTACT GGAT CAACGAGAAGAACGAGAACTT GT CCT T C CCAGGT GGT
TACT GT CCAACT
GT T GGT GT T GGT GGT CACT T T T CT GGT GGT GGT TACGGT GCT T T GAT
GAGAAACTACGGAT T GGCT GCT GACAAC
AT CAT CGACGCT CACT T GGT TAACGT T GACGGTAAGGT T T T GGACAGAAAGT CCAT OGGT
GAGGACT T GT T CT GO
GCTAT TAGAGGT GGT GGT GGT GACAACT T CGGTAT TAT T GCT GCT T GGAAGAT CAAGT T GGT
T GCT GTT CCAT CC
AAGT CCAC TAT CT T CT CCGT TAAGAAAAACAT GGAAAT CCACGGT TT GGT TAAGT T GT T
TAACAAGT GGCAGAAC
AT T GCT TACAAGTAC GACAAGGACT T GGT T T T GAT GACT CACT T CAT CAC
TAAGAACCCCACACCTAACAC TAC T
GT T GAGGGT TACT T GT GT T GGAT GT T GGAGGGT GGT GT T GAT T CGTT GGT T GAT T T
GAT GAAGAAGT CT T T GGGA
GAGT T GGGTAT CAAGAAAACT GACT GTAAAGAGT T CT C CT GGAT C GACACAACAAT CT T
CTACT C C GGT GT T GT T
AACT T CAACACT GCTAACT T TAAGAAAGAGAT CT T GT T GGACAGATCCGCT GGTAAAAAGACT GCT
T TCT CCAT T
AAGTTGGACTACGTTAAGAAGCCAATCCCAGAGACTGCTATGGTTAAGATTTTGGAGAAGTTGTACGAAGAGGAC
GT T GGT GCT GGTAT GTACGT T T T GTACCCATACGGT GGTAT CAT GGAAGAAAT CT CCGAGT
CCGCTATT CCAT T C
C CACACAGAGCT GGTAT TAT GTAG GAGT T GT GGTACACT GOT T CT T GGGAGAAG
CAAGAGGACAACGAAAAGCAG
AT CAACT GGGT TAGAT CCGT T TACAACT T CAC TACT CCT TACGT T TCCCAGAAC CCAAGAT T
GGCT TACT T GAAC
TACAGAGACT T GGACT T GGGTAAGAC TAAC CACGCT T CCCCAAACAAT TACACACAGGCTAGAAT CT
GGGGT GAA
AAGTACTTCGGAAAGAACTTTAACAGATTGGT TAAGGTTAAGACTAAGGTTGACCCTAACAACTT CT TCAGAAAC

GAGCAGT CCAT CCCAC CAT T GGT CAAT TAA
SEQ ID NO: 58 AT GAGAT T T CCT T CAAT T T T TACT GCAGT T T TAT T CGCAGCAT
CCTCCGCATTAGCTGCTCCAGT CAACACTACA
ACAGAAGAT GAAACGGCACAAAT T CCGGCT GAAGCT GT CAT CGGT TACT CAGAT T TAGAAGGGGAT
T TCGAT GT T
GCT GT T T T GCCAT T T T CCAACAGCACAAATAACGGGT TAT T GT
TTATAAATACTACTATTGCCAGCATTGCTGCT
AAAGAAGAAGGGGTAT CT CT CGAGAAAAGAGAGGCT GAAGCT
SEQ ID NO: 59 AT GCAATACAAAAAGACT T T GGT T GCCT CT GC T T T GGCCGCTACTACAT T GGCC GCCTAT
OCT CCAT CT GAGCCT
T GGT CCACT T T GACT CCAACAGCCACT TACAGCGGT GGT GT TACCGACTACGCT T CCACCT T
COGTATT GCCGT T
CAAC CAAT CT CCAC TACAT CCAGCGCAT CAT CT GCAGCCAC CACAGCTAGCT T
GGAGAAGAGGGAGGCT GAT GCT
SEQ ID NO: 60 AT GAGAT T CCCAT CCAT CT T CACT OCT GT T T T OTT COOT OCT T CT TCCGCT T T GGCT
OCTAGACC CTAT OCT CCA
T CT GAGCCT T GGT CCACT T T GACT CCAACAGCCACT TACAGCGGT GGT GT TACC GACTACGCT
T C CACCT T CGGT
AT T GCCGT T CAACCAAT CT CCACTACAT CCAGCGCAT CAT CT GCAGCCACCACAGCCT CAT CT g CTAGCT T GGAG
AAGAGGGAGGCT GAT OCT

SEQ ID NO: 61 ATGAGATTCCCATCCATCTTCACTGCTGTTTTGTTCGCTGCTTCTTCCGCTTTGGCTGctagaGCCTATGCTCCA
TCTGAGCCTTGGTCCACTTTGACTCCAACAGCCACTTACAGCGGTGGTGTTACCGACTACGCTTCCACCTTCGGT
ATTGCCGTTCAACCAATCTCCACTACATCCAGCGCATCATCTGCAGCCACCACAGCCTCATCTgctagaGCCTAT
GCTCCATCTGAGCCTTGGTCCACTTTGACTCCAACAGCCACTTACAGCGGTGGTGTTACCGACTACGCTTCCACC
TTCGGTATTGCCGTTCAACCAATCTCCACTACATCCAGCGCATCATCTGCAGCCACCACAGCCTCATCTgCTAGC
TTGGAGAAGAGGGAGGCTGATGCT
SEQ ID NO: 62 ATGCTTTTGCAAGCTTTCCTTTTCCTTTTGGCTGGTTTTGCAGCCAAAATATCTGCAGGATCCGCTAGCTTGGAG
AAGAGGGAGGCTGAAGCT
SEQ ID NO: 63 ATGTTTTCTCCTATTCTAAGTCTGGAAATTATTCTCGCTTTGGCTACTCTCCAATCAGTCTTTGCGGCTAGCTTG
GAGAAGAG
GGAGGCTGAAGCT
SEQ ID NO: 64 TGTACAGGAACTTAATAATTGCTACTGCCCTTACTTGCGGTGCATACAGTGCCTACGTGCCTTCCGAACCATGGA
GCACACTGACACCTGATGCTAGCCTTGAAAGTGCCCTCAAAGATTACTCACAAACTTTTGGAATAGCTATTAAGT
CCTTAGATGCCGACGGATCCGCTAGCTTGGAGAAGAGGGAGGCTGAAGCT
SEQ ID NO: 65 ATGAGGCAGGTTTGGTTCTCTTGGATTGTGGGATTGTTCCTATGTTTTTTCAACGTGTCTTCTGCTGCTAGCTTG
GAGAAGAGGGAGGCTGATGCT
SEQ ID NO: 66 ATGAGGCAGGTTTGGTTCTCTTGGATTGTGGGATTGTTCCTATGTTTTTTCAACGTGTCTTCTGCTGCTCCAGTT
AACACTACTACTGAGGACGAGACTGCTCAGATTCCAGCTGAAGCTGTTATTGGTTACTCCGACTTGGAAGGTGAC
TT CGACGTT OCT GTTTT GCCATT CT CCAACT CCACTAACAACGGTTT OTT OTT CAT
CAACACTACAATCOCTT CC
ATTGCTGCTAAAGAAGAGGGAGCTAGCTTGGAGAAGAGGGAGGCTGATGCT
SEQ ID NO: 67 ATOTTCAACCTGAAAACTATTCTCATCTCAACACTTGCATCGATCGCTOTTGCCGCTAGCTTGGAGAAGAGGGAG
GCTGATGCT
SEQ ID NO: 68 TACCCATACGATOTTCCAGATTACGCT
SEQ ID NO: 69 CATCACCATCACCATCAC
SEQ ID NO: 70 CATAACCATAATCACAATCACAAC
SEQ ID NO: 71 GATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACAT
AAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCC
TCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGCTTGATTGGAGCTCGCTCATTCCAATTCCTT
CTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTAT
TTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAAATA
GTTTCATOTTCCCCAAATGGCCCAAAACTGACAGTTTAAACGCTGTCTTGGAACCTAATATGACAAAAGCGTGAT
CTCATCCAAGATGAACTAAGTTTGGTTCGTTGAAATGCTAACGGCCAGTTGGTCAAAAAGAAACTTCCAAAAGTC
GGCATACCGTTTGTCTTGTTTGGTATTGATTGACGAATGCTCAAAAATAATCTCATTAATGCTTAGCGCAGTCTC
TCTATCGCTTCTGAACCCCGGTGCACCTGTGCCGAAACGCAAATGGGGAAACACCCGCTTTTTGGATGATTATGC
ATTGTCTCCACATTGTATGCTTCCAAGATTCTGGTGGGAATACTGCTGATAGCCTAACGTTCATGATCAAAATTT
AACTGTTCTAACCCCTACTTGACAGCAATATATAAACAGAAGGAAGCTGCCCTGTCTTAAACCTTTTTTTTTATC

AT CAT TAT TAGCT TACT T T CATAAT T GCGACT GGT T CCAAT T GACAAGCT T T T GAT TT
TAAC GACT T TTAAC GAC
AACT T GAGAAGAT CAAAAAACAACTAAT TAT T C GAAAC G
SEQ ID NO: 72 T TAT T T T T T GACCGAAT T CT T T T T T T CAGACCATAT GACCGGT CCAT CT T CTAC
GGGGGGAT TAT CTATGCTTTG
ACCT CTAT CT T GAT T CT T T TAT GAT T CAAAT CACT T T TACGT TAT TTAT TACT TACT
GGT TAT T TACTTAGCGCC
T T T T CT GAAAAACAT T TAC TAAAAAT CATACAT CGGCACT CT CAAACAC GACAGAT T GT GAT
CAAGAAGCAGAGA
CAAT CAC CAC TAAGGT T GCACAT T T GAGCCAG TAGGCT CCTAATAGAGGT T CGATACT TAT T T
T GATAATAC GAC
ATAT T GT CT TACCT CT GAAT GT GT CAATACT C T CT CGT T CT T C GT CT CGT
CAGCTAAAAATATAACACT T CGAGT
AAGATACGCCCAAT T GAAGGCTAC GAGATAC CAGAC TAT CAC TAGTAGAACT T T GACAT CT
GCTAAAGCAGAT CA
AATAT CCAT T TAT CCAGAAT CAAT TACCT T CC T T TAGCT T GT C GAAGGCAT
GAAAAAGCTACAT GAAAAT CCC CA
T CCT T GAAGT T T T GT CAGCT TAAAGGACT CCAT T T CCTAAAAT TT CAAGCAGT C CT CT
CAACTAAAT TT T T T T CC
AT T OCT CT GCACCCAGCCCT CT T CAT CAACCGT CCAGCCT T CT CAAAAGT CCAAT
GTAAGTAGCCT GCAAAT T CA
GGTTACAACCCCTCAATTTTCCATCCAAGGGCGATCCTTACAAAGTTAATATCGAACAGCAGAGACTAAGCGAGT
CAT CAT CAC CACCCAAC GAT GGT GAAAAACT T TAAGCATAGAT T GAT GGAGGGT GTATGGCACTT
GGCGGCTGCA
T TAGAGT T T GAAAC TAT GGGGTAATACAT CACAT CCGGAACT GAT CCGACT CCGAGAT CATAT
GCAAAGCACGT G
AT GTACCCCGTAAACT GCT CGGAT TAT CGT T GCAAT T CAT CGT CT TAAACAGTACAAG'AAACT T
TAT T CAT GGGT
CAT T GGACT CT GAT GAGGGGCACAT T T CCCCAAT GAT T T T T T GGGAAAGAAAGC
CGTAAGAGGACAGTTAAGC GA
AAGAGACAAGACAAC GAACAGCAAAAGT GACAGCT GT CAGCTACCTAGT GGACAGT T GGGAGT T T
CCAATTGGTT
GGT T T T GAAT T T T TACCCAT GT T GAGT T GT CC T T GCT T CT CCT
TGCAAACAATGCAAGTTGATAAGACATCACCT
T CCAAGATAGGCTAT T T T T GT CGCATAAAT T T T T GT CT CGGAGT GAAAACCCCT T T TAT
GT GAACAGAT TACAGA
AGCGT CCTACCCT T CACCGGT T GAGAT GGGGAGAAAAT TAAGC GAT GAGGAGAC GAT TAT T
GGTATAAAAGAAGC
AAC CAAAAT CCCT TAT T GT CCT T T T CT GAT CAGCAT CAAAGAATATT GT CT TAAAACGGGCT
T T TAACTACAT T G
T T CT TACACAT T GCAAACCT CT T CCT T CTAT T TCGGATCAACT GTAT T GACTACAT T GAT
CT T T T T TAACGAAGT
T TAC GACT TACTAAAT CC C CACAAACAAAT CAACT GAGAAAA
SEQ ID NO: 73 ATATAAATACAT CGCT CAAAGCT CCAACT T T GCT T GT T CATACAATT CT T GATAT T CACAAT
GT CTACCGAAGGT
CAAGTAAGT T CAAT CAAAGTAAT T GT T T GGGAGGGAAGAAGAT T GTT T TAT T GC GAACCT T
T CAATAT CT TACCC
GAC TAAATAAC CAT TACAGT GAAT T T T T TAC TAAC TATATAGAT CAT CAAAT GTAAGGCAGCT
GT T GCCT GGGAG
GCAGGAAAGGAT CT CT CTAT T GAGGAGAT T GAGGT T CT T CCT C CAAGAGCCCAT
GAAGTTAGAGT GAAAGTGGAA
T T CACT GGT GTAT GCCACACT GAT GCT TACACGCT T T CT GGT GCAGAT GCAGAGGGAAGT T T
CCCT GTT GT GT T C
GGCCAT GAAGGT GCT GGT GT T GT CGAGT CAGT T GGAGAAGGT GT T GAGT CCGT GAAGGT T
GGGGAT T CT GTAGT G
CT T CT GTACACT CCT GAGT GCAGAGAGT GCAAGT T CT GT CT GT CT GGTAAGACGAACCT CT
GT GGTAAAAT CAGA
GCCACCCAGGGTAAAGGT T T GT TACCAGACGGGACT T CT CGT T TCCGTTGTAAGGGCAAGGATTT GT
TT CACTAT
AT GGGAT GT T CT T CCT T T T CT CAATACACT GT GGT GGCT GACAT CT CAGT GGT TAAAGT
CCAAGACGAAGCT CCT
AAGGACAAGACAT GT CT GT T GGGT T GT GGT GT TACCACAGGGTACGGT GCT GCTAT CAACACT
GCTAAGAT CT CT
AAGGGT GACAAGAT CGGT GT GT T T GGT GCT GGAT GTAT T GGAT TAT CT GT CAT C CAAGGT
GCAGT T T CCAAAGGT
GCAAGCGAGAT TAT T GTAAT T GACAT CAAT GAT T CAAAGAAGGCAT GGGCGGAC CAAT T T GGT
GCAACTAAGT T T
GT CAAT CCTACAACCT TAC CAGAAGGTAC CAATAT T GT T GAC TACTT GAT T GATAT CACT
GACGGAGGCT T T GAC
TATACCT T CGACT GTACCGGTAAT GT T CAAGTAAT GAGAAAT G CA
SEQ ID NO: 74 AT T CT GGCCCT T GCACCT GAT CGCGAAGGT GGAAAT GGCAGAAGGAT CAGCCT GGACGAAGCAAC
CAGT T CCAAC
TGCTAAGTAAAGAAGATGCTAGACGAAGGAGACTTCAGAGGTGAAAAGTTTGCAAGAAGAGAGCT GCGGGAAATA
AAT T T T CAAT T TAAGGACT T GAGT GCGT CCATAT T CGT GTACGT GT CCAACT GT T T T
CCAT TACCTAAGAAAAAC
ATAAAGATTAAAAAGATAAACCCAATCGGGAAACTTTAGCGTGCCGTTTCGGATTCCGAAAAACTTTTGGAGCGC
CAGAT GAC TAT GGAAAGAGGAGT GTAC CAAAAT GGCAAGT CGGGGGCTACT CAC
CGGATAGCCAATACAT T CT CT
AGGAACCAGGGAT GAAT CCAGGT T T T T GT T GT CACGGTAGGT CAAGCAT T CACT T
CTTAGGAATAT CT CGT T GAA
AGCTACT T GAAAT CCCAT T GGGT GCGGAACCAGCT T CTAAT TAAATAGT T CGAT GAT GT T CT
CTAAGT GGGACT C
TACGGCT CAAACT T CTACACAGCAT CAT CT TAGTAGT CCCT T C CCAAAACAC CAT T CTAGGT T
T C GGAACGTAAC
GAAACAAT GT T C CT CT CT T CACAT T GGGC C GT TACT CTAGC CT
TCCGAAGAACCAATAAAAGGGACCGGCTGAAA
CGGGT GT GGAAACT CCT GT COACT T TAT GGCAAAGGCTACAGAAAT CCCAAT CT T GT CGGGAT
OTT OCT CCT CCC
AAACGCCATATTGTACTGCAGTTGGTGCGCAT T T TAGGGAAAAT T TACCCCAGAT GT CCT GAT T T T
CGAGGGCTA
CCCCCAACT CCCT GT GCT TATACT TAGT CTAAT T CTAT T CAGT GT GCT GACCTACACGTAAT
GAT GT CGTAACCC
AGTTAAATGGCCGAAAAACTATTTAAGTAAGT T TAT T T CT CCT CCAGAT GAGACT CT CCT T CT T
T T CT CCGCTAG
T TAT CAAAC TATAAAC CTAT T T TAC C T CAAATAC C T C CAACAT CAC C CAC T TAAACA

SEQ ID NO: 75 AT CT T CAT T GAT GAAACGT T GT GAT CGGT GT GACT T T TATAGTAAAAGCTACAACT GT T T
GAAATAC CAAGATAT
CAT T GT GAAT GGCT CAAAAGGGTAATACAT CT GAAAAACCT GAAGT GT GGAAAAT T CCGAT
GGAGCCAACT CAT G
ATAACGCAGAAGT CCCAT T T T GCCAT CT T CT C T T GGTAT GAAACGGTAGAAAAT GAT
CCGAGTAT GCCAAT T GAT
ACT CT T GATT CAT GCCCTATAGT T T GCGTAGGGT T TAAT T GAT CT CCT GGT CTAT CGAT
CT GGGACGCAAT GTAG
ACCCCAT TAGT GGAAACACT GAAAGGGAT CCAACACT CTAGGC GGACCCGCT CACAGT CAT T T
CAGGACAAT CAC
CACAGGAAT CAAC TACT T CT CCCAGT CT T CCT TGCGTGAAGCT TCAAGCCTACAACATAACACTT CT
TACT TAAT
CT T T GAT T CT CGAAT T GT T TACCCAAT CT T GACAACT TAGCCTAAGCAATACT CT GGGGT
TATATATAGCAAT T G
CT CT T C CT C GCT GTAGCGT T CAT T C CAT CT T T CTA
SEQ ID NO: 76 T GT CAT CT GCT GAT GCT GT GAGGGAGAAAGAAGTAGGGGT GATACAT GGT T TATAGGCAAAGCAT
GT TT GT T T CA
GAT CAAAGAT TAGCGT T T CAAAGT T GT GGAAAAGT GAC CAT GCAACAATAT GCAACACAT T
CGGAT TAT CT GATA
AGT T T CAAAGCTACTAAGTAAGCCCGT T T CAAGT CT CCAGACC GACAT CT GCCAT CCAGT GAT T
T T CTTAGT CCT
GAAAAATAC GAT GT GTAAACATAAAC CACAAAGAT CGGCCT CC GAGGT T GAACC CT TAC
GAAAGAGACAT CT GGT
AGCGCCAAT GCCAAAAAAAAAT CACAC CAGAAGGACAAT T CCC T T CCCCCCCAGCCCAT TAAAGCT
TAC CAT T T C
CTAT T CCAATACGT T CCATAGAGGGCAT CGCT CGGCT CAT T T T
CGCGTGGGTCATACTAGAGCGGCTAGCTAGTC
GGCT GT T T GAGCT CT CTAAT C GAGGGGTAAGGAT GT CTAATAT GT CATAAT GGCT
CACTATATAAAGAAC C C GCT
T GCT CAACCT T CGACT CCT T T CCCGAT CCT T T GCT T GT T GCT T CT T CT T T
TATAACAGGAAACAAAGGAAT T TAT
ACACTTTAA
SEQ ID NO: 77 AAAT TAAT CCATAAGATAAGGCAAAT GT GCT TAAGTAAT T GAAAACAGT GT T GT GAT TATATAAG
CAT GGTAT T T
GAATAGAAC TACT GGGGT TAACT TAT CTAGTAGGAT GGAAGT T
GAGGGAGATCAAGATGCTTAAAGAAAAGGATT
GGCCAATAT GAAAGCCATAAT TAGCAATACT TAT T TAAT CAGATAAT T GT GGGGCATT GT GACT T
GACTTTTACC
AGGACT T CAAACCT CAAC CAT T TAAACAGT TATAGAAGACGTACCGT CACT T T T GCTT T TAAT
GT GAT CTAAAT G
T GAT CACAT GAACT CAAAC TAAAAT GATAT CT T T TACT GGACAAAAAT GT TAT C CT
GCAAACAGAAAGCT T T CT T
C TAT T CTAAGAAGAACAT T TACAT T GGT GGGAAACCT GAAAACAGAAAATAAATACT CCCCAGT
GACCCTAT GAG
CAGGAT T T T T GCAT CCCTAT T GTAGGCCT T T CAAACT CACACC TAATAT T T CCC SCCACT
CACAC TAT CAAT GAT
CACT T CCCAGT T CT CT T CT T CCCCTAT T CGTACCAT GCAACCC T TACACGCCT T T T CCAT
T T CGGT T CGGAT GCG
ACT T CCAGT CT GT GGGGTACGTAGCCTAT T CT CT TAGCCGGTAT T TAAACATACAAAT T
CACCCAAATT CTACCT
T GATAAGGTAAT T GAT TAAT T T CATAAAT
SEQ ID NO: 78 TCCAAACCAAACGGTCTAGCAAAAACGATAACTTTAAAGAACT TTTCAATTGGTTTTGTACACTACCACCGGTTT
ACTACCT CT GCCT T CGGT T CT T CT CCT CACAT TTTTCGCAACT GGGATAGCGTAGCCTAAAGT GT
CACATGCTCG
CT OCT CACAT T CCCTACACAACAGAGAT T GT CAGCAGAGGAAAT T GAGCT CCAC CATT CAACACT
T GT GGAT T TA
T GATAGT CT GT GCTAT CAGCT CT CT T T T T T T T GT T GCT GTAGAAT TTACCGT
GCTAGCAACCT T T TAAACT T T GT
TTAGCTCTCCTTCCCTCTTCCATTCATCTGTTTCGGTCCGATCCGTCTCTGGTCATCTCCTCCGCATTTTTTTTT
TACCGT TAGCGATAGGGGT CAGAT CAAT T CAAT CAGT T T T GGCAAGGGTAT T TAAAGGT
GGCGAAAT CCCCCT CC
GT T T GT T GAACACAT CCAAC TAT T CT CAACCCAAC CAT CTAAC TAAT CGTA
SEQ ID NO: 79 CGCAGCGT T T T CT GACGGTAC TAGAGGACT CT
TAGGGGAAGGTAGAATCAATAAAGATCATATTAGGTAAGCAAA
T T T T GGAT GGAATAGGAGACTAGGT GT GGAT GCGCGAT CT CGC CAAAT T GCACGACCAGAGT
GGAT GCCGGAT GG
T GGTAAACCGT T T CT T CCT T T T TACCACCCAAGT GCGAGT GAAACACCCCAT GGCT GCT CT
CCGAT T GCCCCT CT
ACAGGCATAAGGGT GT GACT T T GT GGGCT T GAAT T T TACACCC CCT CCAACT T T T CT
CGCAT CAAT T GAT CCT GT
TACCAATAT T GCAT GCCCGGAGGAGACT T GCCCCCTAAT T T CGCGGCGT CGT CC CGGAT
CGCAGGGT GAGACT GT
AGAGACCCCACATAGT GACAAT GAT TAT GTAAGAAGAGGGGGGT GAT T CGGCCGGCTAT CGAACT
CTAACAAC TA
GGGGGGT GAACAAT GCCCAGCAGT CCT CCCCACT CT T T GACAAAT CAGTAT CAC CGAT TAACACC
CCAAAT CT TA
TT CT CAACGGT CCCT CAT CCT T GCACCCCT CT
TTGGACAAATGGCAGTTAGCATTGGTGCACTGACTGACTGCCC
AACCT TAAACCCAAAT T T CT TAGAAGGGGCCCAT CTAGT TAGC GAGGGGT GAAAAATT CCT CCAT
OGGAGATGTA
T T GACCGTAAGT T GCT GCT TAAAAAAAAT CAGT T CAGATAGCGAGACT T T T T T GAT TT
CGCAACGGGAGT GCCT G
T T CCAT T CGAT T GCAAT T CT CACCCCT T CT GCCCAGT CCT GCCAATT GCCCAT GAAT CT
GCTAAT T T CGT T GAT T
CCCACCCCCCT T T CCAACT CCACAAAT T GT CCAAT CT CGT T T T CCAT T T GGGAGAAT CT
GCAT GT CGACTACATA
AAGCGACCGGT GT CCGAAAAGAT CT GT GTAGT TTTCAACATTT T GT GCT CCCCC CGCT GT T T
GAAAACGGGGGT G

AGCGCT CT CCGGGGT GCGAAT T CGT GCCCAAT T CCT T T CACCC T GCCTAT T GTAGACGT
CAACCC GCAT CT GGT G
C GAATATAGCGCACCCCCAAT GAT CACAC CAACAAT T GGT CCACCCCT CCCCAAT CTCTAATAT T
CACAAT T CAC
CT CACTATAAATACCCCT GT CCT GCT CCCAAAT T CT T T T T T CC T T CT T CCAT
CAGCTACTAGCT T T TAT CT TAT T
TACTTTACGAAA
SEQ ID NO: 80 TGTGTCTGTAAATTTAAATCCAAAGAAAAATAAAGGGCACTACATAGAACAACACAATCAACCTACATAGCTCTC
TTTTTTTTTTTTTTTTTTTTTTTCTTTTTTGTTTTTTCTCAATTTTCTTCATTTTTTGCATTGTTACTACTCT CC
CATTAAGGGAAATTCTACCAGGAAAACCGAAGAAGACAAATGCAAAAGGGAAATATGAATACGCATGTATGCGCG
CAAAACCGCACTTACAGAGGGCATTAGGACATT
SEQ ID NO: 81 AGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACA
TAAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTC
CT CAACACCCACT T T T GCCAT CGAAAAACCAGCCCAGT TAT T GGGCT T GAT T GGAGCT CGCT
CAT T CCAAT T CCT
T CTAT TAGGCTACTAACACCAT GACT T TAT TAGCCT GT CTAT C CT GGCCCCCCT GGCGAGGT T
CAT GTT T GT T TA
T T T CCGAAT GCAACAAGCT CCGCAT TACACCCGAACAT CACT C CAGAT GAGGGCT T TCT GAGT
GT GGGGTCAAAT
AGT T T CAT GT T CCCCAAAT GGCCCAAAACT GACAGT T TAAACGCT GT CT T GGAACCTAATAT
GACAAAAGCGT GA
T CT CAT CCAAGAT GAACTAAGT T T GGT T CGT T GAAAT GCTAAC GGCCAGT T GGT
CAAAAAGAAACTTCCAAAAGT
CGGCATACCGT T T GT CT T GT T T GGTAT T GAT T GACGAAT GCT CAAAAATAAT CT CATTAAT
GCT TAGCGCAGT CT
CT CTAT CGCT T CT GAACCCCGGT GCACCT GT GCCGAAACGCAAAT GGGGAAACACCCGCT T T T T
GGAT GAT TAT G
CAT T GT CT CCACAT T GTAT GCT T CCAAGAT T CT GGT GGGAATACT GCT GATAGC CTAACGT
T CAT GATCAAAATT
TAACT GT T CTAACCCCTACT T GACAGCAATATATAAACAGAAG GAAGCT GCCCT GT CT TAAACCT T
T TT T T T TAT
CAT CAT TAT TAGCT TACT T T CATAAT T GCGAC T GGT T CCAAT T GACAAGCTTTT GATT T
TAAC GACT TT TAAC GA
CAACT T GAGAAGAT CAAAAAACAAC TAAT TAT T CGAAACGGAAT T CGCT GGAT C CTACGTAGAAT
T CCCTAGGGC
GGCCGCGAAT TAAT T CGCCT TAGACAT GACT GT T CCT CAGT T CAAGT T GGGCACT
TACGAGAAGACCGGT CT T GC
TAGAT T CTAAT CAAGAGGAT GT CAGAAT GCCAT T T GCCT GAGAGAT GCAGGCT T CATT T T T
GATACT TT T T TAT T
T GTAACCTATATAGTATAGGAT T T T T T T T GT CAT T T T GT T T CT T CTCGTACGAGCT T
GCT CCT GAT CAGCCTAT C
T CGCAGCT GAT GAATAT CT T GT GGTAGGGGT T T GGGAAAAT CAT T CGAGT T T GAT GTT T
T T CT T GGTAT T T CCCA
CT CCT CT T CAGAGTACAGAAGAT TAAGT GAGAAGT T CGT T T GT SCAAGCT TAT C GATAAGCT
T TAAT GCGGTAGT
T TAT CACAGT TAAAT T GCTAACGCAGT CAGGCACCGT GTAT GAAATCTAACAAT GCGCT CAT CGT
CATCCTCGGC
ACCGT CACCCT GGAT GCT GTAGGCATAGGCT T GGT TAT GCCGGTACT GCCGGGC CT CT T
GCGGGATATCGT CCAT
T CCGACAGCAT CGCCAGT CACTAT GGCGT GCT GCTAGCGCTATAT GCGT T GAT GCAAT T T CTAT
GCGCACCCGT T
CT CGGAGCACT GT CCGACCGCT T T GGCCGCCGCCCAGT CCT OCT CGCT T CGCTACT T
GGAGCCACTATCGACTAC
GCGAT CAT GGCGAC CACACCCGT CCT GT GGAT CTAT CGAAT CTAAAT GTAAGT TAAAAT CT
CTAAATAAT TAAAT
AAGT CCCAGT T T CT CCATAC GAACCT TAACAGCAT T GCGGT GAGCAT CTAGACCT T
CAACAGCAGCCAGAT CCAT
CACT GCT T GGCCAATAT GT T T CAGT CCCT CAGGAGT TACGT CT T GT GAAGT GAT GAACT T
CT GGAAGGT T GCAGT
GT TAACT CCGCT GTAT T CACCGCCATAT CCGTACGT T GCCAAACT GT GGT T
CGTACCCGAGGAGTAATCT CCACA
ACT CT CT GGAGAGTAGGCAC CAACAAACACAGAT CCAGCGT GT T GTACT T GAT
CAACATAAGAAGAAGCAT T CT C
GAT T T GCAGGAT CAAGT GT T CAGGAGCGTACT GAT T GGACAT T T CCAAAGCCT GCT CGTAGGT
T GCAACCGATAG
GGT T GTAGAGT GT GCAATACACT T GCGTACAAT T T CAACCCT T GGCAACT GCACAGCT T GGT T
GT GAACAGCATC
TT CAAT T CT GGCAAGCT CCT T GT CT GT CATAT CGACAGCCAACAGAAT CACCT GGGAAT
CAATAC CAT GT T CAGC
T T GAGACAGAAGGT CT GAGGCAAC GAAAT CT GGAT CAGCGTAT T TAT CAGCAATAAC TAGAACT T
CAGAAGGCCC
AGCAGGCAT GT CAATACTACACAGGGCT GAT GT GT CAT T T T GAAC CAT CAT CT T
GGCAGCAGTAACGAACTGGTT
T CCT GGACCAAATAT T T T GT CACACT TAGGAACAGT T T CT GT T
CCGTAAGCCATAGCAGCTACTGCCTGGGCGCC
T CCT GCTAGCACGATACACT TAGCACCAACCT T GT GGGCAACGTAGAT GACT T CT
GGGGTAAGGGTACCAT CCT T
CT TAGGT GGAGAT GCAAAAACAAT T T CT T T GCAAC CAGCAACT T T GGCAGGAACACCCAGCAT
CAGGGAAGT GGA
AGGCAGAAT T GCGGT T CCAC CAGGAATATAGAGGCCAACT T T C T CAATAGGT CT T GCAAAAC
GAGAGCAGAC TAC
ACCAGGGCAAGT CT CAACT T GCAACGT CT CCGT TAGT T GAGCT T CAT GGAAT T T CCT GACGT
TAT CTATAGA GAG
AT CAAT GGCT CT CT TAACGT TAT CT GGCAAT T GCATAAGT T CCT CT GGGAAAGGAGCT T
CTAACACAGGT GT CT T
CAAAGCGACT CCAT CAAACT T GGCAGT TAGT T CTAAAAGGGCT T T GT CAC CAT T T T GAC
GAACAT T GTCGACAAT
T GGT T T GACTAAT T CCATAAT CT GT T CCGT T T T CT GGATAGGACGACGAAGGGCAT CT T
CAAT T T CT T GT GAGGA
GGCCT TAGAAACGT CAAT T T T GCACAAT T CAATACGACCT T CAGAAGGGACT T CT T TAGGT T
T GGAT TCT T CT T T
AGGT T GT T CCT T GGT GTAT CCT GGCT T GGCAT CT CCT T T CCT T
CTAGTGACCTTTAGGGACTTCATATCCAGGTT
T CT CT CCACCT CGT CCAACGT CACACCGTACT T GGCACAT CTAAC TAAT GCAAAATAAAATAAGT
CAGCACATTC
CCAGGCTATAT CT T CCT T GGAT T TAGCT T CT GCAAGT T CAT CAGCTT CCT CCCTAATT T
TAGCGT T CAACAAAAC
T T CGT CGT CAAATAACCGT T T GGTATAAGAACCT T CT GGAGCAT T GCT CT TACGAT
CCCACAAGGT GGCT T CCAT

GGCT CTAAGACCCT T T GAT T GGCCAAAACAGG.AAGT GCGT T CCAAGT GACAGAAAC CAACACCT
GT T T GT T CAAC
CACAAAT T T CAAGCAGT CT CCAT CACAAT CCAAT T CGATACCCAGCAACT T T T GAGTT GCT
CCAGAT GTAGCAC C
TTTATACCACAAACCGTGACGACGAGATTGGTAGACTCCAGTT T GT GT CCT TATAGCCT CCGGAATAGACT
T T T T
GGACGAGTACACCAGGCCCAACGAGTAATTAGAAGAGTCAGCCACCAAAGTAGT GAATAGA.0 CAT
CGGGGCGGTC
AGTAGT CAAAGACGCCAACAAAAT T T CACT GACAGGGAACT T T T T GACAT CT T CAGAAAGT T
CGTAT T CAGTAGT
CAAT T GCCGAGCAT CAATAAT GGGGAT TATAC CAGAAGCAACAGT GGAAGT CACAT CTAC CAACT T
T GCGGT CT C
AGAAAAAGCATAAACAGT T CTAC TACCGC CAT TAGTGAAACTT
TTCAAATCGCCCAGTGGAGAAGAAAAAGGCAC
AGCGATAC TAGCAT TAGCGGGCAAGGAT GCAACT T TAT CAAC CAGGGT CCTATAGATAACCCTAGCGCCT
GGGAT
CAT CCT T T GGACAACT CT T T CT GCCAAAT CTAGGT CCAAAAT CACTT CAT T GATAC CAT
TAT T GTACAACT T GAG
CAAGT T GT C GAT CAGCT C CT CAAAT T GGT C CT CT GTAAC GGAT
GACTCAACTTGCACATTAACTT GAAGCTCAGT
CGAT T GAGT GAACT T GAT CAGGT T GT GCAGCT GGT CAGCAGCATAGGGAAACAC GGCT T T T
CCTACCAAACT CAA
GGAAT TAT CAAACT CT GCAACACT T GCGTAT GCAGGTAGCAAGGGAAAT GT CATACTT GAAGT
CGGACAGT GAGT
GTAGT CT T GA.GAAAT T CT GAAGCCGTAT T T T TAT TAT CAGT GAGT CAGT CAT CAGGAGAT
CCT CTACGCCGGACG
CAT CGT GGCCGACCT GCAGGGGGGGGGGGGGCGCT GAGGT CT GCCT CGT GAAGAAGGT GT T GCT
GACT CATACCA
GGCCT GAAT CGCCCCAT CAT CCAGCCAGAAAGT GAGGGAGCCACGGT T GAT GAGAGCT T T GT T
GTAGGT GGACCA
GT T GGT GAT T T T GAACT T T T GCT T T GCCACGGAACGGT CT GCGT T GT CGGGAAGAT
GCGT GAT CT GAT CCT T CAA
CT CAGCAAAAGT T CGAT T TAT T CAACAAAGCCGCCGT CCCGT CAAGT CAGCGTAAT GCT CT
GCCAGT GT TACAAC
CAAT TAAC CAAT T CT GAT TAGAAAAACT CAT C GAG CAT CAAAT GAAACT GCAAT T TAT T
CATAT CAG GAT TAT CA
ATAC CATAT T T T T GAAAAAGCCGT T T CT GTAAT GAAGGAGAAAACT CACCGAGGCAGT T
CCATAG GAT GGCAAGA
T CCT GGTAT CGGT CT GCGAT T CCGACT CGT CC.AACAT CAATACAACCTAT TAAT T T CCCCT
CGT CAAAAATAAGG
T TAT CAAGT GAGAAAT CAC CAT GAGT GACGAC T GAAT C C G GT GAGAAT GGCAAAAGCT TAT
G CAT T T CT T T CCAG
ACT T GT T CAACAGGCCAGCCAT TACGCT CGT CAT CAAAAT CAC T CGCAT CAAC CAAACCGT TAT
T GATT CGT GAT
T GCGCCT GAGCGAGAC GAAATACGCGAT CGCT GT TAAAAGGACAAT TACAAACAGGAAT CGAAT
GCAACCGGCGC
AGGAACACT GCCAGCGCAT CAACAATAT T T T CACCT GAAT CAG GATAT T CT T CTAATACCT
GGAAT GCT GT T T T C
CCGGGGAT CGCAGT GGT GAGTAAC CAT GCAT CAT CAGGAGTAC GGATAAAAT GCT T GAT GGT
CGGAAGAGGCATA
AAT T CCGT CA.GCCAGT T TAGT CT GACCAT CT CAT CT GTAACAT CATT GGCAACGCTACCT T T
GCCAT GT T T CAGA
AACAACT CT GGCGCAT CGGGCT T CCCATACAAT CGATAGAT T GT CGCACCT GAT T GCCCGACAT
TAT CGCGAGCC
CAT T TATACCCATATAAAT CAGCAT CCAT GT T GGAAT T TAAT C GCGGCCT CGAG CAAGAC GT T
T C CCGT T GAATA
T GGCT CATAACACCCCT T GTAT TACT GT T TAT GTAAGCAGACAGT TT TAT T GT T CAT GAT
GATATAT TT T TAT CT
T GT GCAAT GTAACAT CAGAGAT T T T GAGACACAACGT GGCT T T CCCCCCCCCCC CT GCAGGT
CGGCAT CACCGGC
GCCACAGGTGCGGTTGCTGGCGCCTATATCGCCGACATCACCGATGGGGAAGAT CGGGCTCGCCACTTCGGGCTC
AT GAGCGCT T GT T T CGGCGT GGGTAT GGT GGCAGGCCCCGT GGCCGGGGGACT GT T GGGCGCCAT
CT CCT T GCAT
GCACCAT T CCT T GCGGCGGCGGT GCT CAACGGCCT CAACCTAC TACT GGGCT GCT T CCTAAT
GCAGGAGT CGCAT
AAGGGAGAGCGT CGAGTAT CTAT GAT T GGAAGTAT GGGAAT GGT GATACCCGCAT T CT T CA.GT
GT CT T GAGGT CT
CCTAT CAGAT TAT GCCCAAC TAAAGCAACCGGAGGAGGAGAT T T CAT GGTAAAT T T CT CT GACT
T T T GGT CAT CA
GTAGACT CGAACT GT GAGAC TAT CT CGGT TAT GACAGCAGAAAT GT CCT T CT T
GGAGACAGTAAAT GAAGT CC CA
C CAATAAAGAAAT CCT T GT TAT CAGGAACAAACT T CT T GT T T C GAACT T T T T CGGT
GCCT T GAAC TATAAAAT GT
AGAGT GGATAT GT CGGGTAGGAAT GGAGCGGGCAAAT GCT TAC CT T CT GGACCT T CAAGAGGTAT
GTAGGGTTTG
TAGATACT GAT GCCAACT T CAGT GACAAC GT T G C TAT T T C GT T CAAAC CAT T CC GAAT
CCAGAGAAAT CAAAGT T
GT T T GT CTACTAT T GAT CCAAGCCAGT GCGGT CT T GAAACT GACAATAGT GT GCT CGT GT T
T T GAGGT CAT CT T T
GTAT GAATAAAT CTAGT CT T T GAT CTAAATAAT CT T GAC GAGC CAAGGCGATAAATACCCAAAT
CTAAAACT CT T
T TAAAAC GT TAAAAGGACAAGTAT GT CT GCCT GTAT TAAACCC CAAAT CAGCT C GTAGT CT GAT
C CT CAT CAAC T
T GAGGGGCAC TAT CT T GT T T TAGAGAAAT T T GCGGAGAT GCGATAT CGAGAAAAAGGTACGCT
GAT T TTAAAC GT
GAAAT T TAT CT CAAGAT CT CT GCCT CGCGCGT TT CGGT GAT GACGGT GAAAACCT CT
GACACAT GCAGCT CCCGG
AGACGGT CACAGCT T GT CT GTAAGCGGAT GCCGGGAGCAGACAAGCCCGT CAGGGCGCGT CAGCGGGT
GT T GGCG
GGT GT CGGGGCGCAGCCAT GACCCAGT CACGTAGCGATAGCGGAGT GTATACT GGCTTAACTAT GCGGCAT
CAGA
GCAGAT T GTAC T GAGAGT GCAC CATAT GC GGT GT GAAATAC C G CACAGAT GC
GTAAGGAGAAAATAC C GCAT CAG
GCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCA.CTC
AAAGGC GGTAATAC G GT TAT CCACAGAAT CAGGGGATAAC GCAGGAAAGAACAT GT GAG CAAAAG G
C CAG CAAAA
GGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAA
T CGACGCT CAAGT CAGAGGT GGCGAAACCCGACAGGACTATAAAGATACCAGGC GT TT CCCCCT
GGAAGCT CCCT
CGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCT
TT CT CAA.T GOT CACGCT GTAGGTAT CT CA.GT T CGGT GTAGGT C GT T CGCT CCAA.GCT
GGGCT CT CT GCACGAA.CC
CCCCGT T CAGCCCGACCGCT GCGCCT TAT CCGGTAACTAT CGT CT T GAGT
CCAACCCGGTAAGACACGACT TAT C
GC CACT GGCAGCAGC CACT GGTAACAGGAT TAGCAGAGC GAGGTAT GTAGGC GGT GCTACAGAGT T
CTT GAAGT G
GT GGCCTAACTACGGCTACACTAGAAGGACAGTAT T T GGTAT C T GCGCT CT GCT
GAAGCCAGTTACCTTCGGAAA
AAGAGT T GGTAGCT CT T GAT CCGGCAAACAAACCACCGCT GGTAGCGGT GGT T T T T TT GT T T
GCAAGCAGCA.GAT

TACGCGCAGAAAAAAAGGAT CT CAAGAAGAT CCT T T GAT CT T T T CTACGGGGT CT GACGCT
CAGT GGAACGAAAA
CT CACGT TAAGGGAT T T T GGT CAT GAGAT TAT CAAAAAGGAT C T T CACCTAGAT
CCTTTTAAATTAAAAATGAAG
T T T TAAAT CAAT CTAAAGTATATAT GAGTAAACT T GGT CT GACAGTTAC CAAT GCT TAAT CAGT
GAGGCACCTAT
CT CAGCGAT CT GT CTAT T T CGT T CAT CCATAGT T GCCT GACT C CCCGT COT
GTAGATAACTACGATACGGGAGGG
CT TACCAT CT GGCCCCAGT GCT GCAAT GATACCGCGAGACCCACGCT CACCGGCT CCAGAT T TAT
CAGCAATAAA
CCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACT T TAT CCGCCT C CAT CCAGT CTAT TAAT
T GT T G
CCGGGAAGCTAGAGTAAGTAGT T CGCCAGT TAATAGT T T GCGCAACGT T GT T GC CATT GCT
GCAGGCAT CGT GGT
GT CACGCT CGT CGT T T GGTAT GGCT T CAT T CAGCT CCGGT T CC CAACGAT CAAGGCGAGT
TACAT GAT CCCCCAT
GT T GT GCAAAAAAGCGGT TAGCT CCT T CGGT CCT CCGAT CGT T GT CAGAAGTAAGT T
GGCCGCAGT GTTAT CACT
CAT GGT TAT GGCAGCACT GCATAAT T CT CT TACT GT CAT GCCAT CCGTAAGAT GCT TT T CT
GT GACT GGT GAGTA
CT CAACCAAGT CAT T CT GAGAATAGT GTAT GCGGCGACCGAGT T GCT CT T GCCC GGCGT
CAACAC GGGATAATAC
CGCGCCACATAGCAGAACT T TAAAAGT GCT CAT CAT T GGAAAACGTT CT T CGGGGCGAAAACT CT
CAAGGAT CT T
ACCGCT OTT GAGAT CCAGT T COAT GTAACCCACT COT GCACCCAACT GAT CT T CAGCAT CT T T
TACT TT CACCAG
CGT T T CT GGGT GAGCAAAAACAGGAAGGCAAAAT GCCGCAAAAAAGGGAATAAGGGCGACACGGAAAT GT
T GAAT
ACT CATACT CT T CCT T T T T CAATAT TAT T GAAGCAT T TAT CAG GGTTAT T GT CT CAT
GAGC GGATACATAT T T GA
AT GTAT T TAGAAAAATAAACAAATAGGGGT T CCGCGCACAT T T CCCCGAAAAGT
GCCACCTGACGTCTAAGAAAC
CAT TAT TAT CAT GACAT TAACCTATAAAAATAGGCGTAT CAC GAGGCCCT T T CGT CTT CAAGAAT
TAAT T CT CAT
GT T T GACAGCT TAT CAT CGATAAGCT GACT CAT GT T GGTAT T GT GAAATAGACGCAGAT
CGGGAACACT GAAAAA
TAACAGT TAT TAT T CG
SEQ ID NO: 82 AGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACAT CCACAGGT CCAT T CT
CACACA
TAAGT GCCAAACGCAACAGGAGGGGATACAC TAGCAGCAGACC GT T GCAAACGCAGGACCT CCACT CCT
CT T CT C
CT CAACACCCACT T T T GCCAT CGAAAAACCAGCCCAGT TAT T GGGCT T GAT T GGAGCT CGCT
CAT T CCAAT T CCT
T CTAT TAGGCTACTAACACCAT GACT T TAT TAGCCT GT CTAT C CT GGCCCCCCT GGCGAGGT T
CAT GTT T GT T TA
T T T CCGAAT GCAACAAGCT CCGCAT TACACCCGAACAT CACT C CAGAT GAGGGCT T T CT GAGT
GT GGGGTCAAAT
AGT T T CAT GT T CCCCAAAT GGCCCAAAACT GACAGT T TAAACGCT GT CT T GGAACCTAATAT
GACAAAAGCGT GA
T CT CAT CCAAGAT GAACTAAGT T T GGT T CGT T GAAAT GCTAAC GGCCAGT T GGT
CAAAAAGAAACTTCCAAAAGT
CGGCATACCGT T T GT CT T GT T T GGTAT T GAT T GACGAAT GCT CAAAAATAAT CT CATTAAT
GCT TAGCGCAGT CT
CT CTAT CGCT T CT GAACCCCGGT GCACCT GT GCCGAAACGCAAAT GGGGAAACACCCGCT T T T T
GGAT GAT TAT G
CAT T GT CT CCACAT T GTAT GCT T CCAAGAT T CT GGT GGGAATACT GCT GATAGC CTAACGT
T CAT GAT CAAAAT T
TAACT GT T CTAACCCCTACT T GACAG CAATATATAAACAGAAG GAAGCT GCCCT GT CT TAAACCT T
T TT T T T TAT
CAT CAT TAT TAGCT TACT T T CATAAT T GC GAC T GGT T CCAAT T GACAAGCTTTT GATT T
TAAC GACT TT TAAC GA
CAACT T GAGAAGAT CAAAAAACAAC TAAT TAT T CGAAGGAT CT GAAT T CATAGCTAGCT T
GGAGAAGAGGCCT TA
AT TAACT GGGCCGCGAAT TAAT T CGCCT TAGACAT GACT GT T C CT CAGT T CAAGT T
GGGCACT TACGAGAAGACC
GGT CT T GCTAGAT T CTAAT CAAGAGGAT GT CAGAAT GCCAT T T GCCTGAGAGAT GCAGGCT T
CAT T T TT GATACT
T T T T TAT T T GTAACCTATATAGTATAGGAT T T T T T T T GT CAT T TT GT T T CT T CT
CGTACGAGCTT GCT CCT GAT C
AGCCTAT CT CGCACCT GAT GAATAT CT T GT GCTACCGCT T T GCCAAAAT CAT T C CACT T T
GAT CT T T TT CT T GGT
AT T T CCCACT CCT CT T CAGAGTACAGAAGAT TAAGT GAGACGT T CGT T T GT GCAAGCT TAT
CGATAAGCT T TAAT
GCGGTAGT T TAT CACAGT TAAAT T GCTAACGCAGT CAGGCACC GT GTAT GAAAT CTAACAAT
GCGCT CAT CGT CA
TCCTCGGCACCGTCACCCTGGATGCTGTAGGCATAGGCTTGGT TAT GCCGGTACT GCCGGGCCT CT T
GCGGGATA
TCGTCCATTCCGACAGCATCGCCAGTCACTATGGCGTGCTGCTAGGTACAACTT GAGCAAGT T GT
CGATCAGCTC
CT CAAAT T GGT CCT CT GTAACGGAT GACT CAACT T GCACAT TAACTT GAAGCT CAGT CGAT T
GAGT GAACT T GAT
CAGGT T GT GCAGCT GGT CAGCAGCATAGGGAAACACGGCT T T T CCTACCAAACT CAAGGAAT TAT
CAAACT CT GC
AACACT T GCGTAT GCAGGTAGCAAGGGAAAT GT CATACT T GAAGT CGGACAGT GAGT GTAGT CT T
GAGAAAT T CT
GAAGCCGTAT T T T TAT TAT CAGT GAGT CAGT CAT CAGGAGAT C CT CTACGCCGGACGCAT CGT
GGCCGACCT GCA
GGGGGGGGGGGGGCGCT GAGGT CT GCCT CGT GAAGAAGGT GT T GCT GACT CATACCAGCT GAAT C
GCCCCAT CAT
CCAGCCAGAAAGT GAGGGAGCCACGGT T GAT GAGAGCT T T GT T GTAGGT GGACCAGTT GGT GAT T
T T GAACT T T T
GCT T T GCCACGGAACGGT CT GCGT T GT CGGGAAGAT GCGT GAT CT GAT CCT T CAACT
CAGCAAAAGT T CGAT T TA
T T CAACAAAGCCGCCGT CCCGT CAAGT CAGCGTAAT GCT CT GC CAGT GT TACAACCAAT
TAACCAAT T CT GAT TA
GAAAAACT CAT CGAGCAT CAAAT GAAACT GCAAT T TAT T CATAT CAGGAT TAT CAATAC CATAT
T T T T GAAAAAG
CCGT T T CT GTAAT GAAGGAGAAAACT CACCGAGGCAGT T CCATAGGAT GGCAAGAT CCT GGTAT C
GGT CT GCGAT
T CCGACT CGT CCAACAT CAATACAACCTAT TAAT T T CCCCT CGT CAAAAATAAGGT TAT CAAGT
GAGAAAT CAC C
AT GAGT GACGACT GAAT CCGGT GAGAAT GGCAAAAGCT TAT GCAT TT CT T T CCAGACT T GT T
CAACAGGCCAGCC
AT TACGCT CGT CAT CAAAAT CACT CGCAT CAAC CAAACCGT TAT T CAT T CGT GAT T GCGCCT
GAGCGAGAC GAAA
TACGCGAT CGCT GT TAAAAGGACAAT TACAAACAGGAAT CGAAT GCAACCGGCGCAGGAACACT
GCCAGCGCAT C
AACAATAT T T T CACCT GAAT CAGGATAT T CT T CTAATACCT GGAAT GCT GT T T T
CCCGGGGAT CGCAGT GGT GAG

TAAC CAT GCAT CAT CAGGAGTACGGATAAAAT GCT T GAT GGT C GGAAGAGGCATAAAT T CCGT
CAGCCAGT T TAG
T CT GACCAT CT CAT CT GTAACAT CAT T GGCAACGCTACCT T T GCCAT GT T T CAGAAACAACT
CT GGCGCAT CGGG
CT T CCCATACAAT CGATAGAT T GT CGCACCT GAT T GCCCGACAT TAT CGCGAGC CCAT T
TATACC CATATAAAT C
AGCAT CCAT GT T GGAAT T TAAT CGCGGCCT CGAGCAAGACGT T T CCCGT T GAATAT GGCT
CATAACACCCCT T GT
AT TACT GT T TAT GTAAGCAGACAGT T T TAT T GT T CAT GAT GATATAT T T T TAT CT T
GT GCAAT GTAACAT CAGAG
AT T T T GAGACACAACGT GGCT T T CCCCCCCCCCCCT GCAGGT C GGCAT CACCGGCGCCACAGGT
GCGGT T GCT GG
CGCCTATAT CGCCGACAT CACCGAT GGGGAAGAT CGGGCT CGC CACT T CGGGCT CATGAGCGCTT GT
TT CGGCGT
GGGTAT GGT GGCAGGCCCCGT GGCCGGGGGACT GT T GGGCGCCAT CT CCT T GCAT GCACCAT T
CCT T GCGGCGGC
GGT GOT CAACGGCCT CAACCTACTACT GGGCT GOT T CCTAAT GCAGGAGT CGCATAAGGGAGAGC GT
CGAGTAT C
TAT GAT T GGAAGTAT GGGAAT GGT GATACCCGCAT T CT T CAGT GT CT T GAGGT CT CCTAT
CAGAT TATGCCCAAC
TAAAGCAACCGGAGGAGGAGAT T T CAT GGTAAAT T T CT CT GACT T TT GGT CAT CAGTAGACT
CGAACTGT GAGAC
TAT CT CGGT TAT GACAGCAGAAAT GT CCT T CT T GGAGACAGTAAAT GAAGT CCCAC
CAATAAAGAAATCCT T GT T
AT CAGGAACAAACT T CT T GT T T CGAACT T T T T CGGT GCCT T GAACTATAAAAT GTAGAGT
GGATAT GTCGGGTAG
GAAT GGAGCGGGCAAAT GCT TACCT T CT GGACCT T CAAGAGGTAT GTAGGGT T T GTAGATACT
GAT GCCAACT T C
AGT GACAAC GT T G C TAT T T C GT T CAAAC CAT T CCGAAT CCAGAGAAAT CAAAGT T GT T
T GT C TAC TAT T GAT C CA
AGCCAGT GCGGT CT T GAAACT GACAATAGT GT GCT CGT GT T T T GAGGT CAT CT T T GTAT
GAATAAAT CTAGT CT T
T G'AT CTAAATAAT CT T G'AC GAGCCAAGGC G'ATAAATACCCAAAT CTAAAACT CT T T TAAAAC
GT TAAAAGGACAA
GTAT GT CT GCCT GTAT TAAACCCCAAAT CAGCT CGTAGT CT GAT CCT CAT CAACT T
GAGGGGCACTATCT T GT T T
TAGAGAAATTTGCGGAGATGCGATATCGAGAAAAAGGTACGCT GATT T TAAAC GT GAAAT T TAT CT
CAAGAT CT C
T GCCT CGCGCGT T T CGGT GAT GACGGT GAAAACCT CT GACACAT GCAGCT CCCGGAGACGGT
CACAGCT T GT CT G
TAAGCGGAT GCCGGGAGCAGACAAGCCCGT CAGGGCGCGT CAGCGGGT GT T GGC GGGT GT
CGGGGCGCAGCCAT G
ACCCAGT CACGTAGCGATAGCGGAGT GTATACT GGCT TAACTAT GCGGCAT CAGAGCAGAT T GTACT
GAGAGT GC
ACCATAT GCGGT GT GAAATACCGCACAGAT GCGTAAGGAGAAAATACCGCAT CAGGCGCT CT T CC GCTT
CCT CGC
TCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACT CAAAGGCGGTAATACGGT TAT
CCACAGAAT CAGGGGATAACGCAGGAAAGAACAT GT GAGCAAAAGGCCAGCAAAAGGCCAGGAAC
CGTAAAAAGG
CCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGT
GGCGAAACCCGACAGGACTATAAAGATACCAGGCGT T T CCCCCT GGAAGCT CCCT CGT GCGCT CT
CCTGTTCCGA
CCCT GCCGCT TACCGGATACCT GT CCGCCT T T CT CCCT T CGGGAAGCGT GGCGCT T TCT CAAT
GCT CACGCT GTA
GGTAT CT CAGT T CGGT GTAGGT CGT T CGCT CCAAGCT GGGCT GT GTGCACGAAC CCCCCGT T
CAGCCCGACCGCT
GCGCCT TAT CCGGTAACTAT CGT CT T GAGT CCAACCCGGTAAGACACGACT TAT
CGCCACTGGCAGCAGCCACTG
GTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGT GGTGGCCTAACTACGGCTACA
CTAGAAGGACAGTAT T T GGTAT CT GCGCT CT GCT GAAGCCAGT TACCT T CGGAAAAAGAGT T
GGTAGCT CT T GAT
CCGGCAAACAAAC CACCGCT GGTAGCGGT GGT T T T T T T GT T T GCAAGCAGCAGAT
TACGCGCAGAAAAAAAGGAT
CT CAAGAAGAT CCT T T GAT CT T T T CTACGGGGT CT GACGCT CAGT GGAACGAAAACTCACGT
TAAGGGAT T T T GC
T CAT GAGAT TAT CAAAAAGGAT CT T CACCTAGAT COT T T TAAAT TAAAAAT GAAGT TT TAAAT
CAAT CTAAAGTA
TATAT GAGTAAAC T T GGT CT GACAGT TAC CAAT GC T TAAT CAG T GAGGCAC C TAT C T
CAGC GAT CT GT C TAT T T C
GT T CAT CCATAGT T GCCT GACT CCCCGT CGT GTAGATAACTAC GATACGGGAGGGCTTACCAT CT
GGCCCCAGTG
CT GCAAT GATACCGCGAGACCCACGCT CACCGGCT CCAGAT T TAT CAGCAATAAAC CAGCCAGCC
GGAAGGGCCG
AGCGCAGAAGT GGT CCT GCAACT T TAT CCGCCT CCAT CCAGT CTATTAAT T GT T
GCCGGGAAGCTAGAGTAAGTA
GT T CGCCAGT TAATAGT T T GCGCAACGT T GT T GCCAT T GCT GCAGGCAT CGT GGT
GTCACGCT CGT CGT T T GGTA
T GGCT T CAT T CAGCT CCGGT T CCCAACGAT CAAGGCGAGT TACAT GAT CCCCCAT GTT GT
GCAAAAAAGCGGT TA
GCT CCT T CGGT CCT CCGAT CGT T GT CAGAAGTAAGT T GGCCGCAGTGT TAT CACT CAT GGT
TAT GGCAGCACT GC
ATAAT T CT CT TACT GT CAT GCCAT CCGTAAGAT GCT T T T CT GT GACT GGT
GAGTACTCAACCAAGT CAT T CT GAG
AATAGT GTAT GCGGCGACCGAGT T GCT CT T GCCCGGCGT
CAACACGGGATAATACCGCGCCACATAGCAGAACT T
TAAAAGT GCT CAT CAT T GGAAAACGT T CT T CGGGGCGAAAACT CT CAAGGAT CT TACCGCT GT
T GAGAT CCAGT T
CGAT GTAACCCACT CGT GCACCCAACT GAT CT T CAGCAT CT T T TACT T T CACCAGCGT T T
CT GGGT GAGCAAAAA
CAGGAAGGCAAAAT GCCGCAAAAAAGGGAATAAGGGCGACACGGAAAT GT T GAATACT CATACT CT T CCT
T T T T C
AATAT TAT T GAAG CAT T TAT CAG G GT TAT T GT CT CAT GAG C G GATACATAT T T GAAT
GTAT T TAGAAAAATAAAC
AAATAGGGGT T CCGCGCACAT T T CCCCGAAAAGT GCCACCT GAC GTCTAAGAAAC CAT TAT TAT
CAT GACAT TAA
CCTATAAAAATAGGCGTAT CAC GAGGCCCT T T CGT CT T CAAGAAT TAAT T CT CAT GTT T
GACAGCT TAT CAT C GA
TAAGCT GACT CAT GT T GGTAT T GT GAAATAGACGCAGAT CGGGAACACT GAAAAATAACAGT TAT
TAT T CG
SEQ ID NO: 83 NPRENFLKCFSKHI E'NNVANE'KLVYTQHDQLYMSLLNSTIQNLRFI
SDTTE'KPLVIVTPSNNSHIQATILCSKKV
GLQ I RT RS GGHDAEGMSYI SQVP FVVVDLRNMHS I KI DVHSQTAWVEAGATLGEVYYWINEKNENLS
FP GGYC P T
VGVGGH FS GGGYGALMRNYGLAADN I I DAHLVNVDGKVLDRKSMGEDLFWAI RGGGGENFGI IAAWKI
KLVAVP S
KS T I FSVKKNME I HGLVKL FNKWQN IAYKYDKDLVLMTH FI T KN I TDNHGKNKTTVHGYFS S I
FHGGVDSLVDLM

NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLPPHHHHHH
SEQ ID NO: 84 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVEAGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 85 NARENFLKCFSKHIGNRGNVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNAHIQATILCSKKVGLQI
RIRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVGVG
GHFSGGGYGALMPNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPSKSTI
FSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLMNKSF
PELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEE
DVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYL
NYRDLDLGKINHASPNNYTQARIWGEKYFGKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 86 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVEAGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKPFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPP
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 87 NARENFLQCFSAHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEQNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGSVLDRQSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYFSSIFHGGVDSLVDLM
NKSFPELGIQSTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKQPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGGINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 88 NARENFLQCFSAHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEQNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGSVLDRQSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYFSSIFHGGVDSLVDLM
NKSFPELGIQSTDSKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKQPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPP
LAYLNYRDLDLGGINHASPNNYTQARIWGEKYFGKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 09 NARENFLQCFSAHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNLNRISIDVHSQTAWVESGSTLGEVYYWINEQNENLSFPGGYCPT
VGVGGHFSGGGYGALMRKYGLAADNIIDAILVNVDGSVLDRQSMGEDLFWAIRGGGGENEGIIYAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLENKWQNIAYKYDEDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLM
NKSFPELGIQSTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKQPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESATPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPP
LAYLNYRDLDLGGINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN

SEQ ID NO: 90 NARENFLKCFSKHI PNNVANPKLVYTQHDQLYMS LLNS T I QNL REI
SDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQ I RT RS GGHDAEGMS YI SQVPFVVVDLRNMHS I KI DVHSQTAWVEAGAT LGEVYYWINEKNENL S
FP GGYCPT
VGVGGHFSGGGYGALMRNYGLAADNI I DAHLVNVDGKVLDRKSMGFDL FWAI RGGGGENFGI
IAAWKIKLVAVPS
KS T I FSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFS S I
FHGGVDSLVDLM
NKS FP ELGI KKT DCKEFSWI DTT I FYS GVVNENTANFKKEI LL DRSAGKKTAFS I KLDYVKKP I
P ETAMVKI LEK
LYEEDVGAGMYVLYPYGGIMEEI SESAI P FPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETT PYVSQNP
P
LAYLNYRDLDLGKTNHAS PNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQS I PPLVN
SEQ ID NO: 91 NARENFLKCFSKHI PNNVANPKLVYTQHDQLYMS LLDS T I QNL RFI
SDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQ I RT RS GGHDAEGMS YI SQVPFVVVDLRNMHS I KI DVHSQTAWVEAGAT LGEVYYWINEKNENL S
FP GGYCPT
VGVGGHFSGGGYGALMRNYGLAADNI I DAHLVNVDGKVLDRKSMGEDL FWAI RGGGGENFGI
IAAWKIKLVAVPS
KS T I FSVKKNMEIHGLVKL FNKWQNIAYKYDKDLVLMTHEI TKNI TDNHGKNKTTVHGYFS S I
FHGGVDSLVDLM
NKS FP ELGI KKT DCKEFSWI DTT I FYS GVVNENTANFKKEI LL DRSAGKKTAFS I KLDYVKKP I
P ETAMVKI LEK
LYEEDVGAGMYVLYPYGGIMEEI SESAI P FPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETT PYVSQNP
P
LAYLNYRDLDLGKTNHAS PNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQS I PPLVN
SEQ ID NO: 92 NARENFLKCFSKHI PNNVANPKLVYTQHDQLYMS LLNS T I QNL REI
SDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQ I RT RS GGHDAEGMS YI SQVPFVVVDLRNMHS I KI DVHSQTAWVEAGAT LGEVYYWINEKNENL S
FP GGYCPT
VGVGGHFSGGGYGALMRNYGLAADNI I DAHLVNVDGKVLDRKSMGEDL FWAI RGGGGENFGI
IAAWKIKLVAVPS
KS T I FSVKKNMEIHGLVKL FNKWQNIAYKYDKDLVLMTHFI TKNS GNTVHGYFS S I
FHGGVDSLVDLMNKS FP EL
GI KKT DCKEFSWI DTT I FYSGVVNENTANFKKEILLDRSAGKKTAFS I KLDYVKKP I PETAMVKI
LEKLYEEDVG
AGMYVLYPYGGIMEEI SESAI P FPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETT PYVSQNP
RLAYLNYR
DLDLGKTNHAS PNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQS PPLVN
SEQ ID NO: 93 NARENFLKCFSKHI PNNVANPKLVYTQHDQLYMS LLNS T I QNL RFI
SDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQI RT RS GGHDAEGMS YI SQVPFVVVDLRNMHS I KI DVHSQTAWVEAGAT LGEVYYWINEKNENL S
FP GGYCPT
VGVGGHFSGGGYGALMRNYGLAADNI I DAHLVNVDGKVLDRKSMGEDL FWAI RGGGGENFGI
IAAWKIKLVAVPS
EST I FSVKKNMEIHGLVKL FNKWQNIAYKYDKDLVLMTHFI TKNS GNTVHGYFS S I
FHGGVDSLVDLMQKS FP EL
GI KKT DCKEFSWI DTT I FYSGVVNENTANFKKEILLDRSAGKKTAFS I KLDYVKKP I PETAMVKI
LEKLYEEDVG
AGMYVLYPYGGIMEEI SESAI P FPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTT PYVSQNP
RLAYLNYR
DLDLGKTNHAS PNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQS I PPLVN
SEQ ID NO: 94 NARENFLKCFSKHI PNNVANPKLVYTQHDQLYMS LLNS T I QNL RFI
SDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQI RT RS GGHDAEGMS YI SQVPFVVVDLRNMHS I KI DVHSQTAWVEAGAT LGEVYYWINEKNENL S
FP GGYCPT
VGVGGHFSGGGYGALMRNYGLAADNI I DAHLVNVDGKVLDRKSMGEDL FWAI RGGGGENFGI
IAAWKIKLVAVPS
KS T I FSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFS S I
FHGGVDSLVDLM
QKS FP ELGI KKT DCKEFSWI DTT I FYS GVVNENTANFKKEI LL DRSAGKKTAFS I KLDYVKKP I
P ETAMVKI LEK
LYEEDVGAGMYVLYPYGGIMEEI SESAI PEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPP
LAYLNYRDLDLGKTNHAS PNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQS I PPLVN
SEQ ID NO: 95 NARENFLKCFSKHI PNNVANPKLVYTQHDQLYMS LLNS T I QNL RFI
SDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQI RT RS GGHDAEGMS YI SQVPFVVVDLRNMHS I KI DVHSQTAWVEAGAT LGEVYYWINEKNENL S
FP GGYCPT
VGVGGHFSGGGYGALMRNYGLAADNI I DAHLVNVDGKVLDRKSMGEDL FWAI RGGGGENFGI
IAAWKIKLVAVPS
KS T I FSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFS S I
FHGGCDSAVDLM
QKS FP ELGVKKT DCKEFSWI DTT I FYS GVVNENTANFKKEI LL DRSAGKKTAFS I KLDYVKKP I P
ETAMVKI LEK
LYEEDVGAGMYVLYPYGGIMEEI SESAI PEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPR
LAYLNYRDLDLGKTNHAS PNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQS I PPLVN
SEQ ID NO: 96 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVEAGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
QKSFPELGIKKTDSKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 97 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVEAGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYQFTTPYVSQNPR
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQSIPPLVN
SEQ ID NO: 98 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVEAGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLM
QKSFPELGIKKIDSKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYQFTTPYVSQNPR
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 99 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVEAGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGSGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNSGNTVHGYFSSIFHGGVDSLVDLMQKSFPEL
GIKKIDSKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEEDVG
AGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYQFTTPYVSQNPRLAYLNYR
DLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 100 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPR
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 101 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPR
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 102 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVIPSNNAHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS

WO 202/(103938 KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 103 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGSVLDRQSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGISKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKQPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGGTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 104 NARENFLKCFSKHIPNNVANPKLVYTQHDQLFESLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGLSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNVEIHALVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGTVYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 105 NARENFLKCFSKHIPNNVANPKLVYTQHDQLFESLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGLSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNVEIHALVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGTVYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 106 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRKYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNGAIHELVKLFNKWQNIAYKYDEDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEKISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 107 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGGTGSGTFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLY
EEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLA
YLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 108 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGGTGSGTKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYE

EDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAY
LNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 109 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGOGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSEPELGIKKTDCKEFSWIDTTIFYSGGDGTGKKEILLDRSAKGKTAFSIKLDYVKKPIPETAMVKILEKLYEE
DVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYL
NYRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQSIPPLVN
SEQ ID NO: 110 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNPTPNTIVHGYESSIFHGGVDSLVDLMNKSFP
ELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 111 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAHIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPSKS
TIFSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYESSIFHGGVDSLVDLMNK
SEPELGIKKTDCKEFSWIDTTIFYSGVVNENTANEKKEILLDRSAGKKTAESIKLDYVKKPIPETAMVKILEKLY
EEDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLA
YLNYRDLDLGKTNHASPNNYTQAPIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 112 NARENLLKCLSKHDGIGKIVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNAKIQATILCSKKVGLQI
RTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVGVG
GHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPSKSTI
FSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYESSIFHGGVDSLVDLMNKSF
PELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEE
DVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYL
NYRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQSIPPLVN
SEQ ID NO: 113 NARENLLKCLSKHGDGTGKTVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAKIQATILCSKKVGLQ
IRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVGV
GGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPSKST
IFSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYESSIFHGGVDSLVDLMNKS
FPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYE
EDVGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAY
LNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 114 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIESVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHEITKNITDNHGKNKTTVHGYESSIEHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKTNHASPNDYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN

SEQ ID NO: 115 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKTNHASPNDYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 116 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNEDLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPK
SSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 117 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPTPNTTVHGYFSSIFHGGVDSLVDLMNKSFP
ELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 118 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPSKS
TIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPIPNTTVHGYFSSIFHGGVDSLVDLMNKSFPEL
GIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEEDVG
AGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYLNYR
DLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 119 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNAHIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPSKS
TIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLMNK
SFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLY
EEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLA
YLNYRDLDLGKTNHASPNNYTQAPIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 120 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNEDLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPK
SSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYESSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 121 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT

VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDAKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKINHASPNNYTQARIWGEKYFGKNFNRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 122 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDTKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 123 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYESSIFHGGVDSLVDLM
NKSFPELGIKKTDPKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPP
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 124 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYFSSIFHGGVDSLVDLM
NKSFPELGIKKTDVKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEETSESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPF
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 125 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGDNFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHCKNKTTVHCYFSSIFHGCVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPR
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 126 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPTPNTTVHGYFSSIFHGGVDSLVDLMNKSFP
ELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEOSIPPLVN
SEQ ID NO: 127 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPTPNTTVHGYFSSIFHGGVDSLVDLMNKSFP
ELGIKKIDAKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED

VGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEHHINWVRSVYNETTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 128 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGCGGENEGIIAAWKIKLVAVPS
KSTIFSVNKNMEIHGLVKLFNKWQNTAYKYDKDLVLMTHFITKNPTPNTIVHGYFSSIFHGGVDSLVDLMNKSEP
ELGIKKIDTKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYLN
YRDLDLGKINHASPNNYTQARIWCEKYFGKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 129 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKNLVLMTHFITKNPTPNITV-HGYFSSIFHGGVDSLVDLMNKSFP
ELGIKKTDPKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYLN
YRDLDLGKINHASPNNYTQARIWGEKYFGKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 130 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLEWKWQNIAYKYDKDLVLMTHFITKNPTPNTIVHGYESSIFHGGVDSLVDLMNKSFP
ELGIKKTDVKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 131 NARENFLKCFSKHIPNANTKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAEIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPSKS
TIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYFSSIFHGGVDSLVDLMNK
SFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLY
EEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLA
YLNYRDLDLCKINHASPNNYTQARIWCEKYFCKNENRLVKVKIKVDPNNFERNEQSIPPLVN
SEQ ID NO: 132 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAEIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPSKS
TIFSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLMNK
SEPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLY
EEDVGAGMYVLYPYGGIMEEISESAIFFPHRAGIMYELWYTASWEKQEDNEKEINWVRSVYNFTTPYVSQNPRLA
YLNYRDLDLGKINHASPNDYTQAPIWGEKYFGKNENRLVKVKIKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 133 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVIPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNEDLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPK
SSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTIVHGYESSIFHGGVDSLVDLM
NKSFPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEK
LYEEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPF
LAYLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQSIPPLVN

SEQ ID NO: 134 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAHIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPSKS
TIFSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNPIPNTTVHGYESSIFHGGVDSLVDLMNKSFPEL
GIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEEDVG
AGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYLNYF
DLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 135 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNEDLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENFGIIAAWKIKLVAVPK
SSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPTPNTTVHGYFSSIFHGGVDSLVDLMNKSFP
ELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 136 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNAHIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNEDLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPKSS
TIFSVKKNMEIHGLVKLENKWQNIAYKYDKDLVLMTHFITKNITDNHGKNKTTVHGYESSIFHGGVDSLVDLMNK
SEPELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLY
EEDVGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLA
YLNYRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
SEQ ID NO: 137 NARENFLKCFSKHIPNANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKVGL
QIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNEDLSFPGGYCPTVG
VGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGENEGIIAAWKIKLVAVPKSS
TIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPIPNTTVHGYFSSIFHGGVDSLVDLMNKSFPEL
GIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEEDVG
AGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYLNYR
DLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQSIPPLVN
SEQ ID NO: 138 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLDSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGDNEGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPTPNTTVHGYFSSIFHGGVDSLVDLMNKSFP
ELGIKKTDCKEFSWIDTTIFYSGVVNENTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPEPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNETTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNENRLVKVKTKVDPNNFERNEQSIPPLVN
SEQ ID NO: 139 NARENFLKCFSKHIPNNVANPKLVYTQHDQLYMSLLNSTIQNLRFISDTTPKPLVIVTPSNNSHIQATILCSKKV
GLQIRTRSGGHDAEGMSYISQVPFVVVDLRNMHSIKIDVHSQTAWVESGATLGEVYYWINEKNENLSFPGGYCPT
VGVGGHFSGGGYGALMRNYGLAADNIIDAHLVNVDGKVLDRKSMGEDLFWAIRGGGGDNFGIIAAWKIKLVAVPS
KSTIFSVKKNMEIHGLVKLFNKWQNIAYKYDKDLVLMTHFITKNPTPNTTVHGYESSIFHGGVDSLVDLMNKSFP
ELGIKKTDCKEFSWIDTTIFYSGVVNFNTANFKKEILLDRSAGKKTAFSIKLDYVKKPIPETAMVKILEKLYEED
VGAGMYVLYPYGGIMEEISESAIPFPHRAGIMYELWYTASWEKQEDNEKHINWVRSVYNFTTPYVSQNPRLAYLN
YRDLDLGKTNHASPNNYTQARIWGEKYFGKNFNRLVKVKTKVDPNNFFRNEQSIPPLVN
Accessory elements:
SEQ ID NO: 140 MREPSIETAVLEAASSALAAPVNITTEDETAQIPAEAVIGYSDLEGDEDVAVLPESNSTNNGLLEINTTIASIAA
KEEGVSLEKREAEA
SEQ ID NO: 141 MQYKKILVASALAATTLAAYAPSEPWSTLIPTATYSGGVIDYASTEGIAVQPISTTSSASSAATTASLEKREADA
SEQ ID NO: 142 MREPSIFTAVLFAASSALAARAYAPSEPWSTLTPTATYSGGVTDYASTEGIAVQPISTTSSASSAATTASSASLE
KREADA
SEQ ID NO: 143 MRFPSIFTAVLFAASSALAARAYAPSEPWSTLIPTATYSGGVTDYASTFGIAVQPISTTSSASSAATTASSARAY
APSEPWSTLIPTATYSGGVIDYASTEGIAVQPISTISSASSAATTASSASLEKREADA
SEQ ID NO: 144 MLLQAFLFLLAGFAAKISAGSASLEKREADA
SEQ ID NO: 145 MFSPILSLEIILALATLQSVFAASLEKREADA
SEQ ID NO: 146 MYRNLIIATALTCGAYSAYVPSEPWSTLTPDASLESALKDYSQTFGIAIKSLDADGSASLEKREADA
SEQ ID NO: 147 MRQVWFSWIVGLFLCFFNVSSAASLEKREADA
SEQ ID NO: 148 MRQVWFSWIVGLFLCFENVSSAAPVNITTEDETAQIPAEAVIGYSDLEGDFDVAVLPFSNSTNNGLLFINTTIAS
IAAKEEGASLEKREADA
SEQ ID NO: 149 MFNLKTILISTLASIAVAASLEKREADA
SEQ ID NO: 150 YPYDVPDYA
SEQ ID NO: 151 HHHHHH
SEQ ID NO: 152 HNHNHNHN
SEQ ID NO: 153 TATCCATAT GAT GT T CCAGAT T-kT GCT
Enumerated Embodiments The following enumerated embodiments are provided, the numbering of which is not to be construed as designating levels of importance.
Embodiment 1 provides a recombinant vector comprising a promoter, secretion tag, gene of interest (GOT), and optionally a purification and/or a detection tag, wherein the gene of interest comprises a polynucleotide sequence encoding a polypeptide with at least 90%, 95%, 98%, or 99.9% sequence identity to the sequence as set forth in any one of SEQ ID
NOs: 84-139.
Embodiment 2 provides the recombinant vector of embodiment 1, wherein the polynucleotide sequence encodes a polypeptide as set forth in any one of SEQ
ID NOs: 84-139.
Embodiment 3 provides the recombinant vector of embodiment 2, wherein the polynucleotide sequence comprises the sequence as set forth in any one of SEQ
ID NOs: 2-57, or a sequence comprising at least 90%, 95%, 98%, 99%, or 99.9% sequence identity to the sequence as set forth in any one of SEQ ID NOs: 2-57.
Embodiment 4 provides the recombinant vector of embodiment 1, wherein the gene of interest is operably linked to a promoter.
Embodiment 5 provides the recombinant vector of embodiment 4, wherein the promoter is a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.
Embodiment 6 provides the recombinant vector of embodiment 5, wherein the promoter has a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99%
sequence identity to the sequence of SEQ ID NOs: 71-80.
Embodiment 7 provides the recombinant vector of embodiment 4, wherein the promoter is a constitutive promoter or an inducible promoter.
Embodiment 8 provides the recombinant vector of embodiment 4, wherein the promoter is selected from a group consisting of an alcohol oxidase 1 promoter (pA0X1), an alcohol oxidase 2 promoter (pA0X2), a dihydroxyacetone kinase promoter (pDAK), an S-hydroxymethyl-glutathi one hydrolase promoter (pFGH), an NADtdependent formylglutathione dehydrogenase promoter (pFDH), a fructose 1,6-bisphosphate aldolase promoter (pFBA2), a peroxisomal membrane signal receptor PTS1 promoter (pPEX5), a peroxisomal protein Pex8p promoter (pPEX8), an alcohol dehydrogenase 2 promoter (pADH2) and a peroxin Pex14p promoter (pPEX14).
Embodiment 9 provides the recombinant vector of embodiment 1, comprising a secretion tag as set forth in any one of SEQ ID NOs: 58-67 and 154.
Embodiment 10 provides the recombinant vector of embodiment 9, wherein the sequence of the secretion tag is at least 90%, 95%, 98%, 99%, or 100%
identical to SEQ ID
NOs: 58-67 and 154.

Embodiment 11 provides the recombinant vector of embodiment 1, comprising a purification tag as set forth in any one of SEQ ID NOs: 68-70 and 153.
Embodiment 12 provides the recombinant vector of embodiment 11, wherein the purification/detection tag is selected from the group consisting of a human influenza hemagglutinin (HA) tag, a His 6 tag and an HN tag.
Embodiment 13 provides a host expression system comprising the recombinant vector of embodiment 1.
Embodiment 14 provides the host expression system of embodiment 13, comprising a microbial cell, a yeast cell, a plant cell, or an animal cell.
Embodiment 15 provides the host expression system of embodiment 14, wherein the yeast cell is selected from the group consisting of Pichia pastoris, Pichia angusta, Pichia guillermordii, Pichia methanolica, Pichia inositovera, Hansenula polymorpha, Candida boidinii, and Yarrowia hpolytica.
Embodiment 16 provides a method of producing a cannabinoid compound, comprising reacting a cannabinoid precursor with an enzyme that is expressed by the host expression system of embodiment 13, wherein the cannabinoid precursor is compound of Formula I (see below): wherein Ri is H or ¨COOH and R2 is a linear or branched CH3, C2H5, C3117, C4H9, C5H1o, C6H13, C7}115 or C8H17group.
OH
Ri Formula I
Embodiment 17 provides a polypeptide comprising the amino acid sequence of any one of SEQ ID NOs: 84-139 or an amino acid sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs: 84-139.
Embodiment 18 provides the polypeptide of embodiment 17, wherein the polypeptide comprises the amino acid sequence of any one of SEQ ID NOs: 91 and 110-116 or an amino acid sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs: 91 and 110-116.

Embodiment 19 provides a nucleic acid comprising a polynucleotide sequence encoding a polypeptide comprising the amino acid sequence of any one of SEQ ID
NOs. 84-139 or an amino acid sequence comprising at least 90%, 95%, 98%, or 99.9%
sequence identity to any one of SEQ ID NOs: 84-139.
Embodiment 20 provides a nucleic acid of embodiment 19, wherein the nucleic acid comprises the polynucleotide sequence of any one of SEQ ID NOs: 2-57 or a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ
ID NOs: 2-57.
Embodiment 21 provides a nucleic acid of embodiment 20, wherein the nucleic acid comprises the polynucleotide sequence of any one of SEQ ID NOs: 9 and 28-34 or a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs: 9 and 28-34.
Other Embodiments The disclosures of each and every patent, patent application, and publication cited herein are hereby incorporated herein by reference in their entirety. While this invention has been disclosed with reference to specific embodiments, it is apparent that other embodiments and variations of this invention may be devised by others skilled in the art without departing from the true spirit and scope of the invention. The appended claims are intended to be construed to include all such embodiments and equivalent variations.

Claims

We claim:

1. A recombinant vector comprising a promoter, secretion tag, gene of interest (GOI), and optionally a purification and/or a detection tag, wherein the gene of interest comprises a polynucleotide sequence encoding a polypeptide with at least 90%, 95%, 98%, or 99.9%
sequence identity to the sequence as set forth in any one of SEQ ID NOs: 84-139.

2. The recombinant vector of claim 1, wherein the polynucleotide sequence encodes a polypeptide as set forth in any one of SEQ ID NOs: 84-139.

3. The recombinant vector of claim 1, wherein the polynucleotide sequence comprises the sequence as set forth in any one of SEQ ID NOs: 2-57, or a sequence comprising at least 90%, 95%, 98%, 99%, or 99.9% sequence identity to the sequence as set forth in any one of SEQ ID NOs: 2-57.

4. The recombinant vector of claim 1, wherein the gene of interest is operably linked to a promoter.

5. The recombinant vector of claim 4, wherein the promoter is a polynucleotide as set forth in any one of SEQ ID NOs: 71-80.

6. The recombinant vector of claim 5, wherein the promoter has a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99% sequence identity to the sequence of SEQ ID
NOs: 71-80.

7. The recombinant vector of claim 4, wherein the promoter is a constitutive promoter or an inducible promoter.

8. The recombinant vector of claim 4, wherein the promoter is selected from a group consisting of an alcohol oxidase 1 promoter (pA0X1), an alcohol oxidase 2 promoter (pA0X2), a dihydroxyacetone kinase promoter (pDAK), an S-hydroxymethyl-glutathione hydrolase promoter (pFGH), an NADtdependent formylglutathione dehydrogenase promoter (pFDH), a fructose 1,6-bisphosphate aldolase promoter (pFBA2), a peroxisomal membrane signal receptor PTS1 promoter (pPEX5), a peroxisomal protein Pex8p promoter (pPEX8), an alcohol dehydrogenase 2 promoter (pADH2) and a peroxin Pex14p promoter (pPEX14).

9. The recombinant vector of claim 1, comprising a secretion tag as set forth in any one of SEQ ID NOs: 58-67 and 154.

10. The recombinant vector of claim 9, wherein the sequence of the secretion tag is at least 90%, 95%, 98%, 99%, or 100% identical to SEQ ID NOs: 58-67 and 154.

11. The recombinant vector of claim 1, comprising a purification tag as set forth in any one of SEQ ID NOs: 68-70 and 153.

12. The recombinant vector of claim 11, wherein the purification/detection tag is selected from the group consisting of a human influenza hemagglutinin (HA) tag, a His 6 tag and an FIN tag.

13. A host expression system comprising the recombinant vector of claim 1.

14. The host expression system of claim 13, comprising a microbial cell, a yeast cell, a plant cell, or an animal cell.

15. The host expression system of claim 14, wherein the yeast cell is selected from the group consisting of Pichia pastoris, Pichia angusta, Pichia guillermordii, Pichia methanohca, Pichia inositovera, Hansenula polymorpha, Candida boidinii, and Yarrowia hpolytica.

16. A method of producing a cannabinoid compound, comprising reacting a cannabinoid precursor with an enzyme that is expressed by the host expression system of claim 13, wherein the cannabinoid precursor is compound of Formula I (see below):
wherein Ri is H or ¨COOH and R2 is a linear or branched CH3, C2H5, C3H7, C4H9, C5H10, C6H13, C7H1S or C8H17 group.
OH

Formula I

17. A polypeptide comprising the amino acid sequence of any one of SEQ ID NOs:

or an amino acid sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs: 84-139.

18. The polypeptide of claim 17, wherein the polypeptide comprises the amino acid sequence of any one of SEQ ID NOs: 91 and 110-116 or an amino acid sequence comprising at least 90%, 95%, 98%, or 99 9% sequence identity to any one of SEQ ID Nos: 91 and 110-116.

19. A nucleic acid comprising a polynucleotide sequence encoding a polypeptide comprising the amino acid sequence of any one of SEQ ID NOs: 84-139 or an amino acid sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs:
84-139.

20. The nucleic acid of claim 19, wherein the nucleic acid comprises the polynucleotide sequence of any one of SEQ ID NOs: 2-57 or a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs: 2-57.

21. The nucleic acid of claim 20, wherein the nucleic acid comprises the polynucleotide sequence of any one of SEQ ID NOs: 9 and 28-34 or a polynucleotide sequence comprising at least 90%, 95%, 98%, or 99.9% sequence identity to any one of SEQ ID NOs: 9 and 28-34.