Nothing Special   »   [go: up one dir, main page]

EP1483381A2 - Variants de kallikrein-2 et kallikreine-3 humaines et leurs utilisations - Google Patents

Variants de kallikrein-2 et kallikreine-3 humaines et leurs utilisations

Info

Publication number
EP1483381A2
EP1483381A2 EP03743925A EP03743925A EP1483381A2 EP 1483381 A2 EP1483381 A2 EP 1483381A2 EP 03743925 A EP03743925 A EP 03743925A EP 03743925 A EP03743925 A EP 03743925A EP 1483381 A2 EP1483381 A2 EP 1483381A2
Authority
EP
European Patent Office
Prior art keywords
psa
seq
klk2
sequence
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP03743925A
Other languages
German (de)
English (en)
Inventor
Laurent Bracco
Brigitta Brinkman
Fanny Coignard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ExonHit Therapeutics SA
Original Assignee
ExonHit Therapeutics SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FR0203186A external-priority patent/FR2837215A1/fr
Priority claimed from FR0210975A external-priority patent/FR2844278A1/fr
Application filed by ExonHit Therapeutics SA filed Critical ExonHit Therapeutics SA
Publication of EP1483381A2 publication Critical patent/EP1483381A2/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/6445Kallikreins (3.4.21.34; 3.4.21.35)

Definitions

  • the present invention relates to the field of biology, genetics and medicine. It relates in particular to new nucleotide sequences associated with alternative splicing events of the genes corresponding to the PSA antigen (prostate specific antigen or KLK3) and to kallikrein-2 (KLK2).
  • the invention also relates to methods for detecting the presence or for determining the level of expression of these nucleic acids or the corresponding proteins in biological samples, as well as methods of selecting molecules capable of modulating their activity or their expression.
  • the invention is particularly suitable for screening, prognostic, classification or monitoring of cancers, in particular of the prostate and in particular in the differentiation between prostate cancer and benign prostatic hyperplasia (BPH), as well as 'to the development of new therapeutic approaches to these diseases.
  • BPH benign prostatic hyperplasia
  • Kallikreins correspond to a group of proteins whose protease activity allows post-translational modification of protein precursors to biologically active forms. Some members of this family, kallikrein-3, also known under the name of PSA (“prostate-specific antigen”), and more recently, kallikrein-2 are considered to be the best available markers usable in detection, diagnosis and monitoring of prostate cancer.
  • PSA is also produced by non-cancerous prostate epithelial cells, it is often difficult to differentiate patients with prostate cancer from those with benign hyperplastic symptom (BPH).
  • BPH benign hyperplastic symptom
  • PSA exists in free, uncomplexed form and in complexed form, in particular with alpha-antichymotrypsin.
  • the alternative splicing constitutes a mechanism of regulation of the expression of the genes making it possible to generate functional diversity from limited genetic information.
  • This highly regulated mechanism can undergo alterations during the development of human pathologies.
  • the deregulation of the splicing machinery in cancers can allow the expression of isoforms or variants specifically expressed in certain human tumors. These isoforms may have a determining functional role in the development or maintenance of the pathological state.
  • the specific expression of such isoforms constitutes an event of choice for a rational and targeted approach to the development of drugs and / or diagnostic methods.
  • a gene expression profiling technology has recently been developed to systematically identify genes and, within these genes, the domains likely to be altered by alternative splicing (WO99 / 46403).
  • the present invention now describes novel genetic events associated with alternative splicing of the PSA and KLK2 genes in prostate tissue.
  • the present invention results in particular from the construction of a directory of splicing alterations associated with prostate tumor tissues, and from the identification of structural alterations in the PSA and KLK2 genes or in the corresponding mRNAs.
  • the present invention thus provides new therapeutic and diagnostic approaches for cancers, in particular prostate cancer.
  • RNA extracted from samples of prostate tissue originating from tumor and non-tumor areas of patients with prostate carcinomas was carried out by qualitative differential screening thanks to the implementation of the DATAS technique (described in application n ° WO99 / 46403) T FR03 / 00833
  • RNAs from tumor and non-tumor prostate tissue has made it possible to isolate various cDNA fragments derived from human kalikrein 2 and kalikrein 3 (PSA) mRNAs. These results then made it possible to identify a certain number of cDNAs revealing events linked to alternative splicing.
  • PSA kalikrein 3
  • the present invention therefore describes original molecular events which can lead to the specific expression of isoforms or variants of KLK3 (PSA) and KLK2 in prostate tissue and more specifically in cancerous tissue or tissue associated with benign hyperplasia. (BPH).
  • PSA KLK3
  • BPH benign hyperplasia
  • the present invention provides molecular data which justify the use of one or more of these variants as new therapeutic and diagnostic targets which can advantageously be used in the diagnosis and treatment of cancers and in particular prostate cancer.
  • a first aspect of the present application therefore relates to variants of human PSA and KLK2, in particular splicing variants.
  • the invention relates to the nucleic acids corresponding to these variants or to the specific alterations which they exhibit, as well as the proteins (or polypeptides or protein domains) encoded.
  • Another aspect of the present application relates to methods and tools for detecting the presence of these variants or alterations in biological samples (blood, plasma, urine, serum, saliva, biopsies or cell cultures, etc.), or for determining their ( s) respective quantity (s) or proportion (s).
  • Such tools include in particular nucleic probes or primers, antibodies or other specific ligands, kits, supports, chips, etc.
  • Detection methods can include hybridization, PCR, chromatography, immunology, etc. These methods are particularly suitable for the detection, characterization, monitoring of progression or 03 00833
  • Another aspect of the present application relates to tools and methods for the production of compounds active on the variants described, that is to say capable of modulating their expression or their activity.
  • tools and methods include in particular nucleic acids, vectors, recombinant cells (or preparations derived from such cells), binding tests, etc.
  • the invention also relates to the compounds thus identified or produced, to pharmaceutical compositions containing them, as well as to their therapeutic uses.
  • the present invention is thus applicable to the diagnosis and development of therapeutic strategies for cancers, in particular of the prostate.
  • a first aspect of the present application therefore relates to variants of KLK-2 and KLK-3 (PSA), or particular genetic alterations affecting these genes (or the corresponding RNAs or proteins).
  • PSA KLK-2 and KLK-3
  • a more particular object of the invention relates to nucleic acids corresponding to these variants of human PSA and KLK2 or to the specific alterations which they exhibit, as well as the proteins (or polypeptides or protein domains) encoded.
  • K-LM corresponds to the total retention of intron 1 of KLK2 (Genbank access number: AF336106) (David et.al (2002)). David et.al state that the expression of K-LM messenger RNA is restricted to the prostatic epithelium and that the K-LM protein can be detected by immunohistochemistry in secretory epithelial cells (despite no data indicating the specificity of the antibody used). No data indicates the presence of K-LM in T FR03 / 00833
  • K-LM appears to be detected in two samples of seminal fluids and in a sample of tissues corresponding to benign prostatic hyperplasia.
  • the endogenous form of K-LM could not be detected in prostatic lines (with or without androgen stimulation). No results are shown regarding preferential or differential expression of K-LM in tissues or sera from patients with prostate cancer.
  • PSA-LM corresponds to the total retention of PSA intron 1 (David et.al (2002)) (Genbank access number: AF335477, AF335478, AJ459784). David et.al specify that the expression of the messenger RNA of PSA-LM is restricted to the prostatic epithelium and that the protein PSA-LM can be detected by immunohistochemistry in the secretory epithelial cells. No data indicates the presence of PSA-LM in human sera, seminal fluids or tissues corresponding to benign prostatic hyperplasia. The endogenous form of PSA-LM could not be detected in prostatic lines (with or without androgenic stimulation). No results are shown for a 03 00833
  • PSA-LM preferential or differential expression of PSA-LM in tissues or sera from patients with prostate cancer.
  • Tanaka et.al presents qualitative data for the expression of this variant by RT-PCR in malignant and benign prostatic tissues. The expression of the corresponding protein has not been characterized.
  • PA 424 could translate into a mature protein of 156 amino acids. The last 16 amino acids would be different from wild PSA. PA 525 could translate into a mature protein of 214 amino acids. The last 28 amino acids would be different from wild PSA. Riegman et.al present no additional expression data differentiating from messenger RNAs or proteins.
  • PA 424 and PA 525 described above are very close to PSA-RP1 and PSA-RP2 which were subsequently isolated (Genbank access numbers: AJ310937, AJ310938) (Heuzé et.al (1999); Heuzé-Vourc'h et.al (2001)).
  • COS cell lines transfected with PSA-RP1 and PSA-RP2 cDNAs can express and secrete the corresponding proteins
  • Heuzé et.al show no results demonstrating the expression of the PSA-RP1 and PSA-RP2 proteins. endogenous in prostate tissue.
  • PSA-RP1 messenger RNA Another group (Meng et.al (2002)) characterized the expression of the PSA-RP1 messenger RNA by Northern and in situ hybridization. No difference in expression could be observed between healthy and tumor microdissect tissue.
  • An antibody specific to PSA-RP1 made it possible to detect, by immunohistochemistry, the expression of the protein PSA-RP1 in the cytoplasm epithelilal cells from sections of healthy prostate tissue and tumor.
  • PSA-RP5 A PSA variant corresponding to a retention of the 5 ′ part of intron 4, PSA-RP5, was submitted to Genbank (access number: AJ512346)
  • PSA-RP4 A variant of PSA comprising a deletion in exon 3, PSA-RP4, was submitted to Genbank (access number: AJ459782).
  • a first subject of the invention relates to nucleic acids comprising the sequence of the variants of PSA and KLK2 described in the present application, or a specific part thereof.
  • nucleic acids specific for the genetic alterations carried by the PSA and KLK2 variants described in the present application.
  • Such nucleic acids can in particular be complementary to mutated regions, retained intronic domains or junctions newly created by deletions.
  • Another subject of the invention relates to a nucleic acid comprising all or part of a sequence derived from messenger RNAs (or cDNAs) from KLK2-EHT002 to KLK2-EHT011 and from PSA-EHT001 to PSA-EHT027 or from KLK2-EHTb to KLK2-EHTI and from PSA-EHTa to PSA-EHTu or any combination of these variants as well as their uses for the implementation of a method of diagnosis, detection or monitoring of cancers, in particular prostate cancer and most notably the mild form of the latter, BPH.
  • messenger RNAs or cDNAs
  • Another object of the invention resides in any nucleic acid characterized in that it comprises a sequence chosen from: a) the sequences SEQ ID NOs: 1 to 49, b) a variant of the sequences SEQ ID NOs: 1 to 49 resulting degeneracy of the genetic code, c) the complementary strand of the sequences SEQ ID NOs: 1 to 49, and d) a specific fragment of the sequences a) to c).
  • specific fragment or part designates a fragment characteristic of the variants considered, typically a fragment carrying at least one genetic alteration characteristic of the variants considered. Such specific fragments are therefore distinguished from the wild-type sequence by the presence of their own structural characteristic (eg, mutation, new junction, intron retention, deletion of a sequence, stop codon, new sequence resulting from a shift in the reading frame, etc.) resulting from an alteration event highlighted by the applicants in patients.
  • This specific structural characteristic is also designated by the expression "target sequence”.
  • fragments according to the invention therefore comprise at least one target sequence as defined above.
  • Preferred fragments comprise at least 5 consecutive nucleotides of the sequence considered, preferably at least 8, more preferably at least 12.
  • Fragments can comprise up to 50, 75 or 100 nucleotides, or even more.
  • the nucleic acids can be DNAs, preferably chosen from cDNAs and gDNAs, or RNAs. They can be synthetic or semi-synthetic nucleic acids, PCR fragments, oligonucleotides, double- or single-stranded regions, etc. Nucleic acids T FR03 / 00833
  • the nucleic acids can be used to produce a PSA or KLK-2 variant of the invention in vitro, ex vivo, in vivo or in an acellular transcription system. They can also be used for the manufacture of antisense or interfering molecules (RNAi), capable of reducing the expression or the translation of the corresponding mRNAs in a cell. They can also be used for the production of probes, in particular labeled, allowing, by hybridization reactions, to specifically demonstrate the presence of a mutated form of PSA or KLK-2 of the invention in a sample. They can also be used for the production of nucleic primers, useful for the amplification of a PSA or KLK-2 variant (or of a target sequence of such a variant) in a sample, in particular for the purpose of screening. or diagnostic.
  • RNAi antisense or interfering molecules
  • another object of the invention relates to a nucleic probe characterized in that it allows the detection of a nucleic acid as defined above, typically by selective hybridization from a population of nucleic acids test.
  • the probe comprises the sequence of a nucleic acid as defined above or a (specific) part of the sequence of such a nucleic acid.
  • the specific part is preferably characteristic of a variant as described above, in particular a part containing an alteration associated with prostate cancer. It typically comprises from 10 to 1000 nucleotides, preferably from 50 to 800, and is generally single-stranded.
  • a particular example of a probe is represented by an oligonucleotide specific and complementary to a region of at least one nucleic acid as defined above.
  • the oligonucleotide is typically single-stranded, and generally has 10 to 100 bases. Specific examples of oligonucleotides of the invention are provided in Table 1.
  • the oligonucleotides and / or nucleic probes according to the invention can be labeled, for example by means of radioactive, enzymatic, fluorescent, luminescent markers, etc.
  • Another subject of the invention relates to a nucleic primer, allowing the (selective) amplification of a nucleic acid as defined above or of a (specific) part of such a nucleic acid.
  • the amplified part preferably comprises an alteration characteristic of one of the variants described above, in particular an alteration associated with prostate cancer.
  • a primer according to the invention is typically single-stranded, and advantageously composed of 3 to 50 bases, preferably from 3 to 40 and even more preferably from 3 to 35 bases.
  • a particular primer is complementary to at least one region of the PSA or KLK-2 gene, or of the corresponding RNA.
  • a preferred embodiment resides in a primer consisting of a single-stranded nucleic acid comprising from 3 to 50 nucleotides complementary to at least part of one of the sequences SEQ ID NOs: 1 to 49 or to their complementary strand. Examples of such nucleic acid primers are provided in the experimental section.
  • the invention also relates to a pair of primers comprising a sense sequence and a reverse sequence, characterized in that the primers of said pair hybridize with a region of a nucleic acid as defined above and allow the amplification. at least a portion of this nucleic acid.
  • Another object of the present application relates to any vector comprising a nucleic acid as defined above.
  • They can be plasmids, cosmids, episomes, artificial chromosomes, viruses, phages, etc. Mention may be made of various commercial plasmids such as pUC, pcDNA, pBR, etc.
  • the viral vectors mention may be made of retroviruses, adenoviruses, AAVs, herpesviruses, etc.
  • Another subject of the invention relates to recombinant cells comprising a nucleic acid or a vector as defined above.
  • the cells can be prokaryotic or eukaryotic. Among prokaryotic cells, mention may in particular be made of bacteria such as E. coli. Among the eukaryotic cells, mention may be made of yeast cells or cells of mammals, insects or plants. It can be primary cultures or lines. Mention may be made of COS, CHO, 3T3, HeLa cells, etc.
  • compositions comprising a nucleic acid as defined above immobilized on a support.
  • the invention relates in particular to compositions comprising a plurality of nucleic acids in admixture, in soluble form or immobilized to a support, the composition comprising at least one nucleic acid as defined above.
  • Another subject of the invention relates to a (product comprising a) support on which one or more nucleic acids as defined above are immobilized.
  • the support can be solid, flat or not, regular or not, such as for example nylon, glass, plastic, metal, fiber, ceramic, silica, polymer, etc., or any other compatible material.
  • the nucleic acids are preferably immobilized at one end, under conditions leaving the molecule accessible for a hybridization reaction.
  • the nucleic acids can be precisely arranged on the support, and deposited in several copies.
  • one or more specific oligonucleotides are used to characterize each alternative splicing event (see FIG. 9). It is possible in particular to use an oligonucleotide specific for an eliminated exon, allowing the quantification of the long form, and / or an oligonucleotide specific for one of the adjacent exons not involved in splicing, making it possible to quantify the long and short forms of RNA, and / or one or more (eg three) oligonucleotides specific for junctions, one of which is specific for the new sequence generated after splicing, making it possible to quantify the form spliced.
  • oligonucleotides can be envisaged, in particular the use of one or two oligonucleotides only. More specifically with regard to the junction oligonucleotides, they are ideally centered on the junctions, even if oligonucleotides offset on the junction can also be used.
  • oligonucleotides are used which do not have secondary structures which could interfere with their hybridization capacity.
  • the oligonucleotides can be modified in 5 ′ by an NH 2 -C6 group promoting their flexibility and making it possible to establish a covalent bond with the polymer constituting the coating of the support.
  • Another subject of the invention relates to a (product comprising a) support on which one or more recombinant cells as defined above are immobilized or cultured.
  • the support can be solid, flat or not, regular or not, such as for example nylon, glass, plastic, metal, fiber, ceramic, silica, polymer, etc., or any other compatible material.
  • the cells are, for example, distributed in wells of a microplate or immobilized in a gel or on a suitable support.
  • the invention also relates to the peptides and protein sequences encoded by all or part of the isoforms KLK2-EHT002 to KLK2-EHT011 and PSA-EHT001 to PSA-EHT027, or KLK2-EHTb to KLK2-EHTI and PSA-EHTa to PSA-EHTu in particular. those described among the sequences SEQ ID NO: 50 to 167 as well as their uses for the implementation of a method of diagnosis, detection or monitoring of cancers, in particular prostate cancer and more particularly of the benign form of the latter, BPH.
  • a particular subject of the present application relates to a polypeptide comprising all or a specific part of a sequence chosen from SEQ ID NOs: 50 to 167.
  • polypeptides are composed or comprise a sequence or part of a sequence created by the alteration of the gene or corresponding messenger.
  • the term “part” preferably designates at least 5 contiguous residues, preferably at least 8, more preferably at least 10, even more preferably at least 15.
  • the splicing alterations of the PSA or KLK-2 gene lead to the production of mutated proteins, comprising newly created sequences (target sequences). These can be new sequences (eg, offset translation, insertions), new junctions, etc.
  • Particular peptides of the invention correspond to or include all or a specific part of the sequences SEQ ID Nos: 53, 56, 59, 62, 65, 67 (residues 146-150), 70, 71, 73, 76, 79, 81 , 93, 95, 98, 106, 108, 110, 112, 117, 119 (residues 66-70 or 74-79), 121 (residues 117-121), 123 (residues 25-29, 51-55 or 105- 111), 126, 131, 133, 134, 135 (residues 64-68) and 155.
  • Another subject of the invention relates to a (product comprising a) support on which one or more polypeptides as defined above are immobilized.
  • the support can be solid, flat or not, regular or not, such as for example nylon, glass, plastic, metal, fiber, ceramic, silica, polymer, etc., or any other compatible material.
  • the polypeptides are preferably immobilized at one end, under conditions leaving the molecule accessible for an interaction reaction with a specific ligand, such as an antibody.
  • the polypeptides can be precisely arranged on the support, and deposited in several copies.
  • the invention also relates to specific ligands, preferably peptide, in particular antibodies (polyclonal, monoclonal) and their fragments, specific to the peptide regions characteristic of the proteins coded by KLK2-EHT002-011 and PSA-EHT001-027 or by KLK2-EHTb to KLK2-EHTI and PSA-EHTa to PSA-EHTu (encoded by the retained intronic domains or by specifically created junctions) and their uses for the detection, diagnosis or monitoring of cancers and in particular prostate cancer . In particular, this may involve diagnosing the BPH form and differentiating it from prostate carcinoma.
  • another object of the invention relates to any antibody capable of binding, preferably selectively, to a polypeptide as defined above.
  • the antibody can be polyclonal or monoclonal. It can also be fragments and derivatives of antibodies having substantially the same antigenic specificity, in particular antibody fragments (eg, Fab, Fab'2, CDRs), humanized, polyfunctional, single-stranded antibodies (ScFv) , etc.
  • Antibodies can be produced using conventional methods, including immunizing an animal and recovering its serum (polyclonal) or spleen cells (so as to produce hybridomas by fusion with appropriate cell lines).
  • polyclonal antibodies from various species are described in the prior art.
  • the antigen is combined with an adjuvant (eg, Freund's adjuvant) and administered to an animal, typically by subcutaneous injection. Repeated injections can be given. Blood samples are collected and immunoglobulin or serum are separated.
  • Conventional methods of producing monoclonal antibodies include immunizing an animal with an antigen, followed by the recovery of spleen cells which are then fused with immortalized cells, such as myeloma cells. The resulting hybridomas produce monoclonal antibodies and can be selected by limiting dilutions so as to isolate the individual clones.
  • the Fab or F (ab ') 2 fragments can be produced by digestion using a protease according to conventional techniques.
  • the invention also relates to a method for producing antibodies, comprising injecting a polypeptide as defined above or an immunogenic fragment thereof into a non-human animal and recovering the antibodies or producer cells antibody.
  • the preferred antibodies are antibodies specific for the isoforms of PSA and KLK-2 described in the present application, and essentially non-specific for wild forms.
  • the invention relates to hybridomas producing the monoclonal antibodies described above and their use for producing said antibodies.
  • the antibodies can be coupled to heterologous fragments such as toxins, markers, drugs or any other therapeutic agent, covalently or not, either directly or through coupling agents.
  • the markers can be chosen from radio-markers, enzymes, fluorescent agents, magnetic particles, etc.
  • the antibodies of the invention can be used as screening agents or to detect or quantify the presence or amount of PSA or KLK-2 isoforms in samples collected from a subject, typically a biological fluid from 'a mammal, for example from a human.
  • Another subject of the invention relates to a (product comprising a) support on which one or more antibodies (or fragments or derivatives) as defined above are immobilized.
  • the support can be solid, flat or not, regular or not, such as for example nylon, glass, plastic, metal, fiber, ceramic, silica, polymer, etc., or any other compatible material.
  • Antibodies are preferably immobilized by one end, under conditions leaving the molecule accessible for an interaction reaction with a specific antigen.
  • the antibodies can be precisely arranged on the support, and deposited in several copies.
  • the present application also describes new methods for detecting a pathology or a predisposition to a pathology in a subject, comprising determining the presence, in a sample of said subject, of a nucleic acid, or an alteration genetic or a protein or polypeptide as defined above.
  • the determination can be carried out by various techniques, such as sequencing, hybridization and / or selective amplification.
  • Methods that can be used to determine the presence of proteins are based, for example, on immuno-enzymatic reactions, such as ELISA, RIA, EIA, etc.
  • Techniques that can be used to determine the presence of altered genes or RNA are, for example, PCR, RT-PCR, ligation chain reaction (LCR), PCE or TMA ("Transcriptional Mediated Amplification") technique, gel migration, electrophoresis, in particular DGGE (“denaturing gel gradient electrophoresis”), etc.
  • the latter preferably uses a primer or a pair of primers as defined above.
  • a particular subject of the invention relates to the use of nucleic acids complementary and specific to fragments of the genes or messengers of
  • KLK2-EHT002-011 and from PSA-EHT001-027 or from KLK2-EHTb to KLK2-EHTI and from PSA-EHTa to PSA-EHTu eg, retained intronic domains, junctions PT / FR03 / 00833
  • cancers in particular prostate cancer, and more particularly of its benign form, BPH.
  • This detection may in particular be carried out by means of DNA chips or by the implementation of a PCR from biological fluids such as blood (notably serum or from purified circulating epithelial cells), urine, seminal fluid, etc.
  • the invention also resides in the development and use of immunoassays containing one or more antibodies as described above or fragments thereof. These tests make it possible to individually detect and / or measure a variant using a specific antibody, several variants, in parallel, using the appropriate specific antibodies, or one or more relationships between the isoforms as described above or between said isoforms and other forms described for kallikrein-2 and PSA.
  • a particular method comprises bringing a sample from a subject into contact with a probe as defined above, and demonstrating hybridization.
  • Another particular method comprises bringing a sample from a subject into contact with a primer or a pair of primers as defined above, and demonstrating an amplification product.
  • Another particular method comprises bringing a sample from a subject into contact with an antibody as defined above, and demonstrating an antigen-antibody complex.
  • the method of the invention comprises the determination, in parallel, of the presence of several genetic variants or alterations as described above in a sample of a patient.
  • the invention can be implemented from various biological samples, in particular from biological fluids (eg, blood, plasma, urine, serum, saliva, etc.), biopsies of tissues or cell cultures, for example, and, more generally, from any sample likely to contain nucleic acids or proteins (or polypeptides).
  • biological sample can be treated before the implementation of the method, to facilitate or allow the accessibility of the polypeptides or nucleic acids which it contains.
  • the sample can also be purified, centrifuged, fixed, etc., possibly frozen or stored before use.
  • the invention relates to a method of detecting the presence of an altered form of KLK-2 or KLK-3 in a subject, comprising bringing into contact, in vitro or ex vivo, of a sample of said subject with a specific probe, primer or ligand as defined above and the determination of the formation of a hybrid, of an amplification product or of a complex, respectively, said formation being indicative the presence of an altered form.
  • Another object of the invention resides in a kit which can be used for implementing a method as defined above comprising i. a pair of primers or a probe or an antibody as defined above, and ii. the reagents necessary for amplification or for a hybridization or immunological reaction.
  • the invention also resides in the development of a method making it possible to detect and / or measure specific partners of one or more of these variants by adding one or more of these variants or their fragments in biological fluids to be tested, such as blood (serum in particular), urine or seminal fluid. Screening of active compounds
  • KLK2 and KLK3 according to the invention have been identified and isolated from pathological subjects and therefore represent therapeutic targets which are particularly advantageous for the treatment of cancers and in particular prostate cancer.
  • a particular object of the invention resides in methods of selection, identification, characterization, optimization or production of active compounds, comprising a step of determining the capacity of a test compound to modulate the expression or activity of a polypeptide as defined above.
  • the compounds are more particularly selected on the basis of their capacity to modulate the synthesis of a polypeptide as defined above (that is to say in particular the production or the maturation of the corresponding RNAs, or their translation) or the activity of such a polypeptide (that is to say in particular their maturation, transport, or their interaction with intra- or extracellular targets).
  • the method comprises contacting in vitro or ex vivo a test compound with a polypeptide as defined above or a nucleic acid encoding such a polypeptide (eg, gene, cDNA, RNA), and selecting compounds that bind to said polypeptide or nucleic acid.
  • a polypeptide as defined above or a nucleic acid encoding such a polypeptide (eg, gene, cDNA, RNA)
  • selecting compounds that bind to said polypeptide or nucleic acid eg, gene, cDNA, RNA
  • the binding of the polypeptide to the gene or to the corresponding RNA can be measured by various techniques, such as the displacement of a labeled ligand, migration on gel, electrophoresis, etc. It can be carried out in vitro, for example using the polypeptide or the nucleic acid immobilized on a support.
  • the method comprises contacting in vitro or ex vivo a test compound with a cell expressing a polypeptide as defined above, and the selection or identification of compounds modulating the expression or activity of said polypeptide.
  • the modulation of expression can be determined by assaying the RNAs or proteins, or by means of a reporter system.
  • the cells used can be any compatible cell, in particular eukaryotic or prokaryotic cells as mentioned above.
  • a modified cell is typically used to express said molecule, in particular recombinant cells.
  • Such recombinant cells can be prepared by the introduction of a recombinant nucleic acid expressing the polypeptide, or of a vector comprising the latter. Such recombinant cells constitute particular objects of the invention.
  • the method can be implemented to select or identify an activator or an inhibitor of the expression or of the activity of the specific antigen of PSA or of KLK-2.
  • the selection methods can be carried out in different formats, such as for example in multi-well plates, by testing multiple candidate compounds in parallel.
  • the compound is an antisense nucleic acid capable of inhibiting the expression of the variants described.
  • the antisense nucleic acid can comprise all or part of specific sequences of the variants described.
  • the antisense can in particular comprise a region complementary to the identified splicing form (e.g., of a target sequence), and inhibit (or reduce) its translation into protein.
  • the compound is a chemical compound, of natural or synthetic origin, in particular an organic or inorganic molecule, of vegetable, bacterial, viral, animal, eukaryotic, synthetic or semi-synthetic origin, capable of modulating the expression or activity of one or more of the variants described above.
  • Specific compounds are preferred, that is to say capable of modulating the expression or the activity of the variants, without significantly affecting the expression or the activity of the wild forms.
  • the compounds thus identified can be used for the preparation of a composition intended for the treatment of prostate cancer.
  • Another object of the invention resides in the use of a compound capable of modulating, ie stimulating, inhibiting or reducing, the expression of one or more variants as described above, for the preparation of a composition intended for the treatment of cancers and in particular prostate cancer.
  • treatment designates preventive, curative or palliative treatment, as well as the management of patients (reduction of suffering, improvement of lifespan, slowing down the progression of the disease ), etc.
  • the treatment can also be carried out in combination with other active agents.
  • Another subject of the invention relates to methods of selection, identification, or characterization of active compounds which can be used in the context of the preparation of compositions intended for the treatment of cancerous pathologies, comprising contacting one or more test compounds with cellular extracts expressing the proteins described in the present invention, or with said purified proteins.
  • the invention also relates to a method for producing a medicament for the treatment of cancers, in particular prostate cancer, comprising (i) the selection of active compounds according to the above methods and (ii) the conditioning of said compound or a functional analog thereof in the presence of a pharmaceutically acceptable carrier.
  • the functional analog is typically a compound derived from the active compound identified, for 03 00833
  • the functional analog may be a "pro-drug" of the identified compound.
  • Techniques for preparing functional analogs are well known to those skilled in the art, for example molecular modeling, coupling of NO groups, etc.
  • the method may in this regard comprise an intermediate step of synthesis of the selected compound or of the functional analog thereof.
  • the pharmaceutically acceptable vehicle or excipient can be chosen from buffer solutions, solvents, binders, stabilizers, emulsifiers, etc.
  • Buffer or diluent solutions include dicalcium phosphate, calcium sulfate, lactose, cellulose, kaolin, mannitol, sodium chloride, starch, powdered sugar and hydroxy propyl methyl cellulose (HPMC) (for delayed release).
  • Binders are for example starch, gelatin and filling solutes such as sucrose, glucose, dextrose, lactose, etc.
  • Natural or synthetic gums can also be used, such as alginate, carboxymethylcellulose, methylcellulose, polyvinyl pyrrolidone, etc.
  • excipients are for example cellulose and magnesium stearate.
  • Stabilizing agents can be incorporated into the formulations, such as for example polysaccharides (acacia, agar, alginic acid, guar gum and tragacanth, chitin or its derivatives and cellulose ethers.
  • Solvents or solutes are for example the Ringer solution, l , distilled water, phosphate buffers, phosphate salt solutions, and other conventional fluids.
  • Another subject of the invention relates to the use of cytotoxic ligands specific for one or more variants as described above located on the surface of cancer cells and in particular prostate cancer cells.
  • Table 1 Sequence of specific oligonucleotides (SEQ ID NOs: 168-220). Column 1: Name of the oligonucleotide. Column 2: Sequence of the oligonucleotide. Column 3: SEQ ID NO of the oligonucleotides claimed.
  • Table 2 Couples of primers used for the amplification of the PSA and KLK2 isoforms.
  • Table 3 Values of the fluorescence signals obtained by hybridization from human tissue (Clontech) from a micro-array grouping together oligonucleotides including the oligonucleotides SEQ ID NOs: 168-220.
  • Column 1 Name of the oligonucleotide.
  • Column 2 SEQ ID NO.
  • Column 3-4 Values corresponding to prostate / heart.
  • Column 5-6 Values corresponding to prostate / kidney.
  • Column 7-8 Values corresponding to prostate / prostate.
  • Column 9-10 Values corresponding to prostate / small intestine.
  • the sign # N / A indicates that the value was less than twice the background noise.
  • Table 4 Values of the fluorescence signals obtained by hybridization from cell lines of a micro-array grouping together oligonucleotides including the oligonucleotides SEQ ID NOs: 168-220.
  • Column 1 Name of the oligonucleotide.
  • Column 2 SEQ ID NO.
  • Column 3-4 Values corresponding to Mda2b / BT549.
  • Column 5-6 Values corresponding to Mda2b / MCF7.
  • Column 7-8 Values corresponding to Mda2b / Mda231.
  • Column 9-10 Values corresponding to Mda2b / T47D.
  • the sign # N / A indicates that the value was less than twice the background noise.
  • Table 5 Values of the fluorescence signals obtained by hybridization from benign and tumor tissues originating from patients with prostate cancer from a micro-array grouping together oligonucleotides including the oligonucleotides SEQ ID NOs: 168-220.
  • Column 1 Name of the oligonucleotide.
  • Column 2 SEQ ID NO.
  • Column 3-4 Values corresponding to the tumor tissue / benign tissue of the patient 15068.
  • Column 5-6 Values corresponding to the tumor tissue / benign tissue of the patient 9648.
  • Column 7-8 Values corresponding to the tumor tissue / benign tissue of the patient 8827
  • Column 9-10 Values corresponding to the patient's tumor tissue / benign tissue 10063.
  • the sign # N / A indicates that the value was less than twice the background noise.
  • Figure 1 Arrangement of specific oligonucleotides. Oligonucleotides materialized by rectangles are designed to hybridize specifically to splicing events: intron retention, exon deletion, use of 3 'and 5' cryptic sites.
  • Figure 2 Arrangement of specific oligonucleotides. Five oligonucleotides materialized by a line can be designed to analyze the expression of a long form materialized by 3 exons and a short form materialized by 2 exons.
  • Figure 3 Marking of long and short synthetic shapes. Synthetic RNAs are produced from linearized plasmids expressing the corresponding cDNAs. The RNAs of the long form are labeled using cyanine 3, the RNAs of the short form are labeled using cyanine 5.
  • Figure 4 Demonstration of the specificity of hybridization of oligonucleotides. Five oligonucleotides were used to differentiate the long forms from the short forms mixed in equal amounts. Two examples are presented, gene A and gene B.
  • Figure 5 Quantitative measures of relationships between long and short forms. The percentage of long form (wt) has been established at: 0, 20, 40, 60, 80 and 100% (3 examples are presented, gene A, B and C).
  • FIG. 6 Specificity of the PSA and KLK2 oligonucleotide micro-array.
  • the PSA specific oligonucleotides are revealed by the cyanine labeled PSA isoforms.
  • the KLK2 specific oligonucleotides are revealed by the cyanine labeled KLK2 isoforms.
  • Figure 7 Diagram of the linear amplification of RNA.
  • Figure 8 Example of hybridization of the PSA / KLK2 slide using probes from tumor and healthy tissue from the same patient.
  • Figure 9 Measurement of the differential expression of certain isoforms of PSA and KLK2 via the analysis of the corresponding discriminating oligonucleotides between tumor tissues and healthy tissues within the same patients.
  • Column 1 nature of the isoform
  • column 2 corresponding discriminating oligonucleotide
  • column 3 to 6 log2 (tumor expression / normal expression ratio).
  • Figure 10 Measurement of the differential expression of certain isoforms of PSA and KLK2 via the analysis of the corresponding discriminating oligonucleotides between the prostate cancer cell line (Mda-2b and LNCap) and the breast cancer cell line (T47D) .
  • Column 1 nature of the isoform
  • column 2 corresponding discriminating oligonucleotide
  • column 3.4 log2 (ratio of prostate line expression to breast line expression). Isoforms relatively overexpressed in the prostate line are indicated in orange. Isoforms relatively overexpressed in the breast line are shown in blue.
  • Figure 11 Measurement of the differential expression of certain isoforms of PSA and KLK2 via the analysis of the corresponding discriminating oligonucleotides between different human tissues.
  • Column 1 nature of the isoform
  • column 2 corresponding discriminating oligonucleotide
  • column 3, 4, 5 and 6 log2 (ratio of expression of prostate tissue / tissue of heart, kidney, small intestine and prostate respectively). Isoforms that are relatively overexpressed in prostate tissue are shown in orange. Isoforms relatively overexpressed in other tissues are shown in blue.
  • Figure 12 Graphic illustration of the fluorescence signals obtained for certain isoforms with normal tissues.
  • FIG. 13 PCR amplifications using specific primer oligonucleotides of three PSA isoforms.
  • Figure 14 Annotations of three polyclonal antibodies produced. This figure groups together the information concerning the antibodies SE3962, SE3963, SE4101 produced, the epitopes chosen, the peptides synthesized, the coupling to the KLH used and the isoforms capable of being recognized by these antibodies.
  • Figure 15 Titers of the three antibodies by ELISA tests.
  • Figure 16 Results of "western blots" with the EHT-SE3962 antibody from sera with low total PSA level in A), with average total PSA levels in B), with high total PSA levels in C). Two bands corresponding to expected molecular weights for KLK2-EHT004 and KLK2-EHT006 are observed. The displacement of the signals with increasing doses of the specific synthetic epitope (from 1 to 50 ⁇ g) not observed with a high dose of non-specific peptide at 250 ⁇ g demonstrates the specificity of this antibody.
  • Figure 17 Results of "western blots" with the antibody EHT-SE3963 from prostate tissue. A band corresponding to an expected molecular weight for PSA-EHT021 is observed. Two other higher molecular weight bands are also revealed.
  • Poly A + RNAs are prepared according to techniques known to those skilled in the art. It may in particular be a treatment using chaotropic agents such as guanidium thiocyanate followed by extraction of the total RNAs using solvents (phenol, chloroform for example). Such methods are well known to those skilled in the art (see Maniatis et al., Chomczynsli et al., Anal. Biochem. 162 (1987) 156), and can be easily implemented using commercially available kits . From these total RNAs, poly A + RNAs are prepared according to conventional methods known to those skilled in the art and described in commercial kits.
  • RNAs serve as a template for reverse transcription reactions using reverse transcriptases.
  • reverse transcriptases lacking RNase H activity are used. They make it possible to obtain complementary DNA strands of sizes larger than those obtained using conventional reverse transcriptases. Such preparations of reverse transcriptases without RNase H activity are commercially available.
  • RNA sequences not paired with complementary DNA are released from these heteroduplexes under the action of RNase H, this enzyme degrading the paired RNA sequences.
  • RNase H this enzyme degrading the paired RNA sequences.
  • These unpaired sequences represent the qualitative differences which exist between RNAs which are otherwise homologous to one another. These qualitative differences can be located anywhere on the RNA sequence, either in 5 ′ or 3 ′ as within the sequence and in particular within the coding sequence. Depending on their location, these sequences can be not only modifications of splicing but also the consequences of translocations or deletions.
  • RNA sequences representing the qualitative differences are then cloned according to techniques known to those skilled in the art and in particular those described in the patent relating to the DATAS technology.
  • sequences are grouped together within cDNA banks which constitute qualitative differential banks.
  • One of these banks contains exons and introns specific to the healthy situation; the other banks contain the splicing events characteristic of the pathological conditions.
  • the fragments derived from the human genes of KLK2 and KLK3 come from these banks.
  • RNA pool was treated with Dnase using the "DNA free” kit from the company Ambion (cat. No. 1906). This RNA is then reverse transcribed using the reverse transcriptase from the “High capacity cDNA Archive” kit from the company Aplied Biosystems (cat. No. 4322171).
  • the cDNA thus produced serves as a template for PCR reactions in order to specifically amplify different regions of messenger RNAs derived from human kallikrein-2 and kallikrein-3 according to the following protocol:
  • Taq polymerase 0.2 ⁇ L
  • oligonucleotides used as PCR primers are as follows
  • the amplified products are then cloned in the "Topo" system from the company Invitrogen (cat. No. K4600) according to the protocol provided.
  • the ligation products are transformed into competent “Top 10” cells.
  • the colonies are identified on agar / LB medium supplemented with ampicillin.
  • the cDNAs present in these colonies are amplified individually by PCR amplification using primers Sp6 and T7 according to the following protocol:
  • Taq polymerase 0.2 ⁇ L
  • the amplification products are then purified by P100 to be sequenced using the “Big Dye Terminator” kit from the company Applied Biosystems according to the protocol provided by this supplier. Sequence reactions are analyzed using an Applied Biosystems 3100 sequencer. Table 2 shows the different cDNAs as well as the pairs of priming oligonucleotides used to obtain them and allowing their amplification in a sample.
  • the nucleotide numbering refers to the Genbank accession number M18157 unless otherwise specified.
  • the reference protein is KLK2 provided with its signal peptide.
  • sequences KLK2-EHT002 to KLK2-EHT011 correspond to sequences comprising an open reading phase with a codon for initiating and terminating translation.
  • sequences KLK2-EHTb to KLK2-EHTI correspond to sequences expressed of the “ESTs” type which may include one, two or three reading phases with or without an initiation or termination codon of the translation.
  • This isoform exhibits i) a partial retention of a 5 ′ part of intron 2 (nt 1935-2020) and ii) a use of two cryptic splicing sites in the part 3 'of exon 3 (nt 3728) and part 5' of exon4 (nt 3937). These two events correspond to consensual splicing sites.
  • This KLK2-EHT002 isoform has a stop codon after exon 2 and thus codes for a truncated protein after residue No. 69 (KLK2-EHT002prota / SEQ ID NO: 50). 54 amino acids can be cleaved to form the sequence KLK2- EHT002protb / SEQ ID NO: 51.
  • nucleotides corresponding to Genbank positions (M18157) 1821 and 3581 in SEQ ID NO: 1 correspond to C and A while the Genbank reference indicates T and G respectively. These differences can be explained by the existence of a polymorphism at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase. These two changes do not affect the translated protein sequence.
  • KLK2-EHT003 (SEQ ID NO: 2): This isoform exhibits i) a total deletion of exon 2 and ii) retention of a 5 'part of intron 4 (nt 4061-4097). These two events correspond to consensual splicing sites.
  • This KLK2-EHT003 isoform codes for a protein comprising 34 additional amino acids beyond threonine residue number 15 (KLK2-EHT003prota / SEQ ID NO: 52). These 34 amino acids can be cleaved to form the sequence KLK2-EHT003protb / SEQ ID NO: 53.
  • nucleotides corresponding to Genbank positions (M18157) 3774 and 5486 in SEQ ID NO: 2 correspond to C and T while the Genbank reference indicates T and G respectively. These differences can be explained by the existence of a polymorphism at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase. These two changes do not affect the translated protein sequence.
  • KLK2-EHT004 (SEQ ID NO: 3): This isoform has a total deletion of exon 3.
  • This isoform KLK2- EHT004 codes for a protein comprising 70 additional amino acids beyond threonine residue number 15 (KLK2-EHT004prota / SEQ ID NO: 54). These 70 amino acids can be cleaved to form the sequence KLK2- EHT003protb / SEQ ID NO: 55. The last 16 amino acids are new and could present one or more epitopes specific for this isoform, KLK2- EHT004protc / SEQ ID NO: 56.
  • KLK2-EHT006 (SEQ ID NO: 4):
  • This isoform presents a use of two cryptic splicing sites in the 3 'part of exon 3 (nt 3728) and the 5' part of exon4 (nt 3937). This event corresponds to consensual splicing sites.
  • KLK2-EHT006 codes for a protein of 149 amino acids (KLK2- EHTOO ⁇ prota / SEQ ID NO: 57). 134 amino acids can be cleaved to form the sequence KLK2-EHT006protb / SEQ ID NO 58. The last 12 amino acids are new and could present one or more epitopes specific for this isoform, KLK2-EHT006protc / SEQ ID NO: 59.
  • KLK2-EHT007 (SEQ ID NO: 5):
  • KLK2-EHT007 exhibits retention of the 5 'part of intron 4. This isoform KLK2-EHT007 codes for a protein of 224 amino acids (KLK2-
  • EHT007prota / SEQ ID NO: 60 209 amino acids can be cleaved to form the sequence KLK2-EHT007protb / SEQ ID NO: 61. The last 14 amino acids are new and could present one or more epitopes specific for this isoform, KLK2-EHT007protc / SEQ ID NO: 62.
  • KLK2-EHT009 (SEQ ID NO: 6): KLK2-EHT009 presents i) a deletion of a sequence in exon 3 (nt 3671- 3793) and ii) the use of a cryptic splicing site in the part 5 'of exon 4 (nt 3937) (consensual splicing site).
  • This KLK2-EHT009 isoform codes for a protein of 123 amino acids (KLK2-EHT009prota / SEQ ID NO: 63). 108 amino acids can be cleaved to form the sequence KLK2- EHT009protb / SEQ ID NO: 64. The last 5 amino acids are new and could participate in one or more specific epitopes of this isoform, KLK2-EHT009protc / SEQ ID NO: 65.
  • KLK2-EHT011 (SEQ ID NO: 7): This isoform presents a use of a cryptic splicing site in the 5 'part of exon4 (nt 4041). This event corresponds to consensual splicing sites.
  • This isoform KLK2-EHT011 codes for a protein of 165 amino acids (KLK2-EHT011prota / SEQ ID NO: 66). 150 amino acids can be cleaved to form the sequence KLK2-EHT011 protb / SEQ ID NO: 67. The last amino acid replaces a phenylalanine residue with a tryptophan residue and could participate in an epitope specific for this isoform.
  • KLK2-EHTb (SEQ ID NO: 8):
  • This isoform has a retention of a 5 ′ part of the intron 1 followed by a deletion between positions 701 and 1058 included.
  • This KLK2-EHTb isoform codes for a protein comprising 104 additional amino acids beyond threonine residue number 15 (KLK2-EHTb1, SEQ ID NO: 68). These 104 amino acids can be cleaved to form the sequence KLK2-EHTb2, SEQ ID NO: 69. The last 59 amino acids (KLK2-EHTb3, SEQ ID NO: 70) represent a new sequence compared to an already described isoform, K-LM (David et.al, (2002)).
  • nucleotides in position 97, 214, 249 of SEQ ID NO: 8 correspond to G, C, T while the reference genbank indicates C, T, C respectively. These differences can be explained by the existence of a polymorphism at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase.
  • the mutations 97, 214 do not affect the translated protein sequence.
  • the mutation 249 transforms a serine residue into a phenylalanine residue.
  • nucleotides 1192-1199, GAAGAACA of the reference genbank are replaced by the nucleotides 303-306, AAAC in SEQ ID NO: 8. The last fifteen amino acids of KLK2-EHTb1 thus replace an open sequence comprising the 17 amino acids component KLK2-EHTb4, SEQ ID NO: 71.
  • This isoform uses a cryptic site in intron 1 which occupies the position
  • KLK2-EHTc codes for a protein further comprising 6 amino acids beyond the threonine residue number 15 (KLK2-EHTc1, SEQ ID NO: 72). These 6 amino acids can be cleaved to form the sequence KLK2-EHTc2, SEQ ID NO: 73. It may be noted that the nucleotides 1192-1199, GAAGAACA of the reference genbank are replaced by the nucleotides 71-74, AAAC in SEQ ID NO: 9. This change occurs after a stop codon.
  • KLK2-EHTd (SEQ ID NO: 10):
  • This isoform has a retention of a 5 ′ part of the intron 1 followed by a deletion between positions 657 and 1209 included.
  • This KLK2-EHTd isoform codes for a protein comprising at least 41 additional amino acids beyond threonine residue number 15 (KLK2-EHTd1, SEQ ID NO: 74). These 41 additional amino acids can be cleaved to form the sequence KLK2-EHTd2, SEQ ID NO: 75. The last 11 additional amino acids (KLK2-EHTd3, SEQ ID NO: 76) represent a new sequence compared to an already described isoform, K-LM (David et.al, 2002). ). The sequence predicted by continuing translation into intron 1 produces a protein of 83 amino acids after cleavage: KLK2-EHTd4, SEQ ID NO: 77. KLK2-EHTe (SEQ ID NO: 11):
  • KLK2-EHTe has an unknown sequence of 140 nucleotides between an exon 2 truncated in 3 'and exon 3. This isoform KLK2-EHTe codes for a protein further comprising 19 amino acids beyond the glycine residue occupying position number 52 (KLK2-EHTe1, SEQ ID NO: 78). These 19 amino acids represent the sequence KLK2-EHTe2, SEQ ID NO: 79.
  • KLK2-EHTf (SEQ ID NO: 12): This isoform uses two cryptic sites, the first in the 3 'part of exon 2 (position 1876), the second in intron 2 (position 3349).
  • This KLK2-EHTf isoform codes for a protein further comprising 57 amino acids comprised between the histidine residues at position 49 and asparagine at position 70 (KLK2-EHTf1, SEQ ID NO: 80). These 57 amino acids represent the sequence KLK2-EHTf2, SEQ ID NO: 81.
  • the nucleotide at position 269 of SEQ ID NO: 12 corresponds to C, while the reference genbank indicates T.
  • the mutation 269 transforms a phenylalanine residue into a leucine residue.
  • KLK2-EHTJ (SEQ ID NO: 13):
  • KLK2-EHTJ codes for a protein comprising one of the two reading phases corresponding to KLK2-EHTJ1 (SEQ ID NO: 82), or KLK2- EHTJ2 (SEQ ID NO: 83).
  • KLK2-EHTk codes for a protein comprising one of the two reading phases corresponding to KLK2- EHTk1 (SEQ ID NO: 84) or KLK2-EHTk2 (SEQ ID NO: 85).
  • KLK2-EHTI SEQ ID NO: 15:
  • This isoform uses a cryptic site in intron 2 at position 2991.
  • This isoform codes for a protein comprising one of the three reading phases corresponding to KLK2-EHTI1 (SEQ ID NO: 86), KLK2-EHTI2 (SEQ ID NO : 87) or KLK2-EHTI3 (SEQ ID NO: 88).
  • the nucleotide numbering refers to the Genbank accession number M27274 unless otherwise specified.
  • the reference protein is PSA provided with its signal peptide.
  • sequences PSA-EHT001 to PSA-EHT027 correspond to sequences comprising an open reading phase with a codon for initiating and terminating translation.
  • PSA-EHTa to PSA-EHTu sequences correspond to expressed sequences of the “ESTs” type which may include one, two or three reading phases with or without an initiation or termination codon of the translation.
  • PSA-EHT001 SEQ ID NO: 16
  • This isoform exhibits retention of a deleted fragment of intron 1 (nt 721-
  • PSA-EHT001 isoform codes for a protein of 51 amino acids (PSA-EHT001prota / SEQ ID NO: 89). 36 amino acids can be cleaved to form the PSA-EHT001 protb / SEQ ID NO: 90 sequence.
  • the nucleotide corresponding to the Genbank position (M27274) 738 in SEQ ID NO: 16 corresponds to G whereas the Genbank reference indicates T. This difference can be explained by the existence of a polymorphism at this position, by errors in the referenced sequence, although mutations introduced by the polymerase cannot be excluded. This change replaces a tryptophan residue with a glycine residue.
  • PSA-EHT003 SEQ ID NO: 17
  • This isoform exhibits retention of a deleted fragment of intron 1 (nt 721- 874 then 920-1272).
  • This PSA-EHT003 isoform codes for a protein of 89 amino acids (PSA-EHT003prota / SEQ ID NO: 91). 74 amino acids can be cleaved to form the sequence PSA-EHT003protb / SEQ ID NO: 92. The last 20 acids (PSA-EHT003protc / SEQ ID NO: 93) represent new information compared to an isoform already described comprising total retention of intron 1
  • PSA-EHT004 (SEQ ID NO: 18):
  • This isoform uses a 3 ′ cryptic splicing site located in intron 1 at position 1142 (consensus site).
  • This isoform PSA-EHT004 codes for a protein of 47 amino acids (PSA-EHT004prota / SEQ ID NO: 94). 32 amino acids can be cleaved to form the sequence PSA-EHT004protb / SEQ ID NO: 95.
  • PSA-EHT005 (SEQ ID NO: 19):
  • This isoform exhibits retention of a deleted fragment of intron 1 (nt 721-792 then 1149-1272).
  • This PSA-EHT005 isoform codes for a protein of 68 amino acids (PSA-EHT005prota / SEQ ID NO: 96). 53 amino acids can be cleaved to form the sequence PSA-EHT005protb / SEQ ID NO: 97. The last 28 acids (PSA-EHT005protc / SEQ ID NO: 98) represent new information compared to an isoform already described including total retention intron 1
  • PSA-EHT007 SEQ ID NO: 20:
  • This isoform uses a 5 ′ cryptic splicing site located in exon 1 at position 693 and a 3 ′ cryptic site located in intron 1 at position 1149
  • This PSA-EHT007 isoform codes for a protein of 23 amino acids (PSA - EHT007prota / SEQ ID NO: 99).
  • PSA-EHT008 (SEQ ID NO: 21):
  • This isoform uses a 3 ′ cryptic splicing site located in intron 1 at position 1202 (consensus site)
  • This PSA-EHT008 isoform codes for a protein of 27 amino acids (PSA-EHT008prota / SEQ ID NO: 100). 12 amino acids can be cleaved to form the sequence PSA-EHT008protb / SEQ ID NO: 101.
  • the nucleotide corresponding to the Genbank position (M27274) 679 in SEQ ID NO: 21 corresponds to T whereas the Genbank reference indicates G. This difference can be explained by the existence of a polymorphism at this position, by errors in the referenced sequence, although mutations introduced by the polymerase cannot be excluded. This change replaces a tryptophan residue with a leucine residue.
  • PSA-EHT009 (SEQ ID NO: 22): This isoform exhibits retention of a deleted fragment of intron 2 (nt 2119-2447 then 2988-3226).
  • This PSA-EHT009 isoform codes for a protein of 69 amino acids (PSA-EHT009prota / SEQ ID NO: 102). 54 amino acids can be cleaved to form the sequence PSA-EHT009protb / SEQ ID NO: 103.
  • M27274 the nucleotide corresponding to the Genbank position
  • Genbank reference indicates G. This difference can be explained by the existence of a polymorphism at this position, by errors in the referenced sequence, although mutations introduced by the polymerase cannot be excluded. This change does not change the protein sequence. Other point mutations are identified after the stop codon.
  • PSA-EHT012 SEQ ID NO: 23
  • This isoform uses a 3 ′ cryptic splicing site located in intron 2 at position 2426 (consensus site)
  • This PSA-EHT012 isoform codes for a protein of 83 amino acids (PSA-EHT012prota / SEQ ID NO: 104). 68 amino acids can be cleaved to form the sequence PSA-EHT004protb / SEQ ID NO: 105. The last 14 amino acids (PSA-EHT012protc / SEQ ID NO: 106) represent new information with respect to wild type PSA and are therefore likely to include one or more specific epitopes of this isoform.
  • nucleotides corresponding to the Genbank positions (M27274) 1966 and 2459 in SEQ ID NO: 23 correspond to A and A while the Genbank reference indicates G and G respectively. These differences can be explained by the existence of a polymorphism at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase. These two changes do not affect the translated protein sequence.
  • PSA-EHT013 SEQ ID NO: 24
  • This isoform uses a 3 ′ cryptic splicing site located in intron 1 at position 1945 (consensus site)
  • This PSA-EHT013 isoform codes for a protein of 75 amino acids (PSA-EHT013prota / SEQ ID NO: 107). 60 amino acids can be cleaved to form the sequence PSA-EHT013protb / SEQ ID NO: 108. These 60 amino acids represent new information compared to wild type PSA and are therefore capable of including one or more specific epitopes of this isoform.
  • PSA-EHT015 SEQ ID NO: 25:
  • This isoform uses a 5 ′ cryptic splicing site located in exon 1 at position 703 and a 3 ′ cryptic site located in exon 2 at position 2030
  • This PSA-EHT015 isoform codes for a protein of 41 amino acids (PSA - EHT015prota / SEQ ID NO: 109).
  • the last 30 amino acids represent new information compared to wild type PSA and are therefore likely to include one or more epitopes specific for this isoform.
  • the nucleotide corresponding to the Genbank position (M27274) 2094 in SEQ ID NO: 25 corresponds to C whereas the Genbank reference indicates T. This difference can be explained by the existence of a polymorphism at this position, by errors in the referenced sequence, although mutations cannot be excluded introduced by the polymerase. This change replaces a serine residue with a proline residue.
  • PSA-EHT016 (SEQ ID NO: 26): This isoform uses a 3 'cryptic splicing site located in exon 2 at position 2053 (consensus site)
  • This PSA-EHT016 isoform codes for a protein of 39 amino acids (PSA -EHT016prota / SEQ ID NO: 111). 24 amino acids can be cleaved to form the sequence PSA-EHT016protb / SEQ ID NO: 112. These 24 amino acids represent new information compared to wild type PSA and are therefore likely to include one or more specific epitopes of this isoform.
  • PSA-EHT018 SEQ ID NO: 27
  • This isoform exhibits retention of a deleted fragment of intron 2 (nt 2119-2588 then 3114-3226).
  • This PSA-EHT018 isoform codes for a protein of 69 amino acids (PSA-EHT018prota / SEQ ID NO: 113). 54 amino acids can be cleaved to form the sequence PSA-EHT018protb / SEQ ID NO: 114.
  • the nucleotide corresponding to the Genbank position (M27274) 2545 in SEQ ID NO: 27 corresponds to T whereas the Genbank reference indicates A. This difference can be explained by the existence of a polymorphism at this position, by errors in the referenced sequence, although mutations introduced by the polymerase cannot be excluded. This change does not change the protein sequence.
  • PSA-EHT019 SEQ ID NO: 28
  • This isoform has a deletion of a fragment located in exon 3 (nucleotide 3828-3933).
  • This PSA-EHT019 isoform codes for a protein of 100 amino acids (PSA-EHT019prota / SEQ ID NO: 115). 85 amino acids can be cleaved to form the sequence PSA-EHT019protb / SEQ ID NO: 116. The last 6 amino acids (PSA-EHT019protc / SEQ ID NO: 117) represent new information compared to wild type PSA and are thus likely to include one or more specific epitopes of this isoform.
  • nucleotides corresponding to Genbank positions (M27274) 3786 and 3943 in SEQ ID NO: 28 correspond to T and A while the Genbank reference indicate C and C respectively. These differences can be explained by the existence of polymorphisms at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase.
  • the first change does not change the protein sequence.
  • the second replaces a serine residue with an arginine residue.
  • PSA-EHT021 SEQ ID NO: 29
  • This isoform uses a 3 'cryptic splicing site located in exon 3 at position 3885 (consensus site) and also has a deletion in the 3' part of exon 3 (nucleotides 3903-4025).
  • This PSA-EHT021 isoform therefore codes for a protein of 177 amino acids (PSA-EHT021prota / SEQ ID NO: 118). 162 amino acids can be cleaved to form the PSA-EHT021 protb / SEQ ID NO: 119 sequence.
  • the new junctions created around residues 69 and 76 represent new information with respect to wild type PSA and are therefore likely to include one or more epitopes specific for this isoform.
  • PSA-EHT022 (SEQ ID NO: 30):
  • This isoform has a deletion in the 3 ′ part of exon 3 (nucleotides 3903-4025).
  • This PSA-EHT022 isoform therefore codes for a protein of 220 amino acids (PSA-EHT022prota / SEQ ID NO: 120). 205 amino acids can be cleaved to form the sequence PSA-EHT022protb / SEQ ID NO: 121.
  • the new junction created around residue 119 represents a new information compared to wild type PSA and is therefore likely to include one or more epitopes specific for this isoform.
  • the nucleotide corresponding to the Genbank position (M27274) 1966 in SEQ ID NO: 30 corresponds to A while the Genbank reference indicates G. This difference can be explained by the existence of a polymorphism at this position, by errors in the referenced sequence, although mutations introduced by the polymerase cannot be excluded. This change does not change the protein sequence.
  • PSA-EHT022 (SEQ ID NO: 30) corresponds to a PSA variant submitted to Genbank on October 24, 2002 (access number: AJ459782).
  • PSA-EHT023 SEQ ID NO: 31
  • This isoform comprises a deletion of a fragment of exon 2 (nucleotides
  • This isoform codes for a protein of 207 amino acids (PSA-EHT023prota / SEQ ID NO: 122). 192 amino acids can be cleaved to form the PSA-EHT023protb / SEQ ID NO: 123 sequence.
  • the new junctions created around residues 27, 53 and in region 105-111 represent new information compared to wild type PSA and are thus likely to include one or more specific epitopes of this isoform.
  • nucleotides corresponding to the Genbank positions (M27274) 2060 and 5731 in SEQ ID NO: 31 correspond to G and to G while the Genbank reference indicates T and T respectively. These differences can be explained by the existence of polymorphisms at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase.
  • the first change replaces a cysteine residue with a glycine residue.
  • the second does not modify the protein sequence.
  • PSA-EHT025 (SEQ ID NO: 32): This isoform corresponds to the deletion of exon 3.
  • This isoform codes for a protein of 85 amino acids (PSA-EHT025prota / SEQ ID NO: 124). 70 amino acids can be cleaved to form the sequence PSA-EHT025protb / SEQ ID NO: 125. The last 16 amino acids (PSA-EHT025protc / SEQ ID NO: 126) represent new information compared to wild type PSA and are thus likely to include one or more specific epitopes of this isoform.
  • nucleotides corresponding to the Genbank positions (M27274) 2118-4186 and 5791 in SEQ ID NO: 32 correspond to G and to G whereas the reference Genbank indicates AT and C respectively. These differences can be explained by the existence of polymorphisms at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase. The agreement of the 3 'sites of exon 2 and 5' of exon 4 suggests a mutation introduced by the polymerase in this region. The last change does not change the protein sequence.
  • PSA-EHT026 SEQ ID NO: 33
  • This isoform has a deletion of a fragment located in exon 3 (nucleotide 3781-4025).
  • This PSA-EHT026 isoform codes for a protein of 78 amino acids (PSA-EHT026prota / SEQ ID NO: 127). 63 amino acids can be cleaved to form the sequence PSA-EHT026protb / SEQ ID NO: 128.
  • PSA-EHT027 (SEQ ID NO: 34) This isoform uses a cryptic splicing site located 5 ′ in exon 3 at position 3780 and a deletion of exon 4
  • PSA-EHT027 codes for a protein of 144 amino acids (PSA-EHT027prota / SEQ ID NO: 129). 129 amino acids can be cleaved to form the sequence PSA-EHT027protb / SEQ ID NO: 130.
  • the last 67 amino acids (PSA-EHT027protc / SEQ ID NO: 131) represent new information compared to wild type PSA and are therefore likely to include one or more epitopes specific for this isoform.
  • PSA-EHTa SEQ ID NO: 35
  • This isoform has a retention of 91 nucleotides from the 5 ′ part of intron 1 followed by a deletion of the following 152 nucleotides (to then find intron 1).
  • This PSA-EHTa isoform codes for a protein of 90 amino acids (PSA-EHTa1, SEQ ID NO: 132) whose last 75 amino acids can be cleaved (PSA-EHTa2, SEQ ID NO: 133), representing different information by compared to PSA and of which the last 44 amino acids (PSA-EHTa3, SEQ ID NO: 134) represent new information compared to total retention of intron 1 already described (David et.al, (2002)).
  • Q replaces P in position 26 of the last 74 amino acids.
  • nucleotides at position 90 and 234 of SEQ ID NO: 35 correspond to A, C, while the genbank reference indicates C and T.
  • nucleotides G and C at position 243 and 293 also differ compared to the genbank reference. However, these two nucleotides do correspond to a published genomic sequence (Genbank access number: NT_011190). These differences can be explained by the existence of a polymorphism at these positions, by errors in the referenced sequence, although it is not possible to exclude mutations introduced by the polymerase. Thus, a glutamine residue replaced the praline residue (mutation 90), and a threonine residue replaced an isoleucine residue (mutation 234).
  • PSA-EHTd (SEQ ID NO: 36): This isoform has a deletion of the last 9 nucleotides of exon 2 and the first 243 nucleotides of exon 3. This isoform PSA-EHTd codes for a protein with a deletion of 84 amino acids (PSA-EHTd1, SEQ ID NO: 135). A new domain is created between the cysteine residue 66 and the threonine residue 151.
  • PSA-EHTf SEQ ID NO: 37: This isoform exhibits retention of intron 3 deleted from 105 nucleotides (2420-2526).
  • This PSA-EHTf isoform codes for a truncated protein after the asparagine residue number 69 which is substituted by lysine residue (PSA-EHT 1, SEQ ID NO: 136).
  • PSA-EHT 1, SEQ ID NO: 136 lysine residue
  • PSA-EHTh SEQ ID NO: 38
  • This isoform results from the use of a cryptic splicing site within intron 4 (in position 5472).
  • This PSA-EHTh isoform codes for a protein comprising one of the two reading phases corresponding to PSA-EHTM (SEQ ID NO: 137) or PSA-EHTh2 (SEQ ID NO: 138). It can be noted that the nucleotides at position 79, 199 and 258 of SEQ ID NO: 38 correspond to C, C and G, while the genbank reference indicates T, T and A. These differences can be explained by the existence of 'a polymorphism at these positions, by errors in the referenced sequence, although a mutation introduced by the polymerase cannot be excluded.
  • PSA-EHTj SEQ ID NO: 39
  • This isoform results from the use of a cryptic splicing site within intron 4 (in position 5257).
  • This PSA-EHTj isoform codes for a protein comprising one of the three reading phases corresponding to PSA-EHTj1 (SEQ ID NO: 139), PSA-EHTJ2 (SEQ ID NO: 140) or PSA-EHTJ3 (SEQ ID NO: 141)
  • PSA-EHTk (SEQ ID NO: 40): This isoform has a retention of the 3 ′ part of the intron 3, then a retention of a truncated intron 4 (between positions 4337 and 5516). This isoform codes for a protein comprising one of the three reading phases corresponding to PSA-EHTk1 (SEQ ID NO: 142), PSA-EHTk2 (SEQ ID NO: 143), or PSA-EHTk3 (SEQ ID NO: 144) .
  • PSA-EHTI SEQ ID NO: 41
  • This isoform uses a cryptic site in exon 4 at position 4274 and another cryptic site in intron 4 at position 4538. It can be noted that the nucleotide in position 79 of SEQ ID NO: 41 corresponds to C, whereas the reference genbank indicates T. This difference can be explained by the existence of a polymorphism at this position, by an error in the sequence referenced, although a mutation introduced by the polymerase cannot be excluded.
  • PSA-EHTI codes for a protein comprising one of the three reading phases corresponding to PSA-EHTH (SEQ ID NO: 145), PSA-EHTI2 (SEQ ID NO: 146) or PSA-EHTI3 (SEQ ID NO: 147) . In PSA-EHTI3, this mutation replaces an isoleucine residue with a threonine residue.
  • PSA-EHTm (SEQ ID NO: 42): This isoform exhibits retention of a truncated intron 1 (between 1214 and 1755).
  • PSA-EHTm codes for a protein comprising one of the three reading phases corresponding to PSA-EHTm1 (SEQ ID NO: 148), PSA-EHTm2 (SEQ ID NO: 149) or PSA-EHTm3 (SEQ ID NO: 150) .
  • PSA-EHTn SEQ ID NO: 43
  • PSA-EHTn codes for a protein comprising one of the three reading phases corresponding to PSA-EHTn1 (SEQ ID NO: 151), PSA-EHTn2 (SEQ ID NO: 152) or PSA-EHTn3 (SEQ ID NO: 153) .
  • PSA-EHTp (SEQ ID NO: 44) This isoform results from the use of a cryptic splicing site in intron 1 (in position 1240).
  • PSA-EHTp can code for a protein comprising 27 additional amino acids beyond the isoleucine residue occupying position 15 (PSA-EHTp1, SEQ ID NO: 154). These 27 amino acids representing the PSA-EHTp2 sequence (SEQ ID NO: 155) can be released after cleavage.
  • PSA-EHTq codes for a protein comprising one of the two reading phases corresponding to PSA-EHTq1 (SEQ ID NO: 156), or PSA-EHTq2 (SEQ ID NO: 157).
  • PSA-EHTr SEQ ID NO: 46
  • PSA-EHTr codes for a protein comprising one of the three reading phases corresponding to PSA-EHTM (SEQ ID NO: 158), PSA-EHTr2 (SEQ ID NO: 159) or PSA-EHTr3 (SEQ ID NO: 160) .
  • PSA-EHTs SEQ ID NO: 47: This isoform exhibits retention of a truncated intron 4 (between positions 4516 and 4889). It can be noted that the nucleotides at positions 54, 93 and 201-208 of SEQ ID NO: 47 correspond to C, A and TGCCGCTG, while the genbank reference indicates T, G and AG-GTGT. These differences can be explained by the existence of a polymorphism at these positions, by errors in the referenced sequence, although a mutation introduced by the polymerase cannot be excluded.
  • This isoform codes for a protein comprising one of the two reading phases corresponding to PSA-EHTs1 (SEQ ID NO: 161) or PSA-EHTs2 (SEQ ID NO: 162). The mutation at position 54 replaces in PSA-EHTs1 a leucine residue with a praline residue.
  • PSA-EHTt SEQ ID NO: 48
  • This isoform has a retention of a truncated intron 4 (between positions 4727 and 5111). It can be noted that the nucleotides at position 137 and 239 of SEQ ID NO: 48 correspond to G and A, while the genbank reference indicates A and G. These differences can be explained by the existence of a polymorphism at these positions , by errors in the referenced sequence, although a mutation introduced by the polymerase cannot be excluded.
  • This isoform codes for a protein comprising one of the two reading phases corresponding to PSA-EHTt1 (SEQ ID NO: 163) or PSA-EHTt2 (SEQ ID NO: 164).
  • PSA-EHTu SEQ ID NO: 49
  • PSA-EHTu codes for a protein comprising one of the three reading phases corresponding to PSA-EHTu1 (SEQ ID NO: 165), PSA-EHTu2 (SEQ ID NO: 166) or PSA-EHTu3 (SEQ ID NO: 167) .
  • Mutation 48 replaces the alanine residue with a valine residue in PSA-EHTU2.
  • PSA and KLK2 variants described in this invention were established using a micro-array comprising oligonucleotides capable of hybridizing specifically with these variants. Based on their sequences, the PSA and klk2 splicing variants come from events of different natures ( Figure 1). • “exon skipping”: the specific oligonucleotide (eg, discriminant) is drawn to be complementary to the sequence created by the junction exon1-exon3
  • the discriminating oligonucleotide is designed to be complementary to (ie, placed on) one or the other of these new junctions.
  • oligonucleotides were used to characterize each alternative splicing event (see Figure 2).
  • An oligonucleotide is specific for the exon eliminated and allows the quantification of the long form.
  • a second oligonucleotide is specific for one of the adjacent exons not involved in splicing and makes it possible to quantify the long and short forms of RNA.
  • three oligonucleotides are specific for junctions; among them, one is specific to the new sequence generated after splicing and makes it possible to quantify the spliced shape. It is understood that other combinations of oligonucleotides can be envisaged, in particular the use of one or two oligonucleotides only.
  • oligonucleotides Given that the o probes are shorter than the conventionally used PCR product probes, it is necessary to verify that these probes do not hybridize in an aspecific manner other genes than that for which they were designed . In addition, it is essential to ensure that the oligonucleotides do not have secondary structures which could interfere with their hybridization capacity. In general, it is preferable to have a homogeneous thermodynamic profile on the chip for all of the oligos generated, namely the Tm (65 ° C) and the length (24-25 seas). During their synthesis, the oligonucleotides are also modified in 5 ′ by an NH 2 -C6 group promoting their flexibility and making it possible to establish a covalent bond with the polymer constituting the coating of the glass slide.
  • junction oligonucleotides are ideally centered on the junctions, but we have also considered the possibilities of oligonucleotides shifted on the junction.
  • -% GC 40% to 60% for 24 seas and 30 seas, 30% to 60% for 40 seas.
  • FIG. 4 represents the results obtained on two of the clones corresponding to different genes.
  • This experiment was carried out with the aim of verifying the specificity of hybridization of our oligonucleotides.
  • Drosophila RNA by in vitro transcription in which we have introduced a counterexogen of Arabidopsis thaliana which will be used to calibrate the scanner at the time of reading the slides.
  • the labeled isoforms (5 ng per isoforms) are then diluted in the Drosophila cRNA which creates a complex environment allowing us to verify the specificity of the hybridization knowing that the Drosophila RNA does not contain the sequence allowing the hybridization of the target (bioinformatics analysis).
  • the slide was read in the 2 channels, that of Cy3 and Cy5. The fluorescence intensity is measured on each spot and the values are normalized by calculating the median.
  • Each oligonucleotide is spotted in quadruplet.
  • the oligonucleotides corresponding to exon 2, at junctions 1-2 and 2-3 have been drawn to hybridize only the long form, this is why they appear in red on the image generated by QuantArray.
  • the specific oligonucleotides of the junction 1-3 are supposed to hybridize only the short forms, they actually appear in green. Since an equimolar mixture of long and short isoforms was used, the superimposition of the two images gives orange spots. (Similar experiments were carried out to determine the sensitivity of our chip by diluting the isoforms up to 26 pg).
  • oligonucleotides of 24 and 25 seas have been designed to make the microarray. These oligonucleotides were taken up at a concentration of 25 ⁇ M in a 150 mM sodium phosphate buffer. The oligonucleotides were then deposited on glass slides (Codelink, Amersham), then these slides are incubated in a saturated NaCl chamber for 16 h. The unused reactive sites will then be blocked using a 50 mM ethanolamine solution, 0.1 M Tris, 0.1% SDS at pH 9, they are then washed in a 4xSSC / 0.1% SDS solution.
  • the targets are hybridized in the 5X SSC buffer, 0.1% SDS, 0.1 mg / ml salmon sperm DNA, at a temperature of 50 ° C. for 16 h. They are then washed by increasing the stringency of the baths: 4X SSC to eliminate the cover slip 2X SSC / 0.1% SDS for 5 min at 50 ° C 0.2X SSC for 5 minutes at room temperature 0.1X SSC for 5 minutes at room temperature
  • the first step is to transfer mRNA in the presence of oligodT using Superscript II.
  • RnaseH will degrade the RNA used as a template and leave primers which will be used by DNA polymerase I for the synthesis of the second strand of cDNA.
  • the synthesized fragments will be assembled by DNA ligase.
  • T7 DNA polymerase it will amplify the strand corresponding to the messenger sequence and synthesize cRNA molecules which will hybridize to probes of complementary sequence (sense of mRNA).
  • FIG. 8 represents the superposition of the two images obtained for one of the patients.
  • the quality of the fluorescence signal is good, the intensities are generally greater than 1500.
  • the slides were read in the 2 channels and the fluorescence intensities were normalized in GeneTraffic according to the global intensity method.
  • the slides were read in the 2 channels and the fluorescence intensities were normalized in GeneTraffic according to the global intensity method.
  • Tables 3, 4 and 5 group together the hybridization signals obtained on the oligonucleotide microarray from healthy tissues (Table 3), from lines cells (Table 4) and tissues from patients with prostate cancer (Table 5). Values greater than twice the value of background noise representing significant hybridization are shown. Values less than twice the background noise are represented by #NA. It then appears that all the discriminating oligonucleotides except the oligonucleotides SEQ ID NO: 184, 215 and 220 produce significant signals in at least one of the systems studied. The expression of the isoforms described in the present invention is therefore confirmed by this approach. It should also be noted that the PSA-EHT 023 isoform which is associated with the oligonucleotide SEQ ID NO: 184 could be detected by a more sensitive PCR approach (see chapter D below).
  • a junction PCR technique was used to reveal the existence of certain isoforms. The principle is based on the specific amplification of the isoforms using oligonucleotides designated specifically on the new junction resulting from the alternative splicing already described. These amplifications are carried out on RNAs originating from benign areas and from tumor areas of prostates of the same patients, as well as on plasmid controls.
  • the results of the PCR amplifications are presented in FIG. 13.
  • the arrow represents the band of the expected size.
  • the plasmid with the cloned isoform serves as a positive amplification control.
  • this technique also makes it possible to highlight the presence of certain isoforms in prostate tissue.
  • the PCR approach notably revealed the expression of PSA-EHT012.
  • Two rabbits were immunized with 200 micrograms of coupled peptide.
  • the first injection was made with complete Freunds 'adjuvant, while successive injections were made with incomplete Freunds' adjuvant.
  • a standard protocol was used comprising injections on days 0, 14, 28 and 56 and collections of sera on days 0, 38 and 66. The final bleeding took place on day 87.
  • the change in titer in the sera was was performed by ELISA test ( Figure 15).
  • the antigens, synthetic peptides or KLH were applied to the wells of the ELISA plates (100 nanograms in PBS at 4 ° C for 16 hours).
  • the extracts were quantified by the
  • the PSA and KLK2 variants are then detected by incubation of the membrane with a polyclonal antibody produced specifically (see previous chapter). After washing, the membrane is incubated with a secondary anti-immunoglobulin antibody labeled with HRP peroxidase (dilution 1/5000). The bands are then visualized by ECL detection (Amersham).
  • This antibody was generated against a junction epitope corresponding to PSA-EHT021 (expected size 20 kD).
  • Three bands of molecular weights of approximately 22, 25 and 40 kD are observed from prostate tissue (Figure 17).
  • the lower molecular weight band could correspond to PSA-EHT021.
  • the 25 kD band could correspond to a variant already described and presenting one of the two splicing events associated with PSA-EHT021 (Tanaka et al, 2000).
  • CD CO ⁇ r OO LO CO 00 CM C CO o ⁇ r • co M ⁇ f 3; co CM ⁇ : ⁇ :; : CO - ⁇ o C ⁇ C c 2: 5; N tO ZC _ ° ZZZZ.
  • T- 00 LO o ⁇ ": N- 00 co: ⁇ ; C Z ⁇ ⁇ Z ⁇ Z Z Z ⁇ O Z CM t- CO ⁇ ; ⁇ -î - ⁇
  • T- CM c ⁇ c ⁇ c ⁇ ⁇ ⁇ o
  • T- tt 1 * CM CM CM -Sf * - tt ⁇ CM C ⁇ CM ⁇ ⁇ ⁇ - T- tt tt ⁇ Ffc fl ⁇ ⁇ ⁇ ⁇ Ht ⁇ O ⁇

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

La présente invention concerne le domaine de la biologie, de la génétique et de la médecine. Elle concerne notamment de nouvelles méthodes pour la détection, la caractérisation et/ou le traitement de pathologies cancéreuses, notamment du cancer de la prostate. L'invention concerne également des méthodes pour l'identification ou le criblage de composés actifs dans ces pathologies. L'invention concerne également les composés, gènes, cellules, plasmides ou compositions utiles pour la mise en œuvre des méthodes évoquées ci-dessus. L'invention décrit notamment le rôle de variants de la kallikréine-2 humaine et de la kallikréine-3 humaine, aussi connue sous le nom de PSA, dans ces pathologies et leurs utilisations comme cibles thérapeutiques, diagnostiques ou expérimentales.

Description

Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
La présente invention concerne le domaine de la biologie, de la génétique et de la médecine. Elle concerne notamment de nouvelles séquences nucléotidiques associées à des événements d'épissage alternatif des gènes correspondant à l'antigène PSA (antigène spécifique de la prostate ou KLK3) et à la kallikréine- 2 (KLK2). L'invention concerne également des méthodes pour la détection de la présence ou pour la détermination du niveau d'expression de ces acides nucléiques ou des protéines correspondantes dans des échantillons biologiques, ainsi que des méthodes de sélection de molécules capables de moduler leur activité ou leur expression.
L'invention est particulièrement adaptée au dépistage, au prognostique, à la classification ou au suivi de cancers, notamment de la prostate et notamment dans la différentiation entre le cancer de la prostate et l'hyperplasie bénigne de la prostate (BPH), ainsi qu'au développement de nouvelles approches thérapeutiques de ces maladies.
Les kallikréines correspondent à un groupe de protéines dont l'activité protéasique permet la modification post-traductionnelle de précurseurs protéiques vers des formes biologiquement actives. Certains membres de cette famille, la kallikréine-3, aussi connue sous la dénomination de PSA (« prostate- specific antigen » ou antigène spécifique de la prostate), et plus récemment, la kallikréine-2 sont considérés comme les meilleurs marqueurs disponibles utilisables dans la détection, le diagnostique et le suivi du cancer de la prostate.
L'utilisation de tests mesurant la quantité de PSA dans le sang a permis de diagnostiquer un nombre croissant de patients atteints de cancer de la prostate
(Pca). Cependant, comme la PSA est également produite par les cellules épithéliales prostatiques non cancéreuses, il est souvent difficile de différencier les patients atteints de cancers de la prostate de ceux présentant un symptôme bénin hyperplasique (BPH). Dans le sérum, la PSA existe sous forme libre, non complexée et sous forme complexée, notamment à l'alpha-antichymotrypsine. P T/FR03/00833
La mesure de ces différentes formes et de leurs rapports permet d'améliorer le facteur différentiateur entre Pca et BPH.
L'épissage alternatif constitue un mécanisme de régulation de l'expression des gènes permettant de générer de la diversité fonctionnelle à partir d'une information génétique limitée. Ce mécanisme, fortement régulé, peut subir des altérations au cours du développement de pathologies humaines. Ainsi, la dérégulation de la machinerie d'épissage dans les cancers peut permettre l'expression d'isoformes ou de variants spécifiquement exprimés dans certaines tumeurs humaines. Ces isoformes pourront avoir un rôle fonctionnel déterminant dans le développement ou le maintien de l'état pathologique. L'expression spécifique de telles isoformes constitue un événement de choix pour une approche rationnelle et ciblée de développement de médicaments et/ou de méthodes de diagnostique. Une technologie de profilage de l'expression génétique (DATAS) a été récemment développée pour identifier de façon systématique les gènes et, à l'intérieur de ces gènes, les domaines susceptibles d'être altérés par épissage alternatif (WO99/46403).
La présente invention décrit à présent de nouveaux événements génétiques liés à des epissages alternatifs des gènes PSA et KLK2 dans des tissus prostatiques. La présente invention découle notamment de la construction d'un répertoire des altérations d'épissage associées à des tissus tumoraux de la prostate, et de l'identifications d'altérations structurales dans les gènes PSA et KLK2 ou dans les ARNm correspondants. La présente invention fournit ainsi de nouvelles approches thérapeutiques et diagnostiques des cancers, notamment du cancer de la prostate.
Plus particulièrement, une analyse qualitative différentielle a été effectuée à partir d'ARN extraits d'échantillons de tissus prostatiques provenant de zones tumorale et non tumorale de patients atteints de carcinomes de la prostate. Cette analyse a été effectuée par criblage différentiel qualitatif grâce à la mise en œuvre de la technique DATAS (décrite dans la demande n° WO99/46403) T FR03/00833
qui présente des avantages inégalés. L'application de la technologie DATAS sur des ARNs issus de tissus prostatiques tumoraux et non-tumoraux a permis d'isoler divers fragments d'ADNc dérivés des ARNm de la kalikreine 2 et de la kalikreine 3 (PSA) humaines. Ces résultats ont ensuite permis d'identifier un certain nombre d'ADNc révélateurs d'événements liés à des epissages alternatifs.
La présente invention décrit donc des événements moléculaires originaux qui peuvent aboutir à l'expression spécifique d'isoformes ou de variants de KLK3 (PSA) et de KLK2 dans les tissus prostatiques et plus spécifiquement dans les tissus cancéreux ou les tissus associés à une hyperplasie bénigne (BPH). La présente invention fournit des données moléculaires qui justifient l'utilisation d'un ou de plusieurs de ces variants comme cibles thérapeutiques et diagnostiques nouvelles et utilisables avantageusement dans le diagnostic et le traitement des cancers et notamment du cancer de la prostate.
Un premier aspect de la présente demande concerne donc des variants de PSA et KLK2 humains, notamment des variants d'épissage. L'invention concerne les acides nucléiques correspondant à ces variants ou aux altérations spécifiques qu'ils présentent, ainsi que les protéines (ou polypeptides ou domaines protéiques) codés.
Un autre aspect de la présente demande concerne des méthodes et outils pour détecter la présence de ces variants ou altérations dans des échantillons biologiques (sang, plasma, urine, sérum, salive, biopsies ou cultures cellulaires, etc.), ou pour déterminer leur(s) quantité(s) ou proportion(s) respective(s). De tels outils comprennent notamment des sondes ou amorces nucléiques, des anticorps ou autres ligands spécifiques, des kits, supports, puces, etc. Les méthodes de détection peuvent inclure les méthodes d'hybridation, de PCR, de chromatographie, d'immunologie, etc. Ces méthodes sont particulièrement adaptées à la détection, la caractérisation, le suivi de la progression ou de 03 00833
l'efficacité d'un traitement de cancers, notamment du cancer de la prostate, ou à la détermination d'une prédisposition.
Un autre aspect de la présente demande concerne des outils et méthodes pour la production de composés actifs sur les variants décrits, c'est-à-dire capables de moduler leur expression ou leur activité. Ces outils et méthodes incluent notamment des acides nucléiques, des vecteurs, des cellules recombinantes (ou préparations dérivées de telles cellules), des tests de liaison, etc. L'invention vise également les composés ainsi identifiés ou produits, des compositions pharmaceutiques les contenant, ainsi que leurs utilisations thérapeutiques.
La présente invention est ainsi applicable au diagnostic et au développement de stratégies thérapeutiques de cancers, notamment de la prostate.
Variants de KLK2 et KLK3
Un premier aspect de la présente demande concerne donc des variants de KLK- 2 et KLK-3 (PSA), ou des altérations génétiques particulières affectant ces gènes (ou les ARN ou protéines correspondants). Un objet plus particulier de l'invention concerne des acides nucléiques correspondant à ces variants de PSA et KLK2 humains ou aux altérations spécifiques qu'ils présentent, ainsi que les protéines (ou polypeptides ou domaines protéiques) codées.
Un certain nombre d'isoformes des gènes KLK2 et KLK3 ont été décrites dans l'art antérieur.
K-LM correspond à la rétention totale de l'intron 1 de KLK2 (numéro d'accès Genbank : AF336106) (David et.al (2002)). David et.al précisent que l'expression de l'ARN messager de K-LM est restreinte à l'épithelium prostatique et que la protéine K-LM peut être détectée par immunohistochimie dans les cellules épithéliales sécrétrices (malgré aucune donnée indiquant la spécificité de l'anticorps utilisé). Aucune donnée indique la présence de K-LM dans des T FR03/00833
sérums humains. K-LM semble être détecté dans deux échantillons de fluides séminaux et dans un échantillon de tissus correspondants à des hyperplasies bénignes de la prostate. La forme endogène de K-LM n'a pu être détectée dans des lignées prostatiques (avec ou sans stimulation androgénique). Aucun résultat n'est montré concernant une expression préférentielle ou différentielle de K-LM dans des tissus ou sérums issus de patients atteints d'un cancer de la prostate.
Un variant de KLK2 utilisant un site alternatif entre l'exon 4 et l'exon 5 correspondant ainsi à une phase ouverte de lecture de 669 paires de bases au lieu de 783 a été décrit (numéro d'accès Genbank : S39329) (Riegman et.al (1991)).
Trois variants possédant des régions 3'UTR plus importantes ont été décrites (Liu et.al (1999)) (numéro d'accès Genbank : AF188745-7). Un de ces variants aurait une phase ouverte de lecture équivalente à KLK2 sauvage, un deuxième variant aurait une phase ouverte de lecture correspondant à celle du variant décrit précédemment (Riegman et.al (1991)). Un de ces variants présente une délétion de 13 nucléotides entre l'exon 3 et l'exon 4 codant ainsi pour une protéine tronquée de 97 acides aminés dans sa partie carboxy-terminale. Les auteurs présentent quelques données d'expression par RT-PCR mais n'offrent aucun résultat concernant la ou les protéines correspondantes.
PSA-LM correspond à la rétention totale de l'intron 1 de PSA (David et.al (2002)) (numéro d'accès Genbank : AF335477, AF335478, AJ459784). David et.al précisent que l'expression de l'ARN messager de PSA-LM est restreinte à l'épithelium prostatique et que la protéine PSA-LM peut être détectée par immunohistochimie dans les cellules épithéliales sécrétrices. Aucune donnée indique la présence de PSA-LM dans des sérums humains, fluides séminaux ou tissus correspondants à des hyperplasies bénignes de la prostate. La forme endogène de PSA-LM n'a pu être détectée dans des lignées prostatiques (avec ou sans stimulation androgénique). Aucun résultat n'est montré concernant une 03 00833
expression préférentielle ou différentielle de PSA-LM dans des tissus ou sérums issus de patients atteints d'un cancer de la prostate.
Un variant de PSA possédant une délétion de 129 nucléotide dans l'exon 3 a été décrit (Tanaka et.al (2000)), appelé également PSA-RP3 (Heuzé-Vourc'h et.al (2003)). Tanaka et.al présente des données qualitatives d'expression de ce variant par RT-PCR dans des tissus prostatiques malins et bénins. L'expression de la protéine correspondante n'a pas été caractérisée.
Deux variants de PSA, correspondant à une rétention totale de l'intron 3 (PA 424) et à une rétention partielle des derniers 442 nucléotides de l'intron 4 (PA 525) ont été décrits (numéros d'accès Genbank : M21896, M21897) (Riegman et.al (1988)). PA 424 pourrait se traduire en une protéine mature de 156 acides aminés. Les 16 derniers acides aminés seraient différents de PSA sauvage. PA 525 pourrait se traduire en une protéine mature de 214 acides aminés. Les 28 derniers acides aminés seraient différents de PSA sauvage. Riegman et.al présentent aucune donnée complémentaire d'expression différentiatrice des ARNs messagers ou des protéines.
PA 424 et PA 525 décrits ci-dessus sont très proches de PSA-RP1 et PSA-RP2 qui ont été isolés ultérieurement (numéros d'accès Genbank : AJ310937, AJ310938) (Heuzé et.al (1999) ; Heuzé-Vourc'h et.al (2001 )). Bien que des lignées cellulaires de type COS transfectées avec les cDNAs de PSA-RP1 et de PSA-RP2 peuvent exprimer et sécréter les protéines correspondantes, Heuzé et.al ne montrent aucun résultat démontrant l'expression des protéines PSA- RP1 et PSA-RP2 endogènes dans des tissus prostatiques.
Un autre groupe (Meng et.al (2002)) a caractérisé l'expression de l'ARN messager de PSA-RP1 par Northern et hybridization in situ. Aucune différence d'expression n'a pu être observée entre des tissus microdissectes sains et tumoraux. Un anticorps spécifique de PSA-RP1 a permis de détecter par immunohistochimie l'expression de la protéine PSA-RP1 dans le cytoplasme des cellules épithélilales à partir de coupes de tissus prostatiques sains et tumoraux.
Un variant de PSA correspondant à une rétention de la partie 5' de l'intron 4, PSA-RP5, a été soumis à Genbank (numéro d'accès : AJ512346)
Un variant de PSA comportant une délétion dans l'exon 3, PSA-RP4, a été soumis à Genbank ( numéro d'accès : AJ459782).
La présente demande décrit maintenant l'existence de formes différentes des gènes PSA et KLK2, et leur corrélation à des situations pathologiques. Ces isoformes ont été identifiées à partir d'échantillons tumoraux. La description des ADNc et des protéines/polypeptides codés par ces ADNc est indiquée ci- dessous. Les séquences complètes sont fournies dans la Liste de Séquences annexée à la présente demande. Les caractéristiques principales des variants spécifiques selon l'invention sont décrites dans les exemples.
Un premier objet de l'invention concerne des acides nucléiques comprenant la séquence des variants de PSA et KLK2 décrits dans la présente demande, ou une partie spécifique de celle-ci.
Un autre objet de l'invention concerne des acides nucléiques spécifiques des altérations génétiques portées par les variants de PSA et KLK2 décrits dans la présente demande. De tels acides nucléiques peuvent être notamment complémentaires de régions mutées, de domaines introniques retenus ou de jonctions nouvellement créées par des délétions.
Un autre objet de l'invention concerne un acide nucléique comprenant tout ou partie d'une séquence dérivée des ARNs messagers (ou des ADNc) de KLK2- EHT002 à KLK2-EHT011 et de PSA-EHT001 à PSA-EHT027 ou de KLK2-EHTb à KLK2-EHTI et de PSA-EHTa à PSA-EHTu ou toute combinaison de ces variants ainsi que leurs utilisations pour la mise en œuvre d'une méthode de diagnostic, de détection ou de suivi de cancers, notamment du cancer de la prostate et plus particulièrement de la forme bénigne de ce dernier, BPH.
Un autre objet de l'invention réside dans tout acide nucléique caractérisé en ce qu'il comprend une séquence choisie parmi : a) les séquences SEQ ID NOs : 1 à 49, b) un variant des séquences SEQ ID NOs : 1 à 49 résultant de la dégénérescence du code génétique, c) le brin complémentaire des séquences SEQ ID NOs : 1 à 49, et d) un fragment spécifique des séquences a) à c).
Le terme fragment ou partie « spécifique » désigne un fragment caractéristique des variants considérés, typiquement un fragment portant au moins une altération génétique caractéristique des variants considérés. De tels fragments spécifiques se distinguent donc de la séquence sauvage par la présence d'une caractéristique structurale propre (e.g., mutation, nouvelle jonction, rétention d'intron, délétion d'une séquence, codon stop, nouvelle séquence résultant d'un décalage du cadre de lecture, etc.) résultant d'un événement d'altération mis en évidence par les demandeurs chez des patients. Cette caractéristique structurale propre est également désignée par l'expression « séquence cible ».
Des fragments spécifiques selon l'invention comprennent donc au moins une séquence cible telle que définie ci-avant. Des fragments préférés comportent au moins 5 nucléotides consécutifs de la séquence considérée, de préférence au moins 8, plus préférentiellement au moins 12. Des fragments peuvent comprendre jusqu'à 50, 75 ou 100 nucléotides, voire plus.
Au sens de l'invention, les acides nucléiques peuvent être des ADN, choisis de préférence parmi les ADNc et les ADNg, ou des ARN. Il peut s'agir d'acides nucléiques synthétiques ou semi-synthétiques, de fragments PCR, d'oligonucléotides, de régions double- ou simple-brin, etc. Les acides nucléiques T FR03/00833
peuvent être produits par synthèse, par voie recombinante, par clonage, par assemblage(s) génétique(s), mutagénèse, etc., ou une combinaison de ces techniques.
Les acides nucléiques peuvent être utilisés pour produire un variant de PSA ou KLK-2 de l'invention in vitro, ex vivo, in vivo ou dans un système de transcription acellulaire. Ils peuvent également être utilisés pour la fabrication de molécules antisens ou interférentes (RNAi), capables de réduire l'expression ou la traduction des ARNm correspondants dans une cellule. Ils peuvent aussi servir à la production de sondes, notamment marquées, permettant par des réactions d'hybridation de mettre en évidence de manière spécifique la présence d'une forme mutée de PSA ou KLK-2 de l'invention dans un échantillon. Ils peuvent encore servir à la production d'amorces nucléiques, utiles à l'amplification d'un variant de PSA ou KLK-2 (ou d'une séquence cible d'un tel variant) dans un échantillon, notamment dans un but de dépistage ou de diagnostic.
A cet égard, un autre objet de l'invention concerne une sonde nucléique caractérisée en ce qu'elle permet la détection d'un acide nucléique tel que défini ci-avant, typiquement par hybridation sélective à partir d'une population d'acides nucléiques test. Généralement, la sonde comprend la séquence d'un acide nucléique tel que défini ci-avant ou une partie (spécifique) de la séquence d'un tel acide nucléique. La partie spécifique est préférentiellement caractéristique d'un variant tel que décrit ci-avant, notamment une partie contenant une altération associée au cancer de la prostate. Elle comprend typiquement de 10 à 1000 nucléotides, de préférence de 50 à 800, et est généralement simple-brin. Un exemple particulier de sonde est représenté par un oligonucléotide spécifique et complémentaire d'une région au moins d'un acide nucléique tel que défini ci-avant. L'oligonucléotide est typiquement simple-brin, et comporte généralement de 10 à 100 bases. Des exemples spécifiques d'oligonucléotides de l'invention sont fournis dans le Tableau 1. Les oligonucléotides et/ou les sondes nucléiques selon l'invention peuvent être marquées, par exemple au moyen de marqueurs radioactifs, enzymatiques, fluorescents, luminescents, etc. Un autre objet de l'invention concerne une amorce nucléique, permettant l'amplification (sélective) d'un acide nucléique tel que défini ci-avant ou d'une partie (spécifique) d'un tel acide nucléique. La partie amplifiée comporte préférentiellement une altération caractéristique d'un des variants décrits ci- avant, notamment d'une altération associée au cancer de la prostate. Une amorce selon l'invention est typiquement simple-brin, et avantageusement composée de 3 à 50 bases, de préférence de 3 à 40 et encore plus préférentiellement de 3 à 35 bases. Une amorce particulière est complémentaire d'une région au moins du gène PSA ou KLK-2, ou de l'ARN correspondant.
Un mode de réalisation préféré réside dans une amorce constituée d'un acide nucléique simple-brin comprenant de 3 à 50 nucléotides complémentaires d'une partie au moins de l'une des séquences SEQ ID NOs : 1 à 49 ou de leur brin complémentaire. Des exemples de telles amorces nucléiques sont fournies dans la section expérimentale.
L'invention concerne également un couple d'amorces comprenant une séquence sens et une séquence inverse, caractérisé en ce que les amorces de ladite paire s'hybrident avec une région d'un acide nucléique tel que défini ci- avant et permettent l'amplification d'au moins une portion de cet acide nucléique.
Des couples d'amorces particuliers selon l'invention sont fournis dans le Tableau 2.
Un autre objet de la présente demande concerne tout vecteur comprenant un acide nucléique tel que défini ci-avant. Il peut s'agir de plasmides, cosmides, épisomes, chromosomes artificiels, virus, phages, etc. On peut citer divers plasmides commerciaux tels que pUC, pcDNA, pBR, etc. Parmi les vecteurs viraux, on peut citer les rétrovirus, adénovirus, AAV, herpès virus, etc. Un autre objet de l'invention concerne les cellules recombinantes comprenant un acide nucléique ou un vecteur tels que définis ci-avant. Les cellules peuvent être procaryotes ou eucaryotes. Parmi les cellules procaryotes on peut citer notamment les bactéries telles que E. coli. Parmi les cellules eucaryotes, on peut mentionner les cellules de levure ou les cellules de mammifères, d'insectes ou de plantes. Il peut s'agir de cultures primaires ou de lignées. On peut citer les cellules COS, CHO, 3T3, HeLa, etc.
Un autre objet de l'invention concerne une composition comprenant un acide nucléique tel que défini ci-avant immobilisé sur un support. L'invention concerne notamment des compositions comprenant une pluralité d'acides nucléiques en mélange, sous forme soluble ou immobilisée à un support, la composition comprenant au moins un acide nucléique tel que défini ci-avant.
Un autre objet de l'invention concerne un (produit comprenant un) support sur lequel un ou plusieurs acides nucléiques tels que définis ci-avant sont immobilisés. Le support peut être solide, plan ou non, régulier ou non, comme par exemple du nylon, verre, plastique, métal, fibre, céramique, silice, polymère, etc., ou tout autre matériau compatible. Les acides nucléique sont préférentiellement immobilisés par une extrémité, dans des conditions laissant la molécule accessible pour une réaction d'hybridation. Les acides nucléiques peuvent être arrangés de manière précise sur le support, et déposés en plusieurs exemplaires.
Dans une variante particulière, on utilise un ou plusieurs oligonucléotides spécifiques pour caractériser chaque événement d'épissage alternatif (voir figure 9). On peut notamment utiliser un oligonucléotide spécifique d'un exon éliminé, permettant la quantification de la forme longue, et/ou un oligonucléotide spécifique de l'un des exons adjacents non impliqué dans l'épissage, permettant de quantifier les formes longues et courtes de l'ARN, et/ou un ou plusieurs (e.g. trois) oligonucléotides spécifiques des jonctions, dont l'un est spécifique de la nouvelle séquence générée après épissage, permettant de quantifier la forme épissée. Il est entendu que d'autres combinaisons d'oligonucléotides peuvent être envisagées, notamment l'emploi d'un seul ou de deux oligonucléotides seulement. Concernant plus précisément les oligonucléotides de jonction, ils sont idéalement centrés sur les jonctions, même si des oligonucléotides décalés sur la jonction peuvent également être mis en œuvre. Avantageusement, on utilise des oligonucléotides ne présentant pas de structures secondaires qui pourraient interférer avec leur capacité d'hybridation. D'une manière générale, il est préférable d'avoir sur la puce un profil thermodynamique homogène pour l'ensemble des oligos générés, à savoir le Tm (65°C) et la longueur (24-25 mers). Par ailleurs, au cours de leur synthèse, les oligonucléotides peuvent être modifiés en 5' par un groupement NH2-C6 favorisant leur flexibilité et permettant d'établir une liaison covalente avec le polymère constituant le revêtement du support.
Un autre objet de l'invention concerne un (produit comprenant un) support sur lequel une ou plusieurs cellules recombinantes telles que définies ci-avant sont immobilisées ou cultivées. Le support peut être solide, plan ou non, régulier ou non, comme par exemple du nylon, verre, plastique, métal, fibre, céramique, silice, polymère, etc., ou tout autre matériau compatible. Les cellules sont par exemple réparties dans des puits d'une microplaque ou immobilisées dans un gel ou sur un support adapté.
L'invention concerne également les peptides et séquences protéiques codés par tout ou partie des isoformes KLK2-EHT002 à KLK2-EHT011 et PSA-EHT001 à PSA-EHT027 , ou KLK2-EHTb à KLK2-EHTI et PSA-EHTa à PSA-EHTu notamment celles décrites parmi les séquences SEQ ID NO : 50 à 167 ainsi que leurs utilisations pour la mise en œuvre d'une méthode de diagnostic, de détection ou de suivi de cancers, notamment du cancer de la prostate et plus particulièrement de la forme bénigne de ce dernier, BPH. Un objet particulier de la présente demande concerne un polypeptide comprenant tout ou une partie spécifique d'une séquence choisie parmi SEQ ID NOs : 50 à 167. Des polypeptides particuliers sont composés ou comprennent une séquence ou une partie de séquence créée par l'altération du gène ou du messager correspondant. Au sens de l'invention, le terme « partie » désigne préférentiellement au moins 5 résidus contigus, de préférence au moins 8, plus préférentiellement au moins 10, encore plus préférentiellement au moins 15. Comme expliqué ci-avant, les altération d'épissage du gène PSA ou KLK-2 conduisent à la production de protéines mutées, comprenant des séquences nouvellement créées (séquences cibles). Il peut s'agir de séquences nouvelles (e.g., traduction décalée, insertions), de jonctions nouvelles, etc. Des peptides particuliers de l'invention correspondent ou comprennent tout ou une partie spécifique des séquences SEQ ID Nos : 53, 56, 59, 62, 65, 67 (résidus 146- 150), 70, 71 , 73, 76, 79, 81 , 93, 95, 98, 106, 108, 110, 112, 117, 119 (résidus 66-70 ou 74-79), 121 (résidus 117-121), 123 (résidus 25-29, 51-55 ou 105-111 ), 126, 131 , 133, 134, 135 (résidus 64-68) et 155.
Un autre objet de l'invention concerne un (produit comprenant un) support sur lequel un ou plusieurs polypeptides tels que définis ci-avant sont immobilisés. Le support peut être solide, plan ou non, régulier ou non, comme par exemple du nylon, verre, plastique, métal, fibre, céramique, silice, polymère, etc., ou tout autre matériau compatible. Les polypeptides sont préférentiellement immobilisés par une extrémité, dans des conditions laissant la molécule accessible pour une réaction d'interaction avec un ligand spécifique, tel qu'un anticorps. Les polypeptides peuvent être arrangés de manière précise sur le support, et déposés en plusieurs exemplaires.
Des techniques d'immobilisation de matériels (tels que acides nucléiques, polypeptides, anticorps, etc.) sur des supports ont été décrites dans la littérature, et notamment dans les demandes ou brevets n° EP619 321 , WO91/08307, US4,925,785 et GB2,197,720. Ligands spécifiques
L'invention concerne par ailleurs des ligands spécifiques, de préférence peptidiques, en particulier des anticorps (polyclonaux, monoclonaux) et leurs fragments, spécifiques des régions peptidiques caractéristiques des protéines codées par KLK2-EHT002-011 et de PSA-EHT001-027 ou par KLK2-EHTb à KLK2-EHTI et PSA-EHTa à PSA-EHTu (codées par les domaines introniques retenus ou par les jonctions spécifiquement créées) et leurs utilisations pour la détection, le diagnostique ou le suivi de cancers et notamment du cancer de la prostate. En particulier, il pourra s'agir de diagnostiquer la forme BPH et de la différencier du carcinome de la prostate.
A cet égard, un autre objet de l'invention concerne tout anticorps capable de se lier, de préférence de manière sélective, à un polypeptide tel que défini ci- dessus. L'anticorps peut être polyclonal ou monoclonal. Il peut également s'agir de fragments et dérivés d'anticorps présentant substantiellement la même spécificité antigénique, en particulier des fragments d'anticorps (e.g., Fab, Fab'2, CDRs), d'anticorps humanisés, polyfonctionnels, monocaténaires (ScFv), etc. Les anticorps peuvent être produits à l'aide de méthodes conventionnelles, comprenant l'immunisation d'un animal et la récupération de son sérum (polyclonal) ou de cellules spléniques (de manière à produire des hybridomes par fusion avec des lignées cellulaires appropriées).
Des méthodes de production d'anticorps polyclonaux à partir d'espèces variées sont décrites dans l'art antérieur. Typiquement, l'antigène est combiné avec un adjuvant (e. g., Freund's adjuvant) et administré à un animal, typiquement par injection sous-cutanée. Des injections répétées peuvent être réalisées. Les échantillons sanguins sont collectés et l'immunoglobuline ou le sérum sont séparés. Les méthodes classiques de production d'anticorps monoclonaux comprennent l'immunisation d'un animal avec un antigène, suivie de la récupération des cellules spléniques qui sont ensuite fusionnées avec des cellules immortalisées, telles que des cellules de myélome. Les hybridomes résultant produisent des anticorps monoclonaux et peuvent être sélectionnés par dilutions limites de manière à isoler les clones individuels. Les fragments Fab ou F(ab')2 peuvent être produits par digestion à l'aide d'une protéase selon les techniques conventionnelles.
L'invention concerne également une méthode de production d'anticorps, comprenant l'injection d'un polypeptide tel que défini ci-avant ou d'un fragment immunogène de ce dernier à un animal non humain et la récupération des anticorps ou des cellules productrices d'anticorps. Les anticorps préférés sont des anticorps spécifiques des isoformes de PSA et KLK-2 décrites dans la présente demande, et essentiellement non-spécifique des formes sauvages.
L'invention concerne des hybridomes produisant les anticorps monoclonaux décrits ci-dessus et leur utilisation pour produire lesdits anticorps.
Les anticorps peuvent être couplés à des fragments hétérologues telles que des toxines, des marqueurs, des médicaments ou tout autre agent thérapeutique, de façon covalente ou non, soit directement, soit par l'intermédiaire d'agents de couplage. Les marqueurs peuvent être choisis parmi les radio-marqueurs, des enzymes, des agents fluorescents, des particules magnétiques, etc.
Les anticorps de l'invention peuvent être utilisés comme agents de criblage ou pour détecter ou quantifier la présence ou la quantité d'isoformes de PSA ou KLK-2 dans des échantillons collectés à partir d'un sujet, typiquement, un fluide biologique provenant d'un mammifère, par exemple d'un être humain.
Un autre objet de l'invention concerne un (produit comprenant un) support sur lequel un ou plusieurs anticorps (ou fragments ou dérivés) tels que définis ci- avant sont immobilisés. Le support peut être solide, plan ou non, régulier ou non, comme par exemple du nylon, verre, plastique, métal, fibre, céramique, silice, polymère, etc., ou tout autre matériau compatible. Les anticorps sont préférentiellement immobilisés par une extrémité, dans des conditions laissant la molécule accessible pour une réaction d'interaction avec un antigène spécifique. Les anticorps peuvent être arrangés de manière précise sur le support, et déposés en plusieurs exemplaires.
Méthodes de détection/diagnostic
La présente demande décrit également de nouveaux procédés de détection d'une pathologie ou d'une prédisposition à une pathologie chez un sujet, comprenant la détermination de la présence, dans un échantillon dudit sujet, d'un acide nucléique, ou d'une altération génétique ou d'une protéine ou polypeptide tels que définis ci-avant.
La détermination peut être réalisée par différentes techniques, telles que séquençage, hybridation et/ou amplification sélectives. Des méthodes utilisables pour déterminer la présence de protéines sont basées par exemple sur des réactions immuno-enzymatiques, telles que ELISA, RIA, EIA, etc. Des techniques utilisables pour déterminer la présence de gènes ou d'ARN altérés sont par exemple la PCR, la RT-PCR, la réaction de ligation en chaîne (LCR), la technique de PCE ou TMA (« Transcriptional Mediated Amplification »), la migration sur gel, l'électrophorèse, notamment la DGGE (« denaturing gel gradient electrophoresis »), etc.
Dans le cas où une étape d'amplification est réalisée, celle-ci met préférentiellement en oeuvre une amorce ou un couple d'amorces tel que défini ci-avant.
Un objet particulier de l'invention concerne l'utilisation d'acides nucléiques complémentaires et spécifiques de fragments des gènes ou des messagers de
KLK2-EHT002-011 et de PSA-EHT001-027 ou de KLK2-EHTb à KLK2-EHTI et de PSA-EHTa à PSA-EHTu (e.g., domaines introniques retenus, jonctions P T/FR03/00833
17
spécifiquement crées, mutations particulières, etc.) pour la détection de cancers, notamment du cancer de la prostate, et plus particulièrement de sa forme bénigne, BPH. Cette détection pourra en particulier s'effectuer grâce à des puces à ADN ou à la mise en œuvre d'une PCR à partir de fluides biologiques tels que du sang (le sérum notamment ou a partir de cellules épithéliales circulantes purifiées), des urines, du fluide séminal, etc.
L'invention réside également dans la mise au point et l'utilisation de tests immunologiques contenant un ou plusieurs anticorps tels que décrits ci-dessus ou fragments de ces derniers. Ces tests permettent de détecter et/ou mesurer individuellement un variant à l'aide d'un anticorps spécifique, plusieurs variants, en parallèle, grâce aux anticorps spécifiques appropriés, ou un ou plusieurs rapports entre les isoformes telles que décrites ci-dessus ou entre lesdites isoformes et d'autres formes décrites pour kallikreine-2 et PSA.
Une méthode particulière comprend la mise en contact d'un échantillon provenant d'un sujet avec une sonde telle que définie ci-avant, et la mise en évidence d'une hybridation.
Une autre méthode particulière comprend la mise en contact d'un échantillon provenant d'un sujet avec une amorce ou une paire d'amorces telles que définies ci-avant, et la mise en évidence d'un produit d'amplification.
Une autre méthode particulière comprend la mise en contact d'un échantillon provenant d'un sujet avec un anticorps tel que défini ci-avant, et la mise en évidence d'un complexe antigène-anticorps.
Typiquement, des plusieurs tests sont réalisés en parallèle, à partir de plusieurs échantillons et/ou en utilisant plusieurs sondes, amorces et/ou anticorps. Ainsi, dans un mode particulier, le procédé de l'invention comprend la détermination, en parallèle, de la présence de plusieurs variants ou altérations génétiques tels que décrits ci-avant dans un échantillon d'un patient. Les procédés selon 0833
18
l'invention peuvent être mis en œuvre à partir d'échantillons biologiques variés, notamment de fluides biologiques (e.g., sang, plasma, urine, sérum, salive, etc.), de biopsies de tissus ou de cultures cellulaires, par exemple et, plus généralement, à partir de tout échantillon susceptible de contenir des acides nucléiques ou des protéines (ou polypeptides). L'échantillon biologique peut être traité avant la mise en œuvre du procédé, pour faciliter ou permettre l'accessibilité des polypeptides ou acides nucléiques qu'il contient. L'échantillon peut également être purifié, centrifugé, fixé, etc., éventuellement congelé ou conservé avant usage.
Dans un mode de réalisation particulier, l'invention concerne un procédé de détection de la présence d'une forme altérée de KLK-2 ou KLK-3 chez un sujet, comprenant la mise en contact, in vitro ou ex vivo, d'un échantillon dudit sujet avec une sonde, une amorce ou un ligand spécifique tels que définis ci-avant et la détermination de la formation d'un hybride, d'un produit d'amplification ou d'un complexe, respectivement, la dite formation étant indicative de la présence d'une forme altérée.
Un autre objet de l'invention réside dans un kit utilisable pour la mise en œuvre d'un procédé tel que défini ci-avant comprenant i. un couple d'amorces ou une sonde ou un anticorps tels que définis ci-avant, et ii. les réactifs nécessaires à l'amplification ou à une réaction d'hybridation ou immunologique.
L'invention réside également dans la mise au point d'une méthode permettant de détecter et/ou de mesurer des partenaires spécifiques d'un ou de plusieurs de ces variants par ajout de l'un ou de plusieurs de ces variants ou de leurs fragments dans des fluides biologiques à tester, tels que du sang (sérum notamment), des urines ou du fluide séminal. Criblage de composés actifs
Les variants spécifiques de KLK2 et de KLK3 selon l'invention ont été identifiés et isolés à partir de sujets pathologiques et représentent donc des cibles thérapeutiques particulièrement intéressantes pour le traitement des cancers et notamment du cancer de la prostate.
A cet égard, un objet particulier de l'invention réside dans des méthodes de sélection, d'identification, de caractérisation, d'optimisation ou de production de composés actifs, comprenant une étape de détermination de la capacité d'un composé test à moduler l'expression ou l'activité d'un polypeptide tel que défini ci-avant.
Les composés sont plus particulièrement sélectionnés sur la base de leur capacité à moduler la synthèse d'un polypeptide tel que défini ci-avant (c'est-à- dire notamment la production ou la maturation des ARNs correspondants, ou leur traduction) ou l'activité d'un tel polypeptide (c'est-à-dire notamment leur maturation, transport, ou leur interaction avec des cibles intra- ou extracellulaires).
Dans une variante de réalisation, la méthode comprend la mise en contact in vitro ou ex vivo d'un composé test avec un polypeptide tel que défini ci-avant ou un acide nucléique codant un tel polypeptide (e.g., gène, ADNc, ARN), et la sélection des composés se liant audit polypeptide ou acide nucléique. La liaison au polypeptide au gène ou à l'ARN correspondant peut être mesurée par différentes techniques, telles que le déplacement d'un ligand marqué, la migration sur gel, l'électrophorèse, etc. Elle peut être réalisée in vitro, par exemple en utilisant le polypeptide ou l'acide nucléique immobilisé sur un support.
Dans une autre variante de réalisation, la méthode comprend la mise en contact in vitro ou ex vivo d'un composé test avec une cellule exprimant un polypeptide tel que défini ci-avant, et la sélection ou l'identification de composés modulant l'expression ou l'activité dudit polypeptide. La modulation de l'expression peut être déterminée par dosage des ARN ou des protéines, ou au moyen d'un système rapporteur.
Les cellules utilisées peuvent être toute cellule compatible, notamment des cellules eucaryotes ou procaryotes telles que mentionnées plus haut. On utilise typiquement une cellule modifiée pour exprimer ladite molécule, notamment des cellules recombinantes. De telles cellules recombinantes peuvent être préparées par introduction d'un acide nucléique recombinant exprimant le polypeptide, ou d'un vecteur comprenant celui-ci. De telles cellules recombinantes constituent des objets particuliers de l'invention.
Le procédé peut être mis en œuvre pour sélectionner ou identifier un activateur ou un inhibiteur de l'expression ou de l'activité de l'antigène spécifique de la PSA ou de KLK-2. Les procédés de sélection peuvent être réalisés en différents formats, comme par exemple en plaques multi-puits, en testant en parallèle de multiples composés candidats.
Dans un mode de réalisation particulier, le composé est un acide nucléique antisens, capable d'inhiber l'expression des variants décrits. L'acide nucléique antisens peut comprendre tout ou partie de séquences spécifiques des variants décrits. L'anti-sens peut notamment comprendre une région complémentaire de la forme d'épissage identifiée (e.g., d'une séquence cible), et inhiber (ou réduire) sa traduction en protéine.
Selon un autre mode de réalisation, le composé est un composé chimique, d'origine naturelle ou synthétique, notamment une molécule organique ou inorganique, d'origine végétale, bactérienne, virale, animale, eucaryote, synthétique ou semi-synthétique, capable de moduler l'expression ou l'activité de l'un ou de plusieurs des variants décrits ci-dessus. On préfère des composés spécifiques, c'est-à-dire capables de moduler l'expression ou l'activité des variants, sans affecter significativement l'expression ou l'activité des formes sauvages.
Les composés ainsi identifiés sont utilisables pour la préparation d'une composition destinée au traitement du cancer de la prostate.
Un autre objet de l'invention réside dans l'utilisation d'un composé capable de moduler, i.e. de stimuler, d'inhiber ou de réduire, l'expression d'un ou de plusieurs variants tels que décrits ci-dessus, pour la préparation d'une composition destinée au traitement des cancers et notamment du cancer de la prostate.
Dans le contexte de l'invention, le terme « traitement » désigne le traitement préventif, curatif ou palliatif, ainsi que la prise en charge des patients (réduction de la souffrance, amélioration de la durée de vie, ralentissement de la progression de la maladie), etc. Le traitement peut en outre être réalisé en combinaison avec d'autres agents actifs.
Un autre objet de l'invention concernent des méthodes de sélection, d'identification, ou de caractérisation de composés actifs utilisables dans le cadre de la préparation de compositions destinées au traitement de pathologies cancéreuses, comprenant la mise en contact d'un ou de plusieurs composés tests avec des extraits cellulaires exprimant les protéines décrites dans la présente invention, ou avec lesdites protéines purifiées.
L'invention porte également sur un procédé de production d'un médicament pour le traitement de cancers, notamment du cancer de la prostate, comprenant (i) la sélection de composés actifs selon les procédés ci-dessus et (ii) le conditionnement dudit composé ou d'un analogue fonctionnel de celui-ci en présence d'un véhicule acceptable sur le plan pharmaceutique. L'analogue fonctionnel est typiquement un composé dérivé du composé actif identifié, par 03 00833
22
modification chimique, notamment dans le but d'améliorer son activité ou sa pharmaco-cinétique, ou dans le but de réduire sa toxicité. L'analogue fonctionnel peut être une « pro-drogue » du composé identifié. Des techniques de préparation d'analogues fonctionnels sont bien connues de l'homme du métier, par exemple la modélisation moléculaire, le couplage de groupes NO, etc. Le procédé peut à cet égard comprendre une étape intermédiaire de synthèse du composé sélectionné ou de l'analogue fonctionnel de celui-ci.
Le véhicule ou excipient acceptable sur le plan pharmaceutique peut être choisi parmi des solutés tampons, solvants, liants, stabilisants, emulsifiants, etc. Des solutés tampons ou diluant sont notamment le dicalcium phosphate, sulfate de calcium, lactose, cellulose, kaolin, mannitol, chlorure de sodium, amidon, sucre en poudre et hydroxy propyl methyl cellulose (HPMC) (pour libération retard). Des liants sont par exemple l'amidon, la gélatine et des solutés de remplissage comme le sucrose, glucose, dextrose, lactose, etc. Des gommes naturelles ou synthétiques peuvent aussi être utilisées, comme notamment l'alginate, la carboxymethylcellulose, la méthylcellulose, la polyvinyl pyrrolidone, etc. D'autres excipients sont par exemple la cellulose et du stéarate de magnésium. Des agents stabilisants peuvent être incorporés aux formulations, comme par exemple des polysaccharides (acacia, agar, acide alginique, gomme guar et tragacanth, la chitine ou ses dérivés et des éthers de cellulose. Des solvants ou solutés sont par exemple la solution Ringer, l'eau, l'eau distillée, des tampons phosphates, des solutions salines phosphatées, et autres fluides conventionnels.
Un autre objet de l'invention concerne l'utilisation de ligands cytotoxiques spécifiques d'un ou de plusieurs variants tels que décrits ci-dessus localisés à la surface des cellules cancéreuses et en particulier des cellules cancéreuses prostatiques.
D'autres aspects et avantages de la présente invention apparaîtront à la lecture des exemples qui suivent, qui doivent être considérés comme illustratifs et non limitatifs. Ces exemples indiquent clairement que les isoformes identifiées peuvent s'exprimer dans des systèmes biologiques tant au niveau de l'ARN qu'au niveau protéique dans les tissus et sérums.
LEGENDE DES TABLEAUX ET FIGURES
Tableau 1 : Séquence des oligonucléotides spécifiques (SEQ ID NOs : 168- 220). Colonne 1 : Nom de l'oligonucléotide. Colonne 2 : Séquence de l'oligonucléotide. Colonne 3 : SEQ ID NO des oligonucléotides revendiqués.
Tableau 2 : Couples d'amorces utilisés pour l'amplification des isoformes de PSA et de KLK2.
Tableau 3 : Valeurs des signaux de fluorescence obtenues par hybridation à partir de tissus humains (Clontech) d'un micro-array regroupant des oligonucléotides dont les oligonucléotides SEQ ID NOs : 168-220. Colonne 1 : Nom de l'oligonucléotide. Colonne 2 : SEQ ID NO. Colonne 3-4: Valeurs correspondant à prostate/cœur. Colonne 5-6 : Valeurs correspondant à prostate/rein. Colonne 7-8 : Valeurs correspondant à prostate/prostate. Colonne 9-10 : Valeurs correspondant à prostate/petit intestin. Le signe #N/A indique que la valeur était inférieure à deux fois le bruits de fonds.
Tableau 4 : Valeurs des signaux de fluorescence obtenues par hybridation à partir de lignées cellulaires d'un micro-array regroupant des oligonucléotides dont les oligonucléotides SEQ ID NOs : 168-220. Colonne 1 : Nom de l'oligonucléotide. Colonne 2 : SEQ ID NO. Colonne 3-4: Valeurs correspondant à Mda2b/BT549. Colonne 5-6 : Valeurs correspondant à Mda2b/MCF7. Colonne 7-8 : Valeurs correspondant à Mda2b/Mda231. Colonne 9-10 : Valeurs correspondant à Mda2b/T47D. Le signe #N/A indique que la valeur était inférieure à deux fois le bruits de fonds. 0833
24
Tableau 5 : Valeurs des signaux de fluorescence obtenues par hybridation à partir de tissus bénins et tumoraux issus de patients atteints de cancer de la prostate d'un micro-array regroupant des oligonucléotides dont les oligonucléotides SEQ ID NOs : 168-220. Colonne 1 : Nom de l'oligonucléotide. Colonne 2 : SEQ ID NO. Colonne 3-4: Valeurs correspondant au tissu tumoral/tissu bénin du patient 15068. Colonne 5-6 : Valeurs correspondant au tissu tumoral/tissu bénin du patient 9648. Colonne 7-8 : Valeurs correspondant au tissu tumoral/tissu bénin du patient 8827. Colonne 9-10 : Valeurs correspondant au tissu tumoral/tissu bénin du patient 10063. Le signe #N/A indique que la valeur était inférieure à deux fois le bruits de fonds.
Figure 1 : Disposition des oligonucléotides spécifiques. Des oligonucléotides matérialisés par des rectangles sont conçus pour s'hybrider de façon spécifique à des événements d'épissage : rétention d'intron, délétion d'exon, utilisation de sites cryptiques 3' et 5'.
Figure 2 : Disposition d'oligonucléotides spécifiques. Cinq oligonucléotides matérialisés par un trait peuvent être conçus pour analyser l'expression d'une forme longue matérialisée par 3 exons et d'une forme courte matérialisée par 2 exons.
Figure 3 : Marquage des formes longues et courtes synthétiques. Des ARNs synthétiques sont produits à partir de plasmides linéarisés exprimant les cDNAs correspondants. Les ARNs de la forme longue sont marqués à l'aide de cyanine 3, les ARNs de la forme courte sont marqués à l'aide de cyanine 5.
Figure 4 : Démonstration de la spécificité d'hybridation des oligonucléotides. Cinq oligonucléotides ont été utilisés pour différencier les formes longues des formes courtes mélangées à quantités égales. Deux exemples sont présentés, gène A et gène B. Figure 5 : Mesures quantitatives de rapports entre formes longues et formes courtes. Le pourcentage de forme longue (wt) a été établi à : 0, 20, 40, 60, 80 et 100 % (3 exemples sont présentés, gène A, B et C).
Figure 6 : Spécificité du micro-array à oligonucléotides PSA et KLK2. Les oligonucléotides spécifiques de PSA sont révélés par les isoformes de PSA marquées à la cyanine 3. Les oligonucléotides spécifiques de KLK2 sont révélés par les isoformes de KLK2 marquées à la cyanine 5.
Figure 7 : Schéma de l'amplification linéaire d'ARN.
Figure 8 : Exemple d'hybridation de la lame PSA / KLK2 à l'aide de sondes provenant de tissus tumoraux et sains d'un même patient.
Figure 9 : Mesure de l'expression différentielle de certaines isoformes de PSA et de KLK2 via l'analyse des oligonucléotides discriminants correspondants entre tissus tumoraux et tissus sains au sein de mêmes patients. Colonne 1 : nature de l'isoforme, colonne 2 : oligonucléotide discriminant correspondant, colonne 3 à 6 : log2 (rapport expression tumorale / expression normale).
Figure 10 : Mesure de l'expression différentielle de certaines isoformes de PSA et de KLK2 via l'analyse des oligonucléotides discriminants correspondants entre lignée cellulaire de cancer de la prostate (Mda-2b et LNCap) et lignée cellulaire de cancer du sein (T47D). Colonne 1 : nature de l'isoforme, colonne 2 : oligonucléotide discriminant correspondant, colonne 3,4 : log2 (rapport expression lignée prostate / expression lignée sein). Les isoformes surexprimées de façon relative dans la lignée prostate sont indiquées en orange. Les isoformes surexprimées de façon relative dans la lignée sein sont indiquées en bleu.
Figure 11 : Mesure de l'expression différentielle de certaines isoformes de PSA et de KLK2 via l'analyse des oligonucléotides discriminants correspondants entre différents tissus humains. Colonne 1 : nature de l'isoforme, colonne 2 : oligonucléotide discriminant correspondant, colonne 3, 4, 5 et 6 : log2 (rapport expression tissu prostate / tissus cœur, rein, petit intestin et prostate respectivement). Les isoformes surexprimées de façon relative dans le tissu prostate sont indiquées en orange. Les isoformes surexprimées de façon relative dans les autres tissus sont indiquées en bleu.
Figure 12 : Illustration graphique des signaux de fluorescence obtenus pour certaines isoformes avec des tissus normaux.
Figure 13 : Amplifications par PCR à l'aide d'oligonucléotides amorces spécifiques de trois isoformes de PSA . A)PSA-EHT003 B) PSA-EHT023 et C) PSA-EHT012
Figure 14 : Annotations de trois anticorps polyclonaux produits. Cette figure regroupe les informations concernant les anticorps SE3962, SE3963, SE4101 produits, les épitopes choisis, les peptides synthétisés, le couplage à la KLH utilisé et les isoformes susceptibles d'être reconnues par ces anticorps.
Figure 15 : Titres des trois anticorps par tests ELISA.
Détermination des titres de SE3962 en A), SE3963 en B) et SE4101 en C).
PPI : sérums préimmuns
PP : sérums issus de la première récolte
GP : sérums issus de la deuxième récolte
Figure 16 : Résultats de « western blots » avec l'anticorps EHT-SE3962 à partir de sérums à faible taux de PSA totale en A), à taux moyens de PSA totale en B), à taux élevés de PSA total en C). Deux bandes correspondant à des poids moléculaires attendus pour KLK2-EHT004 et KLK2-EHT006 sont observées. Le déplacement des signaux avec des doses croissantes de l'épitope synthétique spécifique (de 1 à 50 μg) non observé avec une forte dose de peptide non spécifique à 250 μg démontre la spécificité de cet anticorps. Figure 17 : Résultats de « western blots » avec l'anticorps EHT-SE3963 à partir de tissus prostatiques. Une bande correspondant à un poids moléculaire attendu pour PSA-EHT021 est observée. Deux autres bandes de plus haut poids moléculaires sont également révélées.
EXEMPLES
A - ISOLEMENT DES VARIANTS DE PSA ET DE KLK2
L'analyse qualitative différentielle a été effectuée à partir d'ARN poly adénylés (poly A+) extraits d'échantillons tumoraux et normaux prostatiques. Les ARN poly A+ sont préparés selon des techniques connues de l'homme de métier. Il peut s'agir en particulier d'un traitement au moyen d'agents chaotropiques tels que le thiocyanate de guanidium suivi d'une extraction des ARN totaux au moyen de solvants (phénol, chloroforme par exemple). De telles méthodes sont bien connues de l'homme du métier (voir Maniatis et al., Chomczynsli et al., Anal. Biochem. 162 (1987) 156), et peuvent être aisément mises en œuvre en utilisant des kits disponibles dans le commerce. A partir de ces ARN totaux, les ARN poly A+ sont préparés selon des méthodes classiques connues de l'homme de métier et décrites dans les kits commerciaux. Ces ARN poly A+ servent de matrice à des réactions de transcription inverse à l'aide de transcriptases inverses. Des transcriptases inverses dépourvues d'activité RNase H sont avantageusement utilisées. Elles permettent d'obtenir des brins d'ADN complémentaire de tailles supérieures à ceux obtenus à l'aide de transcriptases inverses classiques. De telles préparations de transcriptases inverses sans activité RNase H sont disponibles commercialement.
Conformément à la technique DATAS, pour chaque point de la cinétique des hybridations d'ARNm (C) avec des ADNc (T) et des hybridations réciproques d'ARNm (T) avec des ADNc (C) sont réalisées. Ces hétéroduplexes ARNm/ADNc sont ensuite purifiés selon les protocoles prévus par la technique DATAS.
Les séquences d'ARN non appariées avec un ADN complémentaire sont libérées de ces hétéroduplex sous l'action de la RNase H, cette enzyme dégradant les séquences d'ARN appariées. Ces séquences non appariées représentent les différences qualitatives qui existent entre des ARN par ailleurs homologues entre eux. Ces différences qualitatives peuvent être localisées n'importe où sur la séquence des ARN, aussi bien en 5' ou en 3' qu'à l'intérieur de la séquence et notamment à l'intérieur de la séquence codante. Selon leur localisation, ces séquences peuvent être non seulement des modifications d'épissage mais également des conséquences de translocations ou de délétions.
Les séquences d'ARN représentant les différences qualitatives sont ensuite clonées selon les techniques connues de l'homme de métier et notamment celles décrites dans le brevet relatif à la technologie DATAS.
Ces séquences sont regroupées au sein de banques de ADNc qui constituent des banques qualitatives différentielles. Une de ces banques contient les exons et les introns spécifiques de la situation saine ; les autres banques contiennent les événements d'épissage caractéristiques des conditions pathologiques. Les fragments issus des gènes humains de KLK2 et de KLK3 proviennent de ces banques.
Quatre échantillons tumoraux ont été mélangés pour former un « pool » tumoral. Ce pool d'ARN a été traité à la Dnase à l'aide du kit « DNA free » de la société Ambion (n° cat. 1906). Cet ARN est ensuite reverse-transcrit à l'aide de la transcriptase inverse du kit « High capacity cDNA Archive » de la société Aplied Biosystems (n° cat. 4322171).
L'ADNc ainsi produit sert de matrice pour des réactions de PCR afin d'amplifier spécifiquement différentes régions d'ARNs messagers dérivés de la kallikreine-2 et de la kallikreine-3 humaines selon le protocole suivant :
Tampon Invitrogen 10X : 2μl
DNTPs 2mM: 2μL MgCI2 50mM: 0.6μL
Primer amont 10μM: 0.4μL
Primer aval 10μM: 0.4μL
Taq polymerase : 0.2μL
H20: 13.4μL cDNA 1μL
Volume final : 19μL
Selon le programme de cycles suivant:
94°C 3min
94°C 30sec )
55°C 1min ) 35 cycles
72°C 3min ) 72°C 6min
Les oligonucléotides utilisés comme amorces de PCR sont les suivants
Pour KLK2 :
163 KLK2-1-S GGTTCTCTCCATCGCCTTG
164 KLK2-1-AS CTCCTTTAGTCTGAAGCCTCACC
165 KLK2-2-S TGTATTTCACCACGACTATATCTCCC 166 KLK2-2-AS GCTCTAGCACACATGTCATTGGA
167 KLK2-3-S CAGTCATGGATGGGCACACT
168 KLK2-3-AS CTCAGACCCAGGCATCTGG
169 KLK2-4-S GCCAGATGGTGTAGCTGGG
170 KLK2-4-AS CATGATGTGATACCTTGAAGCACC 171 KLK2-5-S CCCTATCCAATTCTTTTGGGT
172 KLK2-5-AS GCTTTGATGCTTCAGAAGGC
173 KLK2-6-S CCTGCCAAGATCACAGATGTTG
174 KLK2-6-AS TGGTTAGCTTTCAGATTGCAGC 212 KLK2-7-S tgggaagaagaacaacgagca
213 KLK2-7-AS tttagggaatcagagaactggcc
214 KLK2-8-S agctcaatgtgtgtgcatgtgag
215 KLK2-8-AS aaaggatgcgggaagtcaga 216 KLK2-9-S cagcataattcacccattc
217 KLK2-9-AS tctacctgttcactgctgcttcc
218 KLK2-10-S ggagtgacgatgaggatgacc
219 KLK2-10-AS gtcagttcagtgatcagaatgac
220 KLK2-11 -AS gctacagctgaaaccagcc 221 KLK2-12-S ccactacagagccctcactcca
222 KLK2-13-AS aatgcttctcacactcccagc
249 klk2 start CCTGTGTCAGCATGTGGGACC
250 klk2 stop TGGGACAGGGGCACTCAGGG
251 klk2e spe cctgggggtatagttgccactat
Pour PSA :
175 PSA-1-S CGTGACGTGGATTGGTGAGA
176 PSA-1-AS GCTGGCCTTAGAGGTTATCCTG
117777 PPSSAA--22--SS GGCCTGAACTGTGTCTTCCC
178 PSA-2-AS GTGAACTTGCGCACACACG
179 PSA-3-S TGGCAGGTGCTTGTGGC
180 PSA-3-AS CTCCTCCCTCAGACCCAGG
181 PSA-4-S GTCCAGCCCACAACAGTG
118822 PPSSAA--44--AASS CCTTGAAGCACACCATTACAGAC
183 PSA-5-S CCTAAATCCATCTCCTATCCGAGTC
184 PSA-5-AS CAGGATGAAACAGGCTGTGC
185 PSA-6-S TGCTGTGAAGGTCATGGACC
186 PSA-6-AS GACGCCTTGTTGGCTTCTAGAC
220000 PPSSAA--77--SS tcccagagaccttgatgctt
201 PSA-7-AS gtttgcaggttggtggctg
202 PSA-8-S gtcccggttgtcttcctcac 203 PSA-8-AS gacccatttgttgtctcaggc
204 PSA-9-S ctgaacacacgcacgggat
205 PSA-9-AS ccaaagcccttccttttctca
206 PSA-10-S ttggaaacccacgccaaa 207 PSA-10-AS cctcagagtggctcagctgtag
208 PSA-11-S tgactccctcaaggcaataggtta
209 PSA-11-AS tgtttgctcactcccaccttct
210 PSA-12-S tgctggacagaagcaggaca
211 PSA-12-AS atcatcactccctccacatcc 247 PSA start GGAGAGCTGTGTCACCATGTGG
248 PSA stop ATAGGGGTGCTCAGGGGTTGG
Les produits amplifiés sont ensuite clones dans le système « Topo » de la société Invitrogen (n° cat. K4600) selon le protocole fourni. Les produits de ligation sont transformés dans des cellules « Top 10 » compétentes. Les colonies sont identifiées sur milieu agar/LB supplémenté d'ampicilline. Les ADNc présents dans ces colonies sont amplifiés de façon individuelle par amplification PCR à l'aide d'amorces Sp6 et T7 selon le protocole suivant :
PrimerT7 10μM : 2μL
Primer Sp6 10μM 2μL
MgCI2 50mM: 1.2μL
DNTPs 2mM: 4μL Tampon 10x 4μL
Taq polymerase: 0.2μL
H20: 25.6μL
Colonie : 1μL
vol final 40μL
selon le programme de cycles suivant: 94°C 5min
94°C 30sec)
55°C 30sec) 30cycles
72°C 1 min)
72°C 5min
Les produits d'amplification sont ensuite purifiés par P100 pour être séquences à l'aide du kit « Big Dye Terminator » de la société Applied Biosystems selon le protocole fourni par ce fournisseur. Les réactions de séquence sont analysées à l'aide d'un séquenceur 3100 d'Applied Biosystems. Le tableau 2 représente les différents ADNc ainsi que les couples d'oligonucléotides amorces utilisés pour leur obtention et permettant leur amplification dans un échantillon.
B - IDENTIFICATION ET DESCRIPTION DES VARIANTS
Variants de KLK2
La numérotation des nucléotides se réfère au numéro d'accession de Genbank M18157 sauf autre précision. La protéine de référence est la KLK2 munie de son peptide signal.
Les séquences KLK2-EHT002 à KLK2-EHT011 (SEQ ID NO : 1 à 7) correspondent à des séquences comportant une phase ouverte de lecture avec un codon d'initiation et de terminaison de la traduction. Les séquences KLK2-EHTb à KLK2-EHTI (SEQ ID NO : 8 à 15 ) correspondent à des séquences exprimées de type « ESTs » pouvant comporter une, deux ou trois phases de lecture avec ou non un codon d'initiation ou de terminaison de la traduction.
KLK2-EHT002 (SEQ ID NO : 1 ) :
Cette isoforme présente i) une rétention partielle d'une partie 5' de l'intron 2 (nt 1935-2020) et ii) une utilisation de deux sites cryptiques d'épissage dans la partie 3' de l'exon 3 (nt 3728) et la partie 5' de l'exon4 (nt 3937). Ces deux événements correspondent à des sites d'épissage consensuels. Cette isoforme KLK2-EHT002 possède un codon stop après l'exon 2 et code ainsi pour une protéine tronquée après le résidu n° 69 (KLK2-EHT002prota / SEQ ID NO : 50 ). 54 acides aminés peuvent être clivés pour former la séquence KLK2- EHT002protb / SEQ ID NO :51 . On peut remarquer que les nucléotides correspondant aux positions Genbank (M18157) 1821 et 3581 dans SEQ ID NO :1 correspondent à C et A alors que la référence Genbank indique T et G respectivement. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ces deux changements n'affectent pas la séquence protéique traduite.
KLK2-EHT003 (SEQ ID NO : 2) : Cette isoforme présente i) une délétion totale de l'exon 2 et ii) une rétention d'une partie 5' de l'intron 4 (nt 4061-4097). Ces deux événements correspondent à des sites d'épissage consensuels. Cette isoforme KLK2- EHT003 code pour une protéine comprenant 34 acides aminés supplémentaires au-delà du résidu thréonine numéro 15 (KLK2-EHT003prota / SEQ ID NO : 52 ). Ces 34 acides aminés peuvent être clivés pour former la séquence KLK2- EHT003protb / SEQ ID NO : 53 . On peut remarquer que les nucléotides correspondant aux positions Genbank (M18157) 3774 et 5486 dans SEQ ID NO :2 correspondent à C et T alors que la référence Genbank indique T et G respectivement. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ces deux changements n'affectent pas la séquence protéique traduite.
KLK2-EHT004 (SEQ ID NO : 3) : Cette isoforme présente une délétion totale de l'exon 3. Cette isoforme KLK2- EHT004 code pour une protéine comprenant 70 acides aminés supplémentaires au-delà du résidu thréonine numéro 15 (KLK2-EHT004prota / SEQ ID NO : 54 ). Ces 70 acides aminés peuvent être clivés pour former la séquence KLK2- EHT003protb / SEQ ID NO : 55. Les 16 derniers acides aminés sont nouveaux et pourraient présenter un ou des épitopes spécifiques de cette isoforme, KLK2- EHT004protc / SEQ ID NO : 56 . On peut remarquer que le nucléotide correspondant à la position Genbank (M18157) 4097 dans SEQ ID NO :3 correspont à A alors que la référence Genbank indique G. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement n'affecte pas la séquence protéique traduite.
KLK2-EHT006 (SEQ ID NO :4 ) :
Cette isoforme présente une utilisation de deux sites cryptiques d'épissage dans la partie 3' de l'exon 3 (nt 3728) et la partie 5' de l'exon4 (nt 3937). Cet événement correspond à des sites d'épissage consensuels. Cette isoforme KLK2-EHT006 code pour une protéine de 149 acides aminés (KLK2- EHTOOδprota / SEQ ID NO : 57 ). 134 acides aminés peuvent être clivés pour former la séquence KLK2-EHT006protb / SEQ ID NO 58. Les 12 derniers acides aminés sont nouveaux et pourraient présenter un ou des épitopes spécifiques de cette isoforme, KLK2-EHT006protc / SEQ ID NO : 59 . On peut remarquer que le nucléotide correspondant à la position Genbank (M18157) 3689 dans SEQ ID NO :4 correspond à T alors que la référence Genbank indique C. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement n'affecte pas la séquence protéique traduite.
KLK2-EHT007 (SEQ ID NO : 5) :
KLK2-EHT007 présente une rétention de la partie 5' de l'intron 4. Cette isoforme KLK2-EHT007 code pour une protéine de 224 acides aminés (KLK2-
EHT007prota / SEQ ID NO : 60). 209 acides aminés peuvent être clivés pour former la séquence KLK2-EHT007protb / SEQ ID NO : 61 . Les 14 derniers acides aminés sont nouveaux et pourraient présenter un ou des épitopes spécifiques de cette isoforme, KLK2-EHT007protc / SEQ ID NO : 62 .
KLK2-EHT009 (SEQ ID NO : 6) : KLK2-EHT009 présente i) une délétion d'une séquence dans l'exon 3 (nt 3671- 3793) et ii) l'utilisation d'un site cryptique d'épissage dans la partie 5' de l'exon 4 (nt 3937) (site d'épissage consensuel). Cette isoforme KLK2-EHT009 code pour une protéine de 123 acides aminés (KLK2-EHT009prota / SEQ ID NO : 63 ). 108 acides aminés peuvent être clivés pour former la séquence KLK2- EHT009protb / SEQ ID NO : 64 . Les 5 derniers acides aminés sont nouveaux et pourraient participer à un ou des épitopes spécifiques de cette isoforme, KLK2-EHT009protc / SEQ ID NO : 65 .
KLK2-EHT011 (SEQ ID NO : 7) : Cette isoforme présente une utilisation d'un site cryptique d'épissage dans la partie 5' de l'exon4 (nt 4041 ). Cet événement correspond à des sites d'épissage consensuels. Cette isoforme KLK2-EHT011 code pour une protéine de 165 acides aminés (KLK2-EHT011prota / SEQ ID NO : 66 ). 150 acides aminés peuvent être clivés pour former la séquence KLK2-EHT011 protb / SEQ ID NO : 67 . Le dernier acide aminé remplace un résidu phenylalanine en résidu tryptophane et pourrait participer à un épitope spécifique de cette isoforme.
KLK2-EHTb (SEQ ID NO : 8) :
Cette isoforme présente une rétention d'une partie 5' de l'intron 1 suivi d'une délétion comprise entre les positions 701 et 1058 inclues. Cette isoforme KLK2- EHTb code pour une protéine comprenant 104 acides aminés supplémentaires au-delà du résidu thréonine numéro 15 (KLK2-EHTb1 , SEQ ID NO :68). Ces 104 acides aminés peuvent être clivés pour former la séquence KLK2-EHTb2, SEQ ID NO :69. Les 59 derniers acides aminés (KLK2-EHTb3, SEQ ID NO :70) représentent une nouvelle séquence par rapport à une isoforme déjà décrite, K- LM (David et.al, (2002)). On peut remarquer que les nucléotides en position 97, 214, 249 de SEQ ID NO :8 correspondent à G, C, T alors que la référence genbank indique C, T, C respectivement. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Les mutation 97, 214 n'affectent pas la séquence protéique traduite. La mutation 249 transforme un résidu serine en résidu phenylalanine. On peut également remarquer que les nucléotides 1192-1199, GAAGAACA de la référence genbank sont remplacés par les nucléotides 303-306, AAAC dans SEQ ID NO :8. Les quinze derniers acides aminés de KLK2-EHTb1 remplacent ainsi une séquence ouverte comprenant les 17 acides aminés composant KLK2-EHTb4, SEQ ID NO :71.
KLK2-EHTC (SEQ ID NO : 9) :
Cette isoforme utilise un site cryptique dans l'intron 1 qui occupe la position
1157. Cette isoforme KLK2-EHTc code pour une protéine comprenant en outre 6 acides aminés au-delà du résidu thréonine numéro 15 (KLK2-EHTc1, SEQ ID NO :72). Ces 6 acides aminés peuvent être clivés pour former la séquence KLK2-EHTc2, SEQ ID NO :73. On peut remarquer que les nucléotides 1192- 1199, GAAGAACA de la référence genbank sont remplacés par les nucléotides 71-74, AAAC dans SEQ ID NO :9. Ce changement intervient après un codon stop.
KLK2-EHTd (SEQ ID NO : 10) :
Cette isoforme présente une rétention d'une partie 5' de l'intron 1 suivi d'une délétion comprise entre les positions 657 et 1209 inclues. Cette isoforme KLK2- EHTd code pour une protéine comprenant au moins 41 acides aminés supplémentaires au-delà du résidu thréonine numéro 15 (KLK2-EHTd1 , SEQ ID NO :74). Ces 41 acides aminés supplémentaires peuvent être clivés pour former la séquence KLK2-EHTd2, SEQ ID NO :75. Les 11 derniers acides aminés supplémentaires (KLK2-EHTd3, SEQ ID NO :76) représentent une nouvelle séquence par rapport à une isoforme déjà décrite, K-LM (David et.al, 2002). ). La séquence prédite par continuation de la traduction dans l'intron 1 produit une protéine de 83 acides aminés après clivage : KLK2-EHTd4, SEQ ID NO :77. KLK2-EHTe (SEQ ID NO : 11 ) :
KLK2-EHTe présente une séquence inconnue de 140 nucléotides comprise entre un exon 2 tronqué en 3' et l'exon 3. Cette isoforme KLK2-EHTe code pour une protéine comprenant en outre 19 acides aminés au-delà du résidu glycine occupant la position numéro 52 (KLK2-EHTe1 , SEQ ID NO :78). Ces 19 acides aminés représentent la séquence KLK2-EHTe2, SEQ ID NO :79.
KLK2-EHTf (SEQ ID NO : 12) : Cette isoforme utilise deux sites cryptiques, le premier dans la partie 3' de l'exon 2 (position 1876), le second dans l'intron 2 (position 3349). Cette isoforme KLK2-EHTf code pour une protéine comprenant en outre 57 acides aminés compris entre les résidus histidine en position 49 et asparagine en position 70 (KLK2-EHTf1 , SEQ ID NO :80). Ces 57 acides aminés représentent la séquence KLK2-EHTf2, SEQ ID NO :81. On peut remarquer que le nucléotide en position 269 de SEQ ID NO :12 correspond à C, alors que la référence genbank indique T. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position , par une erreur dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase. La mutation 269 transforme un résidu phenylalanine en résidu leucine.
KLK2-EHTJ (SEQ ID NO :13) :
Cette isoforme présente une délétion dans l'intron 2 entre les positions 2473 et 3001. KLK2-EHTJ code pour une protéine comprenant l'une des deux phases de lectures correspondant à la KLK2-EHTJ1 (SEQ ID NO :82), ou KLK2-EHTJ2 (SEQ ID NO :83).
KLK2-EHTk (SEQ ID NO : 14) :
Cette isoforme utilise deux sites cryptiques, le premier situé dans l'intron 4 en position 5049 et le deuxième dans l'exon 5 en position 5469. KLK2-EHTk code pour une protéine comprenant l'une des deux phases de lecture correspondant à KLK2-EHTk1 (SEQ ID NO :84) ou KLK2-EHTk2 (SEQ ID NO :85). KLK2-EHTI (SEQ ID NO :15) :
Cette isoforme utilise un site cryptique dans l'intron 2 en position 2991. Cette isoforme code pour une protéine comprenant l'une des trois phases de lecture correspondant à KLK2-EHTI1 (SEQ ID NO :86), KLK2-EHTI2 (SEQ ID NO :87) ou KLK2-EHTI3 (SEQ ID NO :88).
Variants de PSA (ou KLK3) La numérotation des nucléotides se réfère au numéro d'accession de Genbank M27274 sauf autre précision. La protéine de référence est la PSA munie de son peptide signal.
Les séquences PSA-EHT001 à PSA-EHT027 (SEQ ID NO : 16 à 34 ) correspondent à des séquences comportant une phase ouverte de lecture avec un codon d'initiation et de terminaison de la traduction.
Les séquences PSA-EHTa à PSA-EHTu (SEQ ID NO : 35 à 49) correspondent à des séquences exprimées de type « ESTs » pouvant comporter une, deux ou trois phases de lecture avec ou non un codon d'initiation ou de terminaison de la traduction.
PSA-EHT001 (SEQ ID NO :16) :
Cette isoforme présente une rétention d'un fragment délété de l'intron 1 (nt 721-
811 puis 971-1272). Cette isoforme PSA-EHT001 code pour une protéine de 51 acides aminés (PSA-EHT001prota / SEQ ID NO : 89 ). 36 acides aminés peuvent être clivés pour former la séquence PSA-EHT001 protb / SEQ ID NO : 90 . On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 738 dans SEQ ID NO :16 correspond à G alors que la référence Genbank indique T. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement remplace un résidu tryptophane par un résidu glycine. PSA-EHT003 (SEQ ID NO :17) :
Cette isoforme présente une rétention d'un fragment délété de l'intron 1 (nt 721- 874 puis 920-1272). Cette isoforme PSA-EHT003 code pour une protéine de 89 acides aminés (PSA-EHT003prota / SEQ ID NO : 91 ). 74 acides aminés peuvent être clivés pour former la séquence PSA-EHT003protb / SEQ ID NO : 92 . Les 20 derniers acides (PSA-EHT003protc / SEQ ID NO : 93) représentent une information nouvelle par rapport à une isoforme déjà décrite comprenant une rétention totale de l'intron 1
PSA-EHT004 (SEQ ID NO : 18) :
Cette isoforme utilise un site cryptique d'épisage 3' situé dans l'intron 1 en position 1142 (site consensuel) Cette isoforme PSA-EHT004 code pour une protéine de 47 acides aminés (PSA-EHT004prota / SEQ ID NO : 94 ). 32 acides aminés peuvent être clivés pour former la séquence PSA-EHT004protb / SEQ ID NO : 95 .
PSA-EHT005 (SEQ ID NO : 19) :
Cette isoforme présente une rétention d'un fragment délété de l'intron 1 (nt 721- 792 puis 1149-1272). Cette isoforme PSA-EHT005 code pour une protéine de 68 acides aminés (PSA-EHT005prota / SEQ ID NO : 96). 53 acides aminés peuvent être clivés pour former la séquence PSA-EHT005protb / SEQ ID NO : 97. Les 28 derniers acides (PSA-EHT005protc / SEQ ID NO : 98 ) représentent une information nouvelle par rapport à une isoforme déjà décrite comprenant une rétention totale de l'intron 1
PSA-EHT007 (SEQ ID NO : 20) :
Cette isoforme utilise un site cryptique d'épisage 5' situé dans l'exon 1 en position 693 et un site cryptique 3' situé dans l'intron 1 en position 1149 Cette isoforme PSA-EHT007 code pour une protéine de 23 acides aminés (PSA- EHT007prota / SEQ ID NO : 99 ). PSA-EHT008 (SEQ ID NO :21) :
Cette isoforme utilise un site cryptique d'épisage 3' situé dans l'intron 1 en position 1202 (site consensuel) Cette isoforme PSA-EHT008 code pour une protéine de 27 acides aminés (PSA-EHT008prota / SEQ ID NO : 100 ). 12 acides aminés peuvent être clivés pour former la séquence PSA-EHT008protb / SEQ ID NO : 101 . On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 679 dans SEQ ID NO :21 correspond à T alors que la référence Genbank indique G. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement remplace un résidu tryptophane par un résidu leucine.
PSA-EHT009 (SEQ ID NO : 22) : Cette isoforme présente une rétention d'un fragment délété de l'intron 2 (nt 2119-2447 puis 2988-3226). Cette isoforme PSA-EHT009 code pour une protéine de 69 acides aminés (PSA-EHT009prota / SEQ ID NO : 102). 54 acides aminés peuvent être clivés pour former la séquence PSA-EHT009protb / SEQ ID NO : 103 . On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 1966 dans SEQ ID NO :22 correspond à A alors que la référence Genbank indique G. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement ne modifie pas la séquence protéique. D'autres mutations ponctuelles sont identifiées après le codon stop.
PSA-EHT012 (SEQ ID NO : 23) :
Cette isoforme utilise un site cryptique d'épisage 3' situé dans l'intron 2 en position 2426 (site consensuel) Cette isoforme PSA-EHT012 code pour une protéine de 83 acides aminés (PSA-EHT012prota / SEQ ID NO : 104). 68 acides aminés peuvent être clivés pour former la séquence PSA-EHT004protb / SEQ ID NO : 105. Les 14 derniers acides aminés (PSA-EHT012protc / SEQ ID NO : 106) représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que les nucléotides correspondant aux positions Genbank (M27274) 1966 et 2459 dans SEQ ID NO :23 correspondent à A et A alors que la référence Genbank indique G et G respectivement. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ces deux changements n'affectent pas la séquence protéique traduite.
PSA-EHT013 (SEQ ID NO : 24) :
Cette isoforme utilise un site cryptique d'épisage 3' situé dans l'intron 1 en position 1945 (site consensuel) Cette isoforme PSA-EHT013 code pour une protéine de 75 acides aminés (PSA-EHT013prota / SEQ ID NO : 107). 60 acides aminés peuvent être clivés pour former la séquence PSA-EHT013protb / SEQ ID NO : 108 . Ces 60 acides aminés représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme.
PSA-EHT015 (SEQ ID NO :25) :
Cette isoforme utilise un site cryptique d'épisage 5' situé dans l'exon 1 en position 703 et un site cryptique 3' situé dans l'exon 2 en position 2030 Cette isoforme PSA-EHT015 code pour une protéine de 41 acides aminés (PSA- EHT015prota / SEQ ID NO : 109). Les 30 derniers acides aminés (PSA- EHT015protb / SEQ ID NO : 110) représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 2094 dans SEQ ID NO :25 correspont à C alors que la référence Genbank indique T. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement remplace un résidu serine par un résidu proline.
PSA-EHT016 (SEQ ID NO : 26) : Cette isoforme utilise un site cryptique d'épisage 3' situé dans l'exon 2 en position 2053 (site consensuel) Cette isoforme PSA-EHT016 code pour une protéine de 39 acides aminés (PSA-EHT016prota / SEQ ID NO : 111). 24 acides aminés peuvent être clivés pour former la séquence PSA-EHT016protb / SEQ ID NO : 112 . Ces 24 acides aminés représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme.
PSA-EHT018 (SEQ ID NO : 27) :
Cette isoforme présente une rétention d'un fragment délété de l'intron 2 (nt 2119-2588 puis 3114-3226). Cette isoforme PSA-EHT018 code pour une protéine de 69 acides aminés (PSA-EHT018prota / SEQ ID NO : 113). 54 acides aminés peuvent être clivés pour former la séquence PSA-EHT018protb / SEQ ID NO : 114 . On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 2545 dans SEQ ID NO :27 correspond à T alors que la référence Genbank indique A. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement ne modifie pas la séquence protéique.
PSA-EHT019 (SEQ ID NO : 28) :
Cette isoforme présente une délétion d'un fragment situé dans l'exon 3 (nucléotide 3828-3933). Cette isoforme PSA-EHT019 code pour une protéine de 100 acides aminés (PSA-EHT019prota / SEQ ID NO : 115). 85 acides aminés peuvent être clivés pour former la séquence PSA-EHT019protb / SEQ ID NO : 116. Les 6 derniers acides aminés (PSA-EHT019protc / SEQ ID NO : 117) représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que les nucléotides correspondant aux positions Genbank (M27274) 3786 et 3943 dans SEQ ID NO :28 correspondent à T et à A alors que la référence Genbank indiquent C et C respectivement. Ces différences peuvent s'expliquer par l'existence de polymorphismes à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Le premier changement ne modifie pas la séquence protéique. Le deuxième remplace un résidu serine par un résidu arginine.
PSA-EHT021 (SEQ ID NO : 29) :
Cette isoforme utilise un site cryptique d'épisage 3' situé dans l'exon 3 en position 3885 (site consensuel) et présente également une délétion dans la partie 3' de l'exon 3 (nucléotides 3903-4025). Cette isoforme PSA-EHT021 code donc pour une protéine de 177 acides aminés (PSA-EHT021prota / SEQ ID NO : 118). 162 acides aminés peuvent être clivés pour former la séquence PSA-EHT021 protb / SEQ ID NO : 119 . Les nouvelles jonctions créées autour des résidus 69 et 76 représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 1966 dans SEQ ID NO :29 correspond à A alors que la référence Genbank indique G. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement ne modifie pas la séquence protéique.
PSA-EHT022 (SEQ ID NO : 30) :
Cette isoforme présente une délétion dans la partie 3' de l'exon 3 (nucléotides 3903-4025). Cette isoforme PSA-EHT022 code donc pour une protéine de 220 acides aminés (PSA-EHT022prota / SEQ ID NO : 120). 205 acides aminés peuvent être clivés pour former la séquence PSA-EHT022protb / SEQ ID NO : 121 . La nouvelle jonction créée autour du résidu 119 représente une information nouvelle par rapport à PSA de type sauvage et est ainsi susceptible d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 1966 dans SEQ ID NO :30 correspond à A alors que la référence Genbank indique G. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement ne modifie pas la séquence protéique.
PSA-EHT022 (SEQ ID NO : 30) correspond à un variant de PSA soumis à Genbank le 24 Octobre 2002 (numéro d'accès : AJ459782).
PSA-EHT023 (SEQ ID NO :31) :
Cette isoforme comprend une délétion d'un fragment de l'exon 2 (nucléotides
1990-2040), l'utilisation d'un site cryptique en 3' de l'exon 3 en position 3885 (site consensuel) et une rétention d'un fragment 5' de l'intron 3 (nucléotides 4043-4060) (site consensuel). Cette isoforme code pour une protéine de 207 acides aminés (PSA-EHT023prota /SEQ ID NO : 122). 192 acides aminés peuvent être clivés pour former la séquence PSA-EHT023protb / SEQ ID NO : 123. Les nouvelles jonctions créées autour des résidus 27, 53 et dans la région 105-111 représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que les nucléotides correspondant aux positions Genbank (M27274) 2060 et 5731 dans SEQ ID NO :31 correspondent à G et à G alors que la référence Genbank indiquent T et T respectivement. Ces différences peuvent s'expliquer par l'existence de polymorphismes à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Le premier changement remplace un résidu cystéine par un résidu glycine. Le deuxième ne modifie pas la séquence protéique..
PSA-EHT025 (SEQ ID NO : 32) : Cette isoforme correspond à la délétion de l'exon 3. Cette isoforme code pour une protéine de 85 acides aminés (PSA-EHT025prota / SEQ ID NO : 124). 70 acides aminés peuvent être clivés pour former la séquence PSA-EHT025protb / SEQ ID NO : 125. Les 16 derniers acides aminés (PSA-EHT025protc / SEQ ID NO : 126) représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que les nucléotides correspondant aux positions Genbank (M27274) 2118-4186 et 5791 dans SEQ ID NO :32 correspondent à G et à G alors que la référence Genbank indiquent AT et C respectivement. Ces différences peuvent s'expliquer par l'existence de polymorphismes à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. La concordance des sites 3' de l'exon 2 et 5' de l'exon 4 suggère une mutation introduite par la polymerase dans cette région. Le dernier changement ne modifie pas la séquence protéique.
PSA-EHT026 (SEQ ID NO : 33) :
Cette isoforme présente une délétion d'un fragment situé dans l'exon 3 (nucléotide 3781-4025). Cette isoforme PSA-EHT026 code pour une protéine de 78 acides aminés (PSA-EHT026prota / SEQ ID NO : 127). 63 acides aminés peuvent être clivés pour former la séquence PSA-EHT026protb / SEQ ID NO : 128 .
PSA-EHT027 (SEQ ID NO : 34) Cette isoforme utilise un site cryptique d'épissage situé en 5' dans l'exon 3 en position 3780 et une délétion de l'exon 4 Cette isoforme PSA-EHT027 code pour une protéine de 144 acides aminés (PSA-EHT027prota / SEQ ID NO : 129 ). 129 acides aminés peuvent être clivés pour former la séquence PSA- EHT027protb / SEQ ID NO : 130 . Les 67 derniers acides aminés (PSA- EHT027protc / SEQ ID NO : 131) représentent une information nouvelle par rapport à PSA de type sauvage et sont ainsi susceptibles d'inclure un ou des épitopes spécifiques de cette isoforme. On peut remarquer que le nucléotide correspondant à la position Genbank (M27274) 1966 dans SEQ ID NO :34 correspond à A alors que la référence Genbank indique G. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure des mutations introduites par la polymerase. Ce changement ne modifie pas la séquence protéique.
PSA-EHTa (SEQ ID NO :35) :
Cette isoforme présente une rétention de 91 nucléotides de la partie 5' de l'intron 1 suivie d'une délétion des 152 nucléotides suivants (pour retrouver ensuite l'intron 1). Cette isoforme PSA-EHTa code pour une protéine de 90 acides aminés (PSA-EHTa1 , SEQ ID NO :132) dont les 75 derniers acides aminés peuvent être clivés (PSA-EHTa2, SEQ ID NO :133), représentant une information différente par rapport à PSA et dont les 44 derniers acides aminés (PSA-EHTa3, SEQ ID NO : 134) représentent une information nouvelle par rapport à une rétention totale de l'intron 1 déjà décrite (David et.al, (2002)). Q remplace P en position 26 des 74 derniers acides aminés. On peut remarquer que les nucléotides en position 90 et 234 de SEQ ID NO :35 correspondent à A, C, alors que la référence genbank indique C et T. D'autre part, les nucléotides G et C en position 243 et 293 différent également par rapport à la référence genbank . Cependant, ces deux nucléotides correspondent effectivement à une séquence génomique publiée ( numéro d'accès Genbank : NT_011190 ). Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée , bien que l'on ne peut exclure des mutations introduite par la polymerase. Ainsi, un résidu glutamine a remplacé le résidu praline (mutation 90), et un résidu thréonine a remplacé un résidu isoleucine (mutation 234).
PSA-EHTd (SEQ ID NO : 36) : Cette isoforme présente une délétion des 9 derniers nucléotides de l'exon 2 et des 243 premiers nucléotides de l'exon 3. Cette isoforme PSA-EHTd code pour une protéine présentant une délétion de 84 acides aminés (PSA-EHTd1 , SEQ ID NO :135). Un nouveau domaine est crée entre le résidu cystéine 66 et le résidu thréonine 151.
PSA-EHTf (SEQ ID NO : 37) : Cette isoforme présente une rétention de l'intron 3 délété de 105 nucléotides (2420-2526). Cette isoforme PSA-EHTf code pour une protéine tronquée après le résidu asparagine numéro 69 lequel est substitué par résidu lysine (PSA- EHT l , SEQ ID NO :136). On peut remarquer que le nucléotide en position 56 de SEQ ID NO :37 correspond à G, alors que la référence genbank indique A. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par une erreur dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase. Cette mutation remplace un résidu histidine en résidu arginine.
PSA-EHTh (SEQ ID NO : 38) :
Cette isoforme résulte de l'utilisation d'un site cryptique d'épissage au sein de l'intron 4 (en position 5472). Cette isoforme PSA-EHTh code pour une protéine comprenant l'une des deux phases de lecture correspondant à PSA-EHTM (SEQ ID NO :137) ou PSA-EHTh2 (SEQ ID NO :138). On peut remarquer que les nucléotides en position 79, 199 et 258 de SEQ ID NO :38 correspondent à C, C et G, alors que la référence genbank indique T, T et A. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase.
PSA-EHTj (SEQ ID NO : 39) :
Cette isoforme résulte de l'utilisation d'un site cryptique d'épissage au sein de l'intron 4 (en position 5257). Cette isoforme PSA-EHTj code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTjl (SEQ ID NO :139), PSA-EHTJ2 (SEQ ID NO :140) ou PSA-EHTJ3 (SEQ ID NO :141 )
PSA-EHTk (SEQ ID NO : 40) : Cette isoforme présente une rétention de la partie 3' de l'intron 3, puis une rétention d'un intron 4 tronqué (entre positions 4337 et 5516). Cette isoforme code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTkl (SEQ ID NO :142), PSA-EHTk2 (SEQ ID NO :143), ou PSA-EHTk3 (SEQ ID NO :144).
PSA-EHTI (SEQ ID NO : 41) :
Cette isoforme utilise un site cryptique dans l'exon 4 en position 4274 et un autre site cryptique dans l'intron 4 en position 4538. On peut remarquer que le nucléotide en position 79 de SEQ ID NO :41 correspond à C, alors que la référence genbank indique T. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par une erreur dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase. PSA-EHTI code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTH (SEQ ID NO :145), PSA-EHTI2 (SEQ ID NO :146) ou PSA-EHTI3 (SEQ ID NO :147). Dans PSA-EHTI3, cette mutation remplace un résidu isoleucine en résidu thréonine.
PSA-EHTm (SEQ ID NO : 42) : Cette isoforme présente une rétention d'un intron 1 tronqué (entre 1214 et 1755). PSA-EHTm code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTm1 (SEQ ID NO :148), PSA-EHTm2 (SEQ ID NO :149) ou PSA-EHTm3 (SEQ ID NO :150).
PSA-EHTn (SEQ ID NO : 43) :
Cette isoforme présente une rétention d'un intron 1 tronqué (entre 1366 et 1736). PSA-EHTn code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTn1 (SEQ ID NO :151), PSA-EHTn2 (SEQ ID NO :152) ou PSA-EHTn3 (SEQ ID NO :153).
PSA-EHTp (SEQ ID NO : 44) Cette isoforme résulte de l'utilisation d'un site cryptique d'épissage dans l'intron 1 (en position 1240). PSA-EHTp peut coder pour une protéine comprenant 27 acides aminés supplémentaires au-delà du résidu isoleucine occupant la position 15 (PSA-EHTp1 , SEQ ID NO :154). Ces 27 acides aminés représentant la séquence PSA-EHTp2 (SEQ ID NO :155) peuvent être libérés après clivage.
PSA-EHTq (SEQ ID NO : 45) :
Cette isoforme présente une rétention d'un intron 2 tronqué (entre positions 2740 et 3167). PSA-EHTq code pour une protéine comprenant l'une des deux phases de lecture correspondant à PSA-EHTq1 (SEQ ID NO :156), ou PSA- EHTq2 (SEQ ID NO :157).
PSA-EHTr (SEQ ID NO : 46) :
Cette isoforme présente une rétention d'un intron 2 tronqué (entre positions 2589 et 3199). PSA-EHTr code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTM (SEQ ID NO :158), PSA-EHTr2 (SEQ ID NO :159) ou PSA-EHTr3 (SEQ ID NO :160).
PSA-EHTs (SEQ ID NO :47 ) : Cette isoforme présente une rétention d'un intron 4 tronqué (entre positions 4516 et 4889). On peut remarquer que les nucléotides en position 54, 93 et 201- 208 de SEQ ID NO :47 correspondent à C, A et TGCCGCTG, alors que la référence genbank indique T, G et AG-GTGT. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase. Cette isoforme code pour une protéine comprenant l'une des deux phases de lecture correspondant à PSA-EHTs1 (SEQ ID NO :161) ou PSA-EHTs2 (SEQ ID NO :162). La mutation en position 54 remplace dans PSA-EHTs1 un résidu leucine en résidu praline.
PSA-EHTt (SEQ ID NO : 48) Cette isoforme présente une rétention d'un intron 4 tronqué (entre positions 4727 et 5111). On peut remarquer que les nucléotides en position 137 et 239 de SEQ ID NO :48 correspondent à G et A, alors que la référence genbank indique A et G. Ces différences peuvent s'expliquer par l'existence d'un polymorphisme à ces positions, par des erreurs dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase. Cette isoforme code pour une protéine comprenant l'une des deux phases de lecture correspondant à PSA-EHTt1 (SEQ ID NO :163) ou PSA-EHTt2 (SEQ ID NO :164).
PSA-EHTu (SEQ ID NO : 49) :
Cette isoforme résulte de l'utilisation d'un site cryptique dans l'intron 4 (en position 5056). On peut remarquer que le nucléotide en position 48 de SEQ ID NO :49 correspond à T, alors que la référence genbank indique C. Cette différence peut s'expliquer par l'existence d'un polymorphisme à cette position, par une erreur dans la séquence référencée, bien que l'on ne peut exclure une mutation introduite par la polymerase. PSA-EHTu code pour une protéine comprenant l'une des trois phases de lecture correspondant à PSA-EHTu1 (SEQ ID NO :165), PSA-EHTu2 (SEQ ID NO : 166) ou PSA-EHTu3 (SEQ ID NO :167). La mutation 48 remplace le résidu alanine en résidu valine dans PSA-EHTU2.
C - VALIDATION DE L'EXPRESSION DES ISOFORMES DE PSA ET DE KLK2 PAR L'UTILISATION D'UN MICRO-ARRAY COMPORTANT DES OLIGONUCLEOTIDES DE JONCTION
L'expression des variants de PSA et de KLK2 décrits dans cette invention a été établie à l'aide d'un micro-array comportant des oligonucléotides capables de s'hybrider de façon spécifique avec ces variants. Sur la base de leurs séquences, les variants d'épissage de PSA et klk2 proviennent d'événements de natures différentes (Figure 1). • « exon skipping » : l'oligonucléotide spécifique (e.g., discriminant) est dessiné pour être complémentaire de la séquence créée par la jonction exon1-exon3
• rétention d'introns : l'oligonucléotide spécifique est localisé dans la séquence de l'intron.
• dans le cas d'une utilisation alternative de sites d'épissage en 5' ou 3', l'oligonucléotide discriminant est dessiné pour être complémentaire de (i.e., placé sur) l'une ou l'autre de ces nouvelles jonctions.
• des oligonucléotides dans les exons et sur les jonctions des formes sauvages de klk2 et PSA sont aussi générés.
C1 - Description du micro-array à oligonucléotides de jonction.
Cette étude a consisté à générer 149 oligonucléotides de 24 à 25 mers. Leurs séquences sont jointes en documents annexe (Tableau 1 ). Les oligonucléotides « discriminants », complémentaires des jonctions spécifiques créées par les variants décrits sont revendiqués (SEQ ID NO : 168 à SEQ ID NO : 220).
5 oligonucléotides ont été utilisés pour caractériser chaque événement d'épissage alternatif (voir figure 2). Un oligonucléotide est spécifique de l'exon éliminé et permet la quantification de la forme longue. Un second oligonucléotide est spécifique de l'un des exons adjacents non impliqué dans l'épissage et permet de quantifier les formes longues et courtes de l'ARN. Enfin, trois oligonucléotides sont spécifiques des jonctions ; parmi eux, l'un est spécifique de la nouvelle séquence générée après epissage et permet de quantifier la forme épissée. Il est entendu que d'autres combinaisons d'oligonucléotides peuvent être envisagées, notamment l'emploi d'un seul ou de deux oligonucléotides seulement.
Concernant le design des oligonucléotides, étant donné que les sondes o sont plus courtes que les sondes produits PCR classiquement utilisées, il est nécessaire de vérifier que ces sondes n'hybrident pas de manière aspécifique d'autres gènes que celui pour lequels elles ont été dessinées. De plus, il est indispensable d'assurer que les oligonucléotides ne présentent pas de structures secondaires qui pourraient interférer avec leur capacité d'hybridation. D'un manière générale, il est préférable d'avoir sur la puce un profil thermodynamique homogène pour l'ensemble des oligos générés, à savoir le Tm (65°C) et la longueur (24-25 mers). Au cours de leur synthèse, les oligonucléotides sont par ailleurs modifiés en 5' par un groupement NH2-C6 favorisant leur flexibilité et permettant d'établir une liaison covalente avec le polymère constituant le revêtement de la lame de verre.
Concernant plus précisément les oligonucléotides de jonction, ils sont idéalement centrés sur les jonctions, mais nous avons considéré également les possibilités d'oligonucléotides décalés sur la jonction.
En terme de logiciel de design d'oligonucléotides, nous avons sélectionné le logiciel Primer Finder.
Les critères que nous avons sélectionnés sont les suivants :
- %GC : 40% à 60% pour les 24-mers et les 30-mers, 30% à 60% pour les 40 mers.
- Concentrations en oligonucléotides : 50 nM - Concentrations en sels : 50 mM
- Ignorer les oligonucléotides ayant des tendances à former des structures secondaires en « épingles à cheveux » ou ayant des possibilités de s'autodimériser.
Dans le but de valider notre technologie, nous avons dans un premier temps travaillé avec des isoformes clonées (cf. figure 3). Les plasmides contenant les isoformes longues et courtes ont été linéarisés avant transcription in vitro. Le milieu réactionnel contient de l'aminoailyl-UTP qui interagit chimiquement avec le fluorochrome. Nous avons choisi de marquer les isoformes longues en Cy3 et les isoformes courtes en Cy5. L'ARN présentant de nombreuses structures secondaires qui gêneraient l'hybridation, il a été imaginé d'introduire dans le protocole une étape de fragmentation chimique. Après purification les isoformes ont été mélangées puis hybridées sur lame de verre (3D Link, Mororola ou Codelink, Amersham).
La figure 4 représente les résultats obtenus sur deux des clones correspondant à des gènes différents. Cette expérience a été réalisée dans le but vérifier la spécificité d'hybridation de nos oligonucléotides. Pour cela, nous avons amplifié de l'ARN de drosophile par transcription in vitro dans lequel nous avons introduit un exogène contrai d'Arabidopsis thaliana qui nous servira à calibrer le scanner au moment de la lecture des lames. Les isoformes marquées (5ng par isoformes) sont ensuite diluées dans le cRNA de drosophile qui crée un environnement complexe nous permettant de vérifier la spécificité de l'hybridation sachant que l'ARN de drosophile ne contient pas la séquence permettant l'hybridation de la cible (analyse bioinformatique). Après hybridation, la lame a été lue dans les 2 canaux, celui de la Cy3 et de la Cy5. L'intensité de fluorescence est mesuré sur chaque spot et les valeurs sont normalisées par le calcul de la médiane.
Chaque oligonucléotide est spotté en quadruplet. Les oligonucléotides correspondant à l'exon 2, aux jonctions 1-2 et 2-3 ont été dessinés pour n'hybrider que la forme longue, c'est pourquoi ils apparaissent en rouge sur l'image générée par QuantArray. Les oligonucléotides spécifiques de la jonction 1-3 sont supposés n'hybrider que les formes courtes, ils apparaissent effectivement en vert. Puisqu'on a utilisé un mélange équimolaire d'isoformes longues et courtes, la superposition des deux images donne des spots oranges. (Des expériences similaires ont été réalisées pour déterminer la sensibilité de notre puce en diluant les isoformes jusque 26 pg).
De cette expérience nous pouvons voir que après normalisation 50% de l'hybridation est due à la forme longue si l'on se base sur l'exon commun. Entre 90% et 100% de l'hybridation est due à la forme longue sur l'exon 2, les jonctions 1-2 et 2-3. Moins de 7% de l'hybridation est due à la forme longue sur la jonction 1-3. Ces expériences ont permis de valider le design des oligos et la spécificité des hybridations. Ce fort degré de spécificité est crucial si l'on veut utiliser cet outil pour quantifier les isoformes.
Les résultats précédents ont été obtenus en utilisant un mélange équimolaire d'isoformes longues et courtes. L'étape suivante a donc été de montrer que l'outil est quantitatif (figure 5) ; pour cela nous avons fait varier dans nos échantillons la quantité de formes longues de 0% à 100% par tranches de 20% (axe des abscisses) en marquant les formes longues et les formes courtes avec des fluorochromes différents.
Nous avons après normalisation des intensités de fluorescence, mesuré le % de formes longues sur la base des valeurs obtenues sur l'exon commun que nous avons reportées sur l'axe des ordonnées. Comme en témoigne le graphe, les valeurs mesurées sont très proches des valeurs théoriques.
De l'ensemble de ces études, nous pouvons prévoir d'utiliser l'outil qu'est l'oligoarray dans le but de définir qualitativement et quantitativement l'expression d'exons épissés ou de rétention d'introns.
149 oligonucléotides de 24 et e 25 mers ont été conçus pour réaliser le micro- array. Ces oligonucléotides ont été repris à une concentration de 25 uM dans un tampon Phosphate de Sodium 150 mM. Les oligonucléotides ont ensuite été déposés sur lames de verre (Codelink , Amersham), puis ces lames sont incubées dans une chambre saturante en NaCI pendant 16h. Les sites réactifs non utilisés seront ensuite bloqués en utilisant une solution d'éthanolamine 50 mM, Tris 0.1 M, SDS 0.1% à pH 9, elles sont ensuite lavées dans une solution à 4xSSC/0.1%SDS.
Les cibles sont hybridées dans le tampon 5X SSC, 0.1% SDS, 0.1 mg/ml ADN de sperme de saumon, à une température de 50°C pendant 16h. Elles sont ensuite lavées en augmentant la stringence des bains : 4X SSC pour éliminer le cover slip 2X SSC / 0.1% SDS pendant 5min à 50°C 0.2X SSC pendant 5 minutes à température ambiante 0.1X SSC pendant 5 minutes à température ambiante
C2 - Détermination de la capacité d'hybridation des oligonucléotides
La capacité d'hybridation et la spécificité d'hybridation d'oligonucléotides discriminants entre PSA et klk2 ont été vérifiées. Pour cela, nous avons poolé plusieurs isoformes correspondant à klk2 que l'on a marqué à la cyanine 5 et plusieurs isoformes de PSA qui ont été marquées à la cyanine 3 (figure 6). Les cRNA ont ensuite été cohybridés sur une même lame qui est lue dans les 2 canaux et lorsque l'on superpose les 2 images, il apparaît qu'il n'y a pas d'hybridation croisée entre les oligonucléotides PSA et klk2 à l'exception d'un oligo déposé en quadruplet qui a été redessiné.
C3 - Etudes d'échantillons tumoraux et sains de patients
Puisque la quantité de matériel biologique dont nous disposons le plus souvent est insuffisante, nous avons eu recours à une amplification d'ARN (figure 7). La première étape consiste à reverser de l'ARNm en présence d'oligodT grâce à la Superscript II. La RnaseH va dégrader l'ARN ayant servi de matrice et laisser des amorces qui seront utilisées par la DNA polymerase I pour la synthèse du second brin d'ADNc. Les fragments synthétisés seront assemblés par la DNA ligase. A l'issue de cette étape , on se retrouve avec une structure d'ADN double brin qui sera reconnue par la T7 DNA polymerase, elle va amplifier le brin correspondant à la séquence du messager et synthétiser des molécules de cRNA qui s'hybrideront aux sondes de séquence complémentaire (sens du mRNA).
Pour chaque patient, 8ug de cibles correspondant aux échantillons tumoraux et sains et marqués à l'aide de 2 fluorochromes différents ont été cohybridés sur une même lame. Les intensités de fluorescence ont été mesurées dans les 2 canaux et normalisées selon la méthode de l'intensité globale dans un logiciel d'analyse de fluorescence sur lame de verre (GeneTraffic). La figure 8 représente la superposition des deux images obtenues pour l'un des patients.
Pour les 3 autres patients analysés nous pouvons faire des remarques similaires : la qualité du signal de fluorescence est bonne, les intensités sont supérieures à 1500 en général.
Concernant les échantillons tumoraux et bénins provenant des 4 patients, l'analyse des signaux a démontré que certaines isoformes étaient exprimées différentiellement parmi plusieurs patients (Figure 9).
C4 - Etudes de lignées de cancer de la prostate et de cancer du sein
Des expériences ont consisté à comparer les profils d'expression d'isoformes PSA et de KLK22 entre des lignées de cancer de la prostate et de cancer du sein. Pour cela, nous avons amplifié de l'ARN de deux lignées de cancer de la prostate (Mda2b et LnCAP) et de 4 lignées de cancer du sein (Mda231 , T47D, Mcf7 et BT549).
Nous avons ensuite cohybridé chaque lignée de cancer de la prostate avec les différentes lignées de cancer du sein après avoir marqué les lignées Mda2b et LnCAP à la Cyanine 3 et les lignées de cancer du sein à la Cyanine 5.
Les lames ont été lues dans les 2 canaux et les intensités de fluorescence ont été normalisées dans GeneTraffic selon la méthode d'intensité globale. Nous avons scindé l'étude en deux groupes d'hybridations en fonction de la lignée prostatique. Nous avons ensuite identifié une liste d'oligonucléotides discriminants dont l'expression est dérégulée dans au moins une des hybridations au sein d'un même groupe d'hybridation. Nous avons sélectionné les oligos pour lesquels un ratio inférieur à 0.66 ou supérieur à 1.5 a été calculé (soit -0.58<Mean log2 ratio>0.58). Nous avons choisi de présenter les résultats des l'analyses Mda2b vs T47D et LnCAP vs T47D pour lesquels nous avons observé l'expression différentielle la plus importante et affectant le plus grand nombre d'oligonucléotides discriminants. Une expression différentielle de 15 isoformes parmi lesquelles 3 sont surexprimées dans les lignées issues de cancer de la prostate par rapport à une lignée issue de cancer du sein à savoir PSA-EHT019, PSA-EHTj et PSA-EHTI a pu être observée. Les 12 autres sont sous-exprimées dans le cancer de prostate (Figure 10).
C5 - Etudes de tissus
Des expériences ont consisté à vérifier la spécificité tissulaire de l'expression des isoformes de PSA et de KLK2. Pour cela nous avons choisi 4 tissus : la prostate, le cœur, le rein, et l'intestin. Nous avons amplifié les ARN de ces 4 tissus et nous avons co-hybridé l'ARNc de la prostate marqué à la Cyanine 3 avec les ARNc des autres tissus marqués à la Cyanine 5. Nous avons aussi cohybridé l'ARNc de prostate marqué à la Cyanine 3 avec de ARNc de prostate marqué à la Cyanine 5.
Les lames ont été lues dans les 2 canaux et les intensités de fluorescence ont été normalisées dans GeneTraffic selon la méthode d'intensité globale. Nous avons ensuite identifié une liste d'oligonucléotides discriminant dont l'expression est dérégulée dans au moins une des hybridations au sein du groupe d'hybridation regroupant ces 4 hybridations. Nous avons sélectionné les oligonucléotides pour lesquels un ratio inférieur à 0.66 ou supérieur à 1.5 a été calculé (soit -0.58<Mean log2 ratio>0.58).
Il a ainsi été mis en évidence une expression dérégulée de plusieurs isoformes de PSA et de KLK2 en fonction du tissu sain testé ( prostate, cœur, petit intestin, rein). Ce sont : PSA-EHT003, PSA-EHT005, PSA-EHT013, klk2-EHTb, klk2- EHTd, klk2-EHTj klk2-EHTf et PSA-EHTI, PSA-EHT019 et klk2-EHTe (figure 11 et 12).
C6 - Récapitulation des signaux d'hybridation obtenus
Les tableaux 3, 4 et 5 regroupent les signaux d'hybridation obtenus sur le micro- array à oligonucléotides à partir de tissus sains (tableau 3), de lignées cellulaires (tableau 4) et de tissus provenant de patients atteints de cancer de la prostate (tableau 5). Les valeurs supérieures à deux fois la valeur du bruit de fonds représentant une hybridation significative sont indiquées. Les valeurs inférieures à deux fois le bruits de fonds sont représentées par #NA. Il apparaît alors que tous les oligonucléotides discriminants sauf les oligonucléotides SEQ ID NO : 184, 215 et 220 produisent des signaux significatifs dans au moins un des systèmes étudiés. L'expression des isoformes décrites dans la présente invention est donc confirmée par cette approche. Il convient également de noter que l'isoforme PSA-EHT 023 qui est associée à l'oligonucléotide SEQ ID NO : 184 a pu être détectée par une approche PCR plus sensible (voir chapître D suivant).
En conclusion, il apparaît que la majorité des isoformes décrites dans cette invention soient effectivement exprimées dans un des modèles étudiés. Des expressions tissulaires spécifiques et tumorales spécifiques ont également été mises en évidence.
D - VALIDATION DE L'EXPRESSION DES ISOFORMES DE PSA ET DE KLK2 PAR PCR.
Une technique de PCR de jonction a été utilisée afin de révéler l'existence de certaines isoformes. Le principe repose sur l'amplification spécifique des isoformes grâce à des oligonucléotides désignés spécifiquement sur la nouvelle jonction résultant de l'épissage alternatif déjà décrit. Ces amplifications sont réalisées sur des ARN issus des zones bénignes et des zones tumorales des prostates des mêmes patients, ainsi que sur des contrôles plasmidiques.
Les résultats des amplifications par PCR sont présentés en figure 13. La flèche représente la bande de la taille attendue. On recherche une amplification spécifique des isoformes dans les pools T et N , avec un contrôle wt négatif, c'est à dire aucune amplification spécifique de la taille de l'isoforme sur le plasmide sauvage. Le plasmide avec l'isoforme clonée sert de contrôle positif d'amplification.
En conclusion, cette technique permet également de mettre en évidence la présence de certaines isoformes dans les tissus prostatiques. D'une sensibilité accrue par rapport au micro-array, l'approche PCR a notamment révélé l'expression de PSA-EHT012.
E - PRODUCTION D'ANTICORPS ET EXPRESSION DES PROTEINES
Afin de déterminer l'existence de protéines encodees par certains des variants décrits dans la présente invention, des anticorps polyclonaux spécifiques de T FR03/00833
60
certaines des isoformes ont été produits. Ces anticorps ont été utilisés dans des « westem-blots » afin de détecter l'expression des protéines correspondantes.
Production d'anticorps et expression des protéines. Tous les peptides et les anticorps ont été produits par la société Eurogentec (Belgique). 20-30 milligrammes des peptides correspondant aux séquences décrites dans la figure 14 ont été synthétisés par chimie Fmoc avec une pureté supérieure à 70%. Pour provoquer une réponse immune, la KLH a été couplée à 5 milligrammes de chaque peptide par l'utilisation de MBS (m- maleimidobenzoyl-N-hydroxysuccinimide ester) ou de glutaraldehyde.
Deux lapins (SPF New Zealand white rabbits) ont été immunisés avec 200 microgrammes de peptide couplé. La première injection a été effectuée avec de l'adjuvant de Freunds complet alors que les injections successives ont été effectuées en adjuvant de Freunds incomplet. Un protocole standard a été utilisé comportant des injections aux jours 0, 14, 28 et 56 et des collections de sérums aux jours 0, 38 et 66. Le saignement final a eu lieu au jour 87. L'évolution du titre dans les sérums a été effectuée par test ELISA (figure 15). Les antigènes, peptides synthétiques ou KLH ont été appliqués dans les puits des plaques ELISA (100 nanogramme dans du PBS à 4°C pendant 16 heures). Après saturation (BSA 1mg/ml à 25°C pendant 2 heures), des dilutions successives de sérums (préimmuns : PPI, de la première récolte : PP et de la deuxième récolte : GP) ont été incubées à 25°C pendant 2 heures. Le système HRP / OPD a été utilisé pour révéler la fixation des anticorps par mesure de la densité optique à 492 nm. Les titres obtenus vis à vis des épitopes sélectionnés sont satisfaisants.
Analyse par "Western Blots".
Les extraits protéiques ont été préparé à partir de tissus et de lignées cellulaires à l'aide d'un tampon de lyse (Tris 50 mM pH=7.5, EGTA 5 mM, NaCI 150 mM, Triton 1 %, NaF 50 mM, inhibiteurs de proteases (Roche)). Les extraits ont été quantifiés par la méthode de Bradford. Pour les tissus, 20 microgrammes d'extraits ont été déposés sur gel de poly-acrylamide-SDS, Pour les sérums, 15 microlitres d'une dilution de sérum non purifié au cinquantième ou d'une dilution de sérum purifié (kit Aurum BioRad n° 732-6701 ) au huitième ont été utilisés. Après electrophorése dénaturante, les protéines séparées sont transférrées sur membrane PVDF. Les variants de PSA et de KLK2 sont ensuite détectés par incubation de la membrane avec un anticorps polyclonal produit spécifiquement (cf chapitre précédent). Après lavage, la membrane est incubée avec un anticorps secondaire anti-immunoglobulin marqué à la peroxidase HRP (dilution 1/5000). Les bandes sont ensuite visualisées par détection ECL (Amersham).
Anticorps EHT- SE3962
Cet anticorps a été généré à parir d'un épitope commun aux variants KLK2- EHT004, et KLK2-EHT006. Les tailles attendues pour ces deux variants sont de 17 kD (KLK2-EHT006) et de10 kD (KLK2-EHT004). Deux bandes migrant aux tailles attendues peuvent être observées à partir de sérums (Figure 16).L'anticorps semble reconnaître ces bandes spécifiquement car il peut être déplacé par des doses croissantes de peptides synthétiques correspondant à l'épitope choisi (figure 16D). On peut observer une hétérogénéité selon les échantillons de sérums. On n'observe pas de corrélation évidente avec le taux de PSA total (figure 16 A), B) et C))
Anticorps EHT-SE3963
Cet anticorps a été généré contre un épitope de jonction correspondant à PSA- EHT021 (taille attendue 20 kD). Trois bandes de poids moléculaires d'environ 22, 25 et 40 kD sont observées à partir de tissus prostatiques (figure 17). La bande de plus faible poids moléculaire pourrait correspondre à PSA-EHT021. La bande à 25 kD pourrait correspondre à un variant déjà décrit et présentant un des deux événement d'épissage associé à PSA-EHT021 (Tanaka et al, 2000). REFERENCES
David et.al, (2002) J. Biol. Chem
Riegman et al (1988) Biochem. Biophys. Res. Commun. 155, 181-188. Riegman et.al ( 1991 ) Mol. Cell. Endicronol. 76, 181 -190.
Liu et.al (1999) Biochem. Biophys. Res. Commun. 264, 833-839
Heuzé et.al (1999) Cancer Res. 59, 2820-2824.
Heuzé-Vourc'h et.al (2001) Eur J Biochem. 268, 4408-4413.
Heuzé-Vourc'h et al (2003) Eur J Biochem. 270, 706-714 Meng et.al (2002) Cancer Epidemiology, Biomarkers and Prévention 11, 305-
309.
Tanaka et.al (2000) Cancer Res. 60, 56-59.
Young et.al (1992) Biochemistry 31 , 818-824.
TABLEAU 1
TABLEAU 2
Tableau 3
CD CO <r O O LO CO 00 CM C CO o <r co M ^f 3; co CM <: <: ; : CO - ιo CΛ C c 2: 5; N tO Z C _ ° Z Z Z Z . w eo _ CO - ιθ Z co zz^z -^-^-zzz
H- M tt D lO ^ ^ ^ ^ tt ^ ^ g tt CN M * * ≈tfc ≈tt cM tt ≈tfc cO CO ^ l'* l'* ^
co -- r^ o CΛ
T- 00 LO o <: «: N- 00 co : < < <; C Z ^ ^ Z ∞ Z Z Z ^ O Z CM t- CO ^ ; § -î -<
Z Z ^ z Z 00 z z CM O z z z σj 'r- tt cM ^ J ^ ^ tt ^ sj O tt T- CM tt ^ M ^ ^ -o ^ ^ io σj ^ * ^ ^
CO CO g- CΛ t-
co ° " " CO σ t- si- o
CΛ < 00 o CO -S o LO < co ° LO -
O ^ CC) N ^1 σ> CM 5t 5J; σ ^ CD W ^ CO <: <: 00 7 "^ 00 CO 7 00 CD LO
LO U o z Z LO < T- O CM co - ∞ co -^ * O (O ∞ tt CD 1^ o tt "* "* ££ L
CD
CM CM °° i- ft ft ( t- •^ 00 i- ttz CM ≈ztt CO
CD
5 <; <: <: <: CO CO CO LO
CΛ CΛ CM CΛ $ <. <. <. <. LO co CΛ
00 CD CO <: o ^^^ co Z Z Z Z ~ 00 ^ -. w - wCO ^ n z z z z ^ m z iD ^t-5 M CΛ i^ . 00 N. z z z co ^ tt ^ tt CO CΛ LO CO tt cO ^ tt tt tt cM C ^ CD ^ tt Sj • ^<^-- *z ttz c o tt tt tt
LO < < < oos t 00 CM o CO CO 00 co Çg Ss'' CO Lo
CΛ LOO ^ < ^ < < <
^ 2 Z Z Z N- t- - LO CΛ ≤
Z CM z Z *- Z z ° ZZ Z
£2 * *fc =t* * CO J- i ^ ^ T- tt tt ^ ztt z ^ LO tt co tt tt ^ CM ^ ^ Ç * -H: *fc
5 ≤Ç ^ o -=* "<* < h- T-
T- Si: T- CM c<c< <c :^§^^^ o
L z Z 22 S oo z LO co Z Z Z Z Z - c Z Z Z o -i: co
~ CD O * 00 - -tt tt tt ≈H- ≈tt: T— ^t tt tt tt o tt -lt z-tt z-tt z-ffc ztt ^Z Z≈tfc
00
00 o 00 lO cO C S 1- C - <r, CM -0 ^ - _ CO - ,Λ -O CM ^ <f <ι- ; «j- CO <ι- 00 ^-. CO T- O '^ *»-' 1>I m rv "-" i— U.J -+. ^~ ;-» ι.\ «_» jj' J
CM T- CM CM CΛ °> Çg CM <sf CO ^r C0 ÇO | . CM Ç l^. CM O Z Z Z C _
LO
1- CO ^ t o tt =8: 00
CM CM LO CO LO CΛ T- CM ^ ^ L ^ LO ^
CO 0 τ- 00 00 o -sf- ^ CO CΛ - <: <: - CO 0
O ~ CM σ> ^ 1^ r^- <: <: : CD CO O
CM 2: LO CM o < < <
CΛ z z CM - CM LO CΛ z CD 00 z ^
Z Z Z LO r., co - <t ' CΛ CO O z Z CD ^ =5
LO tt tt CM CM [^ 00 o =tt tt tt ^ CM l-' CO tt LO CD C CO ^ ^ fS ^ ^ tt
< < < < co co CD CD M L co . O N.
CD LO o CM ^fr C C < < CM CM CO CΛ
J? Z zz z LO co - O CM CO O CO ^ 5Î ≤î O ^ ^ CD <C ^ ^ LO Z Z ^- CD CM Z Z ∞ Z Z Z *fc *fc * *fe cCoO CCΛΛ ^ ^ ^ M tt Η- ^ Η: O O -bfc M v * tt tt ^ CM LO ≈fcfc ≈tfc ^r ≈fcfc *fc *fc
LO <f <f CM - O CD 00 o Tr <tf Lθ <r < çθ χ- <£ ' ; <r' <: <r" r, ' l"
O 5 2; CO CO "fr τ- 1^- 00 co <C < c l^ c s o s 5s ^f χfr 5s i: 5s : s 5i: 5 D
CΛ Z Z O ∞ f O CO CΛ Z Z O Z ^ Z Z I^ ^ Z Z Z Z Z Z Z Λ
T- tt =1* CM CM CM -Sf *- tt ^ CM C ^ CM ^ ^ τ- T- tt tt ≈Ffc fl≈ ^ →Ï Ht ζO σ
∞ T- „ O r^- 00 LO en t- CD CM CΛ sf ^- ^. τ- o en <ι- ,~ o ^t «-f r en
CO CM ÇO LO O σ> o o CΛ CO CD CO CM <: ι T- ÇM CM CO C SS ^- ÇO CO O S: ?; -^-
CM co «tf CO
T- t- -r- LO LO CM z O 3 T- T- CO Z L^ Ç5 LO O _ Z c —o co co co CO 1^- T- xj 00 LO * *fc r^- CΛ
CO ^ ^ N-
,_ „ en "tf- co " - σ> i^- JG £2 CM o g ^ O CM O . ^ ^ co "* o S ∞<
CM CM -"T 00 Xj- CO LO CM LO LO Z Z ^ CΛ z LO oo co z _ CD z CD CM CM ∞ ∞ C x- tt T- tt t- -r- CM * tt ≈Jfc - co
CM r - 00 f LO co 5s 5s o σ> co- CoD 5<fs 5 <r co s 5 <ts CD CM l^ h- co 5s o 5s s 5s 5 Lθ
CM z Z f- co co LO Z Z Z CO %
Z Z Z oo 0O CΛ CO Z 0O Z Z Z Z Z CM
C\l * * CO T- T- CO ^ "t "tt ≈tt ≈ffc tt =H; co tt T- CM CM ^ X— tt tt tt tt ≈tfc cΛ - <f <r o * T- o LO ; CO
CΛ 5s 5s LO co CM CM CD 5S O <: <: <: : <: O
CM Z Z . LO ^- TI Z Z Z ^ Z Z Z CΛ Z CD Z CO T- O Z z z z z z T
T- tt tt T- CM ( C 9M tt ft tt I * * * ^ * T- * T- T- CM * =8: =8: tt ≈tfc ≈fcfc °
00 - T- oo o O 5s O se <c t g <c < <t < <: co <C ^ £-* <C < < oo CO O << LO oo en < ; O z 5s co CD O 5s T- Z 00 Z Z o o z Z Z CO L O CM Z Z tt c tt t tZ ocM ttz ttztt ttzttz O M t t ^ tt °2 cθ tt tt tt CO tt 00 tt CM T- tt tt
° < O O CM CΛ
CM rO-, CM -Sf ^r ^__ rLO- <^ <-_: 5_ <-,: <_ S <: co L N- 00 : T- CM 00 CD -
_ oo - co en 5s 5s
LO CM O O ÇO O Z Z Z Z Tfr CM CD " t tt tt tt S z en o en -- co z z co ^ ^ S ^ ∞ c t tt 2 cM *- œ * lO CM ^ tt ∞ x- cO CM LO tt tt
co CM LO
S CD < <r - c c <f <r '
LO§<: cS LLOOS h- :<: : c<: s 5s -5j- co co s s 5s
S C0 CM Z Z O Z Z Z Z Z Z en CM CM co Z Z Z ^- CΛ CO Z Z Z
Cθ tt tt cM Cθ tt tt tt tt tt tt tt O --[. ^ Z Z l^. tt tt tt tt tt 'J- CM CO tt tt tt
CM
o CD co CM T- r <r oo T- - CΛ CO
LO ^E CM : <; z z CO C SÎ 5^ 5Î 5Î 5Î 5^ 5Î o co oo l^- 5s 5s CΛ CM 5 c CO LO <: <:
00 o co z Z O - z co ,_ ∞ z zzzzz z co z Z Z tt tt T tt tt tt tt tt tt tt ^ co cM tt tt co co tt z s tt tt CM co tt tt tt
< S CM
CM CO LO CM tt C (o c^j tt
. co oo oo <r- f_r co CM co 5s o oo co o z
00 co co h- tt o CΛ O CO
CM LO 5: < CD CD 00
CD 00 T- tt
o en CM D LO 00 <:
5- C oo o CΛ Z
LO LO CM tt
-s-
00 oo LO _
N- w T- CD co en 00 tt
co i! co ?<£
CD CD -* Z
^- ° . CD tt
Tableau 4
16
< ,. <c - c _ <c _ ° . Z Z Z Z '≈f --- tt tt tt tt cn tt
tt CD CO o 00 £_ g CD <C O 00 < o oo - LO P co CO LO
O CO s S , C.M. O_ C.O. N. - 00 CO - CΛ ÇO cO CM CM OO St ^" -^ CM o
Γ^ CO CM Z CΛ D Z O Ç CO M Z ^ ^f O O O CM O CD CO ,- CΛ CO 00 (C.
T- ^ - tt cM tt cO CM r- τt tt cM t- - τ- CO Cθ tt |^ CΛ en co r- ∞ tt tt ^ en
<; co <ζ <ζ LO O CΛ Tt ^f co c o < „ - ^ c <r «^ o cΛ <f «;r- <f <<" CD "5 O •-S en -. . „ _ LO CM CD 5t co - Lθ 5 ∞ cΛ 5s ^ o 5s 5s co cn 5s s 5s 5 cΛ L co - Z x- Z T O t- CO Z - CM CM g ^ Z ^ CD Z Z O CO Z Z Z Z O
00 Z r tt T- tt co tt tt T- t- t Tt tt T- CM T- tt *" tt 00 tt tt tt tt tt tt
en co 5 o <f " CM CO CM CO CM "t Λ 5s 5S CD oo — — L Î5 C . Tt CO <! C O - Z g Z ^ Z Z Lθ cn - cM _ CΛ O O Z 00 T- gst- k ?o ^
CΛ 00 Z CO O z Z c Z ^Z -Z ^ C Tt Z coM
-Sf
CM tt tt tt tt τ- CM - τ- tt tt T- T- tt T- T- tt tt T- CM tt tt tt tt Tt
5<S? τ- τt τ- <:f- CO LO Cn θ <r co LO CO T ^ CΛ N co - CD o Ss Ss Ss ï SS LO τt Cθ 5S C0 CΛ LO 00 5> CM CO - ~-, 00 O s LO r- Z Z en CΛ OO r- O Z Z Z Z Z LO LO T- Z CΛ CO OO CO Z CΛ 00 CM lO Z 1^- "* tt tt co CO - LO OO tt tt tt tt tt - CΛ C tt -ςt - v- Lθ tt CO tt CM T- tt CM T-
00 T- CM CM N- CO CD CΛ oo - co <f r- t 00 00 Tt CO O O o en 00 < < < oo en Tt 5s Tt LO 5s co LO 00
00 CO K OO CM LO CD Z cb Z Z Z CM O T Z r~ "t- Z o 00 CM z z z
CM CM CO 00 CO t tt T- tt tt tt T- 00 - tt CO - tt CD τ~ "- tt tt tt
CΛ <D T- tt CO
< S N m r; O O <f C C3 (\! <C <( 10 ^ <f < <C T- CO o CΛ t
5S ^T- CSO D 00 CO t CM CM 5S - 0O ^ S cθ 5s s 5S CΛ 5s 5 5 CΛ h- CΛ
Z ^ CM Tt co co t co T- z co co cn z cn z Z Z O Z Z Z Z CM t o CO tt CM CM CM CO - τ- - τt tt - CM - tt CM tt tt tt cM tt tt tt tt T— T- ztt δ co Tf T-
<f - ~ O CD O t t LO f 00 r- CO CΛ CΛ <f CM 0
2; O ^ O O - LO Tt C.O. S_ O_ C_O 0„0 5*§ - 5* 5* 5* 5* LO CD 55 CO 00 0 O
ZCON CO O O CO Tt Z ^ Tt Z D Z Z I^ Z--. Z^ Z--. Z-- 00 N- Z CM tt CM - CM CM LO CM CO tt cM CΛ CM tt - tt tt tt τ- tt tt tt tt T- CO tt CO
CO CD O CM - CM OO LO CM LO CM CM <f CD -* CD <f LO LO LO <r co o T- CM CM t O Cn cO CM CM LO CΛ CO CΛ 2: CM O <c <c <c CO 5 CM CO 00 5s o r- oo
" CΛ - CM LO CΛ O 00 t^- z «- o co CO Z O CM CΛ CD 00 LO tt M CO - T- CM tt CM tt tt tt T- tt T- T- - tt CM CO T-
° en 2 "«-
CM <f <f OO S <f CD <r' - < "!:r iN- Lo <ι- co <f <r r o - <f LO CO TT M T- Tt t <£ CM co 5 5 . ~ 5s 5*> 2; 2; |v- CM Oθ 5s co 5s 5s 5s CM oo 2: co co CΛ C
CM LO CO t- 5S O co z Z σ> co z co z z Z CO D Tt z o z Z l^ Z r- - CD Tt LO CM CO Z "*
CM tt tt CO T— tt - tt tt tt τ- CM Lθ tt cM tt tt tt - CM tt CM CM Tt T- CM CM CM tt T
CD
Tt t
CM S OI O S Lθ fe t < CΛ LO <]- O CM <ι- LO CO CM <f rf CO 00 CO (O t C0 CM CO CM - TT CO O CM ^ O Î^- Cθ 5S CM Cθ 5S C τ- CD CD O LO CM CO CM en en co z Z t r^ Z '- CM Z '^ LO CM Z z Tt 00 00 00 TT 00
CO CM CM tt tt - CM tt cM -r- tt cM - τ- tt tt CM LO CM CM
Tt en <r
CO oo 5
CM CΛ z O LO tt
CO CM
CΛ h- 5s
T- O Z
Tt CO tt
N- 00 - CΛ CD 2; CM co tt g5t co tt T- tt
<: co z CO
-tt T— tt
Tableau 5
SEQ
Oligonucléotide ID NO patient! 5068 patient9648 patient8827 patient10063
LEX.benin LEX.Tumor LEX.benin - LEX.Tumor LEX.benin - LEX.Tumor X.benign LEX.Tumor
- BG Norm. BG Norm. BG Norm. - BG Norm.
4768 6273 3826 5600 2601 3458 10451 9383
5779 7258 2278 5641 1104 2267 10212 10367
2462 3383 1296 2122 807 961 4392 5049
14805 17594 4881 12028 4606 10985 15573 14987
7297 6707 2817 4635 1446 3054 12933 9720
34320 26749 7839 15212 2364 5386 34033 27809
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
3245 3928 1106 2456 1209 2049 3145 2529
15637 16190 5606 13648 2961 7663 18472 14904
13083 12337 3532 6998 1549 3640 10098 8699
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
1293 1758 #N/A #N/A 1047 1077 #N/A #N/A
1137 1290 1614 1458 1914 1944 #N/A #N/A
#N/A #N/A 793 1022 #N/A #N/A 562 1142
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
1353 1368 #N/A #N/A #N/A #N/A 1815 2154
3232 3485 1916 3544 1128 2706 #N/A #N/A
2336 2241 1005 1244 #N/A #N/A 2289 2175
2093 3008 1790 2578 1314 1329 1254 1620
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A 1101 1565 957 1185 917 806 #N/A #N/A
$ Z tt
O < < τ CΛt CTMΓ ;<: CCMM $< <~ ^< <$ τt O CM < < ^ < < LO LO <: < < O <: <
LO Γ CO LO- ;<S; CCO
. . c CΛ $ Z $ Z cD co Z cD Z Z Z Z co co Z σ LO Z Z Z Z Z co σ> ZZ z - Z Z
CM CM LO tt tt - τ- tt CM tt tt tt tt CO τt tt - tt tt tt tt tt - CO tt tt tt LO tt tt
CΛ CΛ ≈ < < 0 0) < 0 < < < < IO S C <: S — ι <r t^- CM <' <' CM jLδO <L. <
CΛ CO Σ. _-; _= $< §<t < ^<l. l, LO LO 5 θO τt ?5 $ CM OO $ ?=
L CΛ CD Z LO Z Z Z Z - LO Z Z
TOt C TΛ- CM. Z tt Z ^ CM ÎS Z Z Z Z cO CO Z Z r- Tt Z Z - CM tt r- tt tt tt tt LO CO tt tt v- tt tt tt tt CM τt tt tt CM I^ tt tt
0 LO0 LCOM ττt- <î5:
V- LO CM Z
CO - 00 tt
^ o o t N ^< co < < < < t s < ^ < < < < çn ço σj< ω ^| < < co τ- oo oo ^ co o ^ ^^ ^ ^ σ) in ^ ^ ιn ^ ^ ^ ^^ s c5) CM ^ o ^ ^ _5 CΛ LO CΛ LO Z I^- LO Z Γ- Z Z Z Z - CO Z Z OO Z Z Z Z Z T- CO CM Z CO P-: Z Z
C CM CΛ - tt CM CM tt CO tt tt tt tt CD CΛ tt tt -- tt tt tt tt tt LO CD CO tt CO CΞ tt tt
CD CO CΛ OO < LO CΛ < CO < < < < C LO < < CO < < < < < O CO - < τ- τ- < <'
00 © τ 5 cθ CO 0 5 § Ω $ in $ CO in CI) -; O D §
CD τt cM τt Z τt CΛ Z r- Z Z Z Z o cΛ Z Z - Z Z Z Z Z cn o cM Z co cΛ Z Z
CM CM - - tt CM τ- tt CM tt tt tt tt LO LO tt tt - tt tt tt tt tt CO . CM tt CO 00 tt tt
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A 754 1084
29235 21359 6201 11358 4424 8194 15565 15432
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
1062 1406 #N/A #N/A #N/A #N/A 2158 1916
1637 1688 1914 2855 838 910 #N/A #N/A
2950 3775 2478 3653 1836 1948 1200 1797
3281 3736 1504 2473 901 1337 1579 1486
11672 11510 3719 8979 2936 5949 7376 5820
#N/A #N/A 1089 1866 707 2180 #N/A #N/A
1060 1300 737 930 #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
2374 2325 761 1241 #N/A #N/A 1567 1403
27696 22674 4796 10122 2877 6389 21565 21790
4464 4488 2068 4240 1643 3835 1882 2072
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
2255 2526 1601 2084 814 1165 1066 1093
2985 3043 1146 2238 #N/A #N/A 1238 1964
#N/A #N/A #N/A #N/A 1512 916 #N/A #N/A
2643 3101 2228 3216 1649 2071 5836 7488
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
3017 3029 722 1541 #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
#N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
31152 39836 23996 32879 17391 13278 25338 18161
#N/A #N/A 689 3296 #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A #N/A
τt - CM CO LO Cn oθ < CD t^ < < < < < < < < < to CO < < z z z Lθ CM - τ τ ^ g -§ r- CD 5 5 -$ $ -$ 5 $ 5 -5: g σ3 -5 ^ Tt co cO LO co cΛ Tt Z h- T- Z Z Z Z Z Z Z Z Z S oo Z Z tt z tt z tt tt z tt tt τ- CO C CM CM LO LO tt LO τt tt tt tt tt tt tt tt tt tt σ> - tt tt
< CO < < 00 CΛ < < τ- CM z ^ r- Z^ -Ξî C CO ^ ^ r . Lo < < < < CD < <. <. < <. r-- LO Z TJ- Z Z CM LO Z Z T- CO tt z tt z tt z tt z tt z tt tt LO tt tt LO CO tt tt CM - tt z ttz ttz ttz£ T— «11 « zttz •*£ 4z-t.a 00≈- ttz
<: : < ^ ^ < I^ < ; CO CM <: <: CD ^ . <c < o < z CΛ .5: z δ z z δ cn Z Z S o Z Z Z Z CM Z tt z tt tt z tt z tt z z tt tt CM tt tt CD -<- tt tt σ' - tt tt tt tt z 3-f* z «t-1 z ïr « ztt" z »fcr Tt tt
O CΛ < < L τt CO CΛ τt CO τt < < CO CM < < < < < < < < < < CO < < CO - 5 5 CO CO τt Ç CΛ 00 00 5 5 !^ CΛ 5 5 -$ 5 -$ Z5 $ -$ -5 $ Z5 $ - Z Z O co - Tt cM C oO Lo Z Z Z Z Z Z Z Z Z Z co Z Z tt en M CΛ Z Z - tt tt - - CD - CM - CM tt tt LO CO tt tt tt tt tt tt tt tt tt tt - tt tt
CΛ Φ- NO LσO) CCOO CSΛ SCM <Zî <; SS 1wΛ CO Z<5 < Z<; <-5 <; < <; < ClΩO CSO < 5<- z z t z 00 CM - CΛ - 00 Z Z C cO CM Z Z Z Z Z Z Z Z τt- CM Z Z tt tt z tt tt zt CM - CO CM CO CO OO tt tt i: CO τ- tt tt tt tt tt tt tt tt - C tt tt
CD Tt CO C ιO C wΛ T-
CM- CCΛM CΛ-
-
CO τot cτo- -
00 N- * ^ ^ 2^ CΛ CD < < 0O < 0O CΛ τt < < < < Tt CD CM < < < N IO 00 C O C « Ç LO g ^ Z - - - co δ Z Z Z LO -? S -7 o LOo To CO g T- g ∞ tt Z tt Z Z tt Z O θ Z Z θ t tt - - tt tt CM tt - - CM z tt z tt z tt z tt g ^ T- T- tt tt tt T- œ oo
- τt CO O
CO CM CM O CO CO CM
2 LO < < < < < CO τt < τt . CM < < < < L CO C0 < < < CD OO O - CO τt O 5 -î --; --; i CΛ O ^ Z-; CΛ CM ϋ S ( t- 5 -5 -§ - τt O C0 τt
CO ^ Z Z Z Z Z lO CO Z Z ^t C»O; ; 0-0 - CM Z Z Z Z O O CO Z Z Z lO t CO MO - CO tt tt tt tt tt CM - tt tt CO 00 10 T- Tt tt tt tt tt T— T- T— tt tt tt CO - T- T- -
LO LO < 00 < < O CO < <
LO CD Z-; Z-; Z5 --; Z-ï Tt Z-; — ^ CD 00 - LO Tt < < C l^ - CO O
LO J ^ ZJ -J N O ZÎ ^ ZÎ Î ^ S O O CΛ NOi s co n Tt CM Z Z Z Z Z TI- Z O Z LO CO O LO Zo Z Z tt tt tt tt tt LO tt - tt CO - CM - CM ZZZ ZI in tt - tt tt -r- CM tt tt tt tt ^ CM Tt CΛ LO
00 CM CM < CM ~ CM $ tt CΛ N- Z
CM tt
<; CM Tt P < z CM $ Z tt 1^- 00 00 tt
< CD CO CO < t o to Z h- Tt co Z tt T- CM Tt tt
< o (O s < 5 CΛ CM - 5
Z LO CO T- Z tt T- CM 00 tt

Claims

REVENDICATIONS
1. Acide nucléique caractérisé en ce qu'il comprend une séquence choisie parmi : a) les séquences SEQ ID NOs : 1 à 49, b) un variant des séquences SEQ ID NOs : 1 à 49 résultant de la dégénérescence du code génétique, c) le brin complémentaire des séquences SEQ ID NOs : 1 à 49, et d) un fragment spécifique des séquences a) à c).
2. Acide nucléique selon la revendication 1 , caractérisé en ce qu'il s'agit d'un ADN, choisi de préférence parmi les ADNc et les ADNg, ou d'un ARN.
3. Polypeptide codé par un acide nucléique selon l'une quelconque des revendications précédentes, de préférence choisi parmi un polypeptide comprenant tout ou une partie spécifique d'une séquence choisie parmi SEQ ID Nos : 50 à 167.
4. Protéine choisie parmi les variants KLK2-EHT002 à KLK2-EHT011 et
PSA-EHT001 à PSA-EHT027 ou de KLK2-EHTb à KLK2-EHTI et de PSA-EHTa à PSA-EHTu de séquence SEQ ID Nos : 50 à 167, respectivement.
5. Sonde nucléique caractérisée en ce qu'elle permet la détection par hybridation sélective d'un acide nucléique selon l'une des revendications 1 à 2.
6. Sonde selon la revendication 5, caractérisée en ce qu'elle comprend la séquence d'un acide nucléique selon l'une des revendications 1 à
2.
. Sonde selon la revendication 6, caractérisée en ce qu'elle comprend de 20 à 1000 nucléotides, de préférence de 50 à 800. . Amorce, caractérisée en ce qu'elle permet l'amplification sélective d'un acide nucléique selon l'une des revendications 1 à 2. . Amorce selon la revendication 8, caractérisée en ce qu'elle est composée de 3 à 50 bases, de préférence de 3 à 40 et encore plus préférentiellement de 3 à 35 bases.
10. Amorce selon l'une des revendications 8 ou 9, caractérisée en ce qu'elle est complémentaire d'une région au moins du gène codant pour l'antigène spécifique de PSA ou de celui codant pour KLK-2 portant une mutation impliquée dans un cancer.
11. Amorce selon la revendication 10, caractérisée en ce qu'elle est constituée d'un acide nucléique simple-brin comprenant de 3 à 50 nucléotides complémentaires d'une partie au moins de l'une des séquences SEQ ID NO : 1 à 49 ou de leur brin complémentaire.
12. Couple d'amorces comprenant une séquence sens et une séquence inverse, caractérisé en ce que les amorces de ladite paire s'hybrident avec une région d'un acide nucléique selon l'une des revendications 1 à 2 et permettent l'amplification d'au moins une portion de cet acide nucléique.
13. Anticorps, caractérisé en ce qu'il est spécifique d'une protéine ou d'un polypeptide selon les revendications 3 ou 4.
14. Anticorps selon la revendication 14, caractérisé en ce qu'il s'agit d'un polyclonal, d'un monoclonal ou d'un dérivé de ceux-ci.
15. Procédé de détection d'une pathologie ou d'une prédisposition à une pathologie chez un sujet, comprenant la détermination de la présence, dans un échantillon dudit sujet, d'un acide nucléique selon l'une des revendications 1 à 2 ou d'une protéine ou polypeptide selon les revendications 3 et 4.
16. Procédé selon la revendication 15, caractérisé en ce que la détermination est réalisée par séquençage, hybridation et/ou amplification sélectives.
17. Procédé selon la revendication 16, caractérisé en ce que l'amplification est réalisée en utilisant un couple d'amorces selon la revendication 12.
18. Kit utilisable pour la mise en œuvre d'un procédé tel que défini dans les revendications 15 à 17 comprenant
- un couple d'amorces selon la revendication 12 ou une sonde selon l'une des revendications 5 à 7 ou un anticorps selon l'une des revendications 13 et 14, et - les réactifs nécessaires à l'amplification ou à une réaction d'hybridation ou immunologique.
19. Méthode de sélection ou d'identification de composés actifs, comprenant la mise en contact in vitro ou ex vivo d'un composé test avec une cellule exprimant un polypeptide selon la revendication 3, et la sélection ou l'identification de composés modulant l'expression ou l'activité dudit polypeptide.
20. Méthode selon la revendication 19, caractérisée en ce qu'elle comprend la sélection des composés se liant audit polypeptide.
21. Méthode selon la revendication 19, caractérisée en ce qu'elle comprend la sélection des composés modulant l'expression du dit polypeptide.
22. Vecteur comprenant un acide nucléique selon la revendication 1 ou 2.
23. Cellule recombinant comprenant un vecteur selon la revendication 22.
24. Produit comprenant un acide nucléique selon l'une des revendications 1 , 2, 5, 6 et 7, un vecteur selon la revendication 22, un polypeptide selon la revendication 3 ou 4 ou un anticorps selon la revendication 13 ou 14 immobilisé sur un support.
EP03743925A 2002-03-14 2003-03-14 Variants de kallikrein-2 et kallikreine-3 humaines et leurs utilisations Withdrawn EP1483381A2 (fr)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
FR0203186 2002-03-14
FR0203186A FR2837215A1 (fr) 2002-03-14 2002-03-14 Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
FR0210975 2002-09-05
FR0210975A FR2844278A1 (fr) 2002-09-05 2002-09-05 Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
PCT/FR2003/000833 WO2003076610A2 (fr) 2002-03-14 2003-03-14 Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations

Publications (1)

Publication Number Publication Date
EP1483381A2 true EP1483381A2 (fr) 2004-12-08

Family

ID=27806679

Family Applications (1)

Application Number Title Priority Date Filing Date
EP03743925A Withdrawn EP1483381A2 (fr) 2002-03-14 2003-03-14 Variants de kallikrein-2 et kallikreine-3 humaines et leurs utilisations

Country Status (6)

Country Link
US (1) US20050112705A1 (fr)
EP (1) EP1483381A2 (fr)
JP (1) JP2005519606A (fr)
AU (1) AU2003242820A1 (fr)
CA (1) CA2478572A1 (fr)
WO (1) WO2003076610A2 (fr)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6551778B1 (en) * 1999-01-28 2003-04-22 Gen-Probe Incorporated Nucleic acid sequences for detecting genetic markers for cancer in a biological sample
US9012141B2 (en) * 2000-03-27 2015-04-21 Advaxis, Inc. Compositions and methods comprising KLK3 of FOLH1 antigen
FR2848569A1 (fr) * 2002-12-17 2004-06-18 Exonhit Therapeutics Sa Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
CA2656140A1 (fr) * 2006-07-03 2008-01-10 Exonhit Therapeutics Sa Produits de la transcription specifiques de la prostate et leur utilisation pour des therapeutiques et des diagnostics du cancer de la prostate
US8753630B2 (en) * 2008-02-12 2014-06-17 The Board Of Trustees Of The Leland Stanford Junior University Using EGFRvIII to identify and target cancer stem cells
US20110177059A1 (en) * 2008-08-05 2011-07-21 University Of Rochester Psa and klk2 as therapeutic targets and molecules inhibiting psa and klk2
ES2741745T3 (es) 2010-07-27 2020-02-12 Genomic Health Inc Método para usar la expresión génica para determinar el pronóstico de cáncer de próstata
NZ627887A (en) 2012-01-31 2016-08-26 Genomic Health Inc Gene expression profile algorithm and test for determining prognosis of prostate cancer
US20200123608A1 (en) * 2016-10-05 2020-04-23 Institute Of Environmental Science And Research Limited Rna sequences for body fluid identification
TWI852977B (zh) * 2019-01-10 2024-08-21 美商健生生物科技公司 前列腺新抗原及其用途
TW202118792A (zh) * 2019-07-26 2021-05-16 美商健生生物科技公司 抗hk2嵌合抗原受體(car)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2775984B1 (fr) * 1998-03-11 2006-09-15 Bioscreen Therapeutics Sa Criblage differentiel qualitatif
US6479263B1 (en) * 1996-11-14 2002-11-12 Baylor College Of Medicine Method for detection of micrometastatic prostate cancer
WO2001053455A2 (fr) * 1999-12-23 2001-07-26 Hyseq, Inc. Nouveaux acides nucleiques et polypeptides associes
CA2296792A1 (fr) * 1999-02-26 2000-08-26 Genset S.A. Sequences marqueurs exprimees et proteines humaines codees

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO03076610A2 *

Also Published As

Publication number Publication date
WO2003076610A3 (fr) 2004-04-08
WO2003076610A2 (fr) 2003-09-18
JP2005519606A (ja) 2005-07-07
AU2003242820A1 (en) 2003-09-22
US20050112705A1 (en) 2005-05-26
CA2478572A1 (fr) 2003-09-18

Similar Documents

Publication Publication Date Title
JP6434444B2 (ja) 腫瘍の診断と治療を目的とした表面会合抗原の同定
JP6174177B2 (ja) 腫瘍診断と治療のための表面関連抗原の同定
EP1414477B1 (fr) SEQUENCES REPETEES DU GENE CA125 ET LEURS UTILISATIONS DANS DES INTERVENTIONs DIAGNOSTIQUES
JP3455228B2 (ja) 第13染色体連鎖−乳癌感受性遺伝子
US11441190B2 (en) Compositions and methods for the diagnosis and treatment of ovarian cancers that are associated with reduced SMARCA4 gene expression or protein function
CA2848369A1 (fr) Gene chimere de gene kif5b et de gene ret, et procede de determination de l&#39;efficacite d&#39;un traitement anticancereux ciblant le gene chimere
US20060275304A1 (en) Novel tumor antigen useful in diagnosis and therapy of prostate and colon cancer
WO2003076610A2 (fr) Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
US7309760B2 (en) Repeat sequences of the CA125 gene and their use for diagnostic and therapeutic interventions
JP2004533206A (ja) 化学療法のための標的としてのガン関連遺伝子
WO2004056989A2 (fr) Variants de la kallikreine-2 et de la kallikreine-3 humaines et leurs utilisations
EP1511771B1 (fr) Anticorps monoclonal anti-aurora-a, son procede d obtention, et ses utilisations dans le diagnostic et le traitement des cancers
JP2010017194A (ja) 肺腫瘍に関連したマーカー分子
FR2837215A1 (fr) Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
FR2844278A1 (fr) Variants de kallikrein-2 et kallikrein-3 humaines et leurs utilisations
US7008772B1 (en) Compounds for immunodiagnosis of prostate cancer and methods for their use
WO2013119678A1 (fr) Délétion de lkb1/stk11 dans les mélanomes et procédés associés
FR2805279A1 (fr) Sequences retrovirales associees a des affections cutanees

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20040730

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL LT LV MK

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20060815