BR122014027339B1 - métodos para seleção de planta de soja tendo alelo de rhg4 resistente ao nematódeo do cisto da soja e para investigação de haplótipo de rhg4 de planta de soja, bem como método de seleção assistida por marcador de ácido nucleico em planta de soja para seleção de planta de soja tendo alelo que confere resistência ao nematódeo do cisto da soja - Google Patents
métodos para seleção de planta de soja tendo alelo de rhg4 resistente ao nematódeo do cisto da soja e para investigação de haplótipo de rhg4 de planta de soja, bem como método de seleção assistida por marcador de ácido nucleico em planta de soja para seleção de planta de soja tendo alelo que confere resistência ao nematódeo do cisto da soja Download PDFInfo
- Publication number
- BR122014027339B1 BR122014027339B1 BR122014027339A BR122014027339A BR122014027339B1 BR 122014027339 B1 BR122014027339 B1 BR 122014027339B1 BR 122014027339 A BR122014027339 A BR 122014027339A BR 122014027339 A BR122014027339 A BR 122014027339A BR 122014027339 B1 BR122014027339 B1 BR 122014027339B1
- Authority
- BR
- Brazil
- Prior art keywords
- nucleic acid
- rhg4
- sequence
- seq
- allele
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
abstract not avaible
Description
Relatório Descritivo da Patente de Invenção para "MÉTODOS PARA SELEÇÃO DE PLANTA DE SOJA TENDO ALELO DE Rhg4 RESISTENTE AO NEMATÓDEO DO CISTO DA SOJA E PARA INVESTIGAÇÃO DE HAPLÓTIPO DE Rhg4 DE PLANTA DE SOJA, BEM COMO MÉTODO DE SELEÇÃO ASSISTIDA POR MARCADOR DE ÁCIDO NUCLEICO EM PLANTA DE SOJA PARA SELEÇÃO DE PLANTA DE SOJA TENDO ALELO QUE CONFERE RESISTÊNCIA AO NEMATÓDEO DO CISTO DA SOJA".
[001] Dividido do PI0107440-7, depositado em 05.01.2001.
Campo da Invenção [002] A presente invenção refere-se ao campo da genética da soja. Mais especificamente, a invenção refere-se a moléculas de ácido nucleico de regiões do genoma da soja, que estão associadas com a resistência ao nematódeo do cisto da soja (SCN). A invenção também se refere a proteínas codificadas por tais moléculas de ácido nucleico bem como a anticorpos capazes de reconhecer estas proteínas, A invenção também se refere aos marcadores de ácido nucleico de regiões do genoma da soja, que estão associados com a resistência ao SCN. Além disso, a invenção refere-se a usos de tais moléculas, inclusive transformar soja sensível ao SCN com constructos contendo moléculas de ácido de regiões no genoma da soja, que estão associadas com a resistência ao SCN. Ademais, a invenção refere-se ao uso de tais moléculas em um programa de reprodução de planta. Fundamentos da Invenção [003] A soja, Gfycine max (L.) Merril (Glycine max ou soja), é uma das culturas de maior interesse econômico do mundo como principal fonte de óleo vegetal e proteína (Sinclair et al., Compendium of Soybean Diseases, 3- Ed. APS Press, St. Paul, MN, pg. 106 (1989)). A crescente demanda por dietas de baixo colesterol e alto teor de fibras também aumentou a importância da soja como alimento saudável.
[004] Antes de 1940, os cultivares de soja eram resultados diretos de introduções trazidas da Ásia ou seleções de linhagens puras de introduções de plantas geneticamente diversas. A soja era principalmente usada como cultura de forragem no início do século XIX. Somente algumas introduções eram do tipo de sementes grandes úteis como grãos alimentícios e para a produção de óleo. Da metade da década de 30 até os anos 60, ganhos nos rendimentos de sementes de soja foram obtidos mudando-se o método de reprodução de avaliação e seleção de germiplasma introduzido para elite de cruzamento por linhagens de elite. O ciclo contínuo de hibridização cruzada de cepas de elite selecionadas das progênies de cruzamentos anteriores resultou nos atuais cultivares.
[005] Mais de 10.000 cepas de soja foram até agora introduzidas nos Estados Unidos desde o início de 1900 (Bernard et ai., United States National Germplasm Collections. In: L. D. Hil (ed.), World Soybean Research, pp. 286-289. Interstate Printers and Publ., Danville, II. (1976)). Um número limitado dessas introduções forma a base genética de cultivares desenvolvidos dos programas de hibridização e seleção (Johnson et ai., The Soybean, Norman Ed., Academic Press, N.Y., pp. 1-73 (1963)). Por exemplo, em uma pesquisa feita por Specht e Williams, Genetic Contributions, Fehr eds. American Soil Association, Wisconsin, pp. 49-73 (1984), para os 136 cultivares liberados de 1939 a 1989, somente 16 introduções diferentes eram a fonte de citoplasma para 121 dos 136. Certas cepas de soja são sensíveis a um ou mais patógenos. Um patógeno economicamente importante é o SCN.
[006] SCN é responsável por aproximadamente 40% de todas as doenças da soja e pode resultar em significativas perdas de produção (até 90%). O SCN é a praga mais destrutiva da soja conhecida até o presente e é responsável por uma perda estimada de produção de até $809 milhões de dólares anualmente. Atualmente, as medidas de controle de custos mais reduzidos são a rotação de cultura e o uso da resistência da planta hospedeira. Embora os reprodutores tenham obtido êxito em desenvolver linhagens de soja resistentes ao SCN, a reprodução é difícil e demorada devido à natureza complexa e poligênica da resistência. A resistência geralmente é específica da espécie e não oferece estabilidade prolongada devido às variações das populações de SCN no campo. Além disso, muitas das variedades de soja resistentes têm um problema de produção significativo quando cultivadas na ausência de SCN.
[007] SCN, Heterodera glycines Ichinohe, foi identificado na soja nos Estados Unidos em 1954 em Castle Hayne, N. C. Winstead et al., Plast Dis. Rep. 39:9-11 (1955). Desde sua descoberta o SCN foi reconhecido como uma das pragas mais destrutivas na soja. Ele foi registrado em quase todos os estados em que a soja é cultivada, e causa sérios problemas de produção em vários estados, sendo particularmente destrutivo nos estados do centro-oeste. Veja em geral: Caldwell et al., Agron. J. 52:635-636 (1960); Rao-Arelli et al., Crop. Sei. 28:650-652 (1988); Baltazar et al., Soybean Genet. Newsl. 19:120122 (1992); Concibido et al., Crop. Sei. (1993). Por exemplo, cultivares de soja sensíveis tinham rendimentos de semente 5,7 - 35,8% mais baixos que os cultivares resistentes em sítios infestados com a espécie 3 do SCN em lowa (Niblack et al., Plant Dis. 76:943-948 (1992)).
[008] Logo após a descoberta do SCN nos Estados Unidos, foram identificadas fontes de resistência ao SCN (Ross et al., Plant Dis. Rep. 41:923-924 (1957)). Algumas linhagens tais como Peking e Plant Introduction (PI) PI88788 foram rapidamente incorporadas nos programas de reprodução. Peking passou a ser amplamente usada como fonte de resistência devido a sua falta de traços agronomicamente indesejáveis, Pickett sendo primeiro cultivar resistente ao SCN introduzido (Brim et ai., Crop Sei. 6:305 (1966)). O reconhecimento de que determinadas populações resistentes ao SCN poderíam superar cultivares resistentes levou a uma extensa busca por fontes adicionais de resistência ao SCN. PI88788 surgiu como uma fonte popular de resistência para as espécies 3 e 4 ainda que tendo um índice de cisto superior a 10% (porém inferior a 20%) contra a espécie 4, e Peking e seus derivados surgiram como uma fonte popular para as espécies 1 e 3. PI437654 foi subseqüentemente identificada como tendo resistência a todas as espécies conhecidas e sua resistência ao SCN foi cruzada de forma reversível em Forrest. Atualmente existem mais de 130 Pis conhecidas com resistência ao SCN.
[009] A espécie 3 do SCN é considerada a espécie principal nos estados produtores de soja do centro-oeste. Esforços consideráveis foram dedicados à genética e à reprodução para resistência à espécie 3. Embora a Peking e a PI88788 sejam ambas resistentes à espécie 3 do SCN, estudos da genética clássica sugerem que elas ancoram genes diferentes para resistência à espécie 3 (Rao-Arelli et ai., Crop Sei. 28:650-652 (1988)). Cruzamentos entre PI88788(R) e Essex(S) segregam famílias de 9(R): 55(S) na população F2 e 1(R): 26(Seg): 37(S) na geração F3, sugerindo que a resistência à espécie 3 na PI88788 é condicionada por um gene recessivo e dois genes dominantes, ao passo que a resistência na Peking e PI90763 é condicionada por um gene dominante e dois genes recessivos. Baseados em cruzamentos recíprocos, Peking, Forrest e PI90763 possuem genes em comum para resistência à espécie 3 do SCN (Rao-Arelli et ai., Crop Sei., 28:650-652 (1988)). Um cruzamento entre Peking e PI88788 segrega 13(R):3(S) na geração F2, indicando uma diferença importante entre os progenitores para resistência à espécie 3. Análise média de geração baseada em quatro cruzamentos entre genótipos resistentes e sensíveis, A20 (R), Jack (R), Cordell (R) e A2234 (S), sugere que um modelo genético adicional é suficiente para explicar a maioria das variações genéticas da resistência à espécie 3 do SCN em cada cruzamento, ao passo a análise dos dados reunidos indica também a presença de efeitos dominantes (Mansur et ai., Crop Sei. 33:1249-1253 (1993)). Esta análise indica ainda que a resistência à espécie 3 provavelmente está sob controle genético de três porém não mais que quatro genes.
[0010] Análise por RFLP de populações segregantes entre linhagens resistentes e sensíveis, PI209332 (R), PI90763 (R), PI88788 (R), Peking (R) e Evan (S), identificou um importante QTL de resistência ao SCN (rhg1) que mapeia para o grupo de ligação G (Concibido et ai., Theor. Appl. Genet. 93:234-241 (1996)). Neste estudo, rhg1 explica 51,4% da variação fenotípica na PI209322, 52,7% da variação na PI90763, 40,0% da variação na PI88788 e 28,1% da variação em Peking. Supôs-se que este importante QTL de resistência é o mesmo em todas as populações de mapeamento empregadas. No entanto, como salientado pelos autores, é possível que o intervalo genômico contenha QTLs distintos, porém fortemente ligados. Em um estudo relacionado usando PI209332 como a fonte de resistência, Concibido et ai., Crop Sei. 36:1643-1650 (1996), mostram que um QTL no grupo de ligação G (rhg1) é eficaz contra as três espécies de SCN testadas, explicando 35% da variação fenotípica para a espécie 1, 50% da variação para a espécie 3 e 54% da variação para a espécie 6. Além do QTL importante no grupo de ligação G, foram identificados outros 4 QTLs mapeando para os grupos de ligação D, J, L e K, com alguns dos locais de resistência se comportando de maneira específica para a espécie.
[0011] Concibido et al. (Crop Sei. 37:258-264 (1997)) encontraram uma associação significativa do marcador C006V a um QTL importante no grupo de ligação G (rhg1) e resistência à espécie 1, à espécie 3 e à espécie 6, em Peking e PI90763 (Evan X Peking, Evan X PI90763) e espécies 3 e 6 em PI88788 (Evan X PI88788), de acordo com o estudo anterior baseado na fonte de resistência P209332 (Concibido et al., Crop Sei. 36:1643-1650 (1996)). O locus de resistência perto de C006V foi eficaz contra todas as espécies testadas em todas as fontes de resistência. Embora estatisticamente significativo contra todas as espécies, este locus é responsável por proporções diferentes da variação fenotípica total com as espécies testadas. Por exemplo, na PI90763 o locus de resistência perto de C006V explica mais de três vezes a variação fenotípica contra espécie 1 que contra a espécie 3. A variabilidade pode ser atribuída a diferenças nas formações genéticas, variabilidade entre as populações de SCN ou podem ser um reflexo do tamanho limitado das populações de planta que foram empregadas. Esse estudo identificou ainda mais três QTLs de resistência ao SCN independentes; um perto do marcador de RFLP A378H mapeando para a extremidade oposta do grupo de ligação G de C006V (rhg1), um perto do marcador B032V-1 no grupo de ligação J e um terceiro ligado a A280Hae-1 no grupo de ligação N. Comparações entre as diferentes espécies de SCN indicaram que alguns dos supostos QTLs de SCN se comportam de maneira específica para a espécie.
[0012] PI437654 foi identificada como tendo resistência a todas as espécies conhecidas. Com base na análise de 328 linhagens de endógamas recombinantes (RIL) derivadas de um cruzamento entre PI437654 e BSR101, Webb relatou seis QTLs associados com resistência ao SCN nos grupos de ligação A2, C1, G, M, L25 e L26 (Patente US 5.491.081). Um alelo no grupo de ligação G, que se supôs ser o rhg1, está envolvido com certas espécies de SCN testadas (espécies 1, 2, 3, 5 e 14) e possui o maior efeito fenotípico já relatado sobre a resistência para todas as espécies. Ao contrário, os QTLs nos grupos de ligação A2, C1, M, L25 e L26 agem de maneira específica para a espécie. Segundo se sabe o QTL no grupo de ligação L25 estava envolvido com quatro das cinco espécies, ao passo que cada um dos QTLs nos grupos de ligação A2, C1 e L26 estavam envolvidos na resistência a duas das cinco espécies (Patente US
5.491.081) . Webb apresenta ainda dados de que a resistência a qualquer uma das cinco espécies provavelmente resulta dos efeitos combinados do QTL envolvido em cada espécie (Patente US 5.491.081) .
[0013] Qui et al. (Theor. Appl. Genet. 98:356-364 (1999)) analisaram 200 famílias F2-.3 derivadas de um cruzamento entre Peking e Essex e identificaram marcadores de RFLP que estão associados com QTLs de resistência ao SCN nos grupos de ligação B, E, I e H. Os três QTLs nos grupos de ligação B, E e H são co-responsáveis por 57,7% da variação fenotípica para a espécie 1, os QTLs nos grupos de ligação H e B são responsáveis por 21,4% da variação para a espécie 3, ao passo que os QTLs nos grupos de ligação I e E estão associados com a resistência à espécie 5 sendo responsáveis por 14,0% da variação fenotípica. Ao contrário dos estudos de mapeamento anteriores que utilizaram Peking como a fonte de resistência, não foi detectada nenhuma associação significativa para o locus rhg1 no grupo de ligação G. Os autores salientam que o marcador Bng122, que mostrou ter ligação significativa ao rhg1, não é polimórfico na população empregada (Concibido et al., Crop Sei. 36:1643-1650 (1996)).
[0014] Foi relatado que o locus rhg1 no grupo de ligação G é necessário para o desenvolvimento de resistência a qualquer das espécies de SCN. Foram feitos esforços para desenvolver marcadores moleculares para identificar linhagens endógamas ancorando o alelo de rhg1 resistente ao SCN. Um dos marcadores mais com um ente usados para seleção assistida por marcador (MAS) de rhg1 é um locus SSR que co-segrega e mapeía em torno 0,4 cM de rhg1. Este marcador SRR BARC-Satt_3G9, é capaz de distinguir a maioria, senão todos, dos genótipos sensíveis ao SCN daqueles que ancoram rbg1 de importantes fontes de resistência tais como Peking e PI437654. Foram apresentados dois marcadores de repetição de seqüência simples que podem ser usados para selecionar resistência ao SCN no locus rhg1 (Concibido et al., Theor. Appl. Genet. 99; 811-818 (1999)). Satt_309 também foi eficaz para distinguir as fontes resistentes ao SCN P188788 e PI209332 em muitos, mas não em todos, genótipos sensíveis. Em particular, o Satt_309 não pode ser usado para MAS em populações desenvolvidas de cultivares americanos "típicos" do sul (por exemplo Lee, Bragg e Essex) cruzados com as fontes de resistência PI88788 ou PI209332.
[0015] Matson et al. apresentaram um locus de resistência ao SCN dominante, Rhg4, que está fortemente ligado ao locus "í" no grupo de ligação A2 (Matson et al., Crop Sei. 5:447 (1965)). O QTL apresentado por Webb no grupo de ligação A2 mapeia perto do locus Ύ e é considerado como sendo o Rhg4 (Patente US 5.491.081). Webb concluí que apenas dois locos nos grupos de ligação A2 (Rhg4) e G (rhg1) explicam a variação genética para a espécie 3.
Sumário da Invenção [0016] A presente invenção inclui e fornece um método para a produção de uma planta de soja tendo um alelo de rhg1 resistente a SCN compreendendo: (a) cruzar uma primeira planta de soja tendo um alelo de rhg1 resistente a SCN com uma segunda planta de soja tendo um alelo de rhg1 sensível a SCN para produzir uma população segregante; (b) rastrear a população segregante quanto a um membro tendo um alelo de rhg1 resistente a SCN com uma primeira molécula de ácido nucleico capaz de hibridizar especificamente para o grupo de ligação G, onde a primeira molécula de ácido nucleico hibridiza especificamente para uma segunda molécula de ácido nucleico que está ligada ao alelo de rhg1 resistente a SCN; e (c) selecionar o membro para novo cruzamento e seleção.
[0017] A presente invenção inclui e fornece um método para investigar um haplótipo de rhg1 de uma planta de soja compreendendo: (a) isolar moléculas de ácido nucleico da planta de soja; (b) determinar a seqüência de ácidos nucleicos de um alelo de rhg1 ou parte do mesmo; e (c) comparar a seqüência de ácidos nucleicos do alelo de rhg1 ou parte do mesmo com uma seqüência de ácidos nucleicos de referência.
[0018] A presente invenção inclui e fornece um método para introgressão de resistência a SCN ou resistência parcial a SCN em uma planta de soja compreendendo: fazer uma seleção assistida por marcador da planta de soja com um marcador de ácido nucleico, onde o marcador de ácido nucleico hibridiza especificamente com uma molécula de ácido nucleico tendo uma primeira seqüência de ácidos nucleicos que está fisicamente ligada a uma segunda seqüência de ácidos nucleicos que fica localizada no grupo de ligação G da soja A3244, onde a segunda seqüência de ácidos nucleicos está em 500 kb de uma terceira seqüência de ácidos nucleicos que é capaz de hibridizar especificamente com a seqüência de ácidos nucleicos de SEQ ID N° 5, 6, complementos das mesmas, ou fragmentos das mesmas tendo pelo menos 15 nucleotídeos; e selecionar a planta de soja com base na seleção assistida por marcador.
[0019] A presente invenção inclui e fornece um método para a produção de uma planta de soja tendo um alelo de Rhg4 resistente a SCN, compreendendo: cruzar uma primeira planta de soja tendo um alelo de Rhg4 resistente a SCN com uma segunda planta de soja tendo um alelo de Rhg4 sensível a SCN para produzir uma população segregante; rastrear a população segregante quanto a um membro tendo um alelo de Rhg4 resistente a SCN com uma primeira molécula de ácido nucleico capaz de hibridizar especificamente para o grupo de ligação A2, onde a primeira molécula de ácido nucleico hibridiza especificamente para uma segunda molécula de ácido nucleico ligada ao alelo de Rhg4 resistente a SCN; e selecionar o membro para novo cruzamento e seleção.
[0020] A presente invenção inclui e fornece um método para investigar um haplótipo de Rhg4 de uma planta de soja compreendendo: (a) isolar moléculas de ácido nucleico da planta de soja; (b) determinar a seqüência de ácidos nucleicos de um alelo de Rhg4 ou parte do mesmo; e (c) comparar a seqüência de ácidos nucleicos do alelo de Rhg4 ou parte do mesmo com uma seqüência de ácidos nucleicos de referência.
[0021] A presente invenção inclui e fornece um método para introgressão de resistência a SCN ou resistência parcial a SCN em uma planta de soja compreendendo: fazer uma seleção assistida por marcador da planta de soja com um marcador de ácido nucleico, onde o marcador de ácido nucleico hibridiza especificamente com uma molécula de ácido nucleico tendo uma primeira seqüência de ácidos nucleicos que está fisicamente ligada a uma segunda seqüência de ácidos nucleicos que fica localizada no grupo de ligação A2 da soja A3244, onde a segunda seqüência de ácidos nucleicos está em 500 kb de uma terceira seqüência de ácidos nucleicos que é capaz de hibridizar especificamente com a seqüência de ácidos nucleicos de SEQ ID N° 7, complementos da mesma, ou fragmentos da mesma tendo pelo menos 15 nucleotídeos; e selecionar a planta de soja com base na seleção assistida por marcador.
[0022] A presente invenção inclui e fornece uma molécula de ácido nucleico substancialmente purificada compreendendo uma seqüência de ácidos nucleicos selecionada do grupo que consiste nas SEQ ID NoS 5, 6, 8-23, 28-43, complementos das mesmas e fragmentos de qualquer uma delas.
[0023] A presente invenção inclui e fornece uma primeira molécula de ácido nucleico substancialmente purificada com uma seqüência de ácidos nucleicos que hibridiza especificamente uma segunda molécula de ácido nucleico tendo uma seqüência de ácidos nucleicos selecionada do grupo que consiste em um complemento das SEQ ID N0S 5, 6, 8-23, 28-43.
[0024] A presente invenção inclui e fornece uma molécula de ácido nucleico substancialmente purificada compreendendo uma seqüência de ácidos nucleicos selecionada do grupo que consiste nas SEQ ID NoS 7, 44-47 e 50-53, complementos das mesmas e fragmentos de qualquer uma delas.
[0025] A presente invenção inclui e fornece uma primeira molécula de ácido nucleico substancialmente purificada com uma seqüência de ácidos nucleicos que hibridiza especificamente para uma segunda molécula de ácido nucleico tendo uma seqüência de ácidos nucleicos selecionada do grupo que consiste em um complemento das SEQ ID N0S 50-53.
[0026] A presente invenção inclui e fornece uma proteína substancialmente purificada ou parte da mesma compreendendo uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID NoS 1097, 1098 e 1100-1115 e fragmentos das mesmas.
[0027] A presente invenção inclui e fornece uma proteína substancialmente purificada ou parte da mesma compreendendo uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID NoS 1099 e1116-1119e fragmentos das mesmas.
[0028] A presente invenção inclui e fornece uma planta transformada tendo uma molécula de ácido nucleico que compreende: (a) uma região promotora exógena que funciona em uma célula vegetal para causar a produção de uma molécula de mRNA; (b) uma molécula de ácido nucleico estrutural codificando uma proteína ou fragmento da mesma compreendendo uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID NoS 1097, 1100, 1098, 1101, 1102-1115; e (c) uma seqüência não-transladada 3' que funciona na célula vegetal para causar a terminação da transcrição e adição de ribonucleotídeos poliadenilados a uma extremidade 3' da molécula de mRNA.
[0029] A presente invenção inclui e fornece uma planta transformada tendo uma molécula de ácido nucleico que compreende: (a) uma região promotora exógena que funciona em uma célula vegetal para causar a produção de uma molécula de mRNA; (b) uma molécula de ácido nucleico estrutural codificando uma proteína ou fragmento da mesma compreendendo uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID NoS 1099, 1116-1119; e (c) uma seqüência não-transladada 3' que funciona na célula vegetal para causar a terminação da transcrição e adição de ribonucleotídeos poliadenilados a uma extremidade 3' da molécula de mRNA.
[0030] A presente invenção inclui e fornece uma semente transgênica tendo uma molécula de ácido nucleico que compreende: (a) uma região promotora exógena que funciona para causar a produção de uma molécula de mRNA; (b) uma molécula de ácido nucleico estrutural codificando uma proteína ou fragmento da mesma compreendendo uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID NoS 1097, 1100, 1098, 1101,1102-1115; e (c) uma seqüência não-transladada 3’ que funciona para causar a terminação da transcrição e adição de ribonucleotídeos poliadenilados a uma extremidade 3' da molécula de mRNA.
[0031] A presente invenção inclui e fornece uma semente transgênica tendo uma molécula de ácido nucleico que compreende: (a) uma região promotora exógena que funciona para causar a produção de uma molécula de mRNA; (b) uma molécula de ácido nucleico estrutural codificando uma proteína ou fragmento da mesma compreendendo uma seqüência de aminoácidos selecionada do grupo que consiste nas SEQ ID NoS 1099, 1116-1119; e (c) uma seqüência não-transladada 3' que funciona para causar a terminação da transcrição e adição de ribonucleotídeos poliadenilados a uma extremidade 3' da molécula de mRNA, Descrição das Figuras [0032] A figura 1 é um alinhamento de seqüência de aminoácidos do domínio de repetição rico em leucina de rhg1.
[0033] A figura 2 é o alinhamento de uma seqüência de aminoácidos do domínio de repetição rico em leucina de Rhg4. Descrição das Listagens de Seqüências [0034] As listagens de seqüências a seguir fazem parte deste relatório descritivo e foram incluídas para demonstrar certos aspectos da presente invenção, A invenção pode ser melhor compreendida com referência a uma ou mais destas seqüências em conjunto com a descrição detalhada aqui apresentada.
[0035] SEQ ID N°s 1-7 e 1097-1099 referem-se todas a seqüências da linhagem A3244.
[0036] SEQ ID N° 1 é a seqüência ID 515O02_região_G2 da linhagem A3244 e é adjacente ao "contig" contendo rhgl [0037] SEQ ID N° 2 é a seqüência ID 240017_região_G3 da linhagem A3244 e contém o gene de quatro exons de rhgl, v.1 nas coordenadas de codificação 45163-45314, 45450-45509, 4694148763, 48975-49573. A translação de aminoácidos para a SEQ ID N° 2 éaSEQ ID N° 1097.
[0038] SEQ ID N° 3 é a seqüência ID 240017_região_G3 da linhagem A3244 e contém o gene de dois exons de rhg1, v.2 nas coordenadas de codificação 46798-48763 e 48975-49573. A translação de aminoácidos para a SEQ ID N° 3 é a SEQ ID N° 1098.
[0039] SEQ ID N° 4 é a seqüência ID 318013_região_A3 da linhagem A3244, contém o gene Rhg4 nas coordenadas de codificação 111805-113968 e 114968-115204 e tem uma translação de aminoácidos de SEQ ID N° 1099.
[0040] SEQ ID N° 5 é a seqüência ID 240017_região_G3_8_mRNA e compreende os dois exons de rhg1, v.2 da porção da seqüência de codificação de SEQ ID N° 3.
[0041] SEQ ID N° 6 é a seqüência ID 240017_região_G3_8_cds e compreende os quatro exons de rhg1, v.1 da porção da seqüência de codificação de SEQ ID N° 2.
[0042] SEQ ID N° 7 é a seqüência ID 318013_região_A3_17_cds e compreende a porção da seqüência de codificação de Rhg4 de SEQ ID N° 4.
[0043] SEQ ID N° 8-43 e 1100-1115 referem-se todas a seqüências de rhg1.
[0044] SEQ ID N° 8 é a seqüência ID rhg1_A3244_amplicon da linhagem A3244, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1891-3713 e 3925-4523 e tem uma translação de aminoácidos de SEQ ID N° 1100 e 1097.
[0045] SEQ ID N° 9 é a seqüência ID rhg1_A3244_amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 17483713 e 3925-4523 e tem uma translação de aminoácidos de SEQ ID N° 1101 e 1098.
[0046] SEQ ID N° 10 é a seqüência ID rhglpekingamplicon da linhagem peking, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1888-3710 e 3903-4501 e tem uma translação de aminoácidos de SEQ ID N° 1102.
[0047] SEQ ID N° 11 é a seqüência ID rhgl peking amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 17453710 e 3903-4501 e tem uma translação de aminoácidos de SEQ ID N° 1103.
[0048] SEQ ID N° 12 é a seqüência ID rhg1_toyosuzu_amplicon da linhagem toyosuzu, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1890-3712 e 39244522 e tem uma translação de aminoácidos de SEQ ID N° 1104.
[0049] SEQ ID N° 13 é a seqüência ID rhg1_toyosuzu_amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 17473712 e 3924-4522 e tem uma translação de aminoácidos de SEQ ID N° 1105.
[0050] SEQ ID N° 14 é a seqüência ID rhgl will amplicon da linhagem will, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1891-3713 e 3925-4523 e tem uma translação de aminoácidos de SEQ ID N° 1106.
[0051] SEQ ID N° 15 é a seqüência ID rhgl will amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 1748-3713 e 3925-4523 e tem uma translação de aminoácidos de SEQ ID N° 1107.
[0052] SEQ ID N° 16 é a seqüência ID rhg1_a2704_amplicon da linhagem A2704, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1891-3713 e 3925-4523 e tem uma translação de aminoácidos de SEQ ID N° 1108.
[0053] SEQ ID N° 17 é a seqüência ID rhg1_a2704_amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 17483713 e 3925-4523 e tem uma translação de aminoácidos de SEQ ID Ν° 1109.
[0054] SEQ ID Ν° 18 é a seqüência ID rhglnoiramplicon da linhagem noir, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1876-3698 e 3910-4508 e tem uma translação de aminoácidos de SEQ ID N° 1110.
[0055] SEQ ID N° 19 é a seqüência ID rhgl noir amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 17333698 e 3910-4508 e tem uma translação de aminoácidos de SEQ ID N° 1111.
[0056] SEQ ID N° 20 é a seqüência ID rhg1_lee_amplicon da linhagem lee, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1876-3698 e 3910-4508 e tem uma translação de aminoácidos de SEQ ID N° 1112.
[0057] SEQ ID N° 21 é a seqüência ID rhg1_lee_amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 1733-3698 e 3910-4508 e tem uma translação de aminoácidos de SEQ ID N° 1113.
[0058] SEQ ID N° 22 é a seqüência ID rhg1_pi200499_amplicon da linhagem PI200499, contém quatro exons de rhg1, v.1 nas coordenadas de codificação 113-264, 400-459, 1876-3698 e 39104508 e tem uma translação de aminoácidos de SEQ ID N° 1114.
[0059] SEQ ID N° 23 é a seqüência ID rhg1_pi200499_amplicon, contém dois exons de rhg1, v.2 nas coordenadas de codificação 17333698 e 3910-4508 e tem uma translação de aminoácidos de SEQ ID N° 1115.
[0060] SEQ ID N° 24 é a seqüência ID 240017_região_G3-avanço_1, é um prímer que hibridiza para as coordenadas 4505145077 do "contig" 240017_região_G3 antes do códon inicial e pode ser usada com a SEQ ID N° 25.
[0061] SEQ ID N° 25 é a seqüência ID 240017_região_G3_reverso_1, é um prímer que hibridiza para as coordenadas 47942-47918 do "contig" 240017_região_G3 e pode ser usada com a SEQ ID N° 24.
[0062] SEQ ID N° 26 é a seqüência ID 240017_região_G3_avanço_2, é um prímer que hibridiza para as coordenadas 47808-47831 do "contig" 240017_região_G3 e pode ser usada com a SEQ ID N° 27.
[0063] SEQ ID N° 27 é a seqüência ID 240017_região_G3_reverso_2, é um prímer que hibridiza para as coordenadas 49553-49531 do "contig" 240017_região_G3 antes do códon de terminação e pode ser usada com a SEQ ID N° 26.
[0064] Os prímeres dados pelas SEQ ID NoS 24-27 foram usados para criar os amplicons das SEQ ID NoS 8-23. As 22 bases finais foram adicionadas aos amplicons verdadeiros para simular o resto do gene para o códon de terminação, para permitir uma translação completa.
[0065] SEQ ID N° 28 é a seqüência ID rhg1_A3244_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 8.
[0066] SEQ ID N° 29 é a seqüência ID rhgl peking amplicon cds, que é a porção da seqüência de codificação de SEQ ID N° 10.
[0067] SEQ ID N° 30 é a seqüência ID rhg1_toyosuzu_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 12.
[0068] SEQ ID N° 31 é a seqüência ID rhgl will amplicon cds, que é a porção da seqüência de codificação de SEQ ID N° 14.
[0069] SEQ ID N° 32 é a seqüência ID rhg1_a2704_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 16.
[0070] SEQ ID N° 33 é a seqüência ID rhglnoirampliconcds, que é a porção da seqüência de codificação de SEQ ID N° 18.
[0071] SEQ ID N° 34 é a seqüência ID rhg1_lee_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 20.
[0072] SEQ ID N° 35 é a seqüência ID rhg1_pi200499_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 22.
[0073] SEQ ID N° 36 é a seqüência ID rhg1_A3244_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 9.
[0074] SEQ ID N° 37 é a seqüência ID rhg1_peking_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 11.
[0075] SEQ ID N° 38 é a seqüência ID rhg1_toyosuzu_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 13.
[0076] SEQ ID N° 39 é a seqüência ID rhg1_will_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 15.
[0077] SEQ ID N° 40 é a seqüência ID rhg1_a2704_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 17.
[0078] SEQ ID N° 41 é a seqüência ID rhg1_noir_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 19.
[0079] SEQ ID N° 42 é a seqüência ID rhg1_lee_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 21.
[0080] SEQ ID N° 43 é a seqüência ID rhg1_pi200499_amplicon_cds_2, que é a porção da seqüência de codificação de SEQ ID N° 23.
[0081] SEQ ID N0S 44-53 e 1116-1119 referem-se todas a seqüências de Rhg4.
[0082] SEQ ID N° 44 é a seqüência ID rhg4_a3244_amplicon da linhagem A3244, contém Rhg4 nas coordenadas de codificação 792242 e 2958-3478, é feita usando-se as SEQ ID NoS 48 e 49 e tem uma translação de aminoácidos de SEQ ID N° 1116 e 1099.
[0083] SEQ ID N° 45 é a seqüência ID rhg4_Minsoy_amplicon da linhagem Minsoy, contém Rhg4 nas coordenadas de codificação 792242 e 2958-3478, é feita usando-se as SEQ ID NoS 48 e 49 e tem uma translação de aminoácidos de SEQ ID N° 1117.
[0084] SEQ ID N° 46 é a seqüência ID rhg4_Jack_amplicon da linhagem Jack, contém Rhg4 nas coordenadas de codificação 79-2242 e 2958-3478, é feita usando-se as SEQ ID NoS 48 e 49 e tem uma translação de aminoácidos de SEQ ID N° 1118.
[0085] SEQ ID N° 47 é a seqüência ID rhg4_peking_amplicon da linhagem Peking, contém Rhg4 nas coordenadas de codificação 792242 e 2958-3478, é feita usando-se as SEQ ID NoS 48 e 49 e tem uma translação de aminoácidos de SEQ ID N° 1119.
[0086] SEQ ID N° 48 é a seqüência ID 318013_região_A3_avanço, hibridiza para as coordenadas 111727111756 do "contig" 318013_região_A3 e é um prímer usado com a SEQ ID N° 49 para criar amplicons de Rhg4.
[0087] SEQ ID N° 49 é a seqüência ID 318013_região_A3_reverso, hibridiza para as coordenadas 115206115177 do "contig" 318013_região_A3 e é um prímer usado com a SEQ ID N° 48 para criar amplicons de Rhg4.
[0088] SEQ ID N° 50 é a seqüência ID rhg4_A3244_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 44.
[0089] SEQ ID N° 51 é a seqüência ID rhg4_Minsoy_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 45.
[0090] SEQ ID N° 52 é a seqüência ID rhg4_Jack_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 46.
[0091] SEQ ID N° 53 é a seqüência ID rhg4_peking_amplicon_cds, que é a porção da seqüência de codificação de SEQ ID N° 47.
[0092] SEQ ID N° 1120 é a seqüência ID consensusLRR, que é uma seqüência de consenso para as repetições LRR mostradas nas figuras 1 e 2.
[0093] SEQ ID N° 1121 é a seqüência ID rhgILRR, que é a seqüência de aminoácidos do domínio LRR mostrado na figura 1.
[0094] SEQ ID N° 1122 é a seqüência ID Rhg4LRR, que é a seqüência de aminoácidos do domínio DE LRR mostrado na figura 2.
[0095] SEQ ID N° 1123 é a seqüência ID 240017_região_G3_avanço_1_b, que é um prímer alternativo que hibridiza para as coordenadas 45046-45072 do "contig" 240017_região_G3 antes do códon inicial e que pode ser usada com a SEQ ID N° 25.
[0096] O quadro 1 fornece outras informações sobre as seqüências descritas neste relatório.
[0097] No quadro 1, para todas as linhas, "Seq Num" refere-se à SEQ ID N° correspondente na listagem de seqüências.
[0098] Para as linhas com SEQ ID NoS 1-53 e 1120-1123, "Seq ID" refere-se ao nome da SEQ ID N° dada na coluna "Seq Num".
[0099] Para as linhas com SEQ ID NoS 2-4, 8-23 e 44-47, "Seqüência de Codificação" refere-se às coordenadas da porção de codificação da SEQ ID N° dada na coluna "Seq Num", e "AA" refere-se à SEQ ID N° que a translação de aminoácidos da SEQ ID N° dada na coluna "Seq Num".
[00100] Para as linhas com SEQ ID NoS 24-27 e 1123, "Localização do prímer em 240017_região_G3" refere-se às coordenadas do "contig" 240017_região_G3 para o qual a SEQ ID N° dada na coluna "Seq Num" hibridiza.
[00101] Para as linhas com SEQ ID NoS 48 e 49, "Localização do prímer em 318013_região_A3" refere-se às coordenadas do "contig" 318013_região_A3 para o qual a SEQ ID N° dada na coluna "Seq Num" hibridiza.
[00102] Para as linhas com SEQ ID NoS 54-400, "Seq ID" refere-se aos nomes das seqüências de amplicon. Dentro da Seq 1D encontra-se o símbolo (grifo para comprimento duplo). O nome antes deste símbolo é o nome do "contig" no qual se encontra o amplicon, e os números depois deste símbolo referem-se à localização no nucleotídeo do SSR no "contig".
[00103] Para as linhas com SEQ ID N°s 401-1096, "Seq ID" refere-se aos nomes das seqüências de prímer usadas em PCR para gerar as seqüências de amplicon do quadro 1. Para estas linhas, o nome na "Seq ID" contém o mesmo nome que o amplicon que é gerado pelo par de prímeres do qual faz parte a SEQ ID N° mencionada na primeira coluna, O nome na "Seq ID" também contém "avanço" ("avanço") ou "reverso" ("reverso"), que indica a orientação do prímer, Para estas seqüências, localização do prímer no início do “contig"” e "localização do prímer no final do "contig"" referem-se, respectiva mente, ao primeiro e ao último número de base do "contig" onde o prímer se alinha, Tabela 1 Continuação Continuação Descrição Detalhada da Invenção rhq1 [00104] A presente invenção fornece um método para a produção de uma planta de soja tendo um alelo rhgi resistente a SCN compreendendo: (a) cruzar uma primeira planta de soja tendo um alelo de rhg1 resistente a SCN com uma segunda planta de soja tendo um alelo de rhg1 sensível a SCN para produzir uma população segregante; (b) rastrear a população segregante quanto a um membro tendo um alelo de rhg1 resistente a SCN
[00105] com uma primeira molécula de ácido nucleico capaz de hibridizar especifica mente para o grupo de ligação G, onde a primeira molécula de ácido nucleico hibridiza especifica mente para uma segunda molécula de ácido nucleico que está ligada ao alelo de rhg1 resistente a SCN; e (c) selecionar o membro para novo cruzamento e seleção.
[00106] rhg1 fica localizado no grupo de ligação G (Concibido et al., Crop Sei. 36:1643-1650 (1996)). Os alelos de rhg1 resistentes a SCN proporcionam resistência parcial às espécies 1, 2, 3, 5, 6 e 14 do SCN (Concibido et al., Crop Sei. 37:258-264 (1997)). Também, Webb (Patente US 5.491.081) descreve que um QTL no grupo de ligação G (rhg1) proporciona resistência parcial às espécies 1, 2, 3, 5 e 14 do SCN. rhg1 e Rhg4 proporcionam resistência completa ou quase completa à espécie 3 do SCN (Patente US 5.491.081). Embora inicialmente considerado um gene recessivo, a classificação de rhg1 como gene recessivo foi questionada.
[00107] Pelo uso de métodos da bioinformática, foi previsto que a região de codificação de rhg1 contém ou quatro exons (rhg1, v.1) (coordenadas de codificação 45163-45314, 45450-45509, 4694148763 e 48975-49573 de SEQ ID N° 2) ou dois exons (rhg1, v.2) (coordenadas de codificação 46798-48763 e 48975-49573 de SEQ ID N° 3). rhg1, v.1 codifica um polipeptídio de 877 aminoácidos. rhg1, v.2 codifica um polipeptídio de 854 aminoácidos de comprimento. rhg1 codifica uma cinase de receptor semelhante a Xa21 (SEQ ID NoS 1097, 1098 e 1100-1115) (Song et al., Science 270, 1804-1806 (1995)). rhg1 tem um domínio de repetição rico em leucina (LRR) extracelular (rhg1, v.1, SEQ ID N° 1097, resíduos 164-457; rhg1, v.2, SEQ ID N° 1098, resíduos 141-434), um domínio de transmembrana (rhg1, v.1, SEQ ID N° 1097, resíduos 508-530; rhg1, v.2, SEQ ID N° 1098, resíduos 33-51 e 485-507) e domínio da proteína serina/treonina cinase (STK) (rhg1, v.1, SEQ ID N° 1097, resíduos 578-869; rhg1, v.2, SEQ ID N° 1098, resíduos 555-846). Em uma modalidade preferida, o domínio de LRR tem múltiplas repetições LRR. Em uma modalidade mais preferida, o domínio de LRR tem 12 repetições LRR.
[00108] Para identificar proteínas similares às proteínas codificadas por rhg1 candidatos, as buscas em bancos de dados foram feitas usando as seqüências de peptídios previstas. O rhg1 candidato mostrou similaridade com CAA18124, que é a suposta cinase de receptor de Arabidopsis (58,4% de similaridade e 35,8% de identidade, (CLUSTALW (parâmetros padrão), Thompson et ai., Nucleic Acids Res. 22:4673-4680 (1994), pacote GCG, Genetics Computer Group, Madison, Wisconsin), e a proteína cinase semelhante ao receptor rico em leucina da maçã (g3641252) (53,2% de similaridade e 31,5% de identidade, (CLUSTALW (parâmetros padrão))), que tem ambos os domínios de LLR e STK, mostrando conservação em ambos os domínios de LLR e STK. O domínio extracelular de LRR previsto mostra similaridade com os genes de resistência do tomate Cf-2.1 (Lycopersicon pimpinellifolium) (66,9% de similaridade e 45,4% de identidade (CLUSTALW (parâmetros padrão))) e Cf-2.2 (Lycopersicon pimpinellifoium (66,9% de similaridade e 45,4% de identidade (CLUSTALW (parâmetros padrão))).
[00109] A figura 1 é um alinhamento do domínio de LRR do gene rhg1. Uma seqüência de consenso para o LRR está mostrada como a linha superior do alinhamento. Cada linha de aminoácidos representa um domínio de LRR. A região envolvida por um retângulo indica o suposto motivo estrutural de volta β/camada β envolvido na ligação ao ligando (Jones et ai., Adv. Bot. Res. Incorp. Adv. Plant Path. 24:89-167 (1997)). Acredita-se que os resíduos leucina hidrofóbicos se projetam para dentro do núcleo da proteína ao passo que se acredita que os aminoácidos de flanqueamento sejam expostos a solventes onde eles podem interagir com o ligando (Kobe et ai., Nature 374:183-186 (1995)). Acredita-se que alterações não-conservadoras nesta regiões afetem a dobradura. Um "x" representa um aminoácido arbitrário ao passo que um "a" representa um resíduo hidrofóbico (leucina, isoleucina, metionina, valina ou fenilalanina). Substituições de aminoácidos entre fenótipos resistentes e sensíveis estão envolvidas por uma linha dupla. A subs- [00110] tituição de aminoácido na região 302-325 é uma substituição histidina/asparagina, e a substituição de aminoácido na região 422-445 é uma substituição fenilalanina/serina.
[00111] Conforme aqui usado, um alelo natural de rhg1 é qualquer alelo que codifica uma proteína tendo um LRR extracelular, um domínio de transmembrana, e um domínio de STK onde o alelo natural está presente no grupo de ligação G e onde certos alelos de rhg1, mas não todos os alelos de rhg1, são capazes de proporcionar ou contribuir para a resistência ou resistência parcial a uma espécie de SCN. Entende-se que um alelo pode, por exemplo usando métodos descritos neste relatório, ser manipulado para que a molécula de ácido nucleico codificando a proteína não esteja mais presente no grupo de ligação G. Também se entende que tal alelo pode, por exemplo por métodos descritos neste relatório, ser manipulado para que a seqüência da molécula de ácido nucleico seja alterada.
[00112] Conforme aqui usado, um alelo de rhg1 resistente a SCN é qualquer alelo de rhg1 onde aquele alelo isolado ou em combinação com outros alelos resistentes a SCN presentes na planta, tal como um alelo de Rhg4 resistente a SCN, proporciona resistência a uma espécie de SCN, e essa resistência se deve, pelo menos em parte, à contribuição genética do alelo de rhg1.
[00113] A resistência ou resistência parcial a SCN é determinada por uma comparação da planta em questão com um hospedeiro sensível a SCN conhecido, Lee 74, de acordo com o método descrito por Schmitt, J. Nematol. 20:392-395 (1988). Conforme aqui usado, resistência a uma espécie particular de SCN é definida como tendo menos de 10% de desenvolvimento de cistos em relação ao hospedeiro sensível a SCN Lee 74. Ademais, conforme aqui usado, resistência parcial a uma espécie particular de SCN é definida como tendo mais de 10% porém menos de 75% de desenvolví [00114] mento de cistos em relação ao hospedeiro sensível a SCN Lee 74.
[00115] Qualquer planta de soja tendo um alelo de rhg1 resistente a SCN pode ser usada junto com a presente invenção. Plantas de soja com alelos de rhg1 resistentes a SCN conhecidos podem ser usadas. Tais plantas de soja incluem, porém sem limitação, PI548402 (Peking), PI200499, A2869, Jack, A2069, PI209332 (N° 4), PI404166 (Krasnoaarmejkaja), PI404198 (Sun Huan do), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI84751, PI437654, PI40792, Pyramid, Nathan, AG2201, A3469, AG3901, A3904, AG4301, AG4401, AG4501, AG4601, PION9492, PI88788, Dyer, Custer, Manokin e Doles. Em um aspecto preferido, a planta de soja tendo um alelo de rhg1 resistente a SCN é um alelo de rhg1 do haplótipo 2. Exemplos de plantas de soja com um alelo de rhg1 do haplótipo 2 são PI548402 (Peking), PI404166 (Krasnoaarmejkaja), PI404198 (Sun Huan do), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI84751, PI437654 e PI40792. Além disso, usando os métodos ou agentes da presente invenção, plantas de soja e parentes selvagens da soja tal como Soja glicina podem ser analisados quanto à presença de alelos de rhg1 resistentes a SCN.
[00116] Qualquer planta de soja tendo um alelo de rhg1 sensível a SCN pode ser usada junto com a presente invenção. Tais plantas de soja incluem A3244, A2833, AG3001, Williams, Will, A2704, Noir, DK23-51, Lee 74, Essex, Minsoy, A1923 e Hutcheson. Em um aspecto preferido, a planta de soja tendo um alelo de rhg1 sensível a SCN é um alelo de rhg1 de A3244. Além disso, usando os métodos ou agentes da presente invenção, plantas de soja e parentes selvagens da soja tal como Soja glicina podem ser analisados quanto à presença de alelos de rhg1 sensíveis a SCN.
[00117] A Tabela 2 abaixo é um quadro que mostra polimorfismos de um nucleotídeo (SNPs) e sítios de inserções/deleções (INDEL) para oito seqüências de haplótipos de rhg1.
Tabela 2 [00118] Na Tabela 2, haplótipos distintos são designados de 1 a 8. N/A refere-se a um haplótipo que não foi caracterizado. O número de classificação de introdução da planta está indicado na coluna "PI N° Uma barra indica que não se conhece nenhum número de PI para a linhagem sendo pesquisada ou que nenhum número de PI fora atribuído à mesma. A linhagem da qual as seqüências são derivadas está indicada na coluna "linhagem", uma barra indicando uma linhagem desconhecida ou sem nome. A coluna "Ph." (fenótipo) do quadro 2 indica se uma dada linhagem fora considerada resistente (R) a pelo menos uma espécie de SCN ou sensível (S).
[00119] As bases de nucleotídeo localizadas em cada uma das 30 posições em cada uma das seqüências de haplótipo estão mostradas nas colunas identificadas por "Número de bases do "contig" 240017_região_G3 da linhagem de referência A3244". O número de bases na parte superior de cada coluna corresponde ao número de bases do "contig" 240017_região_G3 da linhagem de referência A3244 (SEQ ID NoS 2 e 3). As letras G, A, C e T correspondem às bases guanina, adenina, citosina e timina. Duas bases separadas por uma barra (A/G, C/T ou T/C) indicam incerteza na posição especificada da seqüência do haplótipo. Um "d" seguido por um número indica uma deleção do comprimento especificado. Isto é, d1 é uma deleção de uma base, d2 é uma deleção de duas bases, d14 é uma deleção de quatorze bases e d19 é uma deleção de dezenove bases. Um zero (0) indica nenhuma deleção. Uma barra indica que a identidade da base não foi determinada.
[00120] O exame da Tabela 2 revela que as substituições de aminoácidos na região de codificação de rhg1 são comuns às linhagens resistentes PI467312 (Cha-mo-shi-dou), PI88788 e às linhagens suscetíveis do sul Essex, Hutchenson, Noir e A1923. Conforme aqui usado, um cultivar "do sul" é qualquer cultivar dos grupos de maturidade VI, VII, VIII, IX ou X, e um cultivar "do norte" é qualquer cultivar dos grupos de maturidade 000, 00, 0, I, II, III, IV ou V. Estes dados estão consistentes com as experiências de mapeamento de Qui et al, (Theor. AppL Genet 98:356-364 {1999). Com base na análise de 200 famílias F2:3 derivadas de um cruzamento entre Peking e Essex, os autores não conseguiram detectar nenhuma associação significativa com resistência às espécies 1,2 e 3 do SCN, e o locus de rhg1 no grupo de ligação G. Os autores ressaltam que um dos marcadores, Bng122, que mostrou ter ligação significativa ao rhg1 (Concibido et al., Crop Sei. 36:1643-1650 (1996)) não é polimórfico na população empregada. Também é possível que as linhagens suscetíveis do sul contenham rhg1 e o fenótipo suscetível reflita a natureza poligênica de resistência ao SCN, Em estudo para revelar QTLs para a síndrome da morte súbita (SDS) na soja, foram descritos dois alelos resistentes a SCN provenientes do progenitor suscetível Essex (Hnetkovsky et al., Crop Sei, 36:393-400), [00121] As Tabelas 3a, 3b e 3c abaixo mostram linhagens que compartilham um haplótipo de rhg1.
Tabela 3a [00122] Nos quadros 3a, 3b e 3c, o número de classificação de introdução da planta está indicado na coluna "PI N°Uma barra indica que não se conhece nenhum número de PI para a linhagem em questão ou que nenhum número de PI fora atribuído à mesma. A linhagem da qual as sequências são derivadas está indicada na coluna linhagem", uma barra indicando uma linhagem desconhecida ou sem nome. A coluna "Ph." indica se uma dada linhagem fora considerada resistente (R) a pelo menos uma espécie de SCN ou sensível (S), uma barra indicando que o fenótipo é desconhecido.
[00123] Em um aspecto preferido, a fonte de um alelo de rhg1 sensível a SCN ou de um alelo de rhg1 resistente a SCN, ou mais preferivelmente de ambos, é uma planta de elite. Uma "linhagem de elite" é qualquer linhagem que tenha resultado de cruzamento e seleção para desempenho agronômico superior. Exemplos de linhagens de elite são linhagens que se encontram comercial mente disponíveis para fazendeiros ou reprodutores de soja tais como HARTZ® variedade H4994, HARTZ® variedade H5218, HARTZ® variedade H5350, HARTZ® variedade H5545, HARTZ® variedade H5050, HARTZ® variedade H5454, HARTZ® variedade H5233, HARTZ® variedade H5488, HARTZ® variedade HLA572, HARTZ® variedade H6200, HARTZ® variedade H6104, HARTZ® variedade H6255, HARTZ® variedade H6586, HARTZ® variedade H6191, HARTZ® variedade H7440, HARTZ® variedade H4452 Roundup Ready®, HARTZ® variedade H4994 Roundup Ready®, HARTZ® variedade H4988 Roundup Ready®, HARTZ® variedade H5000 Roundup Ready®, HARTZ® variedade H5147 Roundup Ready®, HARTZ® variedade H5247 Roundup Ready®, HARTZ® variedade H5350 Roundup Ready®, HARTZ® variedade H5545 Roundup Ready®, HARTZ® variedade H5855 Roundup Ready®, HARTZ® variedade H5088 Roundup Ready®, HARTZ® variedade H5164 Roundup Ready®, HARTZ® variedade H5361 Roundup Ready®, HARTZ® variedade H5566 Roundup Ready®, HARTZ® variedade H5181 Roundup Ready®, HARTZ® variedade H5889 Roundup Ready®, HARTZ® variedade H5999 Roundup Ready®, HARTZ® variedade H6013 Roundup Ready®, HARTZ® variedade H6255 Roundup Ready®, HARTZ® variedade H6454 Roundup Ready®, HARTZ® variedade H6686 Roundup Ready®, HARTZ® variedade H7152 Roundup Ready®, HARTZ® variedade H7550 Roundup Ready®, HARTZ® variedade H8001 Roundup Ready® (Hartz Seed, Stuttgart, Arkansas, EUA); A0868, AG0901, A1553, A1900, AG1901, A1923, A2069, AG2101, AG2201, A2247, AG2301, A2304, A2396, AG2401, AG2501, A2506, A2553, AG2701, AG2702, A2704, A2833, A2869, AG2901, AG2902, AG3001, AG3002, A3204, A3237, A3244, AG3301, AG3302, A3404, A3469, AG3502, A3559, AG3601, AG3701, AG3704, AG3750, A3834, AG3901, A3904, A4045, AG4301, A4341, AG4401, AG4501, AG4601, AG4602, A4604, AG4702, AG4901, Α4922, AG5401, Α5547, AG5602, Α5704, AG5801, AG5901, Α5944, Α5959, AG6101, QR4459 e QP4544 (Asgrow Seeds, Des Moines, lowa, EUA); DeKalb variedade CX445 (DeKalb, Illinois), Uma planta de elite é qualquer planta de uma linhagem de elite, B) Rhq4 [00124] A presente invenção fornece um método para a produção de uma planta de soja tendo um alelo Rhg4 resistente a SCN compreendendo: (a) cruzar uma primeira planta de soja tendo um alelo de Rhg4 resistente a SCN com uma segunda planta de soja tendo um alelo de Rhg4 sensível a SCN para produzir uma população segregante; (b) rastrear a população segregante quanto a um membro tendo um alelo de Rhg4 resistente a SCN com uma primeira molécula de ácido nucleico capaz de hibridizar específicamente para o grupo de ligação A2, onde a primeira molécula de ácido nucleico hibridiza especificamente para uma segunda molécula de ácido nucleico ligada ao alelo de Rhg4 resistente a SCN; e (c) selecionar o membro para novo cruzamento e seleção.
[00125] Rhg4 fica localizado no grupo de ligação A2 (Matson et al., Crop Sei. 5:447 (1965)). Os alelos de Rhg4 resistentes a SCN proporcionam resistência parcial às espécies 1 e 3 do SCN (Patente US 5.491.081). juntos, rhg1 e Rhg4 proporcionam resistência completa ou quase completa à espécie 3 do SCN. Verificou-se que gene dominante, Rhg4, estava firmemente ligado ao locus de cor do revestimento da semente (í) (Matson et al., Crop Scí. 5:447 (1965)). Também foi verificado que o locus í na Pekíng estava ligado com um gene recessivo para resistência a SCN (Sugiyama et al., Jpn. J. Breed, 16:83-86 (1966)). É possível que Rhg4 e o gene recessivo ligado ao locus i sejam os mesmos, o que levantaria dúvidas sobre a classificação de Rhg4 como gene dominante, [00126] Pelo uso de métodos da bioinformática, foi previsto que a região de codificação de Rhg4 contém ou 2 exons (coordenadas de codificação 111805-113968 e 114684-115204 de SEQ ID N° 4). Rhg4 codifica um polipeptídio de 894 aminoácidos. Rhg4 codifica uma cinase de receptor semelhante a Xa21 (SEQ ID NoS 1099 e 1116-1119) (Song et ai., Science 270, 1804-1806 (1995)). Rhg4 tem um domínio de LRR extracelular (Rhg4, SEQ ID N° 1099, resíduos 34-44), um domínio de transmembrana (Rhg4, SEQ ID N° 1099, resíduos 449471) e domínio de STK (Rhg4, SEQ ID N° 1099, resíduos 531-830). Em uma modalidade preferida, o domínio de LRR tem múltiplas repetições LRR. Em uma modalidade mais preferida, o domínio de LRR tem 12 repetições LRR.
[00127] Para identificar proteínas similares à Rhg4 candidata, as buscas em bancos de dados foram feitas usando as seqüências de peptídios previstas. O Rhg4 candidato mostrou similaridade com TMK (Y07448) (73,0% de similaridade e 54,8% de identidade (CLUSTALW (parâmetros padrão))) TMK1 PRECURSOR (70,6% de similaridade e 55,1% de identidade (CLUSTALW (parâmetros de "default"))), que são cinases de receptor de arroz e de Arabidopsis, respectivamente. O domínio extracelular de LRR previsto apresenta similaridade com TMK (Y07748) (70,1% de similaridade e 46,6% de identidade (CLUSTALW (parâmetros padrão))), TMK1 PRECURSOR (g1707642) (65,8% de similaridade e 48,8% de identidade (CLUSTALW (parâmetros de padrão))) e F21J9.1 (g2213607 (65,5% de similaridade e 45,6% de identidade (CLUSTALW (parâmetros padrão))) [00128] A figura 2 é um alinhamento do domínio de LRR do gene Rhg4. Uma seqüência de consenso para o LRR está mostrada como a linha superior. Cada linha de aminoácidos representa um domínio de LRR. A região envolvida por um retângulo indica o suposto motivo estrutural de volta β/camada β envolvido na ligação ao ligando (Jones et ai., Adv. Bot. Res. Incorp. Adv. Plant Path. 24:89-167 (1997)).
Acredita-se que os resíduos leucina hidrofóbicos se projetam para dentro do núcleo da proteína ao passo que se acredita que os aminoácidos de flanqueamento sejam expostos a solventes onde eles podem interagir com o ligando (Kobe et ai., Nature 374:183-186 (1995)). Um "x" representa um aminoácido arbitrário ao passo que um "a" representa um resíduo hidrofóbico (leucina, isoleucina, metionina, valina ou fenilalanina). Substituições de aminoácidos entre fenótipos resistentes e sensíveis estão envolvidas por uma linha dupla. A substituição de aminoácido na região 35-57 é uma substituição histidina/glutamina, e a substituição de aminoácido na região 81-104 é uma substituição leucina/fenilalanina.
[00129] Conforme aqui usado, um alelo natural de Rhg4 é qualquer alelo que codifica uma proteína tendo um LRR extracelular, um domínio de transmembrana, e um domínio de STK onde o alelo natural está presente no grupo de ligação A2 e onde certos alelos de Rhg4, mas não todos os alelos de Rhg4, são capazes de proporcionar ou contribuir para a resistência ou resistência parcial a uma espécie de SCN. Entende-se que um alelo pode, por exemplo usando métodos descritos neste relatório, ser manipulado para que a molécula de ácido nucleico codificando a proteína não esteja mais presente no grupo de ligação A2. Também se entende que tal alelo pode, por exemplo por métodos descritos neste relatório, ser manipulado para que a seqüência da molécula de ácido nucleico seja alterada.
[00130] Conforme aqui usado, um alelo de Rhg4 resistente a SCN é qualquer alelo de Rhg4 onde aquele alelo isolado ou em combinação com outros alelos resistentes a SCN presentes na planta, tal como um alelo de rhg1 resistente a SCN, proporciona resistência a uma espécie de SCN, e essa resistência se deve, pelo menos em parte, à contribuição genética do alelo de Rhg4.
[00131] Qualquer planta de soja tendo um alelo de Rhg4 resistente a SCN pode ser usada junto com a presente invenção. Plantas de soja com alelos de Rhg4 resistentes a SCN conhecidos podem ser usadas. Tais plantas de soja incluem, porém sem limitação, PI548402 (Peking), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI88788, PI404198 (Sun Huan do), PI404166 (Krasnoaarmejkaja), Hartwig, Manokin, Doles, Dyer e Custer. Em um aspecto preferido, a planta de soja tendo um alelo de Rhg4 resistente a SCN é um alelo de Rhg4 do haplótipo 3 em uma planta tendo um alelo de rhg1 do haplótipo 2 ou um alelo de rhg1 do haplótipo 4. Exemplos de plantas de soja com um alelo de Rhg4 do haplótipo 3 são PI548402 (Peking), PI88788, PI404198 (Sun Huan do), PI438489 (Chiquita), PI437654 (Er-hej-jan), PI404166 (Krasnoaarmejkaja), PI548655 (Forrest), PI548988 (Pickett) e PI507354 (Tokei 421). Além disso, usando os métodos ou agentes da presente invenção, plantas de soja e parentes selvagens da soja tal como Soja glicina podem ser analisados quanto à presença de alelos de Rhg4 resistentes a SCN.
[00132] A Tabela 4 abaixo é uma tabela mostrando polimorfismos de um nucleotídeo (SNPs) para três seqüências de haplótipos de Rhg4.
Tabela 4 [00133] Na Tabela 4, haplótipos distintos são designados de 1 a 3. N/A refere-se a um haplótipo que não foi caracterizado. Na Tabela 4, o número de classificação de introdução da planta está indicado na coluna "PI N° Uma barra indica que não se conhece nenhum número de PI para a linhagem sendo pesquisada ou que nenhum número de PI fora atribuído à mesma. A linhagem da qual as seqüências são derivadas está indicada na coluna "linhagem", uma barra indicando uma linhagem desconhecida ou sem nome. A coluna "Ph." do quadro 4 indica se uma dada linhagem fora considerada resistente (R) a pelo menos uma espécie de SCN ou sensível (S). A coluna "revestimento" mostra a cor do revestimento fenotípico de uma semente como sendo amarela, preta, verde acastanhado (GnBr) ou desconhecida/não atribuída (barra). No locus I, variedades com sementes pretas ancoram o alelo i para revestimento de semente preto ou preto imperfeito. Em uma modalidade preferida, a semente tem um revestimento amarelo.
[00134] As bases de nucleotídeo localizada em cada uma das 5 posições em cada uma das seqüências de haplótipo está mostrada nas colunas identificadas por "número de bases do "contig" 318013_região_A3". O número de bases na parte superior de cada coluna corresponde ao número de bases do "contig" 318013_região_A3 da linhagem de referência A3244 (SEQ ID N° 4). As letras G, A, C e T correspondem às bases guanina, adenina, citosina e timina. Uma barra indica que a identidade da base não é conhecida.
[00135] Três diferentes marcadores microssatélites ou de repetição de seqüência simples (SSR) que ocorrem nas seqüências, scn279 (SEQ ID N° 292), scn267 (SEQ ID N° 282) e scn273 (SEQ ID N° 294), estão listados na coluna "marcadores". O alelo de cada marcador que ocorre em um haplótipo está indicado por um 1 ou um 2, uma barra indicando que a informação não foi determinada.
[00136] Qualquer planta de soja tendo um alelo de Rhg4 sensível a SCN pode ser usada junto com a presente invenção. Tais plantas de soja incluem A3244, Will, Noir, Lee 74, Essex, Minsoy, A2704, A2833, AG3001, Williams, DK-23-51 e Hutcheson. Em um aspecto preferido, a planta de soja tendo um alelo de Rhg4 sensível a SCN é um alelo de Rhg4 de A3244. Além disso, usando os métodos ou agentes da presente invenção, plantas de soja e parentes selvagens da soja tal como Soja glicina podem ser analisados quanto à presença de alelos de Rhg4 sensíveis a SCN.
[00137] Em um aspecto preferido, a fonte de um alelo de Rbg4 sensível a SCN ou de um alelo de Rhg4 resistente a SCN, ou mais preferivelmente de ambos, é uma planta de elite, [00138] Na Tabela 5 abaixo encontram-se comparados haplótipos de rhg1 e Rhg4 para vários cultivares.
Tabela 5 Ό0139] Na Tabela 5, encontram-se listados para cada linhagem os haplótipos, usados nos Quadros 2 a 4. N/A refere-se a um haplótipo que não foi caracterizado, O número de classificação de introdução da planta está indicado na coluna "PI N° ", Uma barra indica que não se conhece nenhum número de PI para a linhagem em questão ou que nenhum número de PI fora atribuído à mesma, A linhagem da qual as sequências são derivadas está indicada na coluna linhagem", uma barra indicando uma linhagem desconhecida ou sem nome. A coluna "Ph." indica se uma dada linhagem fora considerada resistente (R) a pelo menos uma espécie de SCN ou sensível (S). A coluna "revestimento" mostra a cor do revestimento fenotípico de uma semente como sendo amarela, preta, verde acastanhado (GnBr) ou desconhecida/não atribuída (barra). No locus I, variedades com sementes pretas ancoram o alelo í para revestimento de semente preto ou preto imperfeito. Em uma modalidade preferida, a semente tem um revestimento amarelo.
Análise de alelos de rha1 e Rha4 [00140] Qualquer método apropriado pode ser usado para analisar uma planta tendo um alelo de rhg1 resistente a SCN. Qualquer método apropriado pode ser usado para analisar uma planta tendo um alelo de Rhg4 resistente a SCN. Em um aspecto preferido da presente invenção, um marcador de ácido nucleico da presente invenção pode ser usado (veja seção intitulada "Análise de alelos de rhgi e Rhg4" e subseção (íi) da seção intitulada "Agentes”).
[00141] Marcadores adicionais, tais como SSRs, marcadores de AFLP, marcadores de RFLP, marcadores de RAPD, marcadores fenotípicos, SNPs, marcadores de isozima, perfis de transcrição de microarranjos que estão geneticamente ligados a ou correlacionados com alelos de um QTL da presente invenção podem ser utilizados (Walton, Seed World 22-29 (julho 1993); Burow et al., Molecular Díssection of Complex Traits, 13-29, Eds. Paterson, CRC Press, New York (1988)), Métodos para isolar tais marcadores são conhecidos na técnica. Por exemplo, SSRs específicos para locus podem ser obtidos por rastreamento de uma biblioteca genómica para SSRs, seqüenciamento de clones "positivos", criação de prímeres que flanqueiem as repetições, e ampliação de DNA genômico com esses prímeres. O tamanho dos produtos de ampliação resultantes pode variar por números inteiros da unidade de repetição básica. Para detectar um polimorfismo, produtos de PCR podem ser radio marcados, separados sobre polí ac ri Ia mi d a géis desnaturantes, e detectados por auto-radíografía. Fragmentos com diferenças de tamanho > 4 bp podem ser resolvidos sobre agarose géis, dessa forma evitando a radioatividade.
[00142] Outros marcadores de SSR podem ser utilizados. Ampliação de repetições em série simples, principalmente do tipo [CA]n foi apresentada por Litt et ai., Amer. J. Human Genet. 44:397-401 (1989); Smeets et ai., Human Genet. 83:245-251 (1989); Tautz, Nucleic Acids Res. 17:6463-6472 (1989); Weber et ai., Am. J. Hum. Genet. 44:388-396 (1989). Weber, Genomics 7:524-530 (1990), relatou que o nível de polimorfismo detectado por SSRs do tipo [CA]n ampliados por PCR depende do número dos motivos "perfeitos" (isto é, não interrompidos) repetidos em série. Abaixo de um certo limite (isto é, 12 repetições de CA), verificou-se que os SSRs eram principalmente monomórficos. Acima deste limite, no entanto, a probabilidade de polimorfismo aumenta com o comprimento do SSR. Conseqüentemente, disposições longas perfeitas de SSRs são preferidas para a geração de marcadores, isto é, para a criação e síntese de prímeres flanqueadores.
[00143] Prímeres adequados podem ser deduzidos de bancos de dados de DNA (por exemplo Akkaya et ai., Genetics, 132:1131-1139 (1992)). Alternativamente, bibliotecas genômicas de tamanho selecionado (200 a 500 bp) podem ser construídas, por exemplo, usando-se as seguintes etapas: (1) isolamento de DNA genômico; (2) digestão com uma ou mais enzimas de restrição específicas de 4 bases; (3) seleção por tamanho de fragmentos de restrição por eletroforese em agarose gel, excisão e purificação da fração de tamanho desejada; (4) ligação do DNA em um vetor adequado e transformação em uma cepa de E. coli adequada; (5) rastreamento quanto à presença de SSRs por hibridização de colônias ou placas com uma sonda marcada; (6) isolamento de clones positivos e seqüenciamento das inserções; e (7) criação de prímeres adequados flanqueando o SSR.
[00144] Estabelecer bibliotecas com inserções pequenas, selecionadas por tamanho, pode ser vantajoso para o isolamento de SSR por duas razões: (1) SSRs longos geralmente são instáveis em E. coli, e (2) clones positivos podem ser seqüenciados sem subclonagem. Inúmeros métodos foram apresentados para o enriquecimento de SSRs em bibliotecas genômicas. Tais procedimentos de enriquecimento são particularmente úteis quando as bibliotecas são rastreadas com motivos de repetição do tipo tri- e tetranucleotídeo comparativamente raros. Um procedimento deste tipo foi descrito por Ostrander et al., Proc. Natl. Acad. Sei. (U.S.A.) 89:3419-3423 (1992), que apresentou a geração de uma biblioteca de fagemídeos de inserção pequena em uma cepa de E. coli deficiente em genes de UTPase (d8t) e uracil-N-glicosilase (ung). Na ausência de UTPase e uracil-N-glicosilase, dUTP pode competir com dTTP pela incorporação no DNA. DNA de fagemídeo de cordão simples isolado dessa biblioteca pode receber os prímeres [CA]n e [TG]n para síntese do segundo cordão, e os produtos usados para transformar uma cepa de E. coli do tipo selvagem. Como nessas condições ocorrerá seleção contra moléculas de DNA de cordão simples contendo uracil, a biblioteca resultante consistirá de produtos de cordão duplo, prolongados por prímeres e um enriquecimento de cerca de 50 vezes nas repetições CA.
[00145] Outras estratégias de enriquecimento apresentadas baseiam-se na seleção por hibridização de repetições de seqüência simples antes da clonagem (Karagyozov et al., Nucleic Acids Res. 21:3911:3912 (1993); Armour et al., Hum. Mol. Gen. 3:599-605 (1994); Kijas et al., Genome 38:349-355 (1994); Kandpal et al., Proc. Natl. Acad. Sei. (U.S.A.) 91:88-92 (1994); Edwards et al., Am. J. Hum. Genet. 49:746-756 (1991)). Seleção por hibridização pode, por exemplo, envolver as seguintes etapas: (1) DNA genômico é fragmentado, seja por sonicação ou por digestão com uma enzima de restrição; (2) fragmentos de DNA genômico são ligados a adaptadores que permitem uma "PCR do genoma completo" neste estágio ou em um estágio posterior do procedimento; (3) os fragmentos de DNA genômico são ampliados, desnaturados e hibridizados com seqüências de SSR de cordão simples ligadas a uma membrana de náilon; (4) depois de remover por lavagem DNA não ligado, os fragmentos de hibridização enriquecidos com SSRs são eluídos da membrana por ebulição ou tratamento com álcali, novamente ampliados usando prímeres complementares de adaptadores, e digeridos com uma enzima de restrição para remover os adaptadores; e (5) os fragmentos de DNA são ligados em um vetor adequado e transformados em uma cepa de E. coli adequada. SSRs podem ser encontrados em até 50 - 70% dos clones obtidos por estes procedimentos (Armour et ai., Hum. Mol. Gen. 3:599-605 (1994); Edwards et ai., Am. J. Hum. Genet. 49:746-756 (1991)).
[00146] Uma estratégica de seleção por hibridização alternativa foi apresentada por Kijas et ai., Genome 38:599-605 (1994), que substituiu a membrana de náilon por oligonucleotídeos complementares de SSR biotinilados, presos a partículas magnéticas revestidas com estreptavidina. Fragmentos de DNA contendo SSR são seletivamente ligados às contas magnéticas, novamente ampliados, digeridos com enzimas de restrição e clonados.
[00147] Também deve ficar entendido que podem ser utilizados outros marcadores adicionais no grupo de ligação G ou A2 (Morgante et ai., Genome 37:763-769 (1994)). Conforme aqui usado, referência ao grupo de ligação de G ou A2 refere-se ao grupo de ligação que corresponde aos grupos de ligação U5 e U3, respectivamente, do mapa genético de Glycine max (Mansur et ai., Crop Sei. 36: 1327-1336 (1996), e aos grupos de ligação G e A2, respectivamente, de Glycine max x. Soja glicina (Shoemaker et ai., Genetics 144: 329-336 (1996)) que estão presentes na Soja glicina (Soybase, an Agricultural Research Service, Departamento de Agricultura dos Estados Unidos (http://129.186.26.940/ e USDA - Agricultural Research Service: http://www.ars.usda.gov/)).
[00148] SSRs ampliados por PCR podem ser usados porque são específicos para locus, co-dominantes, ocorrem em grandes números e permitem a identificação exata dos alelos. Protocolos tradicionais de SSR ampliados por PCR utilizam radioisótopos e poliacrilamida géis desnaturantes para detectar SSRs ampliados. Em muitas situações, no entanto, os tamanhos dos alelos são suficientemente diferentes para serem resolvidos em géis com alta percentagem de agarose em combinação com o corante brometo de etídio (Bell et ai., Genomics 19:137-144 (1994); Becker et ai., Genome 38:991-998 (1995); Huttel, Tese de Ph.D., University of Frankfurt, Alemanha (1996)). Alta resolução sem aplicação de radioatividade também é oferecida por poliacrilamida géis desnaturantes em combinação com o corante brometo de etídio (Scrimshaw, Biotechniques 13:2189 (1992)) ou prata (Klinkicht et ai., Molecular Ecology 1: 133-134 (1992); Neilan et al., Biotechniques 17:708-712 (1994)). Uma alternativa para tipificar SSRs ampliados por PCR envolve o uso de prímeres fluorescentes em combinação com um seqüenciador de DNA semi-automático (Schwengel et al., Genomics 22:46-54 (1994)). Produtos de PCR fluorescentes podem ser detectados por varredura a laser em tempo real durante eletroforese em gel. Uma vantagem desta tecnologia é que reações de ampliações diferentes assim como um marcador de tamanho (cada um marcado com um fluoróforo diferente) podem ser combinados em uma faixa durante a eletroforese. Análise múltipla de até 24 locos SSR diferentes por faixa foi apresentada (Schwengel et al., Genomics 22:46-54 (1994)).
[00149] A detecção de sítios polimórficos em uma amostra de DNA pode ser facilitada pelo uso de métodos de ampliação de ácido nucleico. Esses métodos aumentam especificamente a concentração de polinucleotídeos que transpõem o sítio polimórfico, ou incluem esse sítio e seqüências localizadas distante ou perto do mesmo. Tais moléculas ampliadas podem ser facilmente detectadas por eletroforese em gel ou outros meios.
[00150] O método mais preferido para obter tal ampliação emprega a reação de cadeia de poiimerase ("PCR") (Mullis et al., Cold Spring Harbor Symp, Quant. BíoL 51:263-273 (1986); Erlich et al-, Pedido de Patente Européia 50.424; Pedido de Patente Européia 84.796, Pedido de Patente Européia 258,017, Pedido de Patente Européia 237.362; Mullis, Pedido de Patente Européia 201.148; Mullis et al., Patente US N° 4.683.202; Erlich, Patente US N° 4.582.788; e Saiki et al., Patente US N° 4.683.194), usando pares de prímeres que sejam capazes de hibridizar para as seqüências proximais que definem um polimorfismo em sua forma de cordão duplo.
[00151] Ao invés de PCR, métodos alternativos, tal como "Reação de Cadeia de Ligase" ("LCR"), podem ser usados {Barany, Proc. Natl. Acad. Sei. (U.S.A.) 88:189-193 (1991)), A LCR utiliza dois pares de sondas de oligonucleotídeo para ampliar de forma exponencial um alvo específico. As seqüências de cada par de oligonucleotídeos é selecionada de maneira a permitir que o par hibridize para seqüências de apoio do mesmo cordão do alvo. Esta hibridização forma um substrato para ligase dependente de molde. Como com a PCR, os produtos resultantes servem portanto como molde em ciclos subseqüentes e obtém-se uma ampliação exponencial da seqüência desejada.
[00152] LCR pode ser realizada com oligonucleotídeos tendo as seqüências proximal e distai do mesmo cordão de um sítio polimórfico. Em uma modalidade, um ou outro oligonucleotídeo será criado de maneira a incluir o sítio polimórfico verdadeiro do polimorfismo. Nessa modalidade, as condições reacionais são selecionadas de modo que os oligonucleotídeos possam ser ligados entre si somente se a molécula alvo contiver ou não contiver o nucleotídeo específico que seja complementar ao sítio polimórfico presente no oligonucleotídeo. Alternativa mente, os oligonucleotídeos podem ser selecionados de modo a não incluírem o sítio polimórfico (veja Segev, Pedido PCI WO 90/01069).
[00153] O "Ensaio de Ligação de Oligonucleotídeo" ("OLA") pode ser alternativamente empregado (Landegren et ai., Science 241:1077-1080 (1988) ). O protocolo do OLA utiliza dois oligonucleotídeos que são criados para serem capazes de hibridizar para seqüências de apoio de um cordão simples de um alvo. O OLA, como a LCR, é particularmente adequado para a detecção de mutações pontuais. No entanto, ao contrário da LCR, o OLA resulta em ampliação "linear" da seqüência alvo ao invés de exponencial.
[00154] Nickerson et ai. descreveram um ensaio de detecção de ácidos nucleicos que combina características de PCR e de OLA (Nickerson et ai., Proc. Natl. Acad. Sei. (U.S.A.) 87:8923-8927 (1990)). Neste método, a PCR é usada para obter a ampliação exponencial do DNA alvo, que é em seguida detectado usando o OLA. Além de requerer várias e separadas etapas de processamento, um problema associado com tais combinações é que elas herdam todos os problemas associados com PCR e OLA.
[00155] Esquemas baseados na ligação de dois (ou mais) oligonucleotídeos na presença de um ácido nucleico tendo a seqüência do "di-oligonucleotídeo" resultante, dessa forma ampliando o di-oligonucleotídeo também são conhecidos(Wu et ai., Genomics 4:560-569 (1989) ), e podem ser facilmente adaptados aos propósitos da presente invenção.
[00156] Outros procedimentos conhecidos de ampliação de ácidos nucleicos, tais como oligômeros específicos para alelo, tecnologia de DNA ramificado, sistemas de ampliação à base de transcrição ou métodos de ampliação isotérmica também podem ser usados para ampliar e analisar tais polimorfismos (Malek et ai., Patente US 5.130.238; Davey et ai., Pedido de Patente Européia 329.822; Schuster et ai., Patente US 5.169.766; Miller et ai., Pedido de Patente PCT WO 89/06700; Kwoh et al., Proc. Natl. Acad. Sei. (U.S.A.) 86:1173-1177 (1989); Gingeras et al., Pedido de Patente PCT WO 88/10315; Walker et al., Proc. Natl. Acad. Sei. (U.S.A.) 89:392-396 (1992)).
[00157] Polimorfismos também podem ser identificados por análise do Polimorfismo de Conformação de Cordão Simples (SSCP). SSCP é um método capaz de identificar a maioria das variações de seqüência em um cordão simples de DNA, tipicamente com um comprimento entre 150 e 250 nucleotídeos (Elles, Methods in Molecular Medicine: Molecular Diagnosis of Genetic Diseases, Human Press (1996); Orita et al., Genomics 5: 874-879 (1989)). Em condições desnaturantes, um cordão simples de DNA vai adotar uma conformação que é exclusivamente dependente da conformação de sua seqüência. Esta conformação geralmente será diferente, mesmo que apenas uma base simples seja trocada. Foi descrito que a maioria das conformações alteram a configuração física ou o tamanho o suficiente para que sejam detectadas por eletroforese. Foram descritos inúmeros protocolos para SSCP que incluem, porém sem limitação, Lee et al., Anal. Biochem. 205: 289-293 (1992); Suzuki et al., Anal. Biochem. 192: 82-84 (1991); Lo et al., Nucleic Acids Research 20: 1005-1009 (1992); Sarkar et al., Genomics 13: 441443 (1992). Deve ficar entendido que um ou mais dos ácidos nucleicos da presente invenção podem ser utilizados como marcadores ou sondas para detectar polimorfismos por análise por SSCP.
[00158] Polimorfismos também podem ser encontrados usando-se DNA polimórfico ampliado aleatório (RAPD) (Williams et al., Nucl. Acids Res. 18:6531-6535 (1990)) e seqüências polimórficas ampliadas cliváveis (CAPS) (Lyamichev et al., Science 260: 778-783 (1993)). Deve ficar entendido que uma ou mais moléculas de ácido nucleico da presente invenção podem ser utilizadas como marcadores ou sondas para detectar polimorfismos por análise de RAPD ou CAPS.
[00159] A identificação de um polimorfismo pode ser determinada de várias maneiras. Correlacionando-se a presença ou ausência do mesmo em uma planta com a presença ou ausência de um fenótipo, é possível prever o fenótipo daquela planta. Se um polimorfismo criar ou destruir um sítio de divagem de endonuclease de restrição, ou se ele resultar na perda ou inserção de DNA (por exemplo, um polimorfismo de repetição em série de nucleotídeo variável (VNTR)), ele vai alterar o tamanho ou o perfil dos fragmentos de DNA que são gerados por digestão com aquela endonuclease de restrição. Assim, indivíduos que possuem uma seqüência variante podem ser distinguidos daqueles que têm a seqüência original por análise do fragmento de restrição. Os polimorfismos que podem ser identificados dessa maneira são chamados de "polimorfismos de comprimento do fragmento de restrição" ("RFLPs"). RFLPs vêm sendo amplamente usados em análises da genética humana e vegetal (Glassberg, Pedido de Patente UK 2135774; Skolnick et ai., Cytogen. Cell Genet. 32: 58-67 (1982); Botstein et ai., Ann. J. Hum. Genet. 32:314-331 (1980); Fischer et ai. (Pedido PCT WO 90/13668); Uhlen, Pedido PCT WO 90/11369)).
[00160] Uma característica central de "polimorfismos de nucleotídeo simples" ou "SNPs" é que o sítio do polimorfismo fica em um nucleotídeo simples. SNPs têm algumas vantagens declaradas sobre RFLPs e VNTRs. Em primeiro lugar, os SNPs são mais estáveis que outras classes de polimorfismos. Sua velocidade de mutação espontânea é de aproximadamente 10"9 (Kornberg, DNA Replication, W. H. Freeman & Co., San Francisco, 1980), aproximadamente 1000 vezes menos freqüente que VNTRs (Patente US 5.679.524). Em segundo lugar, os SNPs ocorrem com maior freqüência e com uniformidade maior que os RFLPs e VNTRs. Como os SNPs resultam de variação da seqüência, polimorfismos novos podem ser identificados por seqüenciamento de moléculas genômicas aleatórias ou de cDNA. Os SNPs também podem resultar de deleções, mutações pontuais e inserções. Qualquer alteração de base simples, qualquer que seja a causa, pode ser um SNP. Uma freqüência maior de SNPs significa que eles podem ser identificados mais rapidamente que as outras classes de polimorfismos.
[00161] SNPs e inserções/deleções podem ser detectados por métodos, por qualquer um de uma variedade de métodos que incluem aqueles descritos nas Patentes US 5.210.015, 5.876.930 e 6.030.787 onde uma sonda de oligonucleotídeo tendo moléculas relatoras e extintoras é hibridizado para um polinucleotídeo alvo. A sonda é degradada por atividade de 5'-> 3' exonuclease de um ácido nucleico polimerase. Um ensaio útil encontra-se disponível na AB Biosystems (850 Lincoln Centre Drive, Foster City, CA) como ensaio Taqman®.
[00162] Variações de nucleotídeo específicas tais como SNPs e inserções/deleções também podem ser detectadas por métodos de extensão de base marcada como descrito nas Patentes US 6.004.744, 6.013.431, 5.595.890, 5.762.876 e 5.945.283. Estes métodos baseiam-se na extensão com prímer e na incorporação de nucleosídeo trifosfatos detectáveis. O prímer é criado para combinar com a seqüência imediatamente adjacente ao nucleotídeo variável que pode ser detectado depois da incorporação de somente um nucleosídeo trifosfato marcado. A Patente US 5.468.613 descreve hibridizações de oligonucleotídeos específicas para alelo onde variações simples ou múltiplas de nucleotídeo na seqüência de ácidos nucleicos podem ser detectadas nos ácidos nucleicos por um processo no qual a seqüência contendo a variação de nucleotídeo é ampliada, manchada sobre uma membrana e tratada com uma sonda de oligonucleotídeo específica para seqüência marcada.
[00163] Esses métodos também incluem o seqüenciamento direto ou indireto do sítio, o uso de enzimas de restrição onde os respectivos alelos do sítio criam ou destroem um sítio de restrição, o uso de sondas de hibridização específicas para alelo, o uso de anticorpos que são específicos para as proteínas codificadas pelos diferentes alelos do polimorfismo ou por outra interpretação bioquímica. Os SNPs podem ser seqüenciados por inúmeros métodos. Dois métodos básicos podem ser usados para seqüenciamento de DNA, o método de terminação da cadeia de Sanger et ai., Proc. Natl. Acad. Sei. (U.S.A.) 74: 5463-5467 (1977) e o método de degradação química de Maxam et ai., Proc. Natl. Acad. Sei. (U.S.A.) 74: 560-564 (1977). A automatização e os avanços tecnológicos tais como a substituição de radioisótopos por seqüenciamento à base de fluorescência reduziram os esforços necessários para seqüenciar DNA (Craxton, Methods, 2: 20-26 (1991); Ju et ai., Proc. Natl. Acad. Sei. (U.S.A.) 92: 4347-4351 (1995); Tabor et ai., Proc. Natl. Acad. Sei. (U.S.A.) 92: 6339-6343 (1995)). Seqüenciadores automatizados encontram-se disponíveis, por exemplo, na Pharmacia Biotech, Inc., Piscataway, New Jersey (Pharmacia ALF), LI-COR, Inc., Lincoln, Nebraska (LI-COR 4.000) e Millipore, Bedford, Massachusetts (Millipore BaseStation).
[00164] Além disso, os avanços na eletroforese em gel capilar também reduziram os esforços necessários para seqüenciar DNA e tais avanços oferecem um método rápido de alta resolução para seqüenciar amostras de DNA (Swerdlow et ai., Nucleic Acids Res. 18: 1415-1419 (1990); Smith, Nature 349: 812-813 (1991); Luckey et ai., Methods Enzymol. 218: 154-172 (1993); Lu et ai., J. Chromatog. A. 680: 497-501 (1994); Carson et ai., Anal. Chem. 65: 3219-3226 (1993); Huang et ai., Anal. Chem. 64: 2149-2154 (1992); Kheterpal et ai., Electrophoresis 17: 1852-1859 (1996); Quesada et ai., Electrophoresis 17: 1841-1851 (1996); Baba, Yakugaku Zasshi 117: 265-281 (1997); Marino, Appl. Theor. Electrophor. 5: 1-5 (1995)).
[00165] A ligação genética de moléculas marcadoras pode ser estabelecida por um modelo de mapeamento de genes tal como, sem limitação, o modelo de marcador de flanqueamento descrito por Lander et al., Genetics, 121: 185-199 (1989), e o mapeamento de intervalos, baseado em métodos de probabilidade máximo descritos por Lander et al., Genetics, 121: 185-199 (1989), e implementados no 'software package' MAPMAKER/QTL (Lincoln et al., Mapping Genes Controlling Quantitative Traits Using MAPMAKER/QTL, Whitehead Institute for Biomedical Research, Massachusetts (1990)). Software adicional inclui Qgene, versão 2.23 (1996), Department of Plant Breeding and Biometry, 266 Emerson Hall, Cornell University, Ithaca, NY). O uso do software Qgene é um método particularmente preferido.
[00166] Uma estimativa da probabilidade máxima (MLE) quanto à presença de um marcador é calculada, junto com uma MLE presumindo nenhum efeito de QTL, para evitar falsos positivos. Um log-i0 de uma razão de chances (LOD) é então calculado como: LOD = log-i0 (MLE quanto à presença de um QTL/MLE sem QTL ligado).
[00167] O escore de LOD indica essencialmente quanto é mais provável que os dados tenham surgido presumindo-se a presença de um QTL do que em sua ausência. O valor limite de LOD para evitar um falso positivo com certa segurança, digamos 95%, depende do número de marcadores e do comprimento do genoma. Gráficos indicando os limites de LOD foram apresentados por Lander et al., Genetics, 121: 185-199 (1989), e também descritos por Arús et al., Plant Breeding, Hayward et al. (eds.) Chapman & Hall, Londres, pp. 314-331 (1993).
[00168] Outros modelos podem ser usados. Foram apresentadas muitas modificações e métodos alternativos para mapeamento de intervalos que incluem o uso de métodos não paramétricos (Kruglyak et al., Genetics, 139: 1421-1428 (1995)). Também podem ser usados métodos ou modelos de regressão múltipla, nos quais o traço é regredido em inúmeros marcadores (Jansen, Biometrics in Plant Breed, van Oijen, Jansen (eds.) Proceedings of the Ninth Meeting of the Eucarpia Section Biometrics in Plant Breeding, Países Baixos, pp. 116-124 (1994); Weber et al., Advances in Plant Breeding, Blackwell, Berlim, 16 (1994)). Procedimentos combinando mapeamento de intervalos com análise de regressão, por meio do que o fenótipo é regredido para um suposto QTL simples em um dado intervalo do marcador, e ao mesmo tempo em inúmeros marcadores que servem de co-fatores', foram descritos por Jansen et al., Genetics, 136: 1447-1455 (1994) e Zeng, Genetics, 136: 1457-1468 (1994). Em geral, o uso de co-fatores reduz o erro de tendência e amostragem das posições estimadas de QTL (Utz et al., Biometrics in Plant Breeding, van Oijen et al. (eds.) Proceedings of the Ninth Meeting of the Eucarpia Section Biometrics in Plant Breeding, Países Baixos, pp. 195-204 (1994), melhorando assim a precisão e eficiência do mapeamento de QTL (Zeng, Genetics, 136: 1457-1468 (1994)). Estes modelos podem se estender a experiências em múltiplos ambientes para analisar as interações genótipo-ambiente (Jansen et al., Theo. Appl. Genet. 91: 33-37 (1995)).
[00169] A escolha de uma população de mapeamento ou segregação apropriada é importante para a construção do mapa. A escolha da população de mapeamento apropriada depende do tipo de sistemas marcadores empregados (Tanksley et al., Molecular mapping plant chromosomes. Chromosome structure and function: Impact of new concepts J. P. Gustafson et al. (eds.), Plenum Press, New York, pp. 157173 (1988)). Deve-se levar em conta a fonte de progenitores (adaptado vs. exótico) usados na população de mapeamento. As taxas de pareamento e recombinação de cromossomas podem ser severamente perturbadas (suprimidas) em cruzamentos amplos (adaptado x exótico) e geralmente produzem distâncias de ligação grandemente reduzidas. Cruzamentos amplos usualmente vão produzir populações segregantes com um arranjo relativamente grande de polimorfismos quando comparadas com a progênie em um cruzamento estreito (adaptado x adaptado).
[00170] Conforme aqui usado, a progênie inclui não somente, sem limitação, os produtos de qualquer cruzamento (seja ele um cruzamento reversível ou outro tipo de cruzamento) entre duas plantas, mas também todas as progênies cujo pedigree remonta às origens do cruzamento original. Especificamente, sem limitação, tal progênie inclui plantas que têm 12,5% ou menos de material genético derivado de uma das duas plantas originalmente cruzadas. Conforme aqui usado, uma segunda planta é derivada de uma primeira planta se o pedigree da segunda planta incluir a primeira planta.
[00171] Uma população F2 é a primeira geração de auto-polinização depois de a semente híbrida ser produzida. Usualmente uma única planta F-ι é auto-polinizada para gerar uma população que segrega para todos os genes de forma mandeliana (1:2:1). O máximo de informações genéticas são obtidas de uma população F2 completamente classificada usando um sistema marcador co-dominante (Mather, Measurement of Linkage in Heredity: Methuen & Co., (1938)). No caso de marcadores dominantes, são requeridos testes da progênie (por exemplo, F3, BCF2) para identificar os heterozigotos, tornando-a assim equivalente a uma população F2 completamente classificada. No entanto, este procedimento geralmente é proibitivo por causa do custo e tempo envolvidos para verificar progênie. Verificação da progênie de indivíduos F2 geralmente é usada na construção de mapas onde os fenótipos não refletem de forma consistente o genótipo (por exemplo, resistência a doenças) ou onde a expressão de traços é controlada por um QTL. Os dados de segregação das populações de teste de progênie (por exemplo, F3 ou BCF2) podem ser usados na construção de mapas. Seleção assistida por marcadores pode ser então aplicada para cruzar progênie com base em associações de mapas de marcador-traço (F2, F3), onde os grupos de ligação não foram completamente dissociados por eventos de recombinação (isto é, desequilíbrio máximo).
[00172] Linhagens endógamas recombinantes (RIL) (linhagens geneticamente relacionadas; usualmente > F5, desenvolvidas a partir da autopolinização contínua de linhagens F2 para a homozigosidade) podem ser usadas como uma população de mapeamento. As informações obtidas de marcadores dominantes podem ser maximizadas pelo uso de RIL porque todos os locos são homozigotos ou quase homozigotos. Em condições de forte ligação (isto é, cerca de < 10% de recombinação), os marcadores dominantes e co-dominantes avaliados em populações de RIL fornecem mais informações por indivíduo que qualquer dos tipos de marcador em populações de cruzamento reversível (Reiter et ai., Proc. Natl. Acad. Sei. (U.S.A.) 89: 1477-1481 (1992)). No entanto, à medida em que a distância entre marcadores fica maior (isto é, os locos ficam mais independentes), as informações nas populações de RIL diminuem drasticamente em comparação com marcadores dominantes.
[00173] Populações de cruzamento reversível (por exemplo, geradas de um cruzamento entre uma variedade bem-sucedida (progenitor recorrente) e uma outra variedade (progenitor doador) transportando um traço não presente na primeira) podem ser utilizadas como uma população de mapeamento. Uma série de cruzamentos reversíveis com o progenitor recorrente pode ser feita para recuperar a maioria de seus traços desejáveis. Cria-se assim uma população consistindo em indivíduos quase iguais aos progenitor recorrente mas cada indivíduo transporta quantidades variáveis ou mosaicos de regiões genômicas do progenitor doador. Populações de cruzamento reversível podem ser úteis para o mapeamento de marcadores dominantes se todos os locos no progenitor recorrente forem homozigotos e o progenitor doador e recorrente tiver alelos de marcador polimórficos contrastantes (Reiter et ai., Proc. Natl. Acad. Sei. (U.S.A.) 89: 1477-1481 (1992). Menos informações são obtidas de populações de cruzamento reversível usando marcadores co-dominantes ou dominantes do que as obtidas de populações F2 porque um gameta, ao invés de dois, é analisado por planta. Populações de cruzamento reversível, no entanto, possuem mais informações (a uma baixa saturação do marcador) se comparadas com RILs à medida em que distância entre os locos ligados aumenta nas populações de RIL (isto é, cerca de 15% de recombinação). Maior recombinação pode ser vantajosa para resolução de ligações fortes, mas pode ser indesejável na construção de mapas com baixa saturação do marcador.
[00174] Linhagens quase isogênicas (NIL) criadas por muitos cruzamentos reversíveis para produzir um arranjo de indivíduos que são quase idênticos em termos de composição genética exceto pelo traço ou região genômica sendo investigada podem ser usadas como uma população de mapeamento. No mapeamento com NILs, espera-se que apenas uma porção dos locos polimórficos mapeie para uma região selecionada.
[00175] Análise de segregante em massa (BSA) é um método desenvolvido para a rápida identificação de ligação entre marcadores e traços de interesse (Michelmore et al., Proc. Natl. Acad. Sei. (U.S.A.) 88: 9828-9832 (1991)). Em BSA, duas amostras de DNA em massa foram retiradas de uma população segregante originária de um cruzamento simples. Essas massas contêm indivíduos que são idênticos quanto a um traço (resistente ou sensível a uma doença particular) ou região genômica particular porém arbitrários em regiões não ligadas (isto é, heterozigotos). Regiões não ligadas à região alvo não vão diferir entre as amostras em massa de muitos indivíduos em BSA.
[00176] Plantas geradas usando um método da presente invenção podem fazer parte de um programa de reprodução ou ser geradas a partir do mesmo. A escolha do método de reprodução depende do modo de reprodução da planta, da hereditariedade dos traços sendo aperfeiçoados, e do tipo de cultivar comercialmente usado (por exemplo, cultivar de híbrido F-ι, cultivar de linhagem pura etc.). Procedimentos selecionados, não limitativos, para reprodução das plantas da presente invenção estão descritos abaixo. Um programa de reprodução pode ser melhorado usando seleção assistida por marcador da progênie de qualquer cruzamento. Deve ficar ainda entendido que quaisquer cultivares comerciais e não comerciais podem ser utilizados em um programa de reprodução. Fatores tais como, por exemplo, vigor de emergência, vigor vegetativo, tolerância ao estresse, resistência a doenças, ramificação, floração, enxerto de semente ("seed set"), tamanho da semente, massa específica da semente, resistência e capacidade de debulha etc., geralmente vão ditar a escolha.
[00177] Para traços altamente hereditários, a escolha de plantas separadas superiores avaliadas em um único local será eficaz, ao passo que para traços pouco hereditários a escolha deve ser feita com base em valores médios obtidos de repetidas avaliações de famílias de plantas relacionadas. Métodos de seleção populares comumente incluem seleção de pedigree, seleção de pedigree modificado, seleção em massa e seleção recorrente. Em uma modalidade preferida, utiliza-se um programa de cruzamento reversível ou de reprodução recorrente.
[00178] A complexidade de heranças influencia a escolha do método de reprodução. Reprodução por cruzamento reversível pode ser usada para transferir um ou alguns genes favoráveis de um traço altamente herdável para um cultivar desejado. Este método tem sido amplamente usado para reproduzir cultivares resistentes a doenças. Várias técnicas de seleção recorrente são usadas para melhorar traços quantitativamente herdados controlados por numerosos genes. O uso de seleção recorrente em culturas auto-polinizantes depende da facilidade de polinização, da freqüência de híbridos bem-sucedidos de cada polinização e do número de descendentes híbridos de cada cruzamento bem-sucedido.
[00179] Linhagens de reprodução podem ser testadas e comparadas a padrões apropriados em ambientes representativos da(s) área(s) alvo comercial(is) para duas ou mais gerações. As melhores linhagens são candidatas a novos cultivares comerciais; aquelas a que ainda faltam traços podem ser usados como progenitoras para produzir novas populações para posterior seleção.
[00180] Um método para identificar uma planta superior é observar seu desempenho em relação a outras plantas experimentais e a um cultivar tradicional amplamente cultivado. Se uma única observação não for conclusiva, múltiplas observações podem oferecer uma estimativa melhor de seu valor genético. O reprodutor pode selecionar e cruzar duas ou mais linhagens progenitoras, seguido por auto-polinização e seleção repetidas, produzindo muitas combinações genéticas novas.
[00181] O desenvolvimento de novos cultivares de soja requer o desenvolvimento e a seleção de variedades de soja, o cruzamento dessas variedades e a seleção de cruzamentos híbridos superiores. A semente híbrida pode ser produzida por cruzamentos manuais entre progenitores machos férteis selecionados ou usando sistemas de esterilidade de machos. Os híbridos são selecionados por certos traços genéticos simples tais como cor da vagem, cor da flor, rendimento da semente, cor da pubescência ou resistência a herbicidas que indicam que a semente é realmente um híbrido. Outros dados sobre as linhagens progenitoras, assim como o fenótipo do híbrido, influenciar a decisão do reprodutor sobre continuar ou não com o cruzamento híbrido específico.
[00182] Métodos de reprodução por pedigree e de reprodução por seleção recorrente podem ser usados para desenvolver cultivares a partir de populações de reprodução. Os programas de reprodução combinam traços desejáveis de dois ou mais cultivares ou várias fontes irrestritas em combinações de reprodução das quais cultivares são desenvolvidas por auto-polinização e seleção dos fenótipos desejados. Os novos cultivares podem ser avaliados para determinação de quais deles têm potencial comercial.
[00183] A reprodução por pedigree é comumente usada para melhorar culturas autopolinizantes. Dois progenitores que possuem traços complementares favoráveis são cruzados para produzir uma F-ι. Uma população F2 é produzida por autopolinização de uma ou várias F-|S. É feita a seleção dos melhores indivíduos nas melhores famílias. Repetidas avaliações de famílias podem começar na geração F4 para melhorar a eficácia da seleção de traços com pouca hereditabilidade. Em um estágio avançado da endogamia (isto é, F6 e F7), as melhores linhagens ou misturas de linhagens fenotipicamente semelhantes são testadas quanto ao potencial liberação como cultivares novos.
[00184] Cruzamento reversível foi usado para transferir genes de um traço altamente herdável simplesmente herdado para um cultivar homozigoto ou linhagem endógama desejável, que é o progenitor recorrente. A fonte do traço a ser transferido é chamada progenitor doador. Espera-se que a planta resultante tenha as características do progenitor recorrente (por exemplo, cultivar) e o traço desejável transferido do progenitor doador. Depois do cruzamento inicial, os indivíduos que possuem o fenótipo do progenitor doador são selecionados e cruzados repetidas vezes (cruzamento reversível) com o progenitor recorrente. Espera-se que o progenitor resultante tenha as características do progenitor recorrente (por exemplo, cultivar) e o traço desejável transferido do progenitor doador.
[00185] Este procedimento de descendência de uma semente no sentido restrito refere-se ao plantio de uma população segregante, colheita de uma amostra de uma semente por planta, e uso da amostra de uma semente para plantar a geração seguinte. Quando a população tiver avançado do nível F2 para o nível desejado de endogamia, as plantas das quais as linhagens derivam remontarão a indivíduos F2 diferentes. O número de plantas em uma população diminui a cada geração porque algumas sementes deixam de germinar ou algumas plantas não produzem ao menos uma semente. Como resultado, nem todas as plantas F2 originalmente selecionadas na população serão representadas por uma progênie quando a evolução de gerações for completada.
[00186] Em um procedimento com múltiplas sementes, os reprodutores de soja geralmente colhem uma ou mais vagens de cada planta em uma população e as debulham para formar uma massa. Parte da massa é usada para plantar a geração seguinte e parte é reservada. O procedimento é chamado de técnica de descendência de uma semente modificada ou técnica de massa de vagens.
[00187] O procedimento com múltiplas sementes vem sendo usado para poupar trabalho na colheita. É consideravelmente mais rápido debulhar vagens com uma máquina do que remover manualmente uma semente de cada para o procedimento com uma semente. O procedimento com múltiplas sementes também torna possível plantar o mesmo número de sementes de uma população de cada geração de endogamia.
[00188] Descrições de outros métodos de reprodução que são comumente usados para diferentes traços e culturas podem ser encontradas em um de vários livros de referência (por exemplo, Fehr, Principies of Cultivar Development, vol. 1, pp. 2-3 (1987)).
[00189] Em um aspecto preferido da presente invenção, a fonte do alelo de rhg1 resistente a SCN para uso em um programa de reprodução é derivada de uma planta selecionada do grupo que consiste em PI548402 (Peking), PI200499, A2869, Jack, A2069, PI209332 (N° 4), P1404166 (Krasnoaarmejkaja), PI404198 (Sun Huan do), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI84751, PI437654, PI40792, Pyramid, Nathan, AG2201, Α3469, AG3901, Α3904, AG4301, AG4401, AG4501, AG4601, ΡΙΟΝ9492, ΡΙ88788, Dyer, Custer, Manokin, Doles e progênie resistente a SCN das mesmas (USDA, Soybean Germplasm Collection, University of Illinois, Illinois). Em um aspecto mais preferido, a fonte do alelo de rhg1 resistente a SCN para uso em um programa de reprodução é derivada de uma planta selecionada do grupo que consiste em PI548402 (Peking), PI404166 (Krasnoaarmejkaja), PI404198 (Sun Huan do), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI84751, PI437654, PI40792 e progênie resistente a SCN das mesmas.
[00190] Em um aspecto preferido da presente invenção, a fonte do alelo de rhg1 sensível a SCN para uso em um programa de reprodução é derivada de uma planta selecionada do grupo que consiste em A3244, A2833, AG3001, Williams, Will, A2704, Noir, DK23-51, Lee 74, Essex, Minsoy, A1923, Hutcheson e progênie sensível a SCN das mesmas. Em um aspecto mais preferido, a fonte do alelo de rhg1 sensível a SCN para uso em um programa de reprodução é derivada de uma planta A3244 e progênie sensível a SCN da mesma.
[00191] Em um aspecto preferido da presente invenção, a fonte do alelo de Rhg4 resistente a SCN para uso em um programa de reprodução é derivada de uma planta selecionada do grupo que consiste em PI548402 (Peking), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI88788, PI404198 (Sun Huan do), PI404166 (Krasnoaarmejkaja), Hartwig, Manokin, Doles, Dyer, Custer e progênie resistente a SCN das mesmas. Em um aspecto preferido, a fonte do alelo de Rhg4 resistente a SCN para uso em um programa de reprodução é derivada de uma planta selecionada do grupo que consiste em PI548402 (Peking), PI88788, P1404198 (Sun Huan do), PI438489 (Chiquita), PI437654 (Er-hej-jan), PI404166 (Krasnoaarmejkaja), PI548655 (Forrest), PI548988 (Pickett) e ΡΙ507354 (Tokei 421) e progênie resistente a SCN das mesmas.
[00192] Em um aspecto preferido da presente invenção, a fonte do alelo de Rhg4 sensível a SCN para uso em um programa de reprodução é derivada de uma planta selecionada do grupo que consiste em A3244, Will, Noir, Lee 74, Essex, Minsoy, A2704, A2833, AG3001, Williams, DK23-51 e Hutcheson, e progênie sensível a SCN das mesmas. Em um aspecto mais preferido, a fonte do alelo de Rhg4 sensível a SCN para uso em um programa de reprodução é derivada de uma planta A3244 e progênie sensível a SCN da mesma.
[00193] Conforme aqui usado, a ligação de uma seqüência de ácidos nucleicos com uma outra seqüência de ácidos nucleicos pode ser genética ou física. Em uma modalidade preferida, um marcador de ácido nucleico é geneticamente ligado a rhg1 ou Rhg4, onde a molécula de ácido nucleico marcadora apresenta um escore de LOD superior a 2,0, calculado por mapeamento de intervalos, para resistência ou resistência parcial ao SCN, de preferência onde a molécula de ácido nucleico marcadora apresenta um escore de LOD superior a 3,0, calculado por mapeamento de intervalos, para resistência ou resistência parcial ao SCN, mais preferivelmente onde a molécula de ácido nucleico marcadora apresenta um escore de LOD superior a 3,5, calculado por mapeamento de intervalos, para resistência ou resistência parcial ao SCN e ainda mais preferivelmente onde a molécula de ácido nucleico marcadora apresenta um escore de LOD superior a cerca de 4,0, calculado por mapeamento de intervalos, para resistência ou resistência parcial ao SCN com base nos métodos da probabilidade máxima descritos por Lander et ai., Genetics, 121:185-199 (1989), e implementados em no 'software package' MAPMAKER/QTL (parâmetros padrão) (Lincoln et ai., Mapping Genes Controlling Quantitative Traits Using MAPMAKER/QTL, Whitehead Institute for Biomedical Research, Massachusetts, (1990)).
[00194] Em uma outra modalidade, a molécula de ácido nucleico pode estar fisicamente ligada ao rhg1 ou ao Rhg4. Em uma modalidade preferida, o marcador de ácido nucleico hibridiza especificamente para uma molécula de ácido nucleico tendo uma seqüência que está presente no grupo de ligação G em 500 kb ou 100 kb, mais preferivelmente em 50 kb, ainda mais preferivelmente em 25 kb de um alelo de rhg1, onde o alelo de rhg1 de preferência é um alelo sensível, e mais preferivelmente um alelo sensível de A3244. Em uma modalidade preferida, o marcador de ácido nucleico é capaz de hibridizar especificamente para uma molécula de ácido nucleico tendo uma seqüência que está presente no grupo de ligação A2 em 500 kb ou 100 kb, mais preferivelmente em 50 kb, ainda mais preferivelmente em 25 kb de um alelo de Rhg4, onde o alelo de Rhg4 de preferência é um alelo sensível, e mais preferivelmente um alelo sensível de A3244.
[00195] A presente invenção fornece um método para investigar um haplótipo de rhg1 de uma planta de soja compreendendo: (a) isolar moléculas de ácido nucleico da planta de soja; (b) determinar a seqüência de ácidos nucleicos de um alelo de rhg1 ou parte do mesmo; e (c) comparar a seqüência de ácidos nucleicos do alelo de rhg1 ou parte do mesmo com uma seqüência de ácidos nucleicos de referência.
[00196] Conforme aqui usado, o termo "investigar" refere-se a qualquer método capaz de detectar um aspecto, tal como um polimorfismo ou haplótipo. As moléculas de ácido nucleico só precisam ser isoladas de uma planta de soja até o grau de pureza necessário para a tarefa requerida ou até um grau de pureza maior se desejado. O versado na técnica tem técnicas disponíveis para isolar moléculas de ácido nucleico de plantas até uma pureza suficiente, por exemplo sem limitação, seqüenciar a região desejada da molécula de ácido nucleico ou fazer um ensaio de marcador.
[00197] A determinação de um alelo de rhg1 ou de Rhg4 ou parte do mesmo pode ser feita usando qualquer técnica. Ilustrações de tais técnicas incluem técnicas que fornecem a seqüência de ácidos nucleicos para um alelo de rhg1 ou de rhg4 ou parte do mesmo incluem ampliação de um alelo desejado ou de parte do mesmo (veja, por exemplo, os exemplos e as SEQ ID NoS 8-53). Em uma modalidade preferida, a seqüência de ácidos nucleicos determinada é a de um exon de um alelo de rhg1, mais preferivelmente o exon 1 ou o exon 3 de um alelo de rhg1, ou de um domínio de LRR. Em uma outra modalidade preferida, um único nucleotídeo é determinado. Em uma outra modalidade preferida, a seqüência de ácidos nucleicos determinada é a de um domínio de LRR.
[00198] A comparação de uma seqüência com uma seqüência de referência pode ser feita com método apropriado de comparação de seqüências.
[00199] Conforme aqui usado, uma seqüência de referência é qualquer seqüência do alelo de rhg1 ou seqüência de consenso. Uma seqüência de referência pode ser uma seqüência de ácidos nucleicos ou uma seqüência de aminoácidos. Em uma modalidade preferida, a seqüência de referência é qualquer seqüência do alelo de rhg1 resistente a SCN. Em uma outra modalidade preferida, a seqüência de referência de rhg1 é selecionada do grupo que consiste em SEQ ID NoS 2, 3, 5, 6, 823, 28-43, 1097, 1098 e 1100-1115.
[00200] A presente invenção fornece um método para investigar um haplótipo de Rhg4 de uma planta de soja compreendendo: (a) isolar moléculas de ácido nucleico da planta de soja; (b) determinar a seqüência de ácidos nucleicos de um alelo de Rhg4 ou parte do mesmo; e (c) comparar a seqüência de ácidos nucleicos do alelo de Rhg4 ou parte do mesmo com uma seqüência de ácidos nucleicos de referência.
[00201] Conforme aqui usado, uma seqüência de referência é qualquer seqüência do alelo de Rhg4 ou seqüência de consenso. Uma seqüência de referência pode ser uma seqüência de ácidos nucleicos ou uma seqüência de aminoácidos. Em uma modalidade preferida, a seqüência de referência é qualquer seqüência do alelo de Rhg4 resistente a SCN. Em uma outra modalidade, a seqüência de referência de Rhg4 é selecionada do grupo que consiste nas SEQ ID NoS 4, 7, 4447, 50-53, 1099 e 1116-1119.
[00202] A presente invenção fornece um método para introgressão de resistência a SCN ou resistência parcial a SCN em uma planta de soja compreendendo: fazer uma seleção assistida por marcador da planta de soja com um marcador de ácido nucleico, onde o marcador de ácido nucleico hibridiza especificamente com uma molécula de ácido nucleico tendo uma primeira seqüência de ácidos nucleicos que está fisicamente ligada a uma segunda seqüência de ácidos nucleicos que fica localizada no grupo de ligação G da soja A3244, onde a segunda seqüência de ácidos nucleicos está em 500 kb de uma terceira seqüência de ácidos nucleicos que é capaz de hibridizar especificamente com a seqüência de ácidos nucleicos de SEQ ID N° 5, 6, complementos das mesmas, ou fragmentos das mesmas; e selecionar a planta de soja com base na seleção assistida por marcador.
[00203] A presente invenção fornece um método para introgressão de resistência a SCN ou resistência parcial a SCN em uma planta de soja compreendendo: fazer uma seleção assistida por marcador da planta de soja com um marcador de ácido nucleico, onde o marcador de ácido nucleico hibridiza especificamente com uma molécula de ácido nucleico tendo uma primeira seqüência de ácidos nucleicos que está fisicamente ligada a uma segunda seqüência de ácidos nucleicos que fica localizada no grupo de ligação A2 da soja A3244, onde a segunda seqüência de ácidos nucleicos está em 500 kb de uma terceira seqüência de ácidos nucleicos que é capaz de hibridizar especificamente com a seqüência de ácidos nucleicos de SEQ ID N° 7, complementos da mesma, ou fragmentos da mesma; e selecionar a planta de soja com base na seleção assistida por marcador. A introgressão assistida por marcador de traços em plantas já foi descrita. A introgressão assistida por marcador envolve a transferência de uma região de cromossoma definida por um ou mais marcadores de um germiplasma para um segundo germiplasma. Em uma modalidade preferida, a introgressão é feita por cruzamento reversível com um progenitor recorrente de rhg1 ou Rhg4 de soja resistente a SCN.
[00204] Tendo em vista o presente relatório, introduções de planta e germiplasma podem ser rastreados com uma molécula de ácido nucleico marcadora da presente invenção para rastrear alelos de rhg1 ou Rhg4 usando uma ou mais técnicas descritas neste relatório ou conhecidas na técnica.
[00205] A presente invenção também fornece partes das plantas produzidas por um método da presente invenção. Partes de planta incluem, sem limitação, semente, endosperma, óvulo e pólen. Em uma modalidade particularmente preferida da presente invenção, a parte da planta é uma semente.
[00206] As plantas ou partes das mesmas produzidas por um método da presente invenção podem ser cultivadas em cultura e regeneradas. Métodos para a regeneração de plantas de soja a partir de vários tipos de tecido e métodos para a cultura de tecidos de soja são conhecidos na técnica (veja, por exemplo, Widholm et ai., In Vitro Selection and Culture-induced Variation in Soybean, In Soybean: Genetics, Molecular Biology and Biotechnology, Eds. Verma et ai., CAB International, Wallingford, Oxon, Inglaterra (1996)). Técnicas de regeneração para plantas tal como soja podem usar como material de partida uma variedade de tipos de tecido ou célula. Particularmente com a soja, foram desenvolvidos processos de regeneração que começam com certos tipos diferenciados de tecido tais como meristemas, Cartha et ai., Can. J. Bot. 59: 1671-1679 (1981); seções de hipocótilo, Cameya et ai., Plant Science Letters 21: 289-294 (1981), e segmentos dos nós do caule, Saka et ai., Plant Science Letters 19; 193-201 (1980); Cheng et al., Plant Science Letters 19: 91-99 (1980). A regeneração de plantas de soja inteiras sexualmente maduras a partir de embriões somáticos gerados de explantes de embriões de soja imaturos já foi descrita (Ranch et al., In Vitro Cellular & Developmental Biology 21: 653-658 (1985), A regeneração de plantas de soja maduras de cultura de tecido por organogênese e embriogênese também já foi descrita (Barwale et al., Planta 167: 473-481 (1986); Wright et al., Plant Cell Reports 5: 150-154 (1986)).
Agentes [00207] O versado na técnica pode consultar textos de referência usuais para obter descrições detalhadas das técnicas conhecidas discutidas neste relatório ou técnicas equivalentes. Esses textos incluem Current Protocols In Molecular Biology, Ausubel et al,, eds, John Wiley & Sons, ΙΜΎ. (1989), e suplementos até setembro (1998), Molecular Cloning, A Laboratory Manual, Sambrook et al,, 2a ed., Cold Spring Harbor Press, Cold Spring Harbor, New York (1989), Genome Analysis: A Laboratory Manual 1: Analyzing DNA, Birren et al,, Cold Spring Harbor Press, Cold Spring Harbor, New York (1997); Genome Analysis: A Laboratory Manual 2: Detecting Genes, Birren et aI., Cold Spring Harbor Press, Cold Spring Harbor, New York (1998); Genome Analysis: A Laboratory Manual 3: Cloning Systems, Birren et al., Cold Spring Harbor Press, Cold Spring Harbor, New York (1999); Genome Analysis: A Laboratory Manual 4: Mapping Genomes, Birren et al., Cold Spring Harbor Press, Cold Spring Harbor, New York (1999); Plant Molecular Biology: A Laboratory Manual, Clark, Springer-Verlag, Berlim (1997), Methods in Plant Molecular Biology, Maliga et al., Cold Spring Harbor Press, Cold Spring Harbor, New York (1995). Estes textos, naturalmente, também podem ser consultados para fazer ou usar um aspecto da invenção. Fica entendido que qualquer dos agentes da invenção podem ser substancial mente purificados e/ou ser biologicamente ativos e/ou recombinantes.
Moléculas de ácido nucleico [00208] As moléculas de ácido nucleico da presente invenção incluem, sem limitação, moléculas de ácido nucleico tendo uma seqüência de ácidos nucleicos selecionada do grupo que consiste em SEQ ID NoS 11096 e complementos das mesmas. Um subconjunto das moléculas de ácido nucleico da presente invenção inclui moléculas de ácido nucleico que codificam uma proteína ou um fragmento da mesma. Um outro subconjunto das moléculas de ácido nucleico da presente invenção é o de moléculas de cDNA. Um outro subconjunto das moléculas de ácido nucleico da presente invenção inclui moléculas de ácido nucleico que são moléculas marcadoras. Um outro subconjunto das moléculas de ácido nucleico da presente invenção é o de moléculas de ácido nucleico tendo seqüências promotoras.
[00209] Fragmentos de moléculas de ácido nucleico podem compreender porções significativas destas moléculas de ácido nucleico ou, na verdade, a maior parte das mesmas. Em modalidades preferidas, os fragmentos podem compreender polinucleotídeos menores, por exemplo, oligonucleotídeos tendo de cerca de 20 a cerca de 250 resíduos de nucleotídeo e mais preferivelmente cerca de 20 a cerca de 100 resíduos de nucleotídeo ou cerca de 40 a cerca de 60 resíduos de nucleotídeo. Em uma outra modalidade preferida, os fragmentos de moléculas podem ter pelo menos 15 nucleotídeos, pelo menos 30 nucleotídeos, pelo menos 50 nucleotídeos ou pelo menos 100 nucleotídeos.
[00210] O termo "substancialmente purificada", conforme aqui usado, refere-se a uma molécula separada de substancialmente todas as outras moléculas normalmente associadas com ela em seu estado nativo. Mais preferivelmente uma molécula substancialmente purificada é a espécie predominante presente em uma preparação. Uma molécula substancialmente purificada pode ser mais de 60% livre, de preferência 75% livre, mais preferivelmente 90% livre e mais preferivelmente 95% livre das outras moléculas (exclusive de solvente) presentes na mistura natural. O termo "substancialmente purificada" não pretende abranger moléculas presentes em seu estado nativo.
[00211] Os agentes da presente invenção de preferência vão ser "biologicamente ativos" em relação a alguma característica estrutural, tal como a capacidade de um ácido nucleico de hibridizar para uma outra molécula de ácido nucleico ou a capacidade de uma proteína de ser ligada por um anticorpo (ou competir com uma outra molécula por tal ligação). Alternativamente, tal característica pode ser catalítica e assim envolver a capacidade do agente de mediar uma reação ou resposta química.
[00212] Os agentes da presente invenção também podem ser recombinantes. Conforme aqui usado, o termo recombinante descreve (a) moléculas de ácido nucleico que são construídas ou modificadas fora das células e que podem replicar ou funcionar em uma célula viva, (b) moléculas que resultam da transcrição, replicação ou translação de moléculas de ácido nucleico recombinantes, ou (c) organismos que contêm moléculas de ácido nucleico recombinantes ou são modificados usando moléculas de ácido nucleico recombinantes.
[00213] Entende-se que os agentes da presente invenção podem ser marcados com reagentes que facilitam a detecção do agente, por exemplo marcadores fluorescentes (Prober et ai., Science 238: 336-340 (1987); Albarella et ai., EP 144914), marcadores químicos (Sheldon et ai., Patente US 4.582.789; Albarella et ai., Patente US 4.563.417) e bases modificadas (Miyoshi et ai., EP 119448) incluindo nucleotídeos com elementos radioativos, por exemplo 32P, 33P, 35S ou 125l, tal como 32PdCTP.
[00214] Entende-se ainda que a presente invenção fornece células recombinantes bacterianas, animais, fúngicas e vegetais e construções virais compreendendo os agentes da presente invenção.
[00215] As moléculas de ácido nucleico ou fragmentos das mesmas da presente invenção são capazes de hibridizar especificamente para outras moléculas de ácido nucleico em certas circunstâncias. Conforme aqui usado, duas moléculas de ácido nucleico são consideradas capazes de hibridizar especificamente para uma outra se as duas moléculas forem capazes de formar uma estrutura de ácido nucleico de cordão duplo antiparalela. Uma molécula de ácido nucleico é considerada o "complemento" de uma molécula de ácido nucleico se elas mostrarem "complementaridade completa", isto é, cada nucleotídeo em uma seqüência é complementar ao seu parceiro de pareamento de base em uma outra seqüência. Duas moléculas são consideradas "minimamente complementares" se elas puderem hibridizar para uma outra com estabilidade suficiente para permitir que elas continuem combinadas a uma outra pelo menos em condições convencionais "de baixa severidade". Igualmente, as moléculas são consideradas "complementares" se puderem hibridizar para uma outra com estabilidade suficiente para permitir que elas continuem combinadas a uma outra em condições convencionais "de alta severidade". Moléculas de ácido nucleico que podem hibridizar para outras moléculas de ácido nucleico, por exemplo, pelo menos em condições de baixa severidade são consideradas "cognatos hibridizáveis" das outras moléculas de ácido nucleico. As condições convencionais de severidade foram descritas por Sambrook et al., Molecular Cloning, A Laboratory Manual, 2- ed., Cold Spring Harbor Press, Cold Spring Harbor, New York (1989) e por Haymes et al., Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, DC (1985). Desvios da complementaridade completa são portanto permissíveis, contanto que tais desvios não obstruam totalmente a capacidade das moléculas de formar uma estrutura de cordão duplo. Assim, para que uma molécula de ácido nucleico sirva de prímer ou sonda ela só precisa ser de seqüência suficientemente complementar para que possa formar uma estrutura de cordão duplo estável no solvente particular e nas concentrações de sal empregadas.
[00216] Condições de severidade apropriadas que promovem hibridização de DNA, por exemplo 6,0 X cloreto de sódio/citrato de sódio (SSC) a cerca de 45°C, seguido por uma lavagem de 2,0 X SSC a 50°C, são conhecidas pelos versados na técnica ou podem ser encontradas em Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. Por exemplo, a concentração de sal na etapa de lavagem pode ser selecionada de baixa severidade de cerca de 2,0 X SSC a 50°C até alta severidade de cerca de 0,2 X SSC a 50°C. Além disso, a temperatura na etapa de lavagem pode ser aumentada de condições de baixa severidade à temperatura ambiente, cerca de 22°C, para condições de alta severidade a cerca de 65°C. Tanto a temperatura como a concentração de sal podem ser variadas, ou a temperatura ou a concentração de sal pode ser mantida constante ao passo que a outra, variável, é alterada.
[00217] Em uma modalidade preferida, um ácido nucleico da presente invenção vai hibridizar especificamente para uma ou mais das moléculas de ácido nucleico descritas nas SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas em condições de severidade moderada, por exemplo, a cerca de 2,0 X SSC e cerca de 65°C.
[00218] Em uma modalidade particularmente preferida, um ácido nucleico da presente invenção vai incluir as moléculas de ácido nucleico que hibridizam especificamente para uma ou mais das moléculas de ácido nucleico descritas nas SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas em condições de alta severidade, por exemplo, a cerca de 0,2 X SSC e cerca de 65°C.
[00219] Em um aspecto da presente invenção, as moléculas de ácido nucleico da presente invenção compreendem uma ou mais das seqüências de ácido nucleico descritas nas SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas ou fragmentos de qualquer uma delas. Em um outro aspecto da presente invenção, uma ou mais das moléculas de ácido nucleico da presente invenção compartilham pelo menos 60% de identidade de seqüência com uma ou mais das seqüências de ácido nucleico descritas nas SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas ou fragmentos de qualquer uma delas. Em um outro aspecto da presente invenção, uma ou mais das moléculas de ácido nucleico da presente invenção compartilham pelo menos 70% ou mais, por exemplo, pelo menos 80%, de identidade de seqüência com uma ou mais das seqüências ácido nucleico descritas nas SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas ou fragmentos de qualquer uma delas. Em um aspecto mais preferido da presente invenção, uma ou mais das moléculas de ácido nucleico da presente invenção compartilham pelo menos 90% ou mais, por exemplo, pelo menos 95% ou até 100%, de identidade de seqüência com uma ou mais das seqüências ácido nucleico descritas nas SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas ou fragmentos de qualquer uma delas.
[00220] Conforme aqui usado, "identidade de seqüência" refere-se à extensão em que duas seqüências de polinucleotídeos ou peptídios otimamente alinhadas são invariantes em toda uma janela de alinhamento de componentes, por exemplo, nucleotídeos ou aminoácidos. Uma "fração de identidade" para segmentos alinhados de uma seqüência de teste e uma seqüência de referência é o número de componentes idênticos que são compartilhados pelas duas seqüências alinhadas dividido pelo número total de componentes no segmento da seqüência de referência, isto é, na seqüência de referência inteira ou em uma parte definida menor da seqüência de referência. "Identidade percentual" é a fração de identidade vezes 100, [00221] Métodos úteis para determinar a identidade de sequência estão descritos em Guide to Huge Computers, Martin j, Bishop, ed., Academic Press, San Diego, 1994, e Caríllo et al., SI AM J. Applied Math 48: 1073 (1988). Mais particularmente, programas de computador preferidos para determinar a identidade de sequência incluem os programas Basic Local Alignment Search Tool (BLAST) que encontram-se disponíveis ao público no National Genter Biotechnology Information (NCBI) e na National Library of Medicine, National Institute of Health, Bethesda, Md, 20894; veja BLAST Manual, Altschul et al., NCBI, NLM, NIH; Altschul et al,, J. Mol. Bíol, 215: 403-410 (1990); a versão 2.0 ou superiores de programas BLAST permitem a introdução de lacunas (deleções e inserções) em alinhamentos; BLASTX pode ser usado para determinar a identidade de seqüência entre uma seqüência de polinucleotídeos em dúvida e um banco de dados de sequências de proteínas; e BLASTN pode ser usado para determinar a identidade de seqüência entre seqüências.
[00222] Para os propósitos desta invenção, a "identidade de seqüência" será determinada usando-se BLASTX versão 2.0.14 (parâmetros padrão), BLASTN versão 2,0,14 ou BLASTP 2,0.14.
[00223] Um grupo particularmente preferido de seqüências de ácidos nucleicos é o daquelas presentes na inserção de soja dos clones mostrados no quadro 6 abaixo.
Tabela 6 Ό0224] A Tabela 5 mostra clones compreendendo sequências de rhg1 e Rhg4. A coluna "linhagem” indica o cultivar do qual foi derivada a seqüência no clone. As colunas Rhg4, rhg1/frag1, e rhg1/frag2 mostram os clones derivados das linhagens que possuem o Rhg4, o fragmento 1 do rhg1 ou o fragmento 2 do rhg1, respectiva mente. Rhg4 foi ampliado com as SEQ IO NoS 48 e 49, o que produziu um produto de 3,5 kb. O fragmento 1 do rhg1 foi ampliado com as SEQ ID NoS 24 e 25, o que produziu um produto de 2,9 kb, e o fragmento 2 do rhg1 foi ampliado com as SEQ ID N°s 26 e 27, o que produziu um produto de 1,75 kb. Todos os fragmentos foram subclonados em um vetor pCR4-TOPO.
Moléculas de ácido nucleico codificando proteínas ou fragmentos das mesmas rha1 [00225] A presente invenção inclui moléculas de ácido nucleico que codificam uma proteína de rhg1 ou fragmento da mesma. Exemplos de tais moléculas de ácido nucleico incluem aquelas que codificam as proteínas descritas nas SEQ ID N°s 1097, 1100, 1098, 1101 e 11021115. Exemplos de moléculas de fragmentos ilustrativas incluem, sem limitação, um domínio de LRR extracelular (rhg1, v.1, SEQ ID N° 1097, resíduos 164-457; rhg 1, v.2, SEQ ID N° 1098, resíduos 141-434), um domínio de transmembrana (rhg 1, v.1, SEQ ID N° 1097, resíduos 508530; rhg1, v.2, SEQ ID N° 1098, resíduos 33-51 e 485-507) e um domínio de STK (rhg1, v.1, SEQ ID N° 1097, resíduos 578-869; rhg 1, v.2, SEQ ID N° 1098, resíduos 555-846). Exemplos de moléculas de ácido nucleico ilustrativas incluem as SEQ ID NoS 5, 6, 8-23 e 28-43. B) Rhq4 [00226] A presente invenção inclui moléculas de ácido nucleíco que codificam uma proteína de Rhg4 ou fragmento da mesma. Exemplos de tais moléculas de ácido nucleico incluem aquelas que codificam as proteínas apresentadas nas SEQ ID Nos 1099 e 1116-1119. Exemplos de moléculas de fragmentos ilustrativas incluem, sem limitação, um domínio de LRR extracelular (SEQ ID N° 1099, resíduos 34-44), um domínio de transmembrana (SEQ ID N° 1099, resíduos 449-471) e um domínio de STK (SEQ ID N° 1099, resíduos 531-830). Exemplos de moléculas de ácido nucleico ilustrativas incluem as SEQ ID N°s 7, 44-47 e 50-53. C) rhq1 e Rhq4 [00227] Em um outro aspecto da presente invenção, as moléculas de ácido nucleico da presente invenção podem compreender sequências que diferem daqueles que codificam uma proteína ou fragmento da mesma na SEQ ID N° 1097 até a SEQ ID N° 1119 devido ao fato de que a seqüência de ácido nucleico diferente codifica uma proteína tendo uma ou mais alterações de aminoácidos conservadoras. Entende-se que códons capazes de codificar tais substituições de aminoácidos conservadoras são conhecidos na arte.
[00228] Sabe-se na técnica que um ou mais aminoácidos em uma seqüência nativa podem ser substituídos por outro(s) aminoácido(s), sua carga e polaridade sendo semelhantes às do aminoácido nativo, isto é, uma substituição de aminoácido conservadora. Substituições conservadas para um aminoácido na seqüência de polipeptídíos nativa podem ser selecionadas de outros membros da classe à qual pertence a seqüência de polipeptídíos nativa. Os aminoácidos podem ser divididos nos quatro grupos a seguir: (1) aminoácidos ácidos, (2) aminoácidos básicos, (3) aminoácidos polares neutros, e (4) aminoácidos não-polares neutros. Aminoácidos representativos destes vários grupos incluem, porém sem limitação: (1) aminoácidos ácidos (negativamente carregados) tais como ácido aspártico e ácido glutâmíco; (2) aminoácidos básicos (positivamente carregados) tais como arginina, histidina e lisina; (3) aminoácidos polares neutros tais como glicina, serina, treonina, cisteína, cistina, tirosina, asparagina e glutamina; e (4) aminoácidos não-polares (hidrofóbicos) neutros tais como alanina, leucina, isoleucina, valina, prolina, fenilalanina, triptofânio e metionina.
[00229] Alterações de aminoácidos conservadoras na seqüência de polipeptídios nativa podem ser feitas substituindo-se um aminoácido de um desses grupos por um outro aminoácido do mesmo grupo. Equivalentes biologicamente funcionais das proteínas ou fragmentos das mesmas da presente invenção podem ter dez alterações de aminoácidos conservadoras ou menos, mais preferivelmente sete alterações de aminoácidos conservadoras ou menos, e ainda mais preferivelmente cinco alterações de aminoácidos conservadoras ou menos. A seqüência de nucleotídeos codificadora terá assim substituições de bases correspondentes, permitindo que ela codifique formas equivalentes biologicamente funcionais das proteínas ou fragmentos da presente invenção.
[00230] Entende-se que certos aminoácidos podem ser substituídos por outros aminoácidos na estrutura de uma proteína sem perda considerável da capacidade de ligação interativa com estruturas tais como, por exemplo, regiões fixadoras de antígenos de anticorpos ou sítios de ligação em moléculas substratos. Como é a capacidade interativa e a natureza de uma proteína que definem a atividade funcional biológica da proteína, certas substituições na seqüência de aminoácidos podem ser feitas em uma seqüência de proteína e, naturalmente, em sua seqüência codificadora de DNA fundamental e, não obstante, ser obtida uma proteína com propriedades semelhantes. Os inventores contemplam portanto que várias mudanças podem ser feitas nas seqüências de peptídios das proteínas ou fragmentos da presente invenção, ou seqüências de DNA correspondentes que codificam os referidos peptídios, sem perda considerável de sua utilidade ou atividade biológica. Entende-se que códons capazes de codificar tais mudanças de aminoácidos são conhecidos na técnica.
[00231] Quando se faz tais alterações, deve-se levar em conta o índice hidropático dos aminoácidos. A importância do índice hidropático do aminoácido na transmissão de função biológica interativa para uma proteína é comumente conhecida na técnica (Kyte et ai., J. Mol. Biol. 157, 105-132 (1982)). Acredita-se que o caráter hidropático relativo do aminoácido contribui para a estrutura secundária da proteína resultante, que por sua vez define a interação da proteína com outras moléculas, por exemplo, enzimas, substratos, receptores, DNA, anticorpos, antígenos e outros. Quando se faz tais alterações, prefere-se a substituição de aminoácidos cujos índices hidropáticos variam dentro ±2, sendo particularmente preferidos aqueles que variam dentro ±1, e sendo ainda mais particularmente preferidos aqueles que variam dentro ±0,5.
[00232] Também se entende na literatura que as substituições de aminoácidos semelhantes podem ser feitas de maneira eficaz com na hidrofilicidade. A Patente US 4.554.101 ensina que a hidrofilicidade média local mais alta de uma proteína, determinada pela hidrofilicidade de seus aminoácidos adjacentes, está correlacionada com uma propriedade biológica da proteína. Em um outro aspecto da presente invenção, uma ou mais moléculas de ácido nucleico da presente invenção diferem na seqüência de ácidos nucleicos daquelas codificando um peptídio descrito na SEQ ID N° 1097 até a SEQ ID N° 1119 ou fragmento das mesmas pelo fato de que um ou mais códons codificando um aminoácido foram substituídos por um códon que codifica uma substituição não-essencial do aminoácido originalmente codificado.
[00233] Os agentes da invenção incluem moléculas de ácido nucleico que codificam pelo menos uma região de cerca de 10 aminoácidos contíguos de uma proteína da presente invenção, mais preferivelmente pelo menos uma região de cerca de 11 a 14 ou mais amínoácídos contíguos de uma proteína da presente invenção. Entende-se que a presente invenção inclui moléculas de ácido nucleico que bibrídízam especifica mente para as moléculas de ácido nucleico descritas no item (i) ou apresentam uma identidade particular com as mesmas. Veja o item (a) acima fiO Marcadores de moléculas de ácido nucleico e coleções destas moléculas [00234] Um aspecto da presente invenção refere-se a moléculas de ácido nucleico da presente invenção que podem agir como marcadores. Conforme aqui usado, um "marcador” é um indicador da presença de pelo menos um fenótípo ou polimorfismo, tal como polimorfismos de um nucleotídeo (SN Ps), seqüêncías polimórficas ampliadas cliváveis (CAPS), polimorfismos de comprimento do fragmento ampliado (AFLPs), polimorfismos de comprimento do fragmento de restrição (RFLPs), repetições de seqüêncías simples (SSRs) ou DNA polimórfico ampliado aleatório (RAPDs). Um "marcador de ácido nucleico", conforme aqui usado, significa uma molécula de ácido nucleico que é capaz de ser um marcador para detectar um polimorfismo ou um fenótipo.
[00235] Em uma modalidade da presente invenção, o marcador de ácido nucleico hibridiza específica mente para uma molécula de ácido nucleico tendo uma seqüência de ácidos nucleicos selecionada do grupo que consiste em SEQ ID Nos 1-1096 e complementos das mesmas. Em uma modalidade preferida, o marcador de ácido nucleico é capaz de detectar um SNP ou INDEL de rhg1 mostrado na Tabela 2. Em uma modalidade preferida, o marcador de ácido nucleico é capaz de detectar um SNP ou INDEL de Rgh4 mostrado na Tabela 4. Em uma outra modalidade preferida, o marcador de ácido nucleico é uma molécula de ácido nucleico capaz de agir como prímer de PCR para ampliar uma região codifica d ora do rhg1 ou Rhg4. Exemplos destes prímeres incluem, sem limitação, moléculas de ácido nucleico tendo uma seqüência de ácidos nucleicos descrita nas SEQ ID NoS 401-1096 e complementos das mesmas. Tais prímeres podem ser usados em pares para ampliar uma região (amplicons, por exemplo, sem limitação, SEQ ID NoS 54-400) que podem ser investigados pelo uso de técnicas conhecidas na técnica tal como seqüenciamento de ácido nucleico. Pares preferidos são aqueles com "Seq ID" idênticas (veja Descrição da Listagem de Seqüências) exceto pelo fato de que uma "Seq ID" identifica o prímer dianteiro e a outra identifica o prímer invertido.
[00236] Em uma outra modalidade da presente invenção, o marcador de ácido nucleico hibridiza especificamente para uma molécula de ácido nucleico tendo uma seqüência que está presente no grupo de ligação G em 500 kb ou 100 kb, mais preferivelmente em 50 kb, ainda mais preferivelmente em 25 kb de um alelo de rhg1, onde o alelo de Rgh4 é de preferência um alelo sensível, e mais preferivelmente um alelo sensível de A3244. Em uma modalidade preferida, o marcador de ácido nucleico hibridiza especialmente para uma molécula de ácido nucleico tendo uma seqüência que está presente no grupo de ligação A2 em 500 kb ou 100 kb, mais preferivelmente em 50 kb, ainda mais preferivelmente em 25 kb de um alelo de Rhg4, onde o alelo de Rgh4 é de preferência um alelo sensível, e mais preferivelmente um alelo sensível de A3244.
[00237] Conforme aqui usado, uma "coleção de moléculas de ácido nucleico" é uma população de moléculas de ácido nucleico onde pelo menos duas, de preferência todas, das moléculas de ácido nucleico diferem, pelo menos em parte, em sua seqüência de ácido nucleico. Entende-se que, conforme aqui usado, uma espécie individual em uma coleção de moléculas de ácido nucleico pode ser fisicamente separada ou alternativamente não fisicamente separada de uma ou mais outras espécies na coleção de moléculas de ácido nucleico. Um exemplo de uma situação onde espécies separadas podem ser fisicamente separadas mas ser consideradas uma coleção de moléculas de ácido nucleico é aquela onde mais de duas espécies estão presentes em uma única localidade tal como um arranjo.
[00238] Conforme aqui usado, onde uma coleção de moléculas de ácido nucleico é um marcador para uma característica particular, o nível, o padrão, a ocorrência e/ou a ausência das moléculas de ácido nucleico associadas com a característica não precisam ser iguais entre as espécies da coleção. Por exemplo, o aumento no nível de espécie quando em combinação com a redução em uma segunda espécie podería ser diagnóstico para uma característica particular. Em uma modalidade preferida da presente invenção, o nível, o padrão, a ocorrência e/ou a ausência de uma molécula de ácido nucleico e/ou da coleção de moléculas de ácido nucleico da presente invenção é um marcador para resistência a SCM, [00239] Em uma modalidade, o marcador é qualquer molécula de ácido nucleico que hibridiza especificamente para qualquer sequência de ácido nucleico apresentada neste relatório. Em uma outra modalidade, o marcador é um marcador capaz de distinguir entre os haplótipos de rhg1 ou Rhg4. Em ainda uma outra modalidade, mais de um marcador é usado para distinguir simultaneamente mais de um haplótipo. Em uma modalidade preferida, dois, três, quatro, seis, oito, vinte e cinco ou cinqüenta ou mais marcadores de ácido nucleico são usados simultaneamente. Em uma outra modalidade, um ou mais marcadores que são capazes de distinguir entre os haplótipos de rhg1 e um ou mais marcadores que são capazes de distinguir entre os haplótipos de Rhg4 são usados em conjunto. fiii) Moléculas de ácido nucleico tendo seqüências promotoras e outras sequências reguladoras [00240] A presente invenção inclui moléculas de ácido nucleico que são um promotor de rhg1 ou Rhg4 ou fragmento do mesmo. Exemplos de tais moléculas de ácido nucleico incluem aquelas apresentadas na SEQ ID N° 2, acima da coordenada 45163 e na SEQ ID N° 3, acima da coordenada 46798. Conforme aqui usado, um promotor é uma seqüência de ácidos nucleicos que quando unida a uma região codificadora é capaz de expressar a proteína assim codificada ou fragmento da mesma. Em uma modalidade preferida, a seqüência promotora corresponde a entre 500 nucleotídeos e 5.000 nucleotídeos ou entre 300 nucleotídeos e 700 nucleotídeos da seqüência de ácidos nucleicos apresentada na SEQ ID N° 2 entre as coordenadas 45163 e 40163, ou na SEQ ID N° 3 entre as coordenadas 46798 e 41798, ou a seqüência de ácidos nucleicos apresentada na SEQ ID N° 4 entre as coordenadas 111805 e 106805. Regiões promotoras parciais preferidas incluem a região no retângulo TATA, por exemplo nas coordenadas 44234 a 44246 da SEQ ID N° 2 e nas coordenadas 107826 a 107835 da SEQ ID N° 4, e a região no retângulo CAAT, por exemplo nas coordenadas 106243 a 106259 da SEQ ID N° 4.
[00241] Outras seqüências reguladoras incluem introns ou região não-transladadas 3' (3'UTRs) associadas com rhg1 e Rhg4. Em uma modalidade preferida, um íntron é selecionado de um ácido nucleico compreendendo uma seqüência selecionada de SEQ ID N° 2 (rhg1, v.1 nas coordenadas 45315-45449, 45510-46940 e 48764-48974), SEQ ID N° 3 (rhg1, v.2 nas coordenadas 48764-48974) e na SEQ ID N° 4 (Rhg4 nas coordenadas 113969-114683). Em uma outra modalidade preferida, uma 3'UTR está localizada em 5.000 nucleotídeos, mais preferivelmente em 1000 nucleotídeos na direção 3' do último nucleotídeo de codificação de rhg1 ou de Rhg4 (SEQ ID N° 2, rhg1 v.1, coordenada 49573, SEQ ID N° 3, rhg1 v.2, coordenada 49573, SEQ ID N° 4, Rhg4, na coordenada 115204).
[00242] Entende-se que a presente invenção inclui moléculas de ácido nucleico que hibridizam especificamente para as moléculas de ácido nucleico descritas no item (iii) ou apresentam uma identidade particular às mesmas. Veja o item (a) acima.
Moléculas de proteínas e peotídios [00243] Uma classe de agentes compreende uma ou mais moléculas de proteína ou peptídio codificadas pela SEQ ID N° 1097 até a SEQ ID N° 1119 ou uma ou mais das moléculas de proteína ou de fragmento de proteína ou de peptídio codificadas por outros agentes de ácido nucleico da presente invenção. Conforme aqui usado, os termos "molécula de proteína" e "molécula de peptídio" significam qualquer molécula de proteína ou de fragmento de proteína ou de peptídio ou de polipeptídio que compreenda dez ou mais aminoácidos, de preferência pelo menos 11 ou 12 ou mais, mais preferivelmente pelo menos 13 ou 14 aminoácidos. É bem conhecido na técnica ensina que proteínas podem sofrer modificações, inclusive modificações pós-translacionais, tais como, porém sem limitação, formação de ligação dissulfeto, glicosilação, fosforilação ou oligomerização. Assim, conforme aqui usado, os termos "molécula de proteína" e "molécula de peptídio" incluem moléculas que são modificadas por qualquer processo biológico ou não-biológico. Os termos "aminoácido" e "aminoácidos" referem-se a todos os L-aminoácidos de ocorrência natural. Esta definição inclui norleucina, ornitina, homocisteína e homosserina.
[00244] Uma ou mais das moléculas de proteína ou de peptídio podem ser produzidas por meio de síntese química ou, mais preferivelmente, por expressão em um hospedeiro bacteriano ou eucariótico adequado. Métodos adequados para expressão foram descritos por Sambrook et al. (In: Molecular Cloning, A Laboratory Manual, 2- edição, Cold Spring Harbor Press, Cold Spring Harbor, New York (1989), ou textos similares.
[00245] Uma outra classe de agentes compreende moléculas de proteína ou de peptídio codificadas pela SEQ ID N° 1097 até a SEQ ID Ν° 1119 ou complementos das mesmas, ou fragmentos ou fusões das mesmas onde resíduos de aminoácidos não-essenciais, ou não-relevantes, foram acrescentados, substituídos ou deletados. Um exemplo de tal homólogo é um homólogo de proteína de cada espécie de soja, incluindo, porém sem limitação, alfafa, cevada, Brassica, brócolis, repolho, cítricos, alho, aveia, colza, cebola, canola, linhaça, ervilha, amendoim, pimenta, batata, centeio, soja, morango, cana-de-açúcar, beterraba, soja, milho, arroz, algodão, sorgo, Arabidopsis, trigo, pinheiro, abeto, eucalipto, maçã, alface, ervilhas, lentilhas, uva, banana, chá, gramas etc. Plantas diferentes de soja particularmente preferidas utilizadas para isolar homólogos incluem alfafa, cevada, aveia, colza, canola, plantas ornamentais, cana-de-açúcar, beterraba, soja, milho, arroz, algodão, sorgo, Arabidopsis, trigo, batata e gramas. Tal homólogo pode ser obtido por qualquer um de vários métodos. Mais preferivelmente, como indicado acima, uma ou mais das seqüências apresentadas (SEQ ID N° 1 até SEQ ID N° 1096 ou complementos das mesmas) vão ser usadas para definir um par de prímeres que pode ser usado para isolar as moléculas de ácido nucleico codificadoras do homólogo de proteína de qualquer espécie desejada. Tais moléculas podem ser expressas para produzir homólogos de proteína por meios recombinantes.
Constructos de plantas e transformantes de plantas [00246] Uma ou mais das moléculas de ácido nucleico da invenção podem ser usadas na transformação ou transfecção de plantas. Material genético exógeno pode ser transferido para uma célula vegetal e a célula vegetal regenerada como uma planta inteira, fértil ou estéril. Material genético exógeno é qualquer material genético, seja de ocorrência natural ou qualquer outro tipo de ocorrência, de qualquer fonte que possa ser inserida em qualquer organismo. Em uma modalidade preferida, o material genético exógeno inclui uma molécula de ácido nucleico da presente invenção, de preferência uma molécula de ácido nucleico tendo pelo menos 20 nucleotídeos de uma seqüência selecionada do grupo que consiste na SEQ ID N° 1 até a SEQ ID N° 1096 e complementos das mesmas. Em uma modalidade preferida, a molécula de ácido nucleico codifica uma proteína descrita na seção (i) ou fragmento da mesma. Em uma outra modalidade preferida, a molécula de ácido nucleico é um promotor descrito na seção (iii) ou fragmento do mesmo.
[00247] Tal material genético pode ser transferido para monocotiledôneas e dicotiledôneas que incluem, porém sem limitação, tomate, beringela, milho, soja, Arabidopsis, faséolo, amendoim, alfafa, trigo, arroz, aveia, sorgo, centeio, "tritordeum", milhete, festuca, centeio de grama permanente ("perennial ryegran"), cana-de-açúcar, erva-do-mato, mamão papaia, banana, banana, melão almiscarado, maçã, pepino, "dendrobium", palma-de-santa-rita, crisântemo, liliácea, algodão, eucalipto, girassol, canola, grama, beterraba, café e dioscoreácea (Christou, In: Particle Bombardment for Genetic Engineering of Plants, Biotechnology Intelligence Unit, Academic Press, San Diego, Califórnia (1996)).
[00248] Em uma modalidade preferida, o material genético é transferido para uma planta de soja. Plantas de soja preferidas para transferir um alelo de rhg1 resistente a SCN são selecionadas do grupo que consiste em PI548402 (Peking), PI200499, A2869, Jack, A2069, PI209332 (N° 4), PI404166 (Krasnoaarmejkaja), PI404198 (Sun Huan do), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), PI548655 (Forrest), PI548988 (Pickett), PI84751, PI437654, PI40792, Pyramid, Nathan, AG2201, A3469, AG3901, A3904, AG4301, AG4401, AG4501, AG4601, PION9492, PI88788, Dyer, Custer, Manokin e Doles.
[00249] Plantas de soja preferidas para transferir um alelo de Rhg4 resistente a SCN são selecionadas do grupo que consiste em PI548402 (Peking), PI437654 (Er-hej-jan), PI438489 (Chiquita), PI507354 (Tokei 421), ΡΙ548655 (Forrest), PI548988 (Pickett), PI88788, PI404198 (Sun Huan do), PI404166 (Krasnoaarmejkaja), Hartwig, Manokin, Doles, Dyer e Custer.
[00250] A transferência de um ácido nucleico que codifica uma proteína pode resultar na superexpressão daquela proteína em uma célula transformada ou em uma planta transgênica. Uma ou mais das proteínas codificadas pelas moléculas de ácido nucleico da invenção ou fragmentos dessas proteínas podem ser superexpressas em uma célula transformada ou em uma planta transgênica. Esta superexpressão pode ser resultado de transferência transitório ou estável do material genético exógeno. Esta superexpressão também pode resultar em resistência a SCN para uma ou mais espécies de SCN.
[00251] O material genético exógeno pode ser transferido para uma célula hospedeira pelo uso de um vetor ou construção de DNA montado para tal. Geralmente a montagem de tal vetor é conhecida pelo versado na técnica (veja Plant Molecular Biology: A Laboratory Manual, Clark (ed.), Springier, New York (1997).
[00252] Um constructo ou vetor pode incluir um promotor vegetal para expressar a proteína ou fragmento de proteína desejado. Inúmeros promotores, que são ativos em células vegetais, foram descritos na literatura. Estes incluem o promotor para nopalina sintase (NOS) (Ebert et al., Proc. Natl. Acad. Sei. (U.S.A.) 84: 5745-5749 (1987), o promotor para octopina sintase (OCS) (que é transportado em plasmídios indutores de tumor de Agrobacterium tumefaciens), os promotores para caulimovírus tal como o promotor 19S para o vírus do mosaico da couve-flor (CaMV) (Lawton et al., Plant Mol. Biol. 9: 315-324 (1987) e o promotor 35S para o CaMV (Odell et al., Nature 313: 810-812 (1985)), o promotor 35S para o vírus do mosaico da escrofulária, o promotor induzível por luz da subunidade pequena de ribulose-1,5-fosfato carboxilase (ssRUBISCO), o promotor para Adh (Walker et al., Proc. Natl.
Acad. Sei. (U.S.A.) 84: 6624-6628 (1987)), e o promotor para sacarose sintase (Yang et al., Proc. Natl. Acad. Sei. (U.S.A.) 87: 4144-4148 (1990)), o promotor para o complexo do gene R (Chandler et al., The Plant Cell 1: 1175-1183 (1989), e o promotor para o gene da proteína fixadora de a/b da clorofila etc. Estes promotores foram usados para criar constructos de DNA que foram expressas em plantas; veja, por exemplo, publicação PCT WO 84/02913. Os promotores CaMV 35S são preferidos para uso em plantas. Promotores que se sabe causar ou que se verifique que causam transcrição de DNA em células vegetais podem ser usados na invenção.
[00253] Com a finalidade de expressão em tecidos originais da planta, tais como a folha, a semente, a raiz ou o caule, prefere-se que os promotores utilizados tenham expressão relativamente alta nestes tecidos específicos. Expressão específica para tecido de uma proteína da presente invenção é uma modalidade particularmente preferida. Para tal, pode-se escolher entre inúmeros promotores para genes com expressão específica ou intensificada para tecido ou para célula. Exemplos de tais promotores mencionados na literatura incluem o promotor para cloroplasto glutamina sintetase GS2 da ervilha (Edwards et al., Proc. Natl. Acad. Sei. (U.S.A.) 87: 3459-3463 (1990)), o promotor para cloroplasto frutose-1,6-bifosfatase (FBPase) do trigo (Lloyd et al., Mol. Gen. Genet. 225: 209-216 (1991)), o promotor para ST-LS1 fotossintético nuclear da batata (Stockhaus et al., EMBO J. 8: 2445-2451 (1989), o promotor para STK (PAL) e o promotor para glicoamilase (CHS) de Arabidopsis thaliana. Também descritos como ativos em tecidos fotossinteticamente ativos são o promotor para ribulose-1,5-bifosfato carboxilase (RbcS) do lariço do leste (Larix laricina), o promotor para o gene cab, cab6, do pinheiro (Yamamoto et al., Plant Cell Physiol. 35: 773-778 (1994)), o promotor para o gene Cab-1 do trigo (Fejes et al., Plant Mol. Biol. 15: 921-932 (1990)), o promotor para o gene CAB-1 do espinafre (Lubberstedt et al., Plant Physiol. 104: 997-1006 (1994)), o promotor para o gene cab1R do arroz (Luan et al., Plant Cell 4: 971-981 (1992)), o promotor para piruvato, ortofosfato dicinase (PPDK) do milho (Matsuoka et al., Proc. Natl. Acad. Sei. (U.S.A.) 90: 9586-9590 (1993)), o promotor para o gene Lhcb1*2 do tabaco (Cerdan et al., Plant Mol. Biol. 33: 245-255 (1997)), o promotor simpórter para SUC2 sacarose-H+ de Arabidopsis thaliana (Truernit et al., Planta 196: 564-570 (1995)), e o promotor para as proteínas da membrana tilacóide do espinafre (psaD, psaF, psaE, PC, FNR, atpC, atpD, cab, rbcS). Outros promotores para as proteínas fixadoras de a/b da clorofila também podem ser utilizadas na invenção, tais como os promotores para o gene LhcB e para o gene PsbP da mostarda branca (Sinapis alba; Kretsch et al., Plant Mol. Biol. 28: 219-229 (1995)).
[00254] Com a finalidade de expressão de tecidos profundos ("sink tissues") da planta, tal como o tubérculo da batata, o fruto do tomate, ou a semente de milho, trigo, arroz e cevada, prefere-se que os promotores utilizados na invenção tenham expressão relativamente alta nesses tecidos específicos. São conhecidos inúmeros promotores para genes com expressão específica ou intensificada para tubérculo, os quais incluem o promotor para patatina da classe I (Bevan et al., EMBO J. 8: 1899-1906 (1986); Jefferson et al., Plant Mol. Biol. 14: 995-1006 (1990)), o promotor para os genes ADPGPP do tubérculo da batata, tanto as subunidades grandes como as pequenas, o promotor para sacarose sintase (Salanoubat et al., Gene 60: 47-56 (1987), Salanoubat et al., Gene 84: 181-185 (1989)), o promotor para as principais proteínas de tubérculos inclusive os complexos de proteínas de 22 kd e inibidores de proteinase (Hannapel, Plant Physiol. 101: 703-704 (1993)), o promotor para o gene de amido sintase ligado a grânulo (GBSS) (Visser et al., Plant Mol. Biol. 17: 691-699 (1991)), e outros promotores de patatinas das classes I e II (Koster-Topfer et al., Mol. Gen. Genet. 219: 390-396 (1989); Mignery et al., Gene 62: 27-44 (1988)).
[00255] Outros promotores também podem ser usados para expressar uma proteína ou fragmento da mesma em tecidos específicos, tais como sementes ou frutos. O promotor para β-conglicinina (Chen et al., Dev. Genet. 10: 112-122 (1989)) ou outros promotores específicos para semente tais como os promotores para napina e faseolina, podem ser usados. As zeínas constituem um grupo de proteínas de armazenamento encontradas no endosperma de milho. Foram isolados clones genômicos para genes de zeína (Pedersen et al., Cell 29: 1015-1026 (1982)) e os promotores desses clones, inclusive os 15 kD, 16 kD, 19 kD, 22 kD, 27 kD e genes, também poderíam ser usados. Outros promotores que sabidamente funcionam, por exemplo, em milho incluem os promotores para os seguintes genes: waxy, Brittle, Shrunken 2, enzimas ramificadoras I e II, amido sintases, enzimas desramificadoras, oleosinas, glutelinas e sacarose sintases. Um promotor particularmente preferido para a expressão de endosperma de milho é o promotor para o gene glutelina de arroz, mais particularmente o promotor para Osgt-1 (Zheng et al., Mol. Cell Biol. 13: 5829-5842 (1993)). Exemplos de promotores adequados para expressão em trigo incluem os promotores para as subunidades de ADPglicose pirossintase (ADPGPP), a amido sintase ligada a grânulo e outras amido sintases, as enzimas ramificadoras e desramificadoras, as proteínas abundantes em embriogênese, as gliadinas e as gluteninas. Exemplos de tais promotores em arroz incluem os promotores para as subunidades ADPGPP, a amido sintase ligada a grânulo e outras amido sintases, as enzimas ramificadoras, as enzimas desramificadoras, sacarose sintases e as glutelinas. Um promotor particularmente preferido é o promotor para glutelina de arroz, Osgt-1. Exemplos de tais promotores para cevada incluem aqueles para as subunidade ADPGPP, a amido sintase ligada a grânulo e outras amido sintases, as enzimas ramificadoras, as enzimas desramificadoras, sacarose sintases, as hordeínas, as globulinas embriônicas e as proteínas específicas para aleurona.
[00256] Promotores específicos para raiz também podem ser usados. Um exemplo de tal promotor é o promotor para o gene de ácido quitinase (Samac et ai., Plant Mol. Biol. 25: 587-596 (1994)). Expressão em tecido radicular também pode ser realizada utilizando-se os subdomínios específicos para raiz do promotor para CaMV35S que foram identificados (Lam et ai., Proc. Natl. Acad. Sei. (U.S.A.) 86:7890-7894 (1989)). Outros promotores específicos para célula radicular incluem aqueles descritos porConkling et ai. (Conkling et ai., Plant Physiol. 93:1203-1211 (1990)).
[00257] Promotores adicionais que podem ser utilizados estão descritos, por exemplo, nas Patentes US NoS 5.378.619, 5.391.725, 5.428.147, 5.447.858, 5.608.144, 5.608.144, 5.614.399, 5.633.441, 5.633.435 e 4.633.436. Além disso, pode ser usado um intensificador específico para tecido (Fromm et ai., The Plant Cell 1: 977-984 (1989)).
[00258] Os promotores preferidos são aqueles descritos na seção (a)(iii) de Agentes.
[00259] Constructos ou vetores também podem incluir, com a região codificadora de interesse, uma seqüência de ácidos nucleicos que funciona, total ou parcialmente, para terminar a transcrição daquela região. Inúmeras seqüências desse tipo foram isoladas, inclusive a seqüência Tr7 3' e a seqüência NOS 3' (Ingelbrecht et ai., The Plant Cell 1: 671-680 (1989); Bevan et ai., Nucleic Acids Res. 11:369-385 (1983)).
[00260] Um vetor ou constructo também pode incluir elementos reguladores. Exemplos destes incluem o íntron 1 de Adh (Callis et ai., Genes and Develop. 1:1183-1200 (1987)), o íntron de sacarose sintase (Vasil et ai., Plant Physiol. 91: 1575-1579 (1989)) e o elemento TMV ômega (Gallie et ai., The Plant Cell 1: 301-311 (1989)). Estes e outros elementos reguladores podem ser incluídos quando apropriado.
[00261] Um vetor ou constructo também pode incluir um marcador selecionável. Marcadores selecionáveis também podem ser usados para selecionar plantas ou células vegetais que contenham o material genético exógeno. Exemplos destes incluem, porém sem limitação: um gene de neomicina fosfotransferase (Patente US 5.034.322), que codifica para resistência à canamicina e pode ser selecionado usando-se canamicina, G418 etc.; um gene bar que codifica para resistência a bialaphos; genes que codificam para resistência a glifosato (Patentes US 4.940.835, 5.188.642, 4.971.908, 5.627.061); um gene de nitrilase que confere resistência a bromoxynil (Stalker et ai., J. Biol. Chem. 263: 63106314 (1988)); um gene mutante de acetolactato sintase (ALS) que confere resistência à imidazolinona ou sulfoniluréia (Pedido de Patente Européia 154.204 (11 de setembro de 1985)); e um gene DHFR resistente a metotrexato (Thillet et ai., J. Biol. Chem. 263: 12500-12508 (1988)).
[00262] Um vetor ou constructo também pode incluir uma seqüência de DNA que codifica um peptídio de trânsito. A incorporação de um peptídio de trânsito de cloroplasto adequado também pode ser empregada (Publicação de Pedido de Patente Européia Número 0218571). Intensificadores de translação também podem ser incorporados como parte do DNA vetorial. Os constructos de DNA podem conter uma ou mais seqüências líderes não-transladadas 5' que podem servir para intensificar a expressão dos produtos genéticos das transcrições de mRNA resultantes. Tais seqüências podem ser derivadas do promotor selecionado para expressar o gene ou podem ser especificamente modificadas para aumentar a translação do mRNA. Tais regiões também podem ser obtidas de RNAs virais, de genes eucarióticos adequados ou de uma seqüência de genes sintética. Para recapitulação da otimização de expressão de transgenes, veja Koziel et al., Plant Mol. Biol. 32: 393-405 (1996).
[00263] Um vetor ou constructo também pode incluir um marcador rastreável. Marcadores rastreáveis podem ser usados para monitorar a expressão. Marcadores rastreáveis exemplificativos incluem: um gene de β-glicuronidase ou uidA (GUS) que codifica uma enzima para a qual se conhece vários substratos cromogênicos (Jefferson, Plant Mol. Biol. Rep. 5:387-405 (1987); Jefferson et ai., EMBO J. 6: 3901-3907 (1987)); um gene de R-locus, que codifica um produto que regula a produção de pigmentos de antocianina (cor vermelha) em tecidos vegetais (Dellaporta et ai., Stadler Symposium 11:263-282 (1988); um gene de β-lactamase (Sutcliffe et ai., Proc. Natl. Acad. Sei. (U.S.A.) 75: 3737-3741 (1978)), um gene que codifica uma enzima para a qual se conhece vários substratos cromogênicos (por exemplo, PADAC, uma cefalosporina cromogênica); um gene de luciferase (Ow et ai., Science 234: 856-859 (1986)); um gene xylE (Zukowsky et ai., Proc. Natl. Acad. Sei. (U.S.A.) 80: 1101-1105 (1983)) que codifica uma catecol dioxigenase que pode converter catecóis cromogênicos; um gene de α-amilase (Ikatu et ai., Bio/Technol. 8:241-242 (1990)); um gene de tirosinase (Katz et ai., J. Gen. Microbiol. 129: 2703-2714 (1983)) que codifica uma enzima capaz de oxidar tirosina para DOPA e dopaquinona que por sua vez condensa para melanina; uma α-galactosidase, que vai se transformar em um substrato de a-galactose cromogênica.
[00264] Incluídos nos termos "genes marcadores selecionáveis ou rastreáveis" também se encontram genes que codificam um marcador secretável cuja secreção pode ser detectada como meio de identificar ou selecionar células transformadas. Exemplos incluem marcadores que codificam um antígeno secretável que pode ser identificado por interação com anticorpos, ou mesmo enzimas secretáveis que podem ser detectadas cataliticamente. Proteínas secretáveis estão em várias classes, inclusive proteínas difusíveis pequenas que são detectáveis (por exemplo, por ELISA), enzimas ativas pequenas que são detectáveis em solução extracelular (por exemplo, a-amilase, β-lactamase, fosfinotricina transferase), ou proteínas que são inseridas ou aprisionadas na parede celular (tais como proteínas que incluem uma seqüência líder tal como aquela encontrada na unidade de expressão de extensão ou tabaco PR-S). Outros genes marcadores selecionáveis e/ou rastreáveis possíveis serão evidentes para os versados na técnica.
[00265] Existem muitos métodos para introduzir moléculas de ácido nucleico transformantes em células vegetais. Acredita-se que métodos adequados incluem qualquer método pelo qual moléculas de ácido nucleico podem ser introduzidas em uma célula, tal como por infecção de Agrobacterium ou distribuição direta de moléculas de ácido nucleico tal como, por exemplo, por transformação mediada por PEG, por eletroporação ou por aceleração de partículas revestidas com DNA etc. (Potrykus, Ann. Rev. Plant Physiol. Plant Mol. Biol. 42:205-225 (1991); Vasil, Plant Mol. Biol. 25: 925-937 (1994). Por exemplo, eletroporação tem sido usada para transformar protoplastos de milho (Fromm et al., Nature 312: 791-793 (1986)).
[00266] Outros sistemas vetoriais adequados para introduzir DNA transformante em uma célula vegetal hospedeira incluem, porém sem limitação, vetores de cromossomas artificiais binários (BIBAC) (Hamilton et al., Gene 200: 107-116 (1997)); e transfecção com vetores virais de RNA (Della-Ciopa et al., Ann. N. Y. Acad. Sei. (1996), 792 (Engineering Plants for Commercial Products and Applications), 57-61). Outros sistemas vetoriais incluem vetores YAC selecionáveis vegetais tais como aqueles descritos por Mullen et al., Molecular Breeding 4:449-457 (1988)).
[00267] A tecnologia para introduzir DNA em células é bastante conhecida pelos versados na técnica. Foram descritos quatro métodos gerais para introduzir um gene em células: (1) métodos químicos (Graham et al., Virology 54: 536-539 (1973)); (2) métodos físicos tais como microinjeção (Capecchi, Cell 22: 479-488 (1980)), eletroporação (Wong et al., Biochem. Biophys. Res. Commun. 107: 584-587 (1982); Fromm et al., Proc. Natl. Acad. Sei. (U.S.A.) 82: 5824-5828 (1985); Patente US N° 5.384.253); e a pistola de genes (Johnston et al., Methods Cell Biol. 43: 353-365 (1994)); (3) vetores virais (Clapp, Clin. Perinatol. 20: 155-168 (1993); Lu et al., J. Exp. Med. 178: 2089-2096 (1993); Eglitis et al., Biotechniques 6: 608-614 (1988); e (4) mecanismos mediados por receptores (Curiel et al., Hum. Gen. Ther. 3: 147-154 (1992); Wagner et al., Proc. Natl. Acad. Sei. (U.S.A.) 89: 6099-6103 (1992)).
[00268] Métodos de aceleração que podem ser usados incluem, por exemplo, bombardeamento de microprojéteis e outros. Um exemplo de um método para introduzir moléculas de ácido nucleico transformantes em células vegetais é o bombardeamento de microprojéteis. Este método fora revisado por Yang et al. (eds.), Particle Bombardment Technology for Gene Transfer, Oxford Press, Oxford, Inglaterra (1994)). Partículas não-biológicas (microprojéteis) que podem ser revestidas com ácidos nucleicos e introduzidas em células por uma força de propulsão. Partículas exemplificativas incluem aquelas compreendidas de tungstênio, ouro, platina e outros.
[00269] Uma vantagem particular do bombardeamento de microprojéteis, além de ser um meio eficaz de transformar de forma reproduzível monocotiledôneas, é que não são necessários nem o isolamento de protoplastos (Cristou et al., Plant Physiol. 87: 671-674 (1988)) nem a suscetibilidade de infecção de Agrobacterium. Uma modalidade ilustrativa de um método para transferir DNA para células de milho por aceleração é um sistema biolístico de transferência de partículas a, que pode ser usado para propelir partículas revestidas com DNA através de um anteparo, tal como um anteparo de aço inoxidável ou Nytex, e de lá para a superfície de um filtro coberta com células de milho cultivadas em suspensão. Gordon-Kamm et al. descrevem o procedimento básico para revestir partículas de tungstênio com DNA (Gordon-Kamm et al., Plant Cell 2: 603-618 (1990)). O anteparo dispersa as partículas de tungstênio com ácido nucleico para que elas não sejam transferidas para as células receptoras em agregados grandes. Um sistema de transferência de partículas adequado para uso com a invenção é a pistola de PDS-1000/He acelerada com hélio, disponível no Bio-Rad Laboratories (Bio-Rad, Hercules, Califórnia) (Sanford et al., Technique 3: 3-16(1991)).
[00270] Para o bombardeamento, as células em suspensão podem ser concentradas em filtros. Filtros contendo as células a serem bombardeadas são colocados a uma distância apropriada abaixo da placa de parada dos microprojéteis. Se desejado, um ou mais anteparos também são colocados entre a pistola e as células a serem bombardeadas.
[00271] Alternativamente, embriões imaturos ou outras células alvo podem ser dispostas em um meio de cultura sólido. As células a serem bombardeadas são colocadas a uma distância apropriada abaixo da placa de parada dos microprojéteis. Se desejado, um ou mais anteparos também são colocados entre o dispositivo de aceleração e as células a serem bombardeadas. Usando-se técnicas descritas neste relatório pode-se obter até 1000 ou mais focos de células expressando transitoriamente um gene marcador rastreável ou selecionável. O número de células em um foco que expressa o produto genético exógeno 48 horas após o bombardeamento geralmente varia de um a dez e em média de um a três.
[00272] Na transformação por bombardeamento, as condições de cultura de pré-bombardeamento e os parâmetros de bombardeamento podem ser otimizados para produzir os números máximos de transformantes estáveis. Tanto os parâmetros físicos como os biológicos para bombardeamento são importantes nesta tecnologia. Fatores físicos são aqueles que envolvem a manipulação do precipitado DNA/microprojéteis ou aqueles que afetam o percurso e a velocidade dos macro- ou dos microprojéteis. Fatores biológicos incluem todas as etapas envolvidas na manipulação de células antes e imediatamente após o bombardeamento, o ajuste osmótico das células alvo para ajudar a aliviar o trauma associado com o bombardeamento e também a natureza do DNA transformante, tal como DNA linearizado ou plasmídios superespiralados intactos. Acredita-se que as manipulações antes do bombardeamento sejam especialmente importantes para uma transformação bem-sucedida de embriões imaturos.
[00273] Em uma outra modalidade alternativa, plastídios podem ser transformados de maneira estável. Os métodos descritos para transformação de plastídios em plantas superiores incluem a transferência com pistola de partículas de DNA contendo um marcador selecionável e o direcionamento do DNA para o genoma do plastídio por recombinação homóloga (Svab et ai., Proc. Natl. Acad. Sei. (U.S.A.) 87: 8526-8530 (1990); Svab et al., Proc. Natl. Acad. Sei. (U.S.A.) 90: 913917; Staub et al., EMBO J. 12: 601-606 (1993); Patentes US 5.451.513 e 5.545.818).
[00274] Por conseguinte, considera-se que alguém possa desejar ajustar vários aspectos dos parâmetros de bombardeamento em estudos de pequena escala para otimizar totalmente as condições. Pode-se desejar particularmente ajustar parâmetros físicos tais como distância da lacuna, distância de percurso, distância do tecido e pressão de hélio. Os fatores de redução de trauma também podem ser minimizados modificando-se as condições que influenciam o estado fisiológico das células receptoras e que portanto podem influenciar a transformação e as eficiências de integração. Por exemplo, o estado osmótico, a hidratação do tecido e o estágio da subeultura ou o ciclo celular das células receptoras podem ser ajustados por transformação ótima. A execução de outros ajustes de rotina será percebida pelos versados na técnica tendo em vista o presente relatório.
[00275] Transferência mediada por Agrobacterium é um sistema amplamente aplicável para a introdução de genes em células vegetais porque o DNA pode ser introduzido em tecidos vegetais inteiros, eliminando dessa forma a necessidade de regeneração de uma planta intata a partir de um protoplasto. O uso de vetores de integração de planta mediada por Agrobacterium para introduzir DNA em células vegetais é conhecido na técnica. Veja, por exemplo, os métodos descritos por Fraley et ai., Bio/Technology 3: 629-635 (1985) e Rogers et ai., Method Enzymol. 153: 253-277 (1987). Além disso, a integração do T-DNA é um processo relativamente preciso que resulta em poucos rearranjos. A região de DNA a ser transferida é definida pelas seqüências de borda e DNA intermédio usualmente é inserido no genoma da planta, da maneira descrita (Spielmann et ai., Mol. Gen. Genet. 205: 34 (1986)).
[00276] Os vetores de transformação de Agrobacterium modernos são capazes de replicar tanto em E. coli como em Agrobacterium, permitindo manipulações convenientes, como descrito (Klee et ai., In: Plant DNA Infectious Agents, Hohn et ai. (eds.), Springer-Verlag, New York, pp. 179203 (1985)). Ademais, os avanços tecnológicos em vetores para transferência de genes mediada por Agrobacterium melhoraram o arranjo dos genes e sítios de restrição nos vetores para facilitar a construção de vetores capazes de expressar vários genes codificadores de polipeptídios. Os vetores descritos possuem regiões multiligadoras convenientes flanqueadas por um promotor e um sítio de poliadenilação para expressão direta de genes codificadores de polipeptídios inseridos e são adequados para os propósitos da invenção (Rogers et ai., Methods Enzymol. 153: 253-277 (1987)). Além disso, Agrobacterium contendo genes Ti tanto armados como desarmados podem ser usados para as transformações. Nas cepas de plantas onde a transformação mediada por Agrobacterium é eficiente, este é o método preferido por causa da natureza simples e definida da transferência de gene.
[00277] Uma planta transgênica formada usando métodos de transformação com Agrobacterium contém tipicamente um único gene simples em um cromossoma. Tais plantas transgênicas podem ser consideradas heterozigotos para o gene adicionado. Mais preferida é uma planta transgênica que é homozigoto para o gene estrutural adicionado, isto é, uma planta transgênica que contém dois genes adicionados, um gene no mesmo locus em cada cromossoma de um par de cromossomas. Uma planta transgênica homozigoto pode ser obtida por acasalamento sexual (auto-polinização) de uma planta transgênica segregante independente que contém um único gene adicionado, germinação de algumas das sementes produzidas e análise das plantas resultantes produzidas para o gene de interesse.
[00278] Também deve ficar entendido que duas plantas transgênicas diferentes também podem ser acasaladas para produzir descendentes que contenham dois genes exógenos independentemente segregantes. Auto-polinização da progênie apropriada pode produzir plantas que são homozigotos para os dois genes exógenos adicionados que codificam um polipeptídio de interesse. Cruzamento reversível com uma planta progenitora e acasalamento com uma planta não-transgênica sem parentesco ("outcrossing) também são contemplados, bem como a propagação vegetativa.
[00279] A transformação de protoplastos vegetais pode ser obtida por métodos de precipitação de fosfato de cálcio, tratamento com polietileno glicol, eletroporação e combinações destes tratamentos (veja, por exemplo, Potrykus et ai., Mol. Gen. Genet. 205: 193-200 (1986); Lorz et ai., Mol. Gen. Genet. 199: 178 (1985); Fromm et ai., Nature 319:791 (1986); Uchimiya et ai., Mol. Gen. Genet. 204: 204 (1986); Marcotte et ai., Nature 335: 454-457 (1988)).
[00280] A aplicação desses sistemas a diferentes cepas de plantas depende da capacidade de regenerar aquela cepa de planta particular a partir de protoplastos. Encontram-se descritos métodos ilustrativos para a regeneração de cereais a partir de protoplastos (Fujimura et ai., Plant Tissue Culture Letters 2: 74 (1985); Toriyama et ai., Theor. Appl. Genet. 205: 34 (1986): Yamada et ai., Plant Cell Rep. 4: 85 (1986); Abdullah et ai., Biotechnology 4: 1087 (1986)).
[00281] Para transformar cepas de plantas que não podem ser bem regeneradas a partir de protoplastos, pode-se utilizar outras maneiras de introduzir DNA em células ou tecidos intactos. Por exemplo, a regeneração de cereais a partir de embriões imaturos ou explantes pode ser feita da maneira descrita (Vasil, Biotechnology 6: 397 (1988)). Além disso, pode ser utilizada a tecnologia de "pistola de partículas" ou de microprojéteis de alta velocidade (Vasil et ai., Bio/Technology 10: 667 (1992)).
[00282] Pelo uso desta última tecnologia, o DNA é transportado através da parede celular para dentro do citoplasma na superfície de partículas metálicas pequenas, como descrito (Klein et ai., Nature 328: 70 (1987); Klein et ai., Proc. Natl. Acad. Sei. (U.S.A.) 85: 8502-8505 (1988); McCabe et ai., Bio/Technology 6: 923 (1988)). As partículas metálicas penetram nas várias camadas das células e assim possibilitam a transformação de células em explantes de tecido.
[00283] A regeneração, o desenvolvimento e o cultivo de plantas a partir de transformantes de um único protoplasto vegetal ou de vários explantes transformados são bastante conhecidos na técnica (Weissbach et ai., In: Methods for Plant Molecular Biology, Academic Press, San Diego, CA (1988)). Este processo de regeneração e crescimento inclui tipicamente as etapas de seleção de células transformadas, cultura dessas células individualizadas através dos estágios usuais de desenvolvimento embriônico através do estágio de plantícula com raiz. Embriões e sementes transgênicos são regenerados de maneira semelhante. Os brotos transgênicos com raiz resultantes são posteriormente plantados em um meio de crescimento de planta apropriado tal como solo.
[00284] O desenvolvimento ou a regeneração de plantas contendo o gene exógeno estranho que codifica uma proteína de interesse é bastante conhecido na técnica. De preferência, as plantas regeneradas são auto-polinizadas para dar plantas transgênicas homozigotos. Diferentemente, o pólen obtido das plantas regeneradas é cruzado com plantas cultivadas de semente de linhagens agronomicamente importantes. Ao contrário, o pólen de plantas destas linhagens importantes é usado para polinizar plantas regeneradas. Uma planta transgênica da invenção contendo um polipeptídio desejado é cultivada usando-se métodos bastante conhecidos pelo versado na técnica.
[00285] Existe uma variedade de métodos para a regeneração de plantas a partir de tecido vegetal. O método de regeneração particular vai depender do tecido vegetal inicial e da espécie de planta particular a ser regenerada.
[00286] Foram publicados métodos para transformar dicotiledôneas, principalmente pelo uso de Agrobacterium tumefaciens, e para obter plantas transgênicas para algodão (Patente US N° 5.004.863; Patente US N° 5.159.135; Patente US N° 5.518.908); para soja (Patente US N° 5.569.834; Patente US N° 5.416.011; McCabe et al., Biotechnology 6: 923 (1988); Christou et al., Plant Physiol.. 87: 671-674 (1988)); para Brassica (Patente US N° 5.463.174); para amendoim (Cheng et al., Plant Cell Rep. 15: 653-657 (1996); McKently et al., Plant Cell Rep. 14: 699703 (1995)); para mamão papaia e ervilha (Grant et al., Plant Cell Rep. 15: 254-258 (1995)).
[00287] A transformação de monocotiledôneas usando eletroporação, bombardeamento de partículas e Agrobacterium também já foi descrita. Transformação e regeneração de plantas foram feitas em aspargos (Bytebier et al., Proc. Natl. Acad. Sei. (U.S.A.) 84: 5354 (1987)); cevada (Wan et al., Plant Physiol. 104: 37 (1994)); milho (Rhodes et al., Science 240: 204 (1988); Gordon-Kamm et al., Plant Cell 2:603-618 (1990); Fromm et al., Bio/Technology 8: 833 (1990); Koziel et al., Bio/Technology 11: 194 (1993); Armstrong et al., Crop Science 35:550-557 (1995)); aveia (Somers et al., Bio/Technology 10: 1589 (1992)); grama de pomar (Horn et al., Plant Cell Rep. 7: 469 (1988)); arroz (Toriyana et al., Theor. Appl. Genet. 205: 34 (1986)); Part et al., Plant Mol. Biol. 32: 1135-1148 (1996); Abedinia et al., Aust. J. Plant Physiol. 24: 133-141 (1997); Zhang et al., Theor. Appl. Genet. 76: 835 (1988); Zhang et al., Plant Cell Rep. 7: 379 (1988); Battraw et al., Plant Sei. 86: 191-202 (1992); Christou et al., Bio/Technology 9: 957 (1991); centeio (De Ia Pena et al., Nature 325: 274 (1987); cana-de-açúcar (Bower et al., Plant J. 2: 409)); festuca alta (Wang et al., Bio/Technology 10: 691 (1992)) e trigo (Vasil et al., Bio/Technology 10: 667 (1992); Patente US N° 5.631.152).
[00288] Ensaios para expressão de genes com base na expressão de constructos de ácido nucleico clonadas foram desenvolvidas introduzindo-se as moléculas de ácido nucleico em células vegetais por tratamento com polietileno glicol, eletroporação ou bombardeamento de partículas (Marcotte et al., Nature 335: 454-457 (1988); Marcotte et al., Plant Cell 1: 523-532 (1989); McCarty et al., Cell 66: 895-905 (1991); Hattori et al., Genes Dev. 6: 609-618 (1992); Goff et al., EMBO J. 9: 2517-2522 (1990)). Sistemas de expressão transitória podem ser usados para dissecar funcionalmente constructos de gene (veja, genericamente, Mailga et al., Methods in Plant Molecular Biology, Cold Spring Harbor Press (1995)).
[00289] Qualquer uma das moléculas de ácido nucleico da invenção pode ser introduzida em uma célula vegetal de maneira permanente ou temporária em combinação com outros elementos genéticos tais como vetores, promotores, intensificadores etc. Ademais, qualquer uma das moléculas de ácido nucleico da invenção pode ser introduzida em uma célula vegetal de maneira que possibilite a superexpressão da proteína codificada pela molécula de ácido nucleico ou de um fragmento dessa proteína.
[00290] Co-supressão é a redução dos níveis de expressão, usualmente do nível de RNA, de um gene endógeno particular ou de uma família de genes pela expressão de um constructo de sentido homólogo que é capaz de transcrever mRNA do mesmo tipo de estrutura filamentosa que a transcrição do gene endógeno (Napoli et al., Plant Cell 2: 279-289 (1990); van der Krol et al., Plant Cell 2: 291-299 (1990)). Co-supressão pode resultar de transformação estável com uma única cópia de uma molécula de ácido nucleico que seja homóloga a uma seqüência de ácidos nucleicos encontrada na célula (Prolls et al., Plant J. 2: 465475 (1992) ou com múltiplas cópias de uma molécula de ácido nucleico que seja homóloga a uma seqüência de ácidos nucleicos encontrada na célula (Mittlesten et al., Mol. Gen. Genet. 244: 325-330 (1994)). Genes, ainda que diferentes, ligados a promotores homólogos podem resultar na co-supressão dos genes ligados (Vaucheret, C. R. Acad. Sei. III 316: 1471-1483 (1993); Flavell, Proc. Natl. Acad. Sei. (U.S.A.) 91: 3490-3496 (1994)); van Blokland et al., Plant J. 6: 861-877 (1994); Jorgensen, Trends Biotechnol. 8: 340-344 (1990); Meins et al., In: Gene Inactivation and Homologous Recombination in Plants, Paszkowski (ed.), pp. 335348, Kluwer Academic, Países Baixos (1994)).
[00291] Entende-se que um ou mais dos ácidos nucleicos da invenção podem ser introduzidos em uma célula vegetal e transcritos usando-se um promotor apropriado, tal transcrição resultando na co-supressão de uma proteína endógena.
[00292] Abordagens anti-sentido constituem uma maneira de impedir ou reduzir a função do gene direcionando o material genético (Patentes US 4.801.540 e 5.107.065, Mol et al., FEBS Lett. 268: 427-430 (1990)). O objetivo da abordagem anti-sentido é usar uma seqüência complementar ao gene alvo para bloquear sua expressão e criar uma linhagem celular ou organismo mutante em que o nível de uma única proteína escolhida seja seletivamente reduzido ou eliminado. As técnicas anti-sentido têm várias vantagens sobre outras abordagens 'genéticas invertidas'. O sítio de inativação e seu efeito evolucional podem ser manipulados pela escolha do promotor para genes anti-sentido ou pelo ajuste do tempo de aplicação externa ou microinjeção. O anti-sentido pode manipular sua especificidade por seleção de regiões únicas do gene alvo ou regiões onde ele compartilha homologia com outros genes relacionados (Hiatt et ai., In: Genetic Engineering, Setlow (ed.), vol. 11, New York: Plenum 4963 (1989)).
[00293] O princípio de regulação por RNA anti-sentido é que o RNA que é complementar ao mRNA alvo é introduzido nas células, resultando na formação de dúplexes RNA:RNA específicos por pareamento de bases entre o substrato anti-sentido e o mRNA alvo (Green et ai., Annu. Rev. Biochem. 55: 569-597 (1986)). Em uma modalidade, o processo envolve a introdução e a expressão de uma seqüência de genes anti-sentido. Tal seqüência é aquela onde parte das seqüências de genes normais ou todas elas são colocadas sob um promotor em orientação invertida para que o cordão 'errado' ou complementar seja transcrito em um RNA anti-sentido não-codificador que hibridiza com o mRNA alvo e interfere na sua expressão (Takayama et ai., Crit. Rev. Biochem. Mol. Biol. 25: 155-184 (1990)). Um vetor anti-sentido é construído por procedimentos tradicionais e introduzido em células por transformação, transfecção, eletroporação, microinjeção, infecção etc. O tipo de transformação e a escolha do vetor vão determinar se a expressão é temporária ou estável. O promotor usado para o gene anti-sentido pode influenciar o nível, o ajuste do tempo, o tecido, a especificidade ou a indutividade da inibição anti-sentido.
[00294] Sabe-se que a atividade de uma proteína em uma célula vegetal pode ser reduzida ou eliminada desenvolvendo-se uma célula vegetal transformada contendo uma molécula de ácido nucleico cujo cordão não transcrito codifica uma proteína ou fragmento da mesma.
[00295] Silenciamento pós-transcricional de gene (PTGS) pode resultar em imunidade a vírus ou silenciamento de genes em plantas. O PTGS é induzido por dsRNA e é mediado por uma RNA polimerase dependente de RNA, presente no citoplasma, que requer um molde de dsRNA. O dsRNA é formado pela hibridização de mRNAs de transgenes complementares ou regiões complementares da mesma transcrição. A formação de dúplex pode ser feita usando-se transcrições de um gene sense e um gene anti-sentido co-localizados no genoma da planta, uma única transcrição que tenha auto-complementaridade, ou transcrições sense e anti-sentido de genes unidos por cruzamento. O RNA polimerase dependente de dsRNA produz um cordão complementar do mRNA do transgene e moléculas de RNAse se unem a este cordão complementar (cRNA). Estas moléculas de cRNA-RNAse hibridizam para o mRNA endógeno e clivam o RNA de cordão simples adjacente ao híbrido. Os RNAs de cordão simples clivados são ainda degradados por outras RNAses hospedeiras porque um deles não terá uma extremidade 5' encapada e o outro não terá uma cauda de poli(A) (Waterhouse et ai., PNAS 95: 13959-13964 (1998)).
[00296] Entende-se que um ou mais dos ácidos nucleicos da invenção podem ser introduzidos em uma célula vegetal e transcritos usando-se um promotor apropriado, tal transcrição resultando no silenciamento pós-transcricional do gene de uma transcrição endógena.
[00297] Anticorpos foram expressos em plantas (Hiatt et ai., Nature 342: 76-78 (1989); Conrad et ai., Plant Mol. Biol. 26: 1023-1030 (1994)). Foi descrito que a expressão citoplasmática de um scFv (anticorpos Fv de uma cadeia) retarda a infecção pelo vírus do "artichoke mottled crinkle". Plantas transgênicas que expressam anticorpos direcionados contra proteínas endógenas podem apresentar um efeito fisiológico (Philips et al., EMBO J. 16: 4489-4496 (1997); Marion-Poll, Trends in Plant Science 2: 447-448 (1997)). Por exemplo, foi descrito que anticorpos antiabscíssicos resultam em perturbação geral do desenvolvimento da semente (Philips et al., EMBO J. 16: 4489-4496 (1997)).
[00298] Anticorpos que são catalíticos também podem ser expressos em plantas (abzimas). O princípio por trás das abzimas é que desde que possam ser criados anticorpos contra muitas moléculas, esta capacidade de reconhecimento pode ser voltada para gerar anticorpos que ligam estados de transição para forçar uma reação química (Persidas, Nature Biotechnology 15: 1313-1315 (1997); Baca et al., Ann. Rev. Biophys. Biomol. Struct. 26: 461-493 (1997)). As capacidades catalíticas de abzimas podem ser melhoradas por mutagênese direcionada para o sítio. Exemplos de abzimas estão descritos, por exemplo, na Patente US N° 5.658.753, Patente US N° 5.632.990, Patente US N° 5.631.137, Patente US N° 5.602.015, Patente US N° 5.559.538, Patente US N° 5.576.174, Patente US N° 5.500.358, Patente US N° 5.318.897, Patente US N° 5.298.409, Patente US N° 5.258.289 e Patente US N° 5.194.585.
[00299] Entende-se que qualquer dos anticorpos da invenção pode ser expresso em plantas e que tal expressão pode resultar em um efeito fisiológico. Entende-se que qualquer dos anticorpos expressos pode ser catalítico.
Anticorpos [00300] Um aspecto da presente invenção refere-se a anticorpos, moléculas fixadoras de antígenos de uma cadeia, ou outras proteínas que se ligam especificamente a uma ou mais das moléculas de proteína ou peptídio da presente invenção e seus homólogos, fusões ou fragmentos. Estes anticorpos podem ser usados para detectar quantitativa ou qualitativamente as moléculas de proteína ou peptídio da presente invenção. Conforme aqui usado, considera-se que um anticorpo ou peptídio "se liga especificamente" a uma molécula de proteína ou peptídio da presente invenção se tal ligação não for competitivamente inibida pela presença de moléculas não relacionadas.
[00301] Moléculas de ácido nucleico que codificam toda a proteína da presente invenção ou parte da mesma podem ser expressas, por meios recombinantes, para produzir proteínas ou peptídios que por sua vez possam ser usados para criar anticorpos que sejam capazes de ligar a proteína ou peptídio expresso. Estes anticorpos podem ser usados em imunoensaios para aquela proteína. Tais moléculas codificadoras de proteína ou fragmentos das mesmas podem ser uma molécula "de fusão" (isto é, uma parte de uma molécula de ácido nucleico maior) de modo que, com a expressão, é produzida uma proteína de fusão. Entende-se que qualquer das moléculas de ácido nucleico da presente invenção pode ser expressa, por meios recombinantes, para produzir proteínas ou peptídios codificados por estas moléculas de ácido nucleico.
[00302] Os anticorpos que especificamente ligam proteínas e fragmentos de proteínas da presente invenção podem ser policlonais ou monoclonais e podem compreender imunoglobulinas intactas, ou porções fixadoras de antígeno de fragmentos de imunoglobulinas (tais como F(ab'), F(ab')2), ou imunoglobulinas de uma cadeia produzíveis, por exemplo, por meio recombinantes. Entende-se que os profissionais estão familiarizados com os materiais de referência tradicionais que descrevem condições e procedimentos específicos para a construção, manipulação e isolamento de anticorpos (veja, por exemplo, Harlow et al., In: Antibodies: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, New York (1988)).
[00303] Anticorpos monoclonais murinos são particularmente preferidos. Camundongos BALB/c são preferidos para tal, no entanto, cepas equivalentes também podem ser usadas. Os animais são de preferência imunizados com aproximadamente 25 txg de proteína purificada (ou fragmento da mesma) que fora emulsíficada em adjuvantes adequados (tal como o adjuvante TíterMax (Vaxcel, Norcross, GA)). A imunização é de preferência conduzida em dois sítios intramusculares, um sítio intraperitoneal e um sítio subcutâneo na base do rabo. Uma injeção í.v. adicional de aproximadamente 25 ocg de antígeno é de preferência dada em solução salina normal três semanas depois. Depois de aproximadamente 11 dias após a segunda injeção, os camundongos foram sangrados e o sangue rastreado quanto à presença de anticorpos antiproteína ou peptídio. De preferência, um imunoensaio ligado à enzima de ligação direta (ELISA) é usado para tal.
[00304] Mais preferivelmente, o camundongo com a titulação de anticorpos mais alta recebeu uma terceira injeção i.v. de aproximadamente 25 ocg da mesma proteína ou fragmento. Os leucócitos esplênicos deste animal pôde ser recuperado 3 dias depois e em seguida foi deixado fundir, mais preferivelmente usando polietileno glicol, com células de uma linhagem celular de mieioma adequada (tal como, por exemplo, a linhagem celular de mieioma P3X63Ag8,653), Células de hibridoma são selecionadas cultivando-se as células em seleção de "HAT" (hipoxantina-aminopterina-timina) por cerca de uma semana. Os clones resultantes podem ser então rastreados quanto a sua capacidade de produzir anticorpos monoclonais ("mAbs"), de preferência por ELISA direto.
[00305] Em uma modalidade, anticorpos monoclonais anti-proteína ou peptídio são isolados usando-se uma fusão de uma proteína ou peptídio da presente invenção, ou um conjugado de uma proteína ou peptídio da presente invenção, como imunógenos. Assim, por exemplo, um grupo de camundongos pode ser imunizado usando-se uma proteína de fusão emulsíficada em adjuvante completo de Freund (por exemplo, aproximadamente 50 ocg de antígeno por imunização). A intervalos de três semanas, a mesma quantidade de antígeno é emulsificado em adjuvante incompleto de Freund e usada para imunizar os animais. Dez dias depois da terceira imunização, amostras de soro são colhidas e avaliadas quanto à presença de anticorpo. Se as titulações de anticorpos forem demasiadamente baixas, pode-se empregar um quarto reforço. Polissoros capazes de ligar a proteína ou peptídio também podem ser obtidos usando-se este método.
[00306] Em um procedimento preferido para obter anticorpos monoclonais, os baços dos camundongos imunizados descritos acima são removidos, partidos e os esplenócitos imunes são isolados em um gradiente de ficoll. Os esplenócitos isolados são fundidos usando-se polietileno glicol com células de plasmacitoma P3x63xAg8.653 deficiente em HGPRT derivada de BALB/c (hipoxantina guanina fosforribosil transferase). As células fundidas são plaqueadas em placas de microtitulação de 96 cavidades e rastreadas quanto a células de fusão de hibridoma por sua capacidade de crescer no meio de cultura suplementado com hipotantina, aminopterina e timidina por aproximadamente 2-3 semanas.
[00307] As células de hibridoma que surgem de tal incubação são de preferência rastreadas quanto a sua capacidade de produzir uma imunoglobulina que se liga a uma proteína de interesse. Um ELISA indireto pode ser usado para tal. Em resumo, os sobrenadantes de hibridomas são incubados em cavidades de microtitulação que contêm proteína imobilizada. Depois de lavagem, o título de imunoglobulina ligada pode ser determinado usando-se, por exemplo, um anticorpo anti-camundongo de cabra conjugado a uma peroxidase de raiz-forte. Depois de mais uma lavagem, determina-se a quantidade de enzima imobilizada (por exemplo pelo uso de um substrato cromogênico). Tal rastreamento é feito tão rápido quanto possível depois da identificação do hibridoma para garantir que um clone desejado não cresça excessivamente devido a células vizinhas não secretoras. Desejavelmente, as placas de fusão são rastreadas várias vezes uma vez que as velocidades de crescimento dos hibridomas variam. Em uma sub-modalidade preferida, uma forma antigênica diferente pode ser usada para rastrear o hibridoma. Assim, por exemplo, os esplenócitos podem ser imunizados com um imunogêneo, mas os hibridomas resultantes podem ser rastreados usando-se um imunógeno diferente. Entende-se que aminoácido das moléculas de proteína ou peptídio da presente invenção pode ser usada para criar anticorpos.
[00308] Estas moléculas de anticorpos ou seus fragmentos podem ser usados para fins de diagnóstico. Quando os anticorpos destinam-se para fins de diagnóstico, pode ser desejável derivatizá-los, por exemplo, com um grupo ligando (tal como biotina) ou um grupo marcador detectável (tal como um grupo fluorescente, um radioisótopo ou uma enzima).
[00309] A capacidade de produzir anticorpos que ligam as moléculas de proteína ou peptídio da presente invenção permite a identificação de compostos miméticos daquelas moléculas. Um "composto mimético" é um composto que não é o composto, ou um fragmento do composto, mas que não obstante apresenta capacidade de se ligar especificamente a anticorpos direcionados contra o composto.
[00310] Tendo descrito a invenção de um modo geral, a mesma será mais facilmente compreendida com referência aos exemplos a seguir que são oferecidos a título ilustrativo, e não pretendem ser limitativos da presente invenção, a menos que especificado. EXEMPLO 1 [00311] Neste exemplo, DNA é extraído de plantas de soja, ampliado e mapeado.
[00312] Uma única folha trifoliada é colhida da vegetação mais recente de plantas de soja com quatro semanas de idade. Tecido foliar da folha é colocado em gelo e armazenado a -80°C. O tecido congelado é liofilizado, e aproximadamente 0,01 grama do tecido é usado para extração de DNA. O 0,01 grama de tecido foliar é triturado em pó em tubos de 1,4 ml. 600 microlitros (d) de tampão de extração de DNA consistindo em NaCI 0,5 M, Tris-(hidroximetil) aminometano 0,1 M pH 8,0, ácido etilenodiaminatetraacético (EDTA) 0,05 M, 10,0 g Γ1 dodecil sulfato de sódio (SDS) e 2 g I'1 fenantrolina (dissolvidos em 0,01 I de etanol) são aquecidos até 65° C (com 0,77 g Γ1 de ditiotreitol adicionado imediatamente antes do uso) e colocados em cada tubo, e cada tubo é misturado vigo rosa mente. As amostras são colocadas em um banho de água a 65°C por 15 minutos e agitadas manualmente depois de 10 minutos. As amostras são retiradas do banho de água e resfriadas para a temperatura ambiente, e em seguida 200 d de KOAc 5 M são acrescentados a cada tubo. As amostras são invertidas e colocadas a 4oC por 20 minutos. Em seguida as amostras são centrifugadas por 12 minutos a 6200 X g e o sobrenadante (cerca de 600 d) é transferido para novos tubos. O DNA é precipitado com 330 d de isopropanol frio e colocado a -20°C por 1 h. O DNA é peletizado por centrifugação a 6200 X g por 10 minutos e lavado com EtOH a 70%, O DNA é peletizado por centrifugação a 6200 X g por 10 minutos e secado usando um Speed-Vac. O DNA é dissolvido em 100 d de TE0„i (Tris-HCI 0,01 M pH 8,0, EDTA 0,0001 Μ). A extração geralmente produz 500 ng de DNA d'1.
[00313] Uma reação de cadeia de polimerase (PCR) é conduzida com 5 a 10 ng de DNA genômico em volumes de 10 d de Tris-HCI 10 mM (pH 8,3), KCI 50 mM, 0,001% de gelatina, MgCb 1,5 mM, 0,1 mM de cada dNTP, 150 nM de cada prímer, 0,01 mM de vermelho de cresol, 2% de sacarose e 0,32 unidade de AmpliTaq DNA Polimerase (Perkin Elmer Instruments, Inc., EUA). Para termociclagem, o Gene Amp PCR System 9700 (Perkin Elmer Instruments, Inc., EUA) é usado com uma etapa de 94°C por 3 minutos, em seguida 32 ciclos de etapas a 94°C, 47° C e 72°C de 25 segundos cada e uma etapa final de 72°C por 3 minutos. Os produtos de PCR são colocados em um poliacrilamida gel a 6% (30 cm x 8 cm x 1 mm) em 1X TAE (40 mM Tris-HCI, pH 8,3, 1 mM EDTA) a 180 v por 45 minutos. Os géis são coloridos usando-se SYBR Gold (Molecular Probes, Eugene, OR) de acordo com as instruções do fabricante.
[00314] Rastreamento de prímeres de SSR quanto à presença de polimorfismo é feito usando-se os genótipos PIC, HS-1, Will e PI507354. SSRs que são polimórficos e fáceis de classificar (isto é, padrão de bandas límpidas e boa separação entre alelos) são mapeados usando as populações de mapeamento HS-1 x PIC (F2) e/ou Will x PI507354 (RIL). Foi mapeado pelo menos um SRR por seqüência de BAC. Marcadores de DNA que apresentam padrões de bandas co-dominantes são classificados como homozigotos para um ou outro padrão ou como heterozigotos, apresentando alelos de ambos os progenitores. Os escores de marcador são avaliados quanto à distorção de segregação usando a prova do qui-quadrado para verificar sua precisão em relação às razões esperadas. As relações de ligação são determinadas usando-se o Mapmaker Versão 3.0b com um LOD igual a 3,0 (Whitehead Institute, Cambridge, MA). EXEMPLO 2 [00315] Fragmentos de DNA contendo candidatos a genes rhg1 e Rhg4 de linhagens de soja suscetíveis e resistentes foram subclonados em um plasmídio de clonagem TA (TOPO TA Cloning Kit, Versão E, Invitrogen Corporation, 1600 Faraday Avenue, Carlsbad, CA).
[00316] DNA genômico de 24 linhagens suscetíveis e 9 linhagens resistentes foi isolado usando-se técnicas tradicionais. Aproximadamente 500 nanogramas (ng) de DNA foram usados para ampliação por PCR. BAC DNA resistente foi isolado usando AUTOGEN (AutoGen Corp., 35 Loring Drive Framingham, MA). Em seguida a ampliação por PCR foi realizada usando-se 0,1 - 0,2 ng de BAC DNA resistente. Os prímeres que são usados para ampliar genes rhg1 candidatos foram os seguintes: [00317] Fragmento I (2.892 bp) prímer (SEQ ID N° 25), GCA ATA CTT GAA GGA ATA TGT CCA C; prímer (SEQ ID N° 24), começando no códon inicial, ATG GAT GGT AAA AAT TCA AAA CTA AAC; prímer invertido modificado 1 (SEQ ID N° 1123), começando 5 bp antes do códon inicial; GTT GTA TGG ATG GTA AAA ATT CAA AAC. Fragmento II (1.746 bp) prímer invertido 2 (SEQ ID N° 27), terminando 13 bp depois do códon de terminação, GAC TGG CTG TGA CTG ATC TCT CT; prímer 2 (SEQ ID N° 26), CTC ACT TAC ACT GCT GAA TGC AGA.
[00318] Os prímeres para PCR de Rhg4 foram os seguintes: Prímer normal (SEQ ID N° 48), ATG TCT CTC CCC AAA ACC CTA CTT TCT CTC; prímer invertido (SEQ ID N° 49), terminando 2 bp depois do códon de terminação, GGT TAA CGG CAA TCC ATT GAA TCA AAG GAG.
[00319] A ampliação por PCR foi feita em um MJ Research PTC DNA Engine TM System, Modelo PTC-225 (MJ Research Inc., 590 Lincoln Street Waltham, MA). A PCR foi feita usando-se os seguintes componentes: 1 od DNA, 5 od tampão 10x, 1 od prímer 1, 1 od prímer 2, 1 od dNTP 10 mM, 1,5 od MgCI2 50 mM, 0,2 od Taq (platina), 39,3 od H20. O programa de PCR usado foi o seguinte: 95°C por 10 minutos (etapa 1), 95°C por 30 segundos (etapa 2), 70°C por 30 segundos / -1°C por ciclo / 72°C por 3 minutos (etapa 3), etapas dois a três repetidas 9 vezes (etapa 4), 95°C por 30 segundos (etapa 5), 60°C por 30 segundos (etapa 6), 72°C por 3 minutos (etapa 7), etapas cinco a sete repetidas 34 vezes (etapa 8), mantida a 4°C (etapa 9).
[00320] Os produtos de PCR foram separados em agarose gel a 1% por eletroforese. Uma única banda de DNA foi excisada do gel. A extração do gel foi feita usando-se o kit de extração CLONTECH NucleoSpin (Clonetech Laboratories Inc., 1020 East Meadow Circle, Paio Alto, CA). 2 od de DNA purificados foram colocados em agarose gel a 1 % para verificar a concentração. 40 - 100 ng de DNA foram usados para subclonagem.
[00321] Uma reação de clonagem TOPO foi feita da seguinte maneira: 4 od de produto de PCR fresco, 1 od de solução salina Clontech e 1 od de vetor TOPO. A solução é misturada suavemente, incubada por 10 minutos à temperatura ambiente e em seguida colocada em gelo.
[00322] Uma transformação química simples foi realizada da seguinte maneira: 2 od da reação de clonagem TOPO foram adicionados a um frasco de E. coli quimicamente competente monoestável TOP 10 e misturados suavemente. A mistura foi então incubada em gelo por 30 minutos. Em seguida as células receberam choque térmico por 30 segundos a 42°C e foram imediatamente transferidas para gelo. 250 od do meio SOC foram então adicionados, e a mistura foi incubada a 37°C por 1 hora. 80 od foram então espalhados sobre uma placa seletiva e 170 od foram espalhados sobre uma outra placa. As placas foram incubadas a 37°C por 18-20 horas. As placas seletivas eram placas de LB ágar com 100 ocg/ml de ampicilina, 40 ocg/ml de IPTG e 40 ocm/ml de X-GAL.
[00323] Depois da incubação, foram selecionadas 8-10 colônias de cor branca ou azul claro. As colônias positivas foram inoculadas em meio LB contendo 50 ocg/ml de ampicilina e incubadas a 37°C por uma noite. Glicerol esterilizado foi adicionado para fazer um estoque de glicerol a 15%, que pôde ser armazenado a -80°C.
[00324] Reações de seqüenciamento de Sanger foram realizadas em subclones usando BigDye Terminators (Applied Biosystems, 850 Lincoln Centre Drive, Foster City, CA) e em seguida analisadas em máquinas de seqüenciamento automático ABI377/ABI3700 (Applied Biosystems, 850 Lincoln Centre Drive, Foster City, CA). As seqüências foram avaliadas quanto à qualidade e quanto à probabilidade de erro usando o programa PHRED (Ewing e Green, Genome Res., 8: 186-194 (1998), Ewing et ai., Genome Res., 8: 175-185 (1998)) montado usando o assembler phrap e visualizado usando consed (Gordon et ai., Genome Res., 8: 195-202). Um gene candidato a rhg1 foi encontrado em BAC 240017, e tem um tamanho de cerca de 4,5 kb. Um candidato a Rhg4 foi encontrado em BAC 318013, e tem um tamanho de cerca de 3,5 kb. EXEMPLO 3 [00325] Neste exemplo está descrito o mapeamento físico de um QTL (locus de traço quantitativo). O mapeamento é iniciado com análise de ligação de marcadores de SSR (repetições de seqüências simples). Os marcadores que estavam ligados ao QTL de interesse foram usados para rastrear por PCR a biblioteca de BAC de soja e identificar BACs candidatos. Os BACs confirmados foram subclonados e seqüenciados, seqüenciados com extremidade BAC e tiradas as impressões digitais. Novos marcadores foram montados a partir das seqüências com extremidade BAC boas e usados para rastrear a biblioteca, seja por PCR ou hibridização para filtros de grade de alta densidade, para prolongar os contigs. Um banco de dados de seqüências com extremidade BAC e impressões digitais de BACs de soja foi usado junto com os métodos acima para ajudar a construir e prolongar contigs. Os BACs seqüenciados foram alinhados, e os BACs sobrepostos foram colocados em contigs. Estes contigs, que contêm seqüências únicas, foram colocados em um banco de dados ACEBD, e os genes previstos foram anotados a mão usando-se vários programas. Os genes candidatos (ao gene de interesse) foram subclonados de DNA genômico de diferentes linhagens por PCR usando-se prímeres externos às regiões codificadoras previstas. Estes subclones foram seqüenciados e rastreados quando a SNPs (polimorfismos de um nucleotídeo) e INDELs (inserções/deleções), e haplótipos diferentes das linhagens com e sem o fenótipo desejado foram examinados quanto a correlações entre o haplótipo e o fenótipo.
[00326] Uma única folha trifoliada é colhida da vegetação mais recente de plantas de soja com quatro semanas de idade. O tecido foliar é colocado em gelo e armazenado a -80°C. O tecido congelado é liofilizado, e aproximadamente 0,01 grama do tecido é usado para extração de DNA. O tecido foliar é triturado em pó em tubos de 1,4 ml e 600 od de tampão de extração de DNA [NaCI 0,5 M, Tris-(hidroximetil) aminometano 0,1 M pH 8,0, ácido etilenodiaminatetraacético (EDTA) 0,05 M, 10 g I"1 dodecil sulfato de sódio (SDS) e 2 g I"1 fenantrolina (dissolvidos em 0,01 I de etanol)] são aquecidos até 65°C (com 0,77 g I"1 de ditiotreitol adicionado imediatamente antes do uso) e colocados em cada tubo e misturados vigorosamente. As amostras são colocadas em um banho de água a 65°C por 15 minutos e agitadas manualmente depois de 10 minutos. As amostras são retiradas do banho de água, resfriadas para a temperatura ambiente, e 200 od de KOAc 5 M são acrescentados a cada tubo. As amostras são invertidas e colocadas a 4°C por 20 minutos. Em seguida as amostras são centrifugadas por 12 minutos a 6200 X g e o sobrenadante (cerca de 600 od) é transferido para novos tubos. O DNA é precipitado com 330 od de isopropanol frio e colocado a -20°C por 1 h. O DNA é peletizado por centrifugação a 6200 X g por 10 minutos e é lavado com EtOH a 70%. O DNA é peletizado por centrifugação a 6200 X g por 10 minutos e secado usando um Speed-Vac. O DNA é dissolvido em 100 od de TE0,i (Tris-HCI 0,01 M pH 8,0, EDTA 0,0001 Μ). A extração geralmente produz 500 ng de DNA od"1.
[00327] A reação de cadeia de polimerase (PCR) é conduzida com 5 a 10 ng de DNA genômico em volumes de 10 od de Tris-HCI 10 mM (pH 8,3), KCI 50 mM, 0,001% de gelatina, MgCI2 1,5 mM, 0,1 mM de cada dNTP, 150 nM de cada prímer, 0,01 mM de vermelho de cresol, 2% de sacarose e 0,32 unidade de AmpliTaq DNA Polimerase (Perkin Elmer Instruments, Inc., EUA, 761 Main Avenue, Norwalk, CT). Para termociclagem, o Gene Amp PCR System 9700 (Perkin Elmer Instruments, Inc., EUA, 761 Main Avenue, Norwalk, CT) é usado com uma etapa de 94°C por 3 minutos, em seguida 32 ciclos de etapas a 94°C, 47°C e 72°C de 25 segundos cada e uma etapa final de 72°C por 3 minutos. Os produtos de PCR são colocados em um poliacrilamida gel a 6% (30 cm x 8 cm x 1 mm) em 1X TAE (Tris-HCI 40 mM, pH 8,3, EDTA 1 mM) a 180 v por 45 minutos. Os géis são coloridos usando-se SYBR Gold (Molecular Probes, Eugene, OR) de acordo com as instruções do fabricante.
[00328] Rastreamento de prímeres de SSR quanto à presença de polimorfismo é feito usando-se os genótipos PIC, HS-1, Will e PI507354. SSRs que são polimórficos e fáceis de classificar (isto é, padrão de bandas límpidas e boa separação entre alelos) são mapeados usando as populações de mapeamento HS-1 x PIC (F2) e/ou Will x PI507354 (RIL). Foi mapeado pelo menos um SRR por seqüência de BAC. Marcadores de DNA que apresentam padrões de bandas co-dominantes são classificados como homozigotos para um ou outro padrão ou como heterozigotos, apresentando alelos de ambos os progenitores. Os escores de marcador são avaliados quanto à distorção de segregação usando a prova do qui quadrado para verificar sua precisão em relação às razões esperadas. As relações de ligação são determinadas usando-se o Mapmaker Versão 3.0b com um LOD igual a 3,0 (Whitehead Institute, Cambridge, MA).
[00329] Trinta e dois superlagos de BAc DNA (10 equivalentes genômicos) extraídos de 4608 clones (48 placas de microtitulação de 96 cavidades) foram usados como moldes para a primeira rodada de rastreamento por PCR. Depois de identificação dos superlagos positivos, o segundo rastreamento foi realizado em lagos 4-D BAC DNA. Cada clone do superlago foi especificado 4-dimensionalmente (7x7x12x8)e reunido em cada dimensão. Cada grupo de 48 placas foi dividido em 6 grupos de 7 placas e um grupo de 6 placas, e separados de duas maneiras. A primeira divisão foi classificada em ordem numérica, placas 1-7, 8-14, ... 43-48 representando 7 lagos em grupo ou pilha. A segunda divisão foi feita de acordo com a posição das placas em cada pilha respectiva, placas [1, 8, 15, 22, 29, 36], [2, 9, 16, 23, 30, 37, 43] etc., representando 7 lagos em placas. Cada uma das placas de 96 cavidades continha 12 colunas e 8 linhas. Clones da linha 1 foram colhidos de todas as 48 placas e reunidos para gerar o lago da linha 1. Clones das linhas 2, 3, 4, ... 8, e das colunas 1, 2, 3, ... 12 foram colhidos e reunidos para gerar 8 lagos de linha e 12 lagos de coluna, respectivamente.
[00330] Para cada superlago, BAC DNA foi extraído de um total de 34 superlagos ( 7 + 7 + 8 + 12). Os clones positivos foram identificados por rastreamento por TaqMan/PCR dos 34 superlagos quando um clone positivo estava presente. Quando mais de um clone positivo estava presente em um superlago, era realizada uma terceira rodada de rastreamento com reação de N4 PCR.
[00331] Os endereços dos BACs candidatos foram identificados, e os candidatos foram sulcados para isolamento de colônias simples e cultivados por uma noite a 37°C. Uma única colônia isolada foi colhida e sulcada e cultivada por uma noite a 37°C. PCR foi repetida para o marcador de interesse (usando o programa destinado ao marcador de interesse) usando um esfregaço de células da placa sulcada de uma única colônia. O produto de PCR foi colocado em agarose gel a 2% e purificado usando o kit de extração em gel Clonetech NucleoSpin (de acordo com as instruções do fabricante, Clonetech Laboratories Inc., 1020 East Meadow Circle, Paio Alto, CA) e 10 - 50 ng do DNA purificado foram adicionados a 10 pmol de cada prímer (normal e invertido) em um volume total de 6 od de ddH20 e 2 od de BigDye Terminators (Applied Biosystems, 850 Lincoln Centre Drive, Foster City, CA). As condições de ciclagem foram: 96°C por 1 minuto (etapa 1), 96°C por 10 segundos (etapa 2), 50°C por 5 segundos (etapa 3), 60°C por 4 minutos (etapa 4), as etapas 2-4 foram repetidas por 24 ciclos (etapa 5) e mantida a 4°C.
[00332] A seqüência gerada foi comparada à seqüência de consenso usando um software de comparação de DNA. Os clones confirmados foram subclonados, seqüenciados, seqüenciados com extremidade BAC e tiradas as impressões digitais.
[00333] O seqüenciamento com extremidade BAC foi feito usando 3,2 pmol de SP6 e prímeres T7 (separadamente), aproximadamente 600 ng -1 um grupo de reação de BAC DNA (Autogen prepped, AutoGen Corp., 35 Loring Drive Framingham, MA), ressuspensa em 6 od de ddH20, e 4 od de BigDye Terminators (Applied Biosystems, 850 Lincoln Centre Drive, Foster City, CA) para dar um volume total de reação de 10 ui. As condições de ciclagem foram: 96°C por 2 minutos (etapa 1), 96°C por 15 segundos (etapa 2), 50°C por 15 segundos (etapa 3), 60°C por 4 minutos (etapa 4), as etapas 2-4 foram repetidas por 50 - 60 ciclos (etapa 5), 72°C por 2 minutos (etapa 6), mantida a 4°C ou 10°C (etapa 7).
[00334] As reações foram precipitadas em etanol e acondicionadas em seqüenciadores capilares. A seqüência com extremidade BAC recém-gerada foi disposta a partir da seqüência de vetor, e introduzida em um banco de dados contendo aproximadamente 400.000 seqüências com extremidade BAC. Cada BAC foi explodido contra o banco de dados para buscar extensão semelhante com extremidade BAC dos contigs ("BAC-end matches extension of the contigs"). Novos marcadores foram montados a partir de seqüências com extremidade BAC boas, e estes foram então usados para novo rastreamento da biblioteca para construir contigs na região de interesse. O rastreamento pode ser feito de duas maneiras: como acima (estratégia de PCR), ou por hibridização de filtros de grade de alta densidade da Research Genetics (Research Genetics, 2130 Memorial Parkway, Huntsville, AL).
[00335] As sondas usadas para hibridização são derivadas de clones ou DNA genômico por ampliação por PCR usando os prímeres específicos para vetor ou gene, com as condições de ciclagem apropriadas. Os produtos de PCR foram colocados em agarose gel a 1% contendo brometo de etídio (0,2 um grupo/ml) em tampão 1X TAE a 100 volt por 1 - 2 h. Fragmentos de DNA isolados foram excisados e purificados em gel usando o kit de extração em gel Clonetech NucleoSpin (Clonetech Laboratories Inc., 1020 East Meadow Circle, Paio Alto, CA) antes de serem marcados. Para verificar o tamanho dos fragmentos e a concentração, 2 od de DNA eluído mais tampão de acondicionamento foram colocados em agarose gel a 1% junto com marcadores de DNA de concentração e tamanho conhecidos. Todas as sondas usadas para rastrear a biblioteca foram testadas individualmente quanto à repetitividade, com um filtro menor carregado com clones aleatórios da biblioteca junto com alguns clones de controle positivos de acordo com o protocolo descrito abaixo.
[00336] Uma biblioteca de soja A3244 gerada por uma digestão de EcoRI é colocada em 3 filtros de grade de alta densidade da Research Genetics (Research Genetics, 2130 Memorial Parkway, Huntsville, AL). Cada filtro tem seis campos, doze placas de 384 cavidades em cada campo em duplicata, com um total de 27.648 clones colocados em cada filtro. As placas são colocadas em um padrão de grade 5 x 5 (12 clones por grade 5 x 5) em cada campo. Cada clone é colocado em duplicata com uma orientação específica dentro da grade 5x5 que, junto com a posição do campo, dá informações sobre seu endereço. Em uma primeira rodada do procedimento de hibridização, múltiplas sondas são marcadas separadamente e em seguida reunidas para hibridizar para filtros de BAC. BACs positivos identificados neste procedimento são destorcidos por rehibridização com as sondas individuais.
[00337] Um forno de hibridização é ajustado a 65°C, e tampão de Church (fosfato de sódio 0,5 M, pH 7,0, SDS 7%, albumina sérica bovina 1%, EDTA 1 mM, DNA de esperma de salmão 100 ocg/ml) é preaquecida até 65°C. As membranas são lavadas em 500 ml de 0,1 X SSC, SDS 0,1% em um recipiente grande à temperatura ambiente por 5 minutos com agitação suave (50 rpm) em um agitador giratório. As membranas são enxaguadas com 500 ml 0,1X SSC (sem SDS) por 1 minuto. A solução de lavagem é despejada e descartada, e 500 ml de 6 X SSC (sem SDS) são adicionados para equilibrar as membranas. Três filtros são colocados em um tubo. Os filtros são separados uns dos outros e dos lados do tubo por uma camada de tela reticulada. Cada tubo é enchido com 6 X SSC e agitado suavemente com o tubo na vertical para ajudar a eliminar as bolhas entre os filtros e a parede do tubo. A solução de 6 X SSC é despejada e descartada, e 25 ml de tampão de Church preaquecido são adicionados. Os frascos são girados em um forno de hibridização a 60 rpm e 65°C por 30 minutos ou mais.
[00338] As sondas são rotuladas usando 1 od de 40-50 uCi/od [a32P dCTP], 50 ng de DNA purificado em 49 od de ddH20, e contas de marcação Read-To-Go da Amersham Pharmacia de acordo com as instruções do fabricante (Amersham Pharmacia, Uppsala, Suécia). As sondas são purificadas usando a Bio-Spin Column P30 da BioRad de acordo com as instruções do fabricante (Bio-Rad Laboratories, 3316 Spring Garden Street, Filadélfia, PA). 1 od da sonda purificada na coluna é adicionado a um frasco mini-poly-Q (frasco de cintilação líquida) para cada sonda. 5 ml de líquido de cintilação são adicionados a cada frasco, e atividade radioativa para cada frasco é medida usando-se um contador de cintilação líquida.
[00339] Depois de as sondas serem purificadas e contadas quanto à radioatividade, 10-20 sondas e uma sonda de controle (de 50 od reação) são reunidas com 107 cpm/sonda cada, em um tubo de eppendorf de 1,5 ml. As sondas reunidas são desnaturadas a 99°C em um bloco de aquecimento de areia por 10 minutos. Os tubos são resfriados em gelo ou água gelada por 2 minutos, e em seguida centrifugados a 14.000 rpm por 30 segundos em uma microcentrífuga. Os tubos são pré-hibridizados em 25 ml de tampão de Church por pelo menos 30 minutos, que foi então despejado e descartado. 40 ml de solução de hibridização fresca (tampão de Church preaquecido) foram adicionados. A solução de tubos reunidos é adicionada ao tubo de hibridização. O tubo é girado no forno de hibridização a 60 rpm, 65°C, por uma noite.
[00340] A solução de sonda é despejada e descartada, 30 ml de uma solução de lavagem preaquecida (65°C) de 1X SSC, 0,1% SDS é adicionada ao tubo de hibridização, e o tubo de hibridização é girado no forno de hibridização (a 65°C) por 15 minutos, e o processo é repetido duas vezes. Na última lavagem, o tubo é girado a 180°C e à mesma velocidade por 15 minutos a 65°C. A solução de lavagem é despejada e descartada, e 2X SSC (sem SDS) é adicionado.
[00341] O excesso de líquido é removido de cada filtro colocando-se o filtro sobre um pedaço de papel 3MM. O filtro lavado é colocado sobre um filme revelador com o DNA voltado para cima (os BACs laterais foram manchados), coberto com envoltório de Saran e comprimido para forçar a saída do líquido e das bolhas. O envoltório de Saran é dobrado para o outro lado do filme, fixado com fita adesiva e em seguida secada Kimwipes. Os filtros envolvidos são colocados em um cassete de filme com o DNA voltado para cima (os BACs laterais foram manchados), que é colocado sobre um filme BioMax MS (Biomax Technologies Inc., Vancouver, BC, Canadá) em um recinto escuro, e exposto por uma noite à temperatura ambiente sem anteparo de intensificação. O filme é revelado com um revelador de filme no recinto escuro no dia seguinte, e cada filme é etiquetado com o número do filme, a sonda usada para hibridização, o tempo de exposição e a data.
[00342] Começando pelo Campo 3, uma grande de 384 cavidades é colocada sobre o campo com a posição A1 da grade no canto direito superior, e a grade é alinhada para formação de imagem. A posição da linha e da coluna para cada clone positivo sobre cada folha de distribuição de registro de BAC é determinada e anotada. O padrão do sinal de hibridização é comparado a padrões conhecidos. Há 6 números de referência de placa para cada um dos doze padrões, que são dispostos da mesma maneira que os 6 campos. Com base no padrão do sinal e no número do campo, determina-se um número de referência de placa para cada clone positivo. A grade é deslocada para o campo seguinte e o processo é repetido. O número de placa (P) original é determinado usando-se a seguinte fórmula: P = (N-1) x 72 + R, onde N é o número do filtro no qual encontra-se o clone identificado e R é o número de referência da placa anteriormente determinado. O endereço completo do clone identificado é dado pelo número de placa original mais sua posição na placa determinada anteriormente. Os endereços dos BACs são identificados e convertidos em arquivos "imp" de acordo com o formato de arquivo "Q-bot".
[00343] 24 placas de trabalho são introduzidas em um "Q-bot (Genetix, Queensway, New Milton, Hampshire, Reino Unido) 6-high hotel" e placas de 96 cavidades enchidos com meio são colocados sobre o tabuleiro. O "Q-blot" é operado segundo o manual tradicional usando o programa denominado "Rearraying98" com os ajustes dados no Anexo III do manual que o acompanha: BAC-Picking. As placas contendo os clones colhidos são colocadas em uma incubadora oscilante e deixadas crescer por uma noite a 37°C a 200 rpm.
[00344] 35 od de solução de DNA são transferidos de placas de 96 cavidades para uma placa de 384 cavidades usando Platemate de modo que 4 placas de 96 cavidades de DNA são combinadas em uma placa de 384 cavidades. A cabeça de pino (disco) 384 é lavada em solução de SDS 10% por 5 minutos, ultrassonicada em um banho de água por 3 minutos, lavada com etanol 70% por 1 minuto e secada ao ar por 3 minutos. As placas fonte de DNA de 384 cavidades e as membranas são dispostas sobre o tabuleiro de acordo com as instruções do manual e o design da grade manchada escolhido para a membrana. O padrão de manchamento é designado de modo que haja uma sonda de controle em cada um dos 4 cantos da membrana. Um padrão assimétrico é usado para orientar os filtros. A concentração da sonda de controle é de 5 ng/ul. Zeus é operado de acordo com as instruções. Se a concentração de DNA for menor que 5 ng/ul, o Zeus será operado uma segunda vez para dobrar a quantidade de DNA manchado sobre a membrana. Uma das manchas vazias é tingida, se houver, usando uma placa de tingimento de 384 cavidades. Se não houver uma mancha vazia, ela será impressa sobre uma das manchas de DNA. Esta mancha marca a posição de corte dos filtros em pequenas membranas (9 x 12 cm). As membranas são colocadas entre papéis 3M e deixadas secar ao ar. Cada canto de cada membrana é marcado com um marcador permanente e numerado. Os filtros são desnaturados sobre a superfície do papel 3M embebido com solução desnaturante por 4 minutos, e em seguida neutralizados sobre a superfície do papel 3M embebido com solução neutralizante por 5 minutos. Os filtros são lavados com 2X SSC por 5 minutos e em seguida secados ao ar. Os filtros são então cozidos a 80°C por 1 h e cortados em pequenas membranas (9 x 12 cm) individuais de acordo com o canto marcado.
[00345] Para confirmar e desenrascar, hibridizações são feitas como anteriormente, mas com filtros recém-gerados, e cada sonda é feita separadamente com um único filtro usando o tubo menor. 15 ml de tampão de Church são usados para a hibridização.
[00346] Impressões digitais são geradas por digestão do BAC DNA com Hind III por 3 horas a 37°C e operando a reação em um gel 0,8% a 200 V por 19 horas. Os géis são coloridos com SybrGreen, enquanto agitados à temperatura ambiente por 45 minutos, e varridos com um Flourlmager. As bandas são dimensionadas usando-se o software Frag e as impressões digitais são montadas em contigs em FPC. Toda vez que novos clones são adicionados, os contigs são reconstruídos usando-se uma tolerância de 10 e um corte de 10"9.
[00347] Subclones foram gerados e reações de seqüenciamento de Sanger foram realizadas em subclones aleatoriamente escolhidos usando-se BigDye Terminators (Applied Biosystems, 850 Lincoln Centre Drive, Foster City, CA) e em seguida analisados em máquinas de seqüenciamento automático ABI377/ABI3700 (Applied Biosystems, 850 Lincoln Centre Drive, Foster City, CA). Uma cobertura de seqüência de 7 - 8 vezes é assim gerada através do BAC. As seqüências são avaliadas quanto à qualidade e probabilidade de erro usando-se o programa phred, montadas usando-se o componente phrap, e visualizadas usando o consed, como no exemplo 2. Quanto aos BACs padrão de Bermuda, todos os contigs são ordenados e orientados em todas as lacunas são fechadas usando-se uma estratégia de deslocamento de prímer direcionado. Obtém-se um valor final de qualidade de phred40 (erro de 1 base em 10.000 bases) sem regiões de lacuna, cobertura dupla ou duas químicas através de áreas de um cordão.
[00348] Os contigs das seqüências são colocados em um banco de dados ACEDB junto com jogos ("matches") de EST de soja e EST de planta, junto com seleções ("hits") de Blastx, Tblastx e Plant Blastn. Genemark.hmm é usado para prever possíveis genes, e GeneFinder é usado para prever sítios de união, ORFs, regiões codificadoras potenciais, bem como códons iniciais e de terminação. Os contigs são então anotados a mão e genes previstos aceitos, editados e modificados com base nas características presentes na seqüência e "matches" do banco de dados de proteína, nucleotídeos e EST.
[00349] As membranas da biblioteca de BAC de alta densidade usadas para hibridização foram feitas por Research Genetics (Research Genetics, 2130 Memorial Parkway, Huntsville, AL), usando um "Q-bot" modificado (Genetix, Queensway, New Milton, Hampshire, Reino Unido), placas de 384 cavidades contendo BACs foram manchadas sobre membranas Hybond N+ 22 cm x 22 cm (Amersham Pharmacia, Uppsala, Suécia). Bactérias de 72 placas foram manchadas duas vezes sobre uma membrana, dando um total de 55.296 colônias, ou 27.648 clones únicos por membrana. As placas são manchadas em seis "campos" por membrana, cada campo tendo 12 placas manchadas em duplicata. Este formato de manchamento resulta em seis campos com 384 grades em cada campo. Cada grade é uma matriz 5x5 contendo 12 clones únicos em duplicata, com a posição central deixada vazia. As duas posições ocupadas por cada clone em duplicata são criadas para dar um padrão único que indica a localização de cada clone na placa. Depois do manchamento, as bactérias sobre a membrana foram incubadas por 8 horas em placas de LB-ágar contendo 12,5 um grupo/ml de cloranfenicol. As membranas foram então desnaturadas, neutralizadas e lavadas por um procedimento tradicional, reticuladas com luz UV e secadas ao ar. As membranas podem ser armazenadas e expedidas à temperatura ambiente.
REIVINDICAÇÕES
Claims (19)
1. Método para a seleção de uma planta de soja tendo um alelo de Rhg4 resistente a SCN, caracterizado pelo fato de que compreende: (a) obter uma população de plantas de soja; (b) rastrear a referida população quanto a um membro tendo um alelo de Rhg4 resistente a SCN com um primeiro marcador molecular que está localizado dentro de 500 kb de SEQ ID N° 4; e (c) selecionar o referido membro compreendendo o referido alelo de Rhg4 resistente a SCN.
2. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido primeiro marcador molecular é capaz de hibridizar especificamente à uma molécula de ácido nucleico tendo a sequência de ácidos nucleicos da SEQ ID N° 4, complementos da mesma, ou fragmentos da mesma tendo pelo menos 15 nucleotídeos.
3. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido primeiro marcador molecular é capaz de hibridizar especificamente à uma molécula de ácido nucleico tendo a sequência de ácidos nucleicos da SEQ ID N° 7, complementos da mesma, ou fragmentos da mesma tendo pelo menos 15 nucleotídeos.
4. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido primeiro marcador molecular é um marcador de ácido nucleico capaz de detectar o haplótipo 3 de Rhg4.
5. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido primeiro marcador molecular é capaz de hibridizar especificamente à uma molécula de ácido nucleico tendo uma sequência que está presente no grupo de ligação A2 e localizada dentro de 100 kb do referido alelo de Rhg4 resistente a SCN.
6. Método para a seleção de uma planta de soja de acordo com a reivindicação 5, caracterizado pelo fato de que o referido primeiro marcador molecular é capaz de hibridizar especificamente à uma molécula de ácido nucleico tendo uma sequência que está presente no grupo de ligação A2 e localizada dentro de 50 kb do referido alelo de Rhg4 resistente a SCN.
7. Método para a seleção de uma planta de soja de acordo com a reivindicação 6, caracterizado pelo fato de que o referido primeiro marcador molecular é capaz de hibridizar especificamente à uma molécula de ácido nucleico tendo uma sequência que está presente no grupo de ligação A2 e localizada dentro de 25 kb do referido alelo de Rhg4 resistente a SCN.
8. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido membro tendo o referido alelo de Rhg4 resistente a SCN é selecionado do grupo de maturidade de soja consistindo em 000, 00, 0, I, II, III, IV e V.
9. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido membro tendo o referido alelo de Rhg4 resistente a SCN é selecionado do grupo de maturidade de soja consistindo em VI, VII, VIII, IX e X.
10. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja, caracterizado pelo fato de que compreende: (a) isolar moléculas de ácido nucleico da referida planta de soja; (b) determinar a sequência de ácidos nucleicos de um alelo de Rhg4 ou parte do mesmo; e (c) comparar a sequência de ácidos nucleicos do referido alelo de Rhg4 ou parte do mesmo com SEQ ID N° 4, ou parte da mesma tendo pelo menos 15 nucleotídeos.
11. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja de acordo com a reivindicação 10, caracterizado pelo fato de que a referida determinação da sequência de ácidos nucleicos do referido alelo de Rhg4 ou parte do mesmo é uma determinação de um único nucleotídeo.
12. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja de acordo com a reivindicação 10, caracterizado pelo fato de que a referida determinação da referida sequência de ácidos nucleicos do referido alelo de Rhg4 ou parte do mesmo é uma determinação da sequência de ácidos nucleicos de um exon de Rhg4.
13. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja de acordo com a reivindicação 12, caracterizado pelo fato de que o referido exon é o exon 1.
14. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja de acordo com a reivindicação 12, caracterizado pelo fato de que o referido exon é o exon 2.
15. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja de acordo com a reivindicação 12, caracterizado pelo fato de que a referida determinação da referida sequência de ácidos nucleicos do referido alelo de Rhg4 ou parte do mesmo é uma determinação da sequência de ácidos nucleicos de um domínio de repetição rico em leucina.
16. Método para a investigação de um haplótipo de Rhg4 de uma planta de soja de acordo com qualquer uma das reivindicações 10 a 15, caracterizado pelo fato de que o referido método compreende ainda: (d) selecionar uma planta de soja resistente a SCN com base na referida comparação. sequênciasequênciasequênciasequênciasequênciasequênciasequên- ciasequênciasequênciasequênciasequênciasequênciasequênciase-quência
17. Método para a seleção de uma planta de soja de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que a fonte do referido alelo de Rhg4 resistente a SCN é derivada de uma planta selecionada do grupo consistindo em PI548402, PI88788, PI404198, PI438489, P1437654, PI404166, PI548655, PI548988, PI507354, e uma progênie resistente a SCN da mesma.
18. Método para a seleção de uma planta de soja de acordo com a reivindicação 1, caracterizado pelo fato de que o referido primeiro marcador molecular compreende um polimorfismo de nucleotídeo único localizado em uma posição na SEQ ID NO:4 selecionada do grupo consistindo em 111933, 112065, 112101, 112461, e 114066.
19. Método para a seleção de uma planta de soja de acordo com a reivindicação 18, caracterizado pelo fato de que o referido polimorfismo de nucleotídeo único é selecionado do grupo consistindo em uma guanina na posição 111933, uma citosina na posição 112065, uma citosina na posição 112101, uma timina na posição 112461 e uma guanina na posição 114066.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17488000P | 2000-01-07 | 2000-01-07 | |
PCT/US2001/000552 WO2001051627A2 (en) | 2000-01-07 | 2001-01-05 | Soybean cyst nematode (scn) resistance loci rhg1 and rhg4 |
BRPI0107440-7A BRPI0107440B1 (pt) | 2000-01-07 | 2001-01-05 | MÉTODOS PARA SELEÇÃO DE PLANTA DE SOJA TENDO ALELO DE rhg1 RESISTENTE A NEMATÓDEO DO CISTO DE SOJA |
Publications (1)
Publication Number | Publication Date |
---|---|
BR122014027339B1 true BR122014027339B1 (pt) | 2017-01-17 |
Family
ID=22637918
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122014027339A BR122014027339B1 (pt) | 2000-01-07 | 2001-01-05 | métodos para seleção de planta de soja tendo alelo de rhg4 resistente ao nematódeo do cisto da soja e para investigação de haplótipo de rhg4 de planta de soja, bem como método de seleção assistida por marcador de ácido nucleico em planta de soja para seleção de planta de soja tendo alelo que confere resistência ao nematódeo do cisto da soja |
BRPI0107440-7A BRPI0107440B1 (pt) | 2000-01-07 | 2001-01-05 | MÉTODOS PARA SELEÇÃO DE PLANTA DE SOJA TENDO ALELO DE rhg1 RESISTENTE A NEMATÓDEO DO CISTO DE SOJA |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0107440-7A BRPI0107440B1 (pt) | 2000-01-07 | 2001-01-05 | MÉTODOS PARA SELEÇÃO DE PLANTA DE SOJA TENDO ALELO DE rhg1 RESISTENTE A NEMATÓDEO DO CISTO DE SOJA |
Country Status (6)
Country | Link |
---|---|
US (3) | US7154021B2 (pt) |
AR (1) | AR026808A1 (pt) |
AU (1) | AU2771901A (pt) |
BR (2) | BR122014027339B1 (pt) |
CA (1) | CA2396359C (pt) |
WO (1) | WO2001051627A2 (pt) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6162967A (en) * | 1994-01-26 | 2000-12-19 | Pioneer Hi-Bred International, Inc. | Positional cloning of soybean cyst nematode resistance genes |
BR122014027339B1 (pt) | 2000-01-07 | 2017-01-17 | Monsanto Technology Llc | métodos para seleção de planta de soja tendo alelo de rhg4 resistente ao nematódeo do cisto da soja e para investigação de haplótipo de rhg4 de planta de soja, bem como método de seleção assistida por marcador de ácido nucleico em planta de soja para seleção de planta de soja tendo alelo que confere resistência ao nematódeo do cisto da soja |
US20020144310A1 (en) | 2000-01-28 | 2002-10-03 | Lightfoot David A. | Isolated polynucleotides and polypeptides relating to loci underlying resistance to soybean cyst nematode and soybean sudden death syndrome and methods employing same |
US7078234B2 (en) | 2002-12-18 | 2006-07-18 | Monsanto Technology Llc | Maize embryo-specific promoter compositions and methods for use thereof |
US20060200878A1 (en) | 2004-12-21 | 2006-09-07 | Linda Lutfiyya | Recombinant DNA constructs and methods for controlling gene expression |
WO2006073727A2 (en) | 2004-12-21 | 2006-07-13 | Monsanto Technology, Llc | Recombinant dna constructs and methods for controlling gene expression |
US8314290B2 (en) | 2004-12-21 | 2012-11-20 | Monsanto Technology Llc | Temporal regulation of gene expression by MicroRNAs |
US7781648B2 (en) * | 2005-05-18 | 2010-08-24 | Board Of Trustees Of Michigan State University | Resistance to soybean aphid in early maturing soybean germplasm |
US9121028B2 (en) * | 2005-09-09 | 2015-09-01 | Monsanto Technology Llc | Selective gene expression in plants |
EP1934354B1 (en) | 2005-10-13 | 2017-11-08 | Monsanto Technology, LLC | Methods for producing hybrid seed |
CN101421406B (zh) | 2006-02-13 | 2016-08-31 | 孟山都技术有限公司 | 用于产生改变的种子油组成的核酸构建体和方法 |
EP3287524A1 (en) | 2006-08-31 | 2018-02-28 | Monsanto Technology LLC | Phased small rnas |
EP2559767B1 (en) | 2006-10-12 | 2017-04-12 | Monsanto Technology LLC | Plant microRNAs and methods of use thereof |
AU2008218813B2 (en) | 2007-02-20 | 2014-04-17 | Monsanto Technology, Llc | Invertebrate microRNAs |
BRPI0810083B8 (pt) | 2007-03-28 | 2020-10-06 | Monsanto Technology Llc | métodos para estabelecer onde uma planta de soja ou semente de soja deve ser cultivada, de melhoramento da planta de soja, para selecionar uma semente de soja, de distribuição de uma planta de soja, para isolar sementes de soja de maturidade precoce indeterminada, e para determinar se uma planta de soja tem um grupo de maturidade |
BRPI0817848A2 (pt) * | 2007-10-12 | 2014-10-07 | Monsanto Technology Llc | Processos e composições para soja com alto rendimento com resistência a nematóides |
US9133475B2 (en) | 2008-11-26 | 2015-09-15 | Board Of Trustees Of Michigan State University | Aphid resistant soybean plants |
RS55986B1 (sr) | 2010-01-22 | 2017-09-29 | Bayer Ip Gmbh | Akaricidne i/ili insekticidne kombinacije aktivnih supstanci |
AU2011286320A1 (en) | 2010-08-06 | 2013-02-28 | Cornell Research Foundation, Inc. | Nematode resistant crops |
BR112013005431A2 (pt) * | 2010-09-08 | 2016-06-07 | Dow Agrosciences Llc | "evento 1606 de aad-12 e linhagens de soja transgênica relacionadas". |
WO2012059497A1 (en) | 2010-11-02 | 2012-05-10 | Bayer Cropscience Ag | N-hetarylmethyl pyrazolylcarboxamides |
WO2012061513A2 (en) | 2010-11-05 | 2012-05-10 | Agrigenetics, Inc. | Soybean markers linked to scn resistance |
CN103313971B (zh) | 2010-11-15 | 2015-12-02 | 拜耳知识产权有限责任公司 | N-芳基吡唑(硫代)甲酰胺 |
CN103380124A (zh) | 2010-12-29 | 2013-10-30 | 拜耳知识产权有限责任公司 | 杀真菌剂肟基-四唑衍生物 |
US20120192315A1 (en) * | 2011-01-13 | 2012-07-26 | Southern Illinois University Carbondale | Resistance genes and proteins active against fusarium root rots, cyst nematodes and soybean sudden death syndrome and methods employing same |
CA2832710C (en) * | 2011-04-15 | 2021-05-04 | Palle Pedersen | Method for controlling nematode pests |
US10246722B2 (en) | 2011-07-13 | 2019-04-02 | The Curators Of The University Of Missouri | Crop resistance to nematodes |
US9265252B2 (en) | 2011-08-10 | 2016-02-23 | Bayer Intellectual Property Gmbh | Active compound combinations comprising specific tetramic acid derivatives |
CA2792804A1 (en) * | 2011-10-18 | 2013-04-18 | Dow Agrosciences Llc | Materials and methods for detecting the aryloxyalkanoate dioxygenase gene (aad-12) containing event pdab4472-1606 in plants |
US10995342B2 (en) | 2012-05-11 | 2021-05-04 | Wisconsin Alumni Research Foundation | Rhg1 mediated resistance to soybean cyst nematode |
BR112014030017A2 (pt) * | 2012-05-30 | 2017-09-12 | Board Of Trustees Of Southern Illinois Univ | soja resistente aos nematódeos de cisto |
US20130337442A1 (en) * | 2012-06-15 | 2013-12-19 | Pioneer Hi-Bred International, Inc. | Genetic loci associated with soybean cyst nematode resistance and methods of use |
UY35049A (es) * | 2012-09-26 | 2014-04-30 | Syngenta Participations Ag | ?métodos y composiciones para incrementar la resistencia a nematodos en plantas, plantas, semillas y productos cosechados de las mismas?. |
US20140178866A1 (en) * | 2012-12-21 | 2014-06-26 | Pioneer Hi-Bred International, Inc. | Genetic loci associated with soybean cyst nematode resistance and methods of use |
US9464330B2 (en) | 2012-12-21 | 2016-10-11 | Pioneer Hi-Bred International, Inc. | Genetic loci associated with soybean cyst nematode resistance and methods of use |
US10253329B2 (en) | 2013-01-04 | 2019-04-09 | Board Of Trustees Of Michigan State University | Sources of aphid resistance in soybean plants |
SG10201708207PA (en) * | 2013-04-08 | 2017-11-29 | Malaysian Palm Oil Board | Gene controlling fruit color phenotype in palm |
CA2923296A1 (en) | 2013-10-25 | 2015-04-30 | Pioneer Hi-Bred International, Inc. | Stem canker tolerant soybeans and methods of use |
AR100520A1 (es) * | 2014-05-20 | 2016-10-12 | Monsanto Technology Llc | Métodos para mejorar la resistencia de las plantas a nemátodos de quiste de soja y composiciones de estos |
US11180795B1 (en) | 2015-06-02 | 2021-11-23 | Syngenta Participations Ag | Nematode resistance alleles in soybean |
MX2018001408A (es) | 2015-08-07 | 2018-03-15 | Bayer Cropscience Nv | Uso de anexina para para mejorar el rendimiento en condiciones de estres en plantas. |
CA3004914A1 (en) | 2016-02-05 | 2017-08-10 | Pioneer Hi-Bred International, Inc. | Genetic loci associated with brown stem rot resistance in soybean and methods of use |
US10455792B2 (en) | 2017-07-27 | 2019-10-29 | Tropical Melhoramento & Genetica | Soybean cultivar TMG4177 |
CN116445441B (zh) * | 2022-11-30 | 2023-11-03 | 东北农业大学 | 一种大豆的糖基转移酶及其编码基因与应用 |
CN117144056B (zh) * | 2023-10-31 | 2024-03-22 | 中国热带农业科学院三亚研究院 | 与番木瓜果实果糖积累相关的单倍型分子标记的应用 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5284948A (en) * | 1991-06-07 | 1994-02-08 | Eastman Kodak Company | Drug hapten analogues for immunoassays |
US5228992A (en) * | 1992-03-03 | 1993-07-20 | Pall Corporation | Process for preparing hollow fiber separatory devices |
US5491081A (en) * | 1994-01-26 | 1996-02-13 | Pioneer Hi-Bred International, Inc. | Soybean cyst nematode resistant soybeans and methods of breeding and identifying resistant plants |
US6162967A (en) * | 1994-01-26 | 2000-12-19 | Pioneer Hi-Bred International, Inc. | Positional cloning of soybean cyst nematode resistance genes |
AR005084A1 (es) * | 1995-12-15 | 1999-04-14 | Purdue Research Foundation | Metodo para producir una linea de plantas de soja resistente al nematodo de la vesicula de aire y metodos para examinar una planta, para trazar puntosgenomicos, para determinar en una semilla y para introducir dicha resistencia |
US6300541B1 (en) | 1997-01-14 | 2001-10-09 | Southern Illinois University | Soybean sudden death syndrome resistant soybeans, soybean cyst nematode resistant soybeans and methods of breeding and identifying resistant plants |
US6284948B1 (en) | 1998-05-18 | 2001-09-04 | Pioneer Hi-Bred International, Inc. | Genes and methods for control of nematodes in plants |
BR122014027339B1 (pt) | 2000-01-07 | 2017-01-17 | Monsanto Technology Llc | métodos para seleção de planta de soja tendo alelo de rhg4 resistente ao nematódeo do cisto da soja e para investigação de haplótipo de rhg4 de planta de soja, bem como método de seleção assistida por marcador de ácido nucleico em planta de soja para seleção de planta de soja tendo alelo que confere resistência ao nematódeo do cisto da soja |
US20020144310A1 (en) | 2000-01-28 | 2002-10-03 | Lightfoot David A. | Isolated polynucleotides and polypeptides relating to loci underlying resistance to soybean cyst nematode and soybean sudden death syndrome and methods employing same |
US6677250B2 (en) * | 2001-08-17 | 2004-01-13 | Micron Technology, Inc. | CVD apparatuses and methods of forming a layer over a semiconductor substrate |
-
2001
- 2001-01-05 BR BR122014027339A patent/BR122014027339B1/pt active IP Right Grant
- 2001-01-05 BR BRPI0107440-7A patent/BRPI0107440B1/pt active IP Right Grant
- 2001-01-05 WO PCT/US2001/000552 patent/WO2001051627A2/en active Application Filing
- 2001-01-05 AR ARP010100061A patent/AR026808A1/es not_active Application Discontinuation
- 2001-01-05 US US09/754,853 patent/US7154021B2/en not_active Expired - Lifetime
- 2001-01-05 AU AU27719/01A patent/AU2771901A/en not_active Abandoned
- 2001-01-05 CA CA2396359A patent/CA2396359C/en not_active Expired - Lifetime
-
2006
- 2006-03-27 US US11/389,017 patent/US7485770B2/en not_active Expired - Lifetime
- 2006-03-27 US US11/389,343 patent/US20060225150A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2001051627A3 (en) | 2002-06-20 |
BRPI0107440B1 (pt) | 2018-02-27 |
WO2001051627A2 (en) | 2001-07-19 |
AR026808A1 (es) | 2003-02-26 |
US7154021B2 (en) | 2006-12-26 |
CA2396359C (en) | 2019-09-17 |
US7485770B2 (en) | 2009-02-03 |
AU2771901A (en) | 2001-07-24 |
BR0107440A (pt) | 2003-03-25 |
US20060253919A1 (en) | 2006-11-09 |
US20060225150A1 (en) | 2006-10-05 |
US20030005491A1 (en) | 2003-01-02 |
CA2396359A1 (en) | 2001-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR122014027339B1 (pt) | métodos para seleção de planta de soja tendo alelo de rhg4 resistente ao nematódeo do cisto da soja e para investigação de haplótipo de rhg4 de planta de soja, bem como método de seleção assistida por marcador de ácido nucleico em planta de soja para seleção de planta de soja tendo alelo que confere resistência ao nematódeo do cisto da soja | |
ES2307491T3 (es) | Metodos y medios para la modificacion de caracteristicas de la planta usando la vernalizacion gen vrn2. | |
US7868149B2 (en) | Plant genome sequence and uses thereof | |
US7560542B2 (en) | Nucleic acid molecule SEQ ID NO. 68811 and other molecules associated with plants | |
US20080008996A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US7557201B2 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20110185455A1 (en) | Plant Genome Sequences and Uses Thereof | |
US20070150978A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20100269230A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20080113342A1 (en) | Plant Genome Sequence and Uses Thereof | |
US20040116682A1 (en) | Nucleic acid molecules and other molecules associated with the carbon assimilation pathway | |
US7572902B2 (en) | Nucleic acid molecules seq id No. 16372 and other molecules associated with plants | |
US20100186127A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20080114160A1 (en) | Plant Genome Sequence and Uses Thereof | |
US20080276334A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20080066199A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20080072348A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20130340112A1 (en) | Plant genome sequence and uses thereof | |
US20090307807A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US7919608B2 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20070283459A1 (en) | Nucleic acid molecules and other molecules associated with plants | |
US20090241228A1 (en) | Nucleic Acid Molecules and Other Molecules Associated with Plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B07A | Technical examination (opinion): publication of technical examination (opinion) [chapter 7.1 patent gazette] | ||
B06A | Notification to applicant to reply to the report for non-patentability or inadequacy of the application [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 17/01/2017, OBSERVADAS AS CONDICOES LEGAIS. |