Nothing Special   »   [go: up one dir, main page]

JP2003263465A - Method for designing/selecting protein-bonding peptide - Google Patents

Method for designing/selecting protein-bonding peptide

Info

Publication number
JP2003263465A
JP2003263465A JP2002062348A JP2002062348A JP2003263465A JP 2003263465 A JP2003263465 A JP 2003263465A JP 2002062348 A JP2002062348 A JP 2002062348A JP 2002062348 A JP2002062348 A JP 2002062348A JP 2003263465 A JP2003263465 A JP 2003263465A
Authority
JP
Japan
Prior art keywords
protein
peptide
selecting
designing
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002062348A
Other languages
Japanese (ja)
Inventor
Masaki Kobayashi
柾樹 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ENKAKU IRYO KENKYUSHO KK
Original Assignee
ENKAKU IRYO KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ENKAKU IRYO KENKYUSHO KK filed Critical ENKAKU IRYO KENKYUSHO KK
Priority to JP2002062348A priority Critical patent/JP2003263465A/en
Publication of JP2003263465A publication Critical patent/JP2003263465A/en
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To design and select a peptide, which bonds specifically and highly affinitively to a specific protein, as conveniently and rationally as possible through the assistance of a computer. <P>SOLUTION: According to this method for designing/selecting the protein-bonding peptide, the amino-acid sequence of a target protein and its three-dimensional molecular structure are inputted into the computer, hydrophobic potential (MHP) of surface points uniformly disposed on a solvent contacting surface of the molecular structure is calculated while this is two-dimensionally developed by a self-organization characterized map method, further an aggregating area of a hydrophobic amino-acid is identified by removing high frequency areas through Fourier transformation, and a peptide having a bonding property to an amino-acid sequence on the molecular structure corresponding to this aggregating area is designed/selected by using a qualitative structure activity correlation program of the computer. As the correlation program, it is possible to employ a program including processes for quantifying and Fourier- transforming the degree of hydrophobicity of each amino-acid residue on the molecular structure corresponding to the aggregating area of the hydrophobic amino-acid and selecting an amino-acid sequence expressing a complementary hydrophobicity period as against a displayed period. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、コンピュータを
利用した新規ペプチドの設計・選出方法に関し、詳細に
は、目標蛋白質(レセプター)におけるペプチドが結合
しうる領域(エピトープ)を同定し、このエピトープ配
列に結合しうる新規候補ペプチド(リガンド)を1以上
設計すると共に適当なものを選出し、また幾何学的・エ
ネルギー的評価による結合シミュレーション工程を含め
た蛋白質結合性ペプチドの設計・選出方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for designing and selecting a novel peptide using a computer, and in particular, it identifies a region (epitope) to which a peptide in a target protein (receptor) can bind and identifies this epitope sequence. The present invention relates to a method for designing / selecting a protein-binding peptide, including designing one or more novel candidate peptides (ligands) capable of binding to and selecting appropriate ones, and including a binding simulation step by geometric / energetic evaluation.

【0002】[0002]

【従来の技術】蛋白質と生理活性のあるペプチドを結合
させようとする場合に、特定の蛋白質に特異的に確実に
結合するペプチドを設計することができれば、薬剤を患
部や免疫機構などに到達させやすくなり、疾病の治療や
予防に大いに役立つと考えられる。
2. Description of the Related Art When attempting to bind a protein with a physiologically active peptide, if a peptide that can reliably bind with a specific protein can be designed, the drug can reach the affected area or the immune system. It will be easier and will be very useful for treatment and prevention of diseases.

【0003】従来のエピトープ配列に結合しうる新規候
補ペプチド(リガンド)の設計法としては、ブラロック
(Blalock)のグループが提唱したセンスーアンチセン
ス理論またはファシナ(Fassina)のグループが提唱し
た理論など幾例か報告されている。
Conventional methods for designing novel candidate peptides (ligands) capable of binding to an epitope sequence include the sense-antisense theory proposed by Blalock group and the theory proposed by Fassina group. Examples have been reported.

【0004】ブラロックらが提唱したセンス-アンチセ
ンス理論[Biochem. Biophys. Res. Commum.,121;203-20
7(1984)]は、あるペプチド(センスペプチド)をコード
するmRNAの塩基配列に相補的な塩基配列によってコード
されるペプチド(アンチセンスペプチド)がセンスペプ
チドと相互作用するという経験的に導かれた理論であ
る。
Sense-antisense theory proposed by Bralock et al. [Biochem. Biophys. Res. Commum., 121; 203-20]
7 (1984)] was empirically derived that a peptide (antisense peptide) encoded by a nucleotide sequence complementary to the nucleotide sequence of mRNA encoding a peptide (sense peptide) interacts with the sense peptide. It is a theory.

【0005】またファシナらが提唱した理論[Arch. Bio
chem. biophys.,296;137-143(1992)]は、あるペプチド
の各アミノ酸の持つ疎水度と、絶対値が同程度で正負が
逆のアミノ酸からなるペプチドが、元のペプチドと相互
作用するという経験的に導かれた理論である。
The theory proposed by Fasina et al. [Arch. Bio
chem. biophys., 296; 137-143 (1992)], a peptide consisting of amino acids whose absolute values are the same and whose positive and negative are the same as the hydrophobicity of each amino acid of a certain peptide interacts with the original peptide. Is an empirically derived theory.

【0006】また、エピトープ配列に結合しうる新規候
補ペプチド(リガンド)の設計法には、動物免疫で得られ
た標的蛋白質に対して特異的な抗体の超可変部配列(CD
R)を、模倣して設計を行う方法などもある。
[0006] Further, a method of designing a novel candidate peptide (ligand) capable of binding to an epitope sequence is described in the hypervariable region sequence (CD) of an antibody specific to a target protein obtained by animal immunization.
There is also a method of designing by imitating R).

【0007】幾何学的評価による結合シミュレーション
は、多くの場合、剛体モデルでレセプターとリガンドを
設定する。剛体モデルは、本来、柔軟性を持って多様な
コンフォメーション変化を取りうる蛋白質またはペプチ
ドの主鎖や側鎖を、敢えて固定したモデルである。
[0007] In many cases, the geometrical evaluation of binding simulation sets a receptor and a ligand in a rigid body model. The rigid body model is a model in which the main chain or side chain of a protein or peptide, which is originally flexible and capable of undergoing various conformational changes, is intentionally fixed.

【0008】幾何学的評価では多くの場合、蛋白質であ
れば3次元立体構造を標準とし、ペプチドであればエネ
ルギー的に最適化した構造を標準として剛体モデルを導
き、この剛体モデルを用いてレセプター/リガンドの結
合シミュレーションを行っている。
In the geometrical evaluation, in many cases, a rigid body model is derived by using a three-dimensional three-dimensional structure as a standard for proteins, and an energy-optimized structure as a standard for peptides, and using this rigid body model, receptors are used. / We are performing a ligand binding simulation.

【0009】理想的には、柔体モデルを用いてレセプタ
ー/リガンドの結合シミュレーションを行なうことが好
ましいが、その場合には蛋白質やリガンドが取りうる構
造上の多様性によって計算コストが莫大になり実用性が
低下する。
Ideally, it is preferable to perform a receptor / ligand binding simulation using a soft body model, but in that case, the computational cost becomes enormous due to the structural diversity that can be taken by proteins and ligands. Sex decreases.

【0010】エネルギー的に結合シミュレーションを評
価するには、溶媒中のレセプター/リガンド複合体の自
由エネルギーの安定性をみる。具体的には水素結合、イ
オン結合(静電的結合)、疎水性結合、ファンデルワー
ルス結合が、エネルギー的にレセプター/リガンド複合
体の結合シミュレーションに関与するので、これらを総
合的に加味して自由エネルギーを算出して評価する。
To evaluate energetically binding simulations, one looks at the stability of the free energy of the receptor / ligand complex in a solvent. Specifically, hydrogen bonds, ionic bonds (electrostatic bonds), hydrophobic bonds, and van der Waals bonds are energetically involved in the binding simulation of the receptor / ligand complex. Calculate and evaluate free energy.

【0011】エネルギー的評価をする場合にも、幾何学
的評価をする場合と同様に柔体モデルを用いる方が理想
的である。複合体空間を全て満たすような結合シミュレ
ーションは、蛋白質を剛体モデルと仮定しても、最低6
方向の自由度を考慮に入れる必要があるからである。
In the energy evaluation, it is ideal to use the soft body model as in the geometric evaluation. The binding simulation that fills the entire complex space is at least 6 even if the protein is assumed to be a rigid body model.
This is because it is necessary to take the degree of freedom of direction into consideration.

【0012】しかし、柔体モデルでシミュレーションす
ると、側鎖の自由度だけ計算量が指数関数的に増加する
ため、計算コストが膨大になり現実的ではなくなる。
However, when the simulation is performed using a soft body model, the amount of calculation exponentially increases by the degree of freedom of the side chain, and the calculation cost becomes enormous, which is not realistic.

【0013】そのため、ほとんどの場合にリガンドを低
分子化合物として実施しており、リガンドをペプチドと
して評価できるシステムは少ない。また、多くのシステ
ムは、剛体モデルで評価し、あるいは一部の側鎖のみ自
由度を与えて評価を行なっている。
Therefore, in most cases, the ligand is used as a low molecular weight compound, and few systems can evaluate the ligand as a peptide. In addition, many systems evaluate by using a rigid body model or by giving degrees of freedom only to some side chains.

【0014】[0014]

【発明が解決しようとする課題】上記したように従来技
術では、作業者の経験に依存する部分が多く、論理的に
導くことができないか、または再現性をもって妥当な領
域を同定できない事が多い。
As described above, in the prior art, there are many parts that depend on the experience of the operator, and it is often impossible to logically guide them, or it is often impossible to identify a valid region with reproducibility. .

【0015】また、目的とする蛋白質結合性ペプチドを
実際に得るためには、高価で長時間を要する実験的手段
であるペプチドライブラリ等からスクリーニングする手
法を採用し、または実験者の経験的判断からペプチド配
列を選択することが行なわれる。
Further, in order to actually obtain the target protein-binding peptide, a method of screening from a peptide library or the like, which is an expensive and long-term experimental means, is adopted, or from the empirical judgment of the experimenter. Selection of the peptide sequence is performed.

【0016】幾何学的評価の段階では、シミュレーショ
ン時に剛体モデルを用いる場合が多いため、試験管内実
験の結果がシミュレーションの結果を反映しないケース
が存在する。エネルギー的評価の段階では、溶媒環境も
含めて未だにシミュレーションでカバーしきれない要素
が存在し、試験管内実験の結果がシミュレーションの結
果とは相違する場合や実験環境を考慮できない場合もあ
る。
At the geometrical evaluation stage, a rigid body model is often used during simulation, and therefore there are cases where the results of the in-vitro experiment do not reflect the results of the simulation. At the stage of energetic evaluation, there are elements that cannot be covered by simulation, including the solvent environment, and the results of in vitro experiments may differ from the results of simulation or the experimental environment may not be taken into consideration.

【0017】このように特定蛋白質に対して特異的にか
つ高親和的に結合するペプチドを設計および選出するこ
とは容易なことではなく、簡略な手段で確実に所期した
機能を有するペプチドを設計しさらに選出できる方法が
要望されていた。
Thus, it is not easy to design and select a peptide that specifically binds to a specific protein with high affinity, and a peptide having a certain function can be designed by a simple means. However, there was a demand for a method of further selection.

【0018】そこで、この発明の課題は、上記した問題
点を解決して、特定蛋白質に対して特異的かつ高親和的
に結合するペプチドをコンピュータの支援によって可及
的に簡便かつ合理的に設計し、得られたペプチドは実用
化できるペプチド配列を設計しかつ選出することを課題
としている。
Therefore, an object of the present invention is to solve the above-mentioned problems and design a peptide that binds specifically and with high affinity to a specific protein as easily and rationally as possible with the aid of a computer. However, the subject of the obtained peptides is to design and select a peptide sequence that can be put to practical use.

【0019】[0019]

【課題を解決するための手段】上記の課題を解決するた
めに、この発明においては、標的蛋白質のアミノ酸配列
およびその立体分子構造をコンピュータに入力し、前記
立体分子構造の溶媒接触表面上に均等に配置した表面点
の疎水性ポテンシャル(MHP)を算出すると共に、こ
れを自己組織化特徴地図法によって2次元に展開し、さ
らにフーリエ変換によって高周波領域を除去することに
より疎水性アミノ酸の集合領域を特定し、この領域に対
応する前記立体分子構造上のアミノ酸配列に対して結合
性を有するペプチドを、コンピュータの定量的構造活性
相関プログラムで設計および選出することからなる蛋白
質結合性ペプチドの設計・選出方法としたのである。
In order to solve the above-mentioned problems, in the present invention, the amino acid sequence of a target protein and its three-dimensional molecular structure are input to a computer, and the three-dimensional molecular structure is evenly distributed on the solvent contact surface. The hydrophobic potential (MHP) of the surface points arranged on the surface is calculated, and it is two-dimensionally developed by the self-organizing feature map method, and the high-frequency region is removed by Fourier transform to determine the aggregate region of the hydrophobic amino acids. Design and selection of a protein-binding peptide, which comprises identifying and designing a peptide having a binding property to the amino acid sequence on the above-mentioned three-dimensional molecular structure corresponding to this region by a computer-based quantitative structure-activity relationship program It was a method.

【0020】上記した定量的構造活性相関プログラム
は、疎水性アミノ酸の集合領域に対応する立体分子構造
上のアミノ酸配列の各アミノ酸残基の疎水度を定量化し
てフーリエ変換し、表示される周期に対して相補的な疎
水度の周期を示すアミノ酸配列を選出する工程を含むプ
ログラムを採用することが好ましい。
The above-mentioned quantitative structure-activity relationship program quantifies the hydrophobicity of each amino acid residue of the amino acid sequence in the three-dimensional molecular structure corresponding to the aggregated region of hydrophobic amino acids, Fourier transforms it, and displays it in the displayed cycle. It is preferable to employ a program including a step of selecting an amino acid sequence having a complementary hydrophobicity cycle.

【0021】また、前記した疎水性ポテンシャル(MH
P)は、下記の式(2)で示される値である。
Further, the above-mentioned hydrophobic potential (MH
P) is a value represented by the following formula (2).

【0022】[0022]

【数2】 [Equation 2]

【0023】また、前記したコンピュータの定量的構造
活性相関プログラムは、遺伝的アルゴリズムの組み込ま
れた定量的構造活性相関プログラムであることが好まし
い。
The computer-based quantitative structure-activity relationship program is preferably a quantitative structure-activity relationship program incorporating a genetic algorithm.

【0024】蛋白質−ペプチド複合体の結合シュミレー
ションは、幾何学的評価による剛体モデルについて行な
い、次いで蛋白質−ペプチド間の相互作用エネルギーに
ついて行なうことが好ましく、これらのシュミレーショ
ンで評価されたペプチドを選択する工程を含む蛋白質結
合性ペプチドの設計・選出方法を採用できる。
The binding simulation of the protein-peptide complex is preferably carried out on a rigid body model by geometrical evaluation, and then on the protein-peptide interaction energy, and a step of selecting peptides evaluated by these simulations. A method of designing and selecting a protein-binding peptide containing

【0025】[0025]

【発明の実施の形態】蛋白質結合性ペプチドの設計およ
び選出を行う各段階の基本的なフローチャートを図1に
示す。
BEST MODE FOR CARRYING OUT THE INVENTION A basic flow chart of each step for designing and selecting a protein-binding peptide is shown in FIG.

【0026】コンピュータ上のプログラムは、C言語を
用いて作成し、開発環境はUNIX(R)で行なえる。プロ
グラムは主に、ペンティアム(R)II 500MHz、メモリ
ー 256M、FreeBSD 2.2.8RELEASE上で実行でき、SunOS、
Solaris、IRIX上での動作が確認されている。
The program on the computer can be created using C language, and the development environment can be UNIX (R). The program mainly runs on Pentium (R) II 500MHz, memory 256M, FreeBSD 2.2.8 RELEASE, SunOS,
Operation on Solaris and IRIX has been confirmed.

【0027】図2(b)の標的蛋白質表面上のペプチド
が結合しうる領域の同定(SD-LIME)は、本願の発明者
らが称するSD-LIME(Search Domain-Leading Interacti
on system for Molecular Evaluation)法により行なう
が、この方法は、標的蛋白質表面において、物理化学的
な特徴(疎水的特徴、静電的特徴)をもつ領域がエピト
ープになり易いことに着目したものであり、高精度に標
的蛋白質表面上のペプチドが結合しうる領域を同定する
ことが可能である。SD-LIME法の性能については、蛋白
質間相互作用の結合面推測試験において、X線結晶構造
解析モデルとの比較から示唆することができる。
Identification of a region to which a peptide on the surface of the target protein shown in FIG. 2 (b) can bind (SD-LIME) is carried out by the inventors of the present application, SD-LIME (Search Domain-Leading Interacti).
on system for molecular evaluation), but this method focuses on the fact that a region having physicochemical characteristics (hydrophobic characteristic, electrostatic characteristic) on the surface of the target protein is likely to become an epitope. , It is possible to identify with high accuracy a region to which a peptide on the surface of a target protein can bind. The performance of the SD-LIME method can be suggested by comparison with the X-ray crystal structure analysis model in the binding surface inference test of protein-protein interaction.

【0028】まず、SD-LIME法を利用してペプチドを設
計する場合には、目標蛋白質(レセプター)におけるペプ
チドが結合しうる領域(エピトープ)を同定するため、
標的蛋白質の3次元立体構造の情報を必要とする。
First, when a peptide is designed using the SD-LIME method, in order to identify a region (epitope) to which the peptide in the target protein (receptor) can bind,
It requires information on the three-dimensional structure of the target protein.

【0029】多くの蛋白質の3次元立体構造データは、
X線結晶解析技術、NMR構造解析技術などで報告され
ており、一般的に登録が公開されており、自由に3次元
情報を入手できる。
The three-dimensional structure data of many proteins are
It has been reported by X-ray crystal analysis technology, NMR structure analysis technology, etc., and the registration is open to the public, and three-dimensional information can be freely obtained.

【0030】また、蛋白質の3次元構造が発表されてい
ない場合には、ホモロジーモデリング法、3D−1D法
などの一般的に用いられている3次元構造予測方法で、
標的蛋白質(レセプター)の3次元構造を取得すればよ
い。
If the three-dimensional structure of the protein has not been published, a homology modeling method, a 3D-1D method or the like, which is a commonly used three-dimensional structure prediction method,
The three-dimensional structure of the target protein (receptor) may be acquired.

【0031】そして、ペプチドが結合しうる領域は、標
的蛋白質(レセプター)の表面、すなわち溶媒と接してい
る面内にある。そのような条件に適合する領域を発見す
るには、溶媒接触表面において溝状(Groove)または穴
状(Cavity)を形成している領域を、蛋白質3次元立体
構造から視覚的またはプログラム的に探索し、ペプチド
が結合しうる領域とする。表面域において疎水的な性質
を持ったアミノ酸が比較的集合している領域や、動物免
疫を行なって作製された抗体がエピトープとして認識し
た領域をペプチドが結合しうる領域とすることもでき
る。
The region to which the peptide can bind is on the surface of the target protein (receptor), that is, in the plane in contact with the solvent. In order to find a region that meets such conditions, a region that forms a groove (Groove) or a hole (Cavity) on the solvent-contacting surface is searched visually or programmatically from the three-dimensional structure of the protein. The region to which the peptide can bind. A region in which amino acids having hydrophobic properties are relatively aggregated in the surface region, or a region recognized as an epitope by an antibody prepared by immunizing an animal can be a region to which a peptide can bind.

【0032】好適な例としては、図2に示すように、9
2点法を用いて溶媒分子の半径を1.4Åとし、レセプ
ターの分子表面点の計算を行い、溶媒接触表面(図2
(a))に均等に配置されるグリッドを作成する(図2
(b))。表面点(ポイントM)上において疎水性ポテ
ンシャル(MHP)の計算を行なうには、以下の計算式の
〔式3〕に従う[J. Biol. Chem.,266(24),16120-16127,
1991.]。
As a preferred example, as shown in FIG.
Using the two-point method, the radius of the solvent molecule is set to 1.4 Å, the molecular surface point of the receptor is calculated, and the solvent contact surface (Fig. 2) is calculated.
Create grids that are evenly arranged in (a) (Fig. 2).
(B)). In order to calculate the hydrophobic potential (MHP) on the surface point (point M), follow [Equation 3] of the following equation [J. Biol. Chem., 266 (24), 16120-16127,
1991.].

【0033】[0033]

【数3】 [Equation 3]

【0034】[0034]

【表1】 [Table 1]

【0035】学習回数を2000回として表面点(グリ
ッドの格子点)上の位置とMHP値とを対応させた自己
組織化特徴地図を作成する。
The learning number is set to 2000, and a self-organizing feature map in which the positions on the surface points (grid points of the grid) are associated with the MHP values is created.

【0036】そして、図3(a)に示すように、自己組
織化特徴地図法によって2次元に転換し、必要に応じて
スペクトラに変換する。
Then, as shown in FIG. 3 (a), it is converted into a two-dimensional shape by the self-organizing feature map method, and converted into a spectrum if necessary.

【0037】自己組織化特徴地図法は、競合学習型ニュ
ーラルネットワーク法とも別称され文献(Kohonen, T.:
Self-organization and Associative Memory,Springer
-Verlag(1988)、Kohonen, T.: The Self-Organizing Ma
p, Proc. IEEE 78(9),1464-1480(1990))等により良く
知られたパターン認識法の一種である。
The self-organizing feature map method is also referred to as a competitive learning type neural network method (Kohonen, T .:
Self-organization and Associative Memory, Springer
-Verlag (1988), Kohonen, T .: The Self-Organizing Ma
p, Proc. IEEE 78 (9), 1464-1480 (1990)), etc., which is a type of pattern recognition method well known.

【0038】ニューラルネットワーク法は、データから
学習することを特徴とし、バラエティに富んだデータの
中に隠れた共通の特徴を学習により抽出できる方法であ
る。
The neural network method is characterized by learning from data, and is a method capable of extracting a common feature hidden in a variety of data by learning.

【0039】この方法では、ニューロンが1次元ないし
2次元的なつながりをもって配置されていることによ
り、競合によって勝ち残ったニューロンだけでなく、そ
の近傍にあるニューロンも同時に学習を行うというパタ
ーン認識を行なうことを特徴としている。この方法によ
れば、入力データの元の空間における相互関係を、ニュ
ーロンによる1次元または2次元的なつながりをもつマ
ップに写像することが可能である。
In this method, since the neurons are arranged in a one-dimensional or two-dimensional connection, it is possible to perform pattern recognition in which not only the neurons that have survived due to the competition but also the neurons in the vicinity of the neurons simultaneously learn. Is characterized by. According to this method, it is possible to map the mutual relationship of the input data in the original space into a map having one-dimensional or two-dimensional connections by the neurons.

【0040】次に、所定レベルの周波までを特徴部分と
するFFT処理を行ない(図3(b))、すなわち、所
定の閾値(たとえば、平均値)以上の領域、つまり親水
傾向にある領域を除去し、疎水性の高い領域のみをクラ
ス分けする処理を行なうと、クラスタ化されたマップを
得ることができる(図3(c))。
Next, FFT processing is performed with a characteristic portion up to a predetermined level of frequency (FIG. 3 (b)), that is, an area above a predetermined threshold value (for example, an average value), that is, an area that tends to be hydrophilic. By removing and classifying only the highly hydrophobic region, a clustered map can be obtained (FIG. 3C).

【0041】このようにクラスタ化された自己組織化特
徴地図を3次元座標に逆写像することによって、標的蛋
白質表面上のペプチドが結合しうる領域(図2(b)の
黒色部分が密集している領域)の同定が可能となる。
By inversely mapping the clustered self-organizing feature map into three-dimensional coordinates, the regions on the surface of the target protein to which peptides can bind (black portions in FIG. 2 (b) are densely gathered. Area) can be identified.

【0042】次に、特定された領域に対応する立体分子
構造上のアミノ酸配列に対して結合性を有するペプチド
を、コンピュータの定量的構造活性相関プログラムで設
計および選出する。
Next, a peptide having a binding property to the amino acid sequence on the stereomolecular structure corresponding to the specified region is designed and selected by a computer-based quantitative structure-activity relationship program.

【0043】ここで、アミノ酸配列に対して特異的に結
合しうるペプチドの候補を設計する方法として、PC-LIM
E(Phase C-Leading Interaction system for Molecula
r Evaluation)法と称される方法を採用できる。
Here, as a method for designing a peptide candidate capable of specifically binding to an amino acid sequence, PC-LIM is used.
E (Phase C-Leading Interaction system for Molecula
r Evaluation) method can be adopted.

【0044】通常、各アミノ酸残基にはそれぞれ異なっ
た性質があり、その性質がペプチドまたは蛋白質の働き
を支配している。各アミノ酸残基の特徴は電気的または
幾何学的など様々な観点からみることができるので、1
つのアミノ酸に対し、その特徴について相対的に数値の
定量化が可能である。
Usually, each amino acid residue has different properties, and these properties govern the action of the peptide or protein. Since the characteristics of each amino acid residue can be seen from various points of view such as electrical or geometric,
Numerical quantification of the characteristics of one amino acid is possible.

【0045】PC-LIME法ではペプチドの情報として与え
られた各アミノ酸残基の疎水度を定量化し、フーリエ変
換してその結果を周期性グラフとして表示させる。疎水
度で評価する理由は、疎水性残基と親水性残基がその物
理化学的性質から周期的に存在することが明らかになっ
ているからである。候補ペプチドの設計では、この周期
に対して相補的な周期を示す配列を選出する。
In the PC-LIME method, the hydrophobicity of each amino acid residue given as peptide information is quantified, Fourier transformed, and the result is displayed as a periodicity graph. The reason for evaluating the degree of hydrophobicity is that it has become clear that hydrophobic residues and hydrophilic residues are present periodically due to their physicochemical properties. In designing a candidate peptide, a sequence showing a cycle complementary to this cycle is selected.

【0046】定量的構造活性相関プログラムは、遺伝的
アルゴリズムの組み込まれた定量的構造活性相関プログ
ラムであることが好ましい。詳細には、候補ペプチドの
周期に対して、多く存在する相補性を示すペプチド配列
の中から選択する場合に、生物界の進化を模倣した遺伝
的アルゴリズムを計算式に取り入れることにより、効率
よく候補ペプチドを絞り込む。
The quantitative structure-activity relationship program is preferably a quantitative structure-activity relationship program incorporating a genetic algorithm. Specifically, when selecting from peptide sequences showing abundant complementarity to the cycle of a candidate peptide, a genetic algorithm that mimics the evolution of the living world is incorporated into the calculation formula to efficiently select candidates. Narrow down the peptides.

【0047】遺伝的アルゴリズムによれば、選択(進化
すべき評価の高いペプチドを選択し、次世代へ情報が継
続される)、交叉(選択されたペプチドの中から2つに
分離して、交配を行い新規ペプチドを作成する)、突然
変異(ある確率で選択されたペプチドのアミノ酸配列中
にある残基を他の残基に置き換えて新規ペプチドを作成
する)のサイクルを繰り返し、候補ペプチドを選出す
る。
According to the genetic algorithm, selection (selection of highly evaluated peptides to be evolved, information is continued to the next generation), crossover (separation into two out of the selected peptides and mating) To create a new peptide) and mutation (create a new peptide by replacing a residue in the amino acid sequence of the selected peptide with another residue with a certain probability), and select a candidate peptide. To do.

【0048】このようなPC-LIME法の他の特徴として
は、実験的データのフィードバックにより、標的蛋白質
によく対応できるように、自らの工程を進化させること
も可能な利点もある。
Another feature of the PC-LIME method is that it is possible to evolve its own process by feeding back experimental data so that it can respond well to the target protein.

【0049】具体的には、標的蛋白質または標的一次配
列が、何らかの独自な物理化学的特徴を有する場合、当
業者の周知の技術によりQSAR(定量的構造活性相
関)モデルを作成し、各標的に対応させることができ
る。
Specifically, when the target protein or target primary sequence has some unique physicochemical characteristics, a QSAR (quantitative structure activity relationship) model is prepared by a technique well known to those skilled in the art, Can be adapted.

【0050】例えば、あるレセプター/リガンド間の結
合に、重要な周波数の存在がQSARモデルから判明し
た場合、本方法の遺伝的アルゴリズムの工程において、
目的の周波数を優先的に淘汰されない様な工程に変える
ことが可能である。この作業を行なえば、各標的の蛋白
質に対してより最適なペプチド設計が可能である。
For example, if the presence of an important frequency for binding between a receptor / ligand is found from the QSAR model, then in the step of the genetic algorithm of the present method,
It is possible to change the target frequency to a process that is not preferentially selected. If this work is performed, more optimal peptide design can be performed for each target protein.

【0051】次に、蛋白質−ペプチド複合体の結合シュ
ミレーションは、先ず幾何学的評価による剛体モデルで
行ない、次に蛋白質−ペプチド間の相互作用エネルギー
について行なうことが好ましく、これらのシュミレーシ
ョンで評価されたペプチドを選択する工程を含む蛋白質
結合性ペプチドの設計・選出方法とする。
Next, it is preferable that the binding simulation of the protein-peptide complex is first performed by a rigid body model by geometrical evaluation, and then the interaction energy between the protein and peptide is evaluated. A method for designing and selecting a protein-binding peptide including a step of selecting a peptide.

【0052】この発明における幾何学的評価による剛体
モデルについて行なう蛋白質−ペプチド複合体の結合シ
ュミレーションは、発明者らがGD-LIME(Geometrical D
ocking-Leading Interaction system for Molecular Ev
aluation)法と称する方法を採用できるが、他の周知の
結合シュミレーションを採用することもできる。剛体モ
デルについて行なう蛋白質−ペプチド複合体の結合シュ
ミレーションは、次段階でエネルギー評価を行なう際の
初期位置の探索を行うことにも役立つので重要である。
The binding simulation of the protein-peptide complex performed on the rigid body model by the geometrical evaluation in the present invention was carried out by the inventors of the present invention by GD-LIME (Geometrical D
ocking-Leading Interaction system for Molecular Ev
The method referred to as “aluation” method can be adopted, but other well-known coupling simulation can also be adopted. The binding simulation of the protein-peptide complex performed on the rigid body model is important because it also helps to search for the initial position when performing energy evaluation in the next step.

【0053】この発明では、次の段階でTD-LIME(Total
Docking-Leading Interaction system for Molecular E
valuation)法という蛋白質−ペプチド複合体の結合シュ
ミレーションを行なうが、この方法は、リガンドの主鎖
および側鎖共に自由度を与え、レセプター側は側鎖に自
由度を与えてエネルギー評価を行なうという方法であ
る。
In the present invention, TD-LIME (Total
Docking-Leading Interaction system for Molecular E
valuation) method, which is a simulation of binding of a protein-peptide complex. This method gives a degree of freedom to both the main chain and side chain of the ligand, and gives a degree of freedom to the side chain on the receptor side to perform energy evaluation. Is.

【0054】いくつかの蛋白質においては、その相互作
用時にシステイン間に見られるS−S結合のような共有
結合を構成するものもあるが、多くの場合は、非共有結
合で複合体構造が構築される。蛋白質間相互作用におい
て主となる非共有結合は、水素結合、イオン結合(静電
的結合)、疎水性結合、ファンデルワールス結合であ
る。
Some proteins form covalent bonds such as S—S bonds found between cysteines during their interaction, but in many cases, a non-covalent bond forms a complex structure. To be done. The main non-covalent bonds in protein-protein interactions are hydrogen bonds, ionic bonds (electrostatic bonds), hydrophobic bonds, and van der Waals bonds.

【0055】これらの結合は、共有結合に比較して弱い
結合力であるが、それら多くの相互作用が安定な複合体
構造を構成する。さらにこのような結合は、非常に短い
距離(10 Å以下)において顕著に観測される。この事
実は生体高分子間相互作用の特異的な特徴の多くを反映
している。
Although these bonds have a weaker binding force than covalent bonds, many of these interactions constitute a stable complex structure. Furthermore, such coupling is noticeable at very short distances (10 Å or less). This fact reflects many of the unique features of biopolymer interactions.

【0056】この発明では、蛋白質−ペプチド間の相互
作用エネルギーについて行なうシュミレーションとし
て、蛋白質の溶媒との相互作用も明確に考慮した新しい
レセプター/リガンド間相互作用モデルを提案し、溶媒
中での複合体エネルギーを求める。
The present invention proposes a new receptor / ligand interaction model in which the interaction between a protein and a solvent is clearly taken into consideration as a simulation for the interaction energy between a protein and a peptide, and a complex in a solvent is proposed. Seeking energy.

【0057】溶媒から蛋白質表面上に加わる圧力により
生じるエネルギーはpΔVを評価することによって計算で
きる。ΔVは複合体構造変化による溶媒除外体積の変化
である。本発明におけるこのエネルギーは、除外体積計
算のための解析的アルゴリズムを組み込んだ方法によっ
て計算する。
The energy produced by the pressure exerted by the solvent on the protein surface can be calculated by evaluating pΔV. ΔV is the change in solvent excluded volume due to the change in the structure of the complex. This energy in the present invention is calculated by a method incorporating an analytical algorithm for calculating the excluded volume.

【0058】まず、与えられた複合体構造中にある原子
のΔV(溶媒除外体積の変化)を計算する。
First, ΔV (change in solvent excluded volume) of atoms in a given complex structure is calculated.

【0059】そして運動エネルギー項を計算するために
これらの値を用いる。複合体表面にかかる溶媒からの圧
力によって生じるエネルギーは次のように計算される。
These values are then used to calculate the kinetic energy term. The energy generated by the pressure from the solvent on the surface of the complex is calculated as follows.

【0060】[0060]

【数4】 [Equation 4]

【0061】ここで、kBはボルツマン定数、Tは絶対
温度、ρは原子個数濃度、G(r)は空洞形成自由エネルギ
ー、G(ri c)は原子iによる空洞形成エネルギーである。
空洞半径をri c空洞体積の変化をΔVi cとする。
Here, k B is the Boltzmann constant, T is the absolute temperature, ρ is the number concentration of atoms, G (r) is the free energy of cavity formation, and G (r i c ) is the energy of cavity formation by atom i.
Let the cavity radius be r i c Let the change in cavity volume be ΔV i c .

【0062】疎水性相互作用エネルギーは、複合体表面
への圧力、複合体を構成する蛋白質間の全ての原子ペア
間のファンデルワールス相互作用と溶媒と蛋白質間のフ
ァンデルワールス相互作用からなる。蛋白質間のファン
デルワールス相互作用エネルギーは、次のポテンシャル
によって計算される。
The hydrophobic interaction energy consists of pressure on the surface of the complex, van der Waals interaction between all atom pairs between the proteins constituting the complex, and van der Waals interaction between the solvent and the protein. The van der Waals interaction energy between proteins is calculated by the following potential.

【0063】[0063]

【数5】 [Equation 5]

【0064】式中、Nは全原子数Aij, Bijは原子ペアに
依存するパラメータである。
In the equation, N is the total number of atoms A ij and B ij are parameters depending on the atom pair.

【0065】複合体と溶媒間のファンデルワールス相互
作用エネルギーの計算コスト低減のために、次の近似式
を用いてもよい。
To reduce the calculation cost of the van der Waals interaction energy between the complex and the solvent, the following approximate expression may be used.

【0066】[0066]

【数6】 [Equation 6]

【0067】aは原子種、SASAは溶媒接触面積を示
す。ここでは回帰分析法の1つであるPLS法を用いた
本願の発明者らの提案するパラメータを用いた。
“A” represents an atomic species, and SASA represents a solvent contact area. Here, the parameters proposed by the inventors of the present application using the PLS method, which is one of the regression analysis methods, were used.

【0068】[0068]

【表2】 [Table 2]

【0069】これは次の式を元に間接的に実験値として
のGvdwを算出している。
This indirectly calculates G vdw as an experimental value based on the following equation.

【0070】[0070]

【数7】 [Equation 7]

【0071】これを次のように表す。This is expressed as follows.

【0072】[0072]

【数8】 [Equation 8]

【0073】Gsol、Gcav、Gpolはそれぞれ溶媒和エネル
ギー、空洞形成エネルギー、静電相互作用エネルギーを
示す。Gsolは実験値を用い、残りの項は計算より算出し
たものを使用した。これにより、Gcav、Gpolを正しいと
仮定することにより間接的にGvdwを計算することができ
る。以上より、全Evdwは次のようになる。
G sol , G cav , and G pol represent solvation energy, cavity formation energy, and electrostatic interaction energy, respectively. For G sol , experimental values were used, and the remaining terms were calculated. By this, G vdw can be indirectly calculated by assuming that G cav and G pol are correct. From the above, all E vdw are as follows.

【0074】[0074]

【数9】 [Equation 9]

【0075】さらに、疎水性相互作用は、溶媒圧力とフ
ァンデルワールス相互作用の和として以下の式のように
定義される。
Further, the hydrophobic interaction is defined as the sum of the solvent pressure and the Van der Waals interaction as follows.

【0076】[0076]

【数10】 [Equation 10]

【0077】この発明では、溶媒分子と全ての複合体を
構成する原子により生じる静電相互作用ポテンシャルを
計算するために、次の式を採用した。
In the present invention, the following formula is adopted to calculate the electrostatic interaction potential generated by the solvent molecules and the atoms forming all the complexes.

【0078】[0078]

【数11】 [Equation 11]

【0079】ここで、Gelは静電相互作用エネルギーを
示す。Nは複合体を構成する全原子数であり、qiqjは原
子の点電荷、diは原子間距離、αiは原子iの空洞又はBo
rn半径である。上記式の第1項は、2つの項に分けるこ
とができ、1つは真空中におけるクーロンの法則を示
し、第2項は帯電した粒子ペアの誘電体効果を示してい
る。
Here, G el represents electrostatic interaction energy. N is the total number of atoms forming the complex, q i q j is the point charge of the atom, d i is the interatomic distance, α i is the cavity of atom i or Bo
rn is the radius. The first term of the above equation can be divided into two terms, one showing Coulomb's law in vacuum and the second term showing the dielectric effect of charged particle pairs.

【0080】[0080]

【数12】 [Equation 12]

【0081】因みに、上記した式12の第2項、第3項
はソリューション・ケミストリ(Solution Chemistry)
分野における一般Born(GB)式またはGpolである複合体-
溶媒間静電分極エネルギーとして次のように表すことが
できる。各記号の意味は上記同様である。
Incidentally, the second and third terms of the above equation 12 are the Solution Chemistry.
General Born (GB) formula or G pol complex in the field-
It can be expressed as the electrostatic polarization energy between solvents as follows. The meaning of each symbol is the same as above.

【0082】[0082]

【数13】 [Equation 13]

【0083】水素結合エネルギーは、以下のポテンシャ
ルを用いた。このポテンシャルは現実的でない短い距
離、かつ非常に強い水素結合を反発項によって防ぐこと
ができるという利点がある。
The following potential was used as the hydrogen bond energy. This potential has the advantage that a very short hydrogen bond and a very strong hydrogen bond can be prevented by the repulsive term.

【0084】[0084]

【数14】 [Equation 14]

【0085】Cij,Dijは水素結合ペアに依存するパラメ
ータである。
C ij and D ij are parameters depending on the hydrogen bond pair.

【0086】生体高分子の結合は単量体間の配座変化に
よってもたらされる。この項は相互作用をしている蛋白
質間の内部エネルギーの変化を考慮するために採用し
た。しかしながら、この項は蛋白質結合サイトの側鎖に
のみ適用している。蛋白質内の主鎖は固定している。結
果として、結合、変角エネルギーはこの段階では考慮し
ていない。ねじれエネルギーはMM3力場のものを採用し
た。
The binding of biopolymers is brought about by conformational changes between the monomers. This term was adopted to take into account changes in internal energy between interacting proteins. However, this section applies only to the side chains of protein binding sites. The backbone of the protein is fixed. As a result, bond and bending energy are not considered at this stage. The twisting energy used is that of the MM3 force field.

【0087】[0087]

【数15】 [Equation 15]

【0088】ここで、Vは二面角を形成する原子種に依
存するパラメータである。蛋白質の溶媒和エネルギー、
脱溶媒和(desolvation)エネルギーが提案されてい
る。
Here, V is a parameter that depends on the atomic species forming the dihedral angle. Protein solvation energy,
Desolvation energies have been proposed.

【0089】[0089]

【数16】 [Equation 16]

【0090】ここで、Δσは、原子種に依存するパラメ
ータ(Atomic Solvation Parameters (ASP))であり、
Nは全原子数である。
Where Δσ is an atomic species dependent parameter (Atomic Solvation Parameters (ASP)),
N is the total number of atoms.

【0091】この発明において疎水性相互作用エネルギ
ーは複合体表面への圧力、複合体を構成する蛋白質間の
全ての原子ペア間のファンデルワールス相互作用と溶媒
と蛋白質間のファンデルワールス相互作用からなる。つ
まり、溶媒から蛋白質表面上に加わる圧力により生じる
エネルギーをEpx、レセプター/リガンド間のファンデ
ルワールス相互作用エネルギーをEvdwとすると、疎水
性相互作用エネルギーEhyは、その総和Ehy=Epx+E
vdwで表すことができる。
In the present invention, the hydrophobic interaction energy is derived from the pressure on the surface of the complex, the van der Waals interaction between all the atom pairs between the proteins constituting the complex, and the van der Waals interaction between the solvent and the protein. Become. That is, assuming that the energy generated by the pressure applied from the solvent on the protein surface is E px and the van der Waals interaction energy between the receptor / ligand is E vdw , the hydrophobic interaction energy E hy is the sum E hy = E px. + E
It can be represented by vdw .

【0092】レセプター/リガンド間の相互作用は、疎
水性相互作用をエネルギーをEhy、静電相互作用エネル
ギーをEel 、水素結合で獲得するエネルギーをEhb
分子内間の配座変化によってもたらされるエネルギーを
tor、溶媒和・脱溶媒和エネルギーをEdesolとする
と、レセプター/リガンド間の相互作用エネルギーΔG
は以下の式で示すことができる。
The interaction between the receptor / ligand is as follows: hydrophobic interaction energy is E hy , electrostatic interaction energy is E el , hydrogen bond energy is E hb ,
Letting E tor be the energy produced by the intramolecular conformational change and E desol the solvation / desolvation energy, the receptor / ligand interaction energy ΔG
Can be expressed by the following formula.

【0093】 ΔG=Ehy +Eel +Ehb +Etor +Edesol このようにΔGの定量的比較評価により、候補ペプチド
群から目的のペプチド(例えば低エネルギー状態のも
の)を選出することができる。
ΔG = E hy + E el + E hb + E tor + E desol Thus, the quantitative comparison evaluation of ΔG can select the target peptide (for example, one in a low energy state) from the candidate peptide group. it can.

【0094】この発明は、従来法である1次アミノ酸配
列のみからペプチドを設計する方法や標的蛋白質の3次
元立体構造からペプチドを設計する方法をそれぞれ改良
し、かつこれらを組合組み合わせてペプチド設計を行う
方法である。組み合わせ的にペプチドを設計すること
で、各段階で生じる問題点を相補することができる。
The present invention improves the conventional method for designing a peptide from only a primary amino acid sequence and the method for designing a peptide from the three-dimensional structure of a target protein, and combines these methods for peptide design. Is the way to do it. By designing the peptides in a combinatorial manner, the problems occurring at each stage can be complemented.

【0095】例えば1次配列のみから設計する方法で
は、3次元空間における幾何学的な評価はできないが、
これは3次元立体構造からペプチドを設計する方法の組
み合わせによりによって補えることである。3次元立体
構造からペプチドを設計する方法では、1次配列がもつ
連続的な物理化学的性質を考慮できないが、1次配列の
みからの設計方法ではこれを補うことができる。以上の
方法により、論理的、合理的な特定蛋白質に特異的かつ
高親和的に結合するペプチドをコンピュータの支援によ
って設計することができる。
For example, the method of designing only from the primary array cannot perform geometrical evaluation in a three-dimensional space,
This can be complemented by a combination of methods for designing peptides from a three-dimensional structure. In the method of designing a peptide from a three-dimensional structure, the continuous physicochemical properties of the primary sequence cannot be taken into consideration, but this can be compensated for in the method of designing only the primary sequence. By the above method, a peptide that binds to a specific protein in a logical and rational manner with high specificity and specificity can be designed with the aid of a computer.

【0096】この発明は、ペプチドを用いた研究用試
薬、治療用及び診断用医薬、食品への添加、このペプチ
ドをリード化合物として導かれる化合物、その他のペプ
チド利用の周知技術に応用することもできる。
The present invention can also be applied to research reagents using peptides, therapeutic and diagnostic pharmaceuticals, addition to foods, compounds derived using this peptide as a lead compound, and other well-known techniques utilizing peptides. .

【0097】[0097]

【実施例】この発明の実施例として、エンテロトキシン
A(Enterotoxin A)に対して特異的なペプチド設計を
説明する。
EXAMPLE As an example of the present invention, a peptide design specific to enterotoxin A will be described.

【0098】実施例に用いたコンピュータプログラム
は、C言語を用いて作成し、開発環境はUNIX(R)で行
なったものであり、プログラムは主に、ペンティアム
(R)II500MHz、メモリー256M、FreeBSD 2.2.8RELEASE
上で実行した。
The computer programs used in the examples were created using C language, and the development environment was UNIX (R). The programs were mainly Pentium (R) II 500 MHz, memory 256M, FreeBSD 2.2. .8 RELEASE
Ran on

【0099】エンテロトキシンA(Enterotoxin A)に
ついての1次配列は、配列番号1に示したが、これはGen
bankのアクセッション番号(SAENTAB)から取得でき、
さらに3次元立体構造は、PDBファイル(1D5X)を用い
て解析を行った(図5)。
The primary sequence for Enterotoxin A is shown in SEQ ID NO: 1, which is Gen
It can be obtained from the bank's accession number (SAENTAB),
Furthermore, the three-dimensional structure was analyzed using a PDB file (1D5X) (Fig. 5).

【0100】因みに、エンテロトキシンは、分子量27
000前後の単純蛋白質であり、トリプシンなどの消化
酵素や熱に対して抵抗性があり、抗原性の違いから現在
A〜L型までのものが知られている。食中毒の原因菌と
して最も発生件数の多いエンテロトキシン型は、A型で
あり、A+B型とA+D 型によるものを合わせた食中
毒の発生件数は全体の80%以上を占める。
Incidentally, enterotoxin has a molecular weight of 27
It is a simple protein of about 000, is resistant to digestive enzymes such as trypsin and heat, and is currently known to have A to L types due to the difference in antigenicity. The enterotoxin type, which is the most common cause of food poisoning, is type A, and the combined number of cases of food poisoning due to A + B type and A + D type accounts for over 80%.

【0101】また、エンテロトキシンはT細胞を特異的
に活性化し、短時間に多種類のサイトカインを大量生産
させる作用があり、「細菌性スーパー抗原」とも称され
ている。ヒトでエンテロトキシンによる発症に必要な量
は、エンテロトキシンBではに5〜50μg と考えら
れていたが、加工乳などの事件では200ng以下のエ
ンテロトキシンAでも発症した例がある。ブドウ球菌に
よる食中毒は、黄色ブドウ球菌が食品中で増殖する時に
産生するエンテロトキシンを、食品と共に摂取すること
によって起こる。
Further, enterotoxin has the action of specifically activating T cells and producing a large amount of various types of cytokines in a short time, and is also called "bacterial superantigen". The amount required for the onset of enterotoxin in humans was considered to be 5 to 50 μg for enterotoxin B, but in cases such as processed milk, there were cases where enterotoxin A of 200 ng or less also developed. Food poisoning by Staphylococcus occurs by ingesting enterotoxins produced by Staphylococcus aureus when they grow in food together with food.

【0102】標的配列を決定するために、SD-LIME(Sea
rch Domain-Leading Interaction system for Molecula
r Evaluation)によって解析した。明らかに疎水性クラ
スターを形成している領域が2箇所発生していることが
判明した。
To determine the target sequence, SD-LIME (Sea
rch Domain-Leading Interaction system for Molecula
r Evaluation). It was revealed that two regions clearly forming hydrophobic clusters were generated.

【0103】図4に示すように、この結果を3次元立体
構造(溶媒接触表面1)に逆写像した。疎水性クラスタ
ーを形成している領域が2箇所に濃い黒色部分2、2´
として観察できた。このデータをもとに黒色部分2に相
当するアミノ酸配列をペプチド設計の標的とした。
As shown in FIG. 4, this result was inversely mapped to a three-dimensional structure (solvent contact surface 1). Regions forming hydrophobic clusters are dark black areas 2 and 2'in two places.
I was able to observe. Based on this data, the amino acid sequence corresponding to the black portion 2 was targeted for peptide design.

【0104】この標的配列を配列番号2に示した。この
領域は配列番号1のアミノ酸配列の第65〜78番目の
部分であり、MHCとの結合に関与する領域であってペ
プチドの結合面としての候補として妥当なものである。
The target sequence is shown in SEQ ID NO: 2. This region is the 65th to 78th portion of the amino acid sequence of SEQ ID NO: 1 and is a region involved in binding to MHC and is a valid candidate as a peptide binding surface.

【0105】次に、上記標的配列からPC-LIME法により
ペプチド配列を設計した。ペプチド配列は配列番号3に
示すものとなった。次に、このペプチドを選出すべきも
のかどうか調べるためにエネルギー最適化し、エントロ
トキシンAと幾何学的ドッキング(GD-LIME)で解析を
行い、そのポジショニングを表記した。
Next, a peptide sequence was designed from the above target sequence by the PC-LIME method. The peptide sequence is shown in SEQ ID NO: 3. Next, in order to investigate whether or not this peptide should be selected, energy optimization was performed, and analysis was performed by entrotoxin A and geometric docking (GD-LIME), and its positioning was indicated.

【0106】図5に示すように、配列番号3のペプチド
3は、エンテロトキシンA(濃い黒色のリボン状の3次
元立体構造)4の一部分に沿う灰色のリング状部として
現れた。このポジションから2分子のエネルギー評価を
行った結果、総合エネルギーΔGは、−25.545kc
alと非常に低エネルギー状態の安定した結果であった。
As shown in FIG. 5, peptide 3 of SEQ ID NO: 3 appeared as a gray ring-shaped portion along a part of enterotoxin A (three-dimensional structure of dark black ribbon-like structure) 4. As a result of evaluating the energy of two molecules from this position, the total energy ΔG is −25.545 kc
It was a stable result of al and very low energy state.

【0107】これらの結果から、設計されたペプチド
は、幾何学的、エネルギー的に安定した高特異性、親和
性を持つ結合が得られるペプチドであり、選出されるべ
きものであると評価された。
From these results, it was evaluated that the designed peptide is a peptide that can obtain a bond with high specificity and affinity that is geometrically and energetically stable and should be selected. .

【0108】[0108]

【発明の効果】この発明は、以上説明したように、疎水
性アミノ酸の集合領域を特定し、この領域に対応する立
体分子構造上のアミノ酸配列に対して結合性を有するペ
プチドを、コンピュータの定量的構造活性相関プログラ
ムで設計および選出する方法としたので、特定蛋白質に
対して特異的かつ高親和的に結合するペプチドをコンピ
ュータの支援によって可及的に簡便かつ合理的に設計し
かつ選出できるという利点がある。
Industrial Applicability As described above, the present invention specifies a region where hydrophobic amino acids are assembled, and a computer quantitative determination of a peptide having a binding property to the amino acid sequence in the stereomolecular structure corresponding to this region. Since it was designed and selected by a dynamic structure-activity relationship program, it is possible to design and select a peptide that binds specifically and with high affinity to a specific protein as easily and rationally as possible with the aid of a computer. There are advantages.

【0109】[0109]

【配列表】 SEQUENCE LISTING <110> Kabushikikaisha enkaku-iryou kenkyusho <120> Method for designing and selecting protein-binding peptides <130> KPO5586-27 <160> 3 <210> 1 <211> 257 <212> PRT <220> staphylococcus aureus <400> 1 Met Lys Lys Thr Ala Phe Thr Leu Leu Leu Phe Ile Ala Leu Thr Leu 1 5 10 15 Thr Thr Ser Pro Leu Val Asn Gly Ser Glu Lys Ser Glu Glu Ile Asn 20 25 30 Glu Lys Asp Leu Arg Lys Lys Ser Glu Leu Gln Gly Thr Ala Leu Gly 35 40 45 Asn Leu Lys Gln Ile Tyr Tyr Tyr Asn Glu Lys Ala Lys Thr Glu Asn 50 55 60 Lys Glu Ser His Asp Gln Phe Leu Gln His Thr Ile Leu Phe Lys Gly 65 70 75 80 Phe Phe Thr Asp His Ser Trp Tyr Asn Asp Leu Leu Val Asp Phe Asp 85 90 95 Ser Lys Asp Ile Val Asp Lys Tyr Lys Gly Lys Lys Val Asp Leu Tyr 100 105 110 Gly Ala Tyr Tyr Gly Tyr Gln Cys Ala Gly Gly Thr Pro Asn Lys Thr 115 120 125 Ala Cys Met Tyr Gly Gly Val Thr Leu His Asp Asn Asn Arg Leu Thr 130 135 140 Glu Glu Lys Lys Val Pro Ile Asn Leu Trp Leu Asp Gly Lys Gln Asn 145 150 155 160 Thr Val Pro Leu Glu Thr Val Lys Thr Asn Lys Lys Asn Val Thr Val 165 170 175 Gln Glu Leu Asp Leu Gln Ala Arg Arg Tyr Leu Gln Glu Lys Tyr Asn 180 185 190 Leu Tyr Asn Ser Asp Val Phe Asp Gly Lys Val Gln Arg Gly Leu Ile 195 200 205 Val Phe His Thr Ser Thr Glu Pro Ser Val Asn Tyr Asp Leu Phe Gly 210 215 220 Ala Gln Gly Gln Tyr Ser Asn Thr Leu Leu Arg Ile Tyr Arg Asp Asn 225 230 235 240 Lys Thr Ile Asn Ser Glu Asn Met His Ile Asp Ile Tyr Leu Tyr Thr Ser 245 250 255 <110> Kabushikikaisha enkaku-iryou kenkyusho <120> Method for designing and selecting protein-binding peptides <130> KPO5586-27 <160> 3 <210> 2 <211> 14 <212> PRT <220> staphylococcus aureus <400> 2 Lys Glu Ser His Asp Gln Phe Leu Gln His Thr Ile Leu Phe 1 5 10 <110> Kabushikikaisha enkaku-iryou kenkyusho <120> Method for designing and selecting protein-binding peptides <130> KPO5586-27 <160> 3 <210> 3 <211> 14 <212> PRT <400> 3 His Asp Arg Ser Ile Ser Asp His Leu Cys Thr Leu Val Val 1 5 10[Sequence list]                               SEQUENCE LISTING <110> Kabushikikaisha enkaku-iryou kenkyusho <120> Method for designing and selecting protein-binding peptides <130> KPO5586-27 <160> 3 <210> 1 <211> 257 <212> PRT <220> staphylococcus aureus <400> 1 Met Lys Lys Thr Ala Phe Thr Leu Leu Leu Phe Ile Ala Leu Thr Leu  1 5 10 15 Thr Thr Ser Pro Leu Val Asn Gly Ser Glu Lys Ser Glu Glu Ile Asn             20 25 30 Glu Lys Asp Leu Arg Lys Lys Ser Glu Leu Gln Gly Thr Ala Leu Gly          35 40 45 Asn Leu Lys Gln Ile Tyr Tyr Tyr Asn Glu Lys Ala Lys Thr Glu Asn      50 55 60 Lys Glu Ser His Asp Gln Phe Leu Gln His Thr Ile Leu Phe Lys Gly  65 70 75 80 Phe Phe Thr Asp His Ser Trp Tyr Asn Asp Leu Leu Val Asp Phe Asp                  85 90 95 Ser Lys Asp Ile Val Asp Lys Tyr Lys Gly Lys Lys Val Asp Leu Tyr             100 105 110 Gly Ala Tyr Tyr Gly Tyr Gln Cys Ala Gly Gly Thr Pro Asn Lys Thr         115 120 125 Ala Cys Met Tyr Gly Gly Val Thr Leu His Asp Asn Asn Arg Leu Thr     130 135 140 Glu Glu Lys Lys Val Pro Ile Asn Leu Trp Leu Asp Gly Lys Gln Asn 145 150 155 160 Thr Val Pro Leu Glu Thr Val Lys Thr Asn Lys Lys Asn Val Thr Val                 165 170 175 Gln Glu Leu Asp Leu Gln Ala Arg Arg Tyr Leu Gln Glu Lys Tyr Asn             180 185 190 Leu Tyr Asn Ser Asp Val Phe Asp Gly Lys Val Gln Arg Gly Leu Ile         195 200 205 Val Phe His Thr Ser Thr Glu Pro Ser Val Asn Tyr Asp Leu Phe Gly     210 215 220 Ala Gln Gly Gln Tyr Ser Asn Thr Leu Leu Arg Ile Tyr Arg Asp Asn 225 230 235 240 Lys Thr Ile Asn Ser Glu Asn Met His Ile Asp Ile Tyr Leu Tyr Thr Ser                 245 250 255 <110> Kabushikikaisha enkaku-iryou kenkyusho <120> Method for designing and selecting protein-binding peptides <130> KPO5586-27 <160> 3 <210> 2 <211> 14 <212> PRT <220> staphylococcus aureus <400> 2 Lys Glu Ser His Asp Gln Phe Leu Gln His Thr Ile Leu Phe  1 5 10 <110> Kabushikikaisha enkaku-iryou kenkyusho <120> Method for designing and selecting protein-binding peptides <130> KPO5586-27 <160> 3 <210> 3 <211> 14 <212> PRT <400> 3 His Asp Arg Ser Ile Ser Asp His Leu Cys Thr Leu Val Val   1 5 10

【図面の簡単な説明】[Brief description of drawings]

【図1】実施形態の蛋白質結合性ペプチドの設計・選出
工程を説明するフローチャート
FIG. 1 is a flow chart illustrating a process of designing and selecting a protein-binding peptide according to an embodiment.

【図2】(a)分子の溶媒接触表面の説明図 (b)蛋白質分子の溶媒接触表面の三次元立体構造を示
す模式図
FIG. 2A is an explanatory view of a solvent contact surface of a molecule. FIG. 2B is a schematic view showing a three-dimensional structure of a solvent contact surface of a protein molecule.

【図3】(a)溶媒接触表面上の疎水性ポテンシャルを
2次元に転換した自己組織化特徴地図 (b)FFT処理後の自己組織化特徴地図 (c)クラスタ化された自己組織化特徴地図
FIG. 3A is a self-organizing feature map in which a hydrophobic potential on a solvent-contacting surface is converted into a two-dimensional shape. FIG. 3B is a self-organizing feature map after FFT processing.

【図4】エンテロトキシンAの溶媒接触表面にペプチド
が結合した状態を示す3次元立体構造図
FIG. 4 is a three-dimensional structure diagram showing a state in which a peptide is bound to the solvent-contact surface of enterotoxin A.

【図5】実施例の方法で設計・選出されたペプチドのエ
ンテロトキシンAに対する幾何学結合状態を示すコンピ
ュータシュミレーシヨン画像
FIG. 5 is a computer simulation image showing a geometrical binding state of enterotoxin A of peptides designed and selected by the method of Example.

【符号の説明】[Explanation of symbols]

1 溶媒接触表面 2、2’ 黒色部分 3 ペプチド 4 エンテロトキシンA 1 Solvent contact surface 2, 2'black part 3 peptides 4 Enterotoxin A

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 蛋白質のアミノ酸配列およびその立体分
子構造をコンピュータに入力し、前記立体分子構造の溶
媒接触表面上に均等に配置した表面点の疎水性ポテンシ
ャル(MHP)を算出すると共に、これを自己組織化特
徴地図法によって2次元に展開し、さらにフーリエ変換
によって高周波領域を除去することにより疎水性アミノ
酸の集合領域を特定し、この領域に対応する前記立体分
子構造上のアミノ酸配列に対して結合性を有するペプチ
ドを、コンピュータの定量的構造活性相関プログラムで
設計および選出することからなる蛋白質結合性ペプチド
の設計・選出方法。
1. An amino acid sequence of a protein and its three-dimensional molecular structure are input to a computer to calculate a hydrophobic potential (MHP) of surface points evenly arranged on the solvent contact surface of the three-dimensional molecular structure, A hydrophobic amino acid assembly region is identified by two-dimensional expansion by the self-organizing feature map method, and a high frequency region is removed by Fourier transform, and the amino acid sequence corresponding to this region in the three-dimensional molecular structure is identified. A method for designing and selecting a protein-binding peptide, which comprises designing and selecting a peptide having a binding property by a computer-based quantitative structure-activity relationship program.
【請求項2】 定量的構造活性相関プログラムが、疎水
性アミノ酸の集合領域に対応する立体分子構造上のアミ
ノ酸配列の各アミノ酸残基の疎水度を定量化してフーリ
エ変換し、表示される周期に対して相補的な疎水度の周
期を示すアミノ酸配列を選出する工程を含む定量的構造
活性相関プログラムである請求項1記載の蛋白質結合性
ペプチドの設計・選出方法。
2. The quantitative structure-activity relationship program quantifies the degree of hydrophobicity of each amino acid residue of the amino acid sequence on the three-dimensional molecular structure corresponding to the aggregated region of hydrophobic amino acids, Fourier transforms it, and displays it in the displayed cycle. The method for designing and selecting a protein-binding peptide according to claim 1, which is a quantitative structure-activity relationship program including a step of selecting an amino acid sequence having a complementary hydrophobicity cycle.
【請求項3】 疎水性ポテンシャル(MHP)が、下記
の式(1)で示される値である請求項1または2に記載
の蛋白質結合性ペプチドの設計・選出方法。 【数1】
3. The method for designing / selecting a protein-binding peptide according to claim 1, wherein the hydrophobic potential (MHP) is a value represented by the following formula (1). [Equation 1]
【請求項4】 コンピュータの定量的構造活性相関プロ
グラムが、遺伝的アルゴリズムの組み込まれた定量的構
造活性相関プログラムである請求項1〜3のいずれかに
記載の蛋白質結合性ペプチドの設計・選出方法。
4. The method for designing and selecting a protein-binding peptide according to claim 1, wherein the computer-based quantitative structure-activity relationship program is a quantitative structure-activity relationship program incorporating a genetic algorithm. .
【請求項5】 蛋白質−ペプチド複合体の結合シュミレ
ーションを、幾何学的評価による剛体モデルについて行
ない、次いで蛋白質−ペプチド間の相互作用エネルギー
について行ない、これらのシュミレーションで評価され
たペプチドを選択する工程を含む請求項1〜4のいずれ
かに記載の蛋白質結合性ペプチドの設計・選出方法。
5. A step of performing a binding simulation of a protein-peptide complex on a rigid body model by geometrical evaluation, then on a protein-peptide interaction energy, and selecting peptides evaluated by these simulations. The method for designing and selecting a protein-binding peptide according to any one of claims 1 to 4, which comprises:
JP2002062348A 2002-03-07 2002-03-07 Method for designing/selecting protein-bonding peptide Pending JP2003263465A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002062348A JP2003263465A (en) 2002-03-07 2002-03-07 Method for designing/selecting protein-bonding peptide

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002062348A JP2003263465A (en) 2002-03-07 2002-03-07 Method for designing/selecting protein-bonding peptide

Publications (1)

Publication Number Publication Date
JP2003263465A true JP2003263465A (en) 2003-09-19

Family

ID=29196168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002062348A Pending JP2003263465A (en) 2002-03-07 2002-03-07 Method for designing/selecting protein-bonding peptide

Country Status (1)

Country Link
JP (1) JP2003263465A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323099A (en) * 2006-05-30 2007-12-13 Hitachi Ltd Parameter determination method for simulation
JP2008518369A (en) * 2005-03-11 2008-05-29 シュレディンガー エルエルシー Predictive scoring function for estimating binding affinity
JP2008222574A (en) * 2007-03-08 2008-09-25 Chiba Univ Molecular design device, molecular design method and program
JP2011526382A (en) * 2008-06-20 2011-10-06 ノバルティス アーゲー Method for identifying macromolecular binding regions and regions prone to aggregation in proteins and uses thereof
US9676841B2 (en) 2008-06-20 2017-06-13 Novartis Ag Immunoglobulins with reduced aggregation
US10431325B2 (en) 2012-08-03 2019-10-01 Novartis Ag Methods to identify amino acid residues involved in macromolecular binding and uses therefor

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518369A (en) * 2005-03-11 2008-05-29 シュレディンガー エルエルシー Predictive scoring function for estimating binding affinity
JP4719223B2 (en) * 2005-03-11 2011-07-06 シュレディンガー エルエルシー Predictive scoring function for estimating binding affinity
US8145430B2 (en) 2005-03-11 2012-03-27 Schrodinger, Llc Predictive scoring function for estimating binding affinity
JP2007323099A (en) * 2006-05-30 2007-12-13 Hitachi Ltd Parameter determination method for simulation
JP2008222574A (en) * 2007-03-08 2008-09-25 Chiba Univ Molecular design device, molecular design method and program
JP2011526382A (en) * 2008-06-20 2011-10-06 ノバルティス アーゲー Method for identifying macromolecular binding regions and regions prone to aggregation in proteins and uses thereof
US9676841B2 (en) 2008-06-20 2017-06-13 Novartis Ag Immunoglobulins with reduced aggregation
US9922164B2 (en) 2008-06-20 2018-03-20 Novartis Ag Methods to identify macromolecule binding and aggregation prone regions in proteins and uses therefor
US10431325B2 (en) 2012-08-03 2019-10-01 Novartis Ag Methods to identify amino acid residues involved in macromolecular binding and uses therefor

Similar Documents

Publication Publication Date Title
Soleymani et al. Protein–protein interaction prediction with deep learning: A comprehensive review
US11869629B2 (en) Systems and methods for artificial intelligence-guided biomolecule design and assessment
US11067582B2 (en) Peptide array quality control
Xue et al. HomPPI: a class of sequence homology based protein-protein interface prediction methods
US20230034425A1 (en) Systems and methods for artificial intelligence-guided biomolecule design and assessment
US20210005277A1 (en) Obtaining an Improved Therapeutic Ligand
CA3226172A1 (en) Systems and methods for artificial intelligence-guided biomolecule design and assessment
CN114649054A (en) Antigen affinity prediction method and system based on deep learning
Colubri et al. Minimalist representations and the importance of nearest neighbor effects in protein folding simulations
Zheng et al. Protein structure prediction constrained by solution X-ray scattering data and structural homology identification
Song et al. Identification of inhibitors of MMPS enzymes via a novel computational approach
JP2003263465A (en) Method for designing/selecting protein-bonding peptide
Zhou et al. Identification of amyloidogenic peptides via optimized integrated features space based on physicochemical properties and PSSM
WO2020123302A1 (en) Predicting affinity using structural and physical modeling
Liu et al. Pre-training of graph neural network for modeling effects of mutations on protein-protein binding affinity
CN116343922A (en) Method for predicting polypeptide based on machine learning
Ye et al. Probabilistic cross‐link analysis and experiment planning for high‐throughput elucidation of protein structure
EP4205119A1 (en) Predicting protein structures using auxiliary folding networks
US20120232856A1 (en) Method of calculating areas
Verma et al. SSnet-Secondary Structure based End-to-End Learning model for Protein-Ligand Interaction Prediction
Gong et al. A holistic molecular docking approach for predicting protein-protein complex structure
Munoz et al. Docking Unbound Proteins with MIAX A Novel Algorithm for Protein-Protein Soft Docking
US12027235B1 (en) Systems and methods for artificial intelligence-based binding site prediction and search space filtering for biological scaffold design
Gupta et al. Open Tools of Drug Designing for Open Research.
WO2024180402A1 (en) Computer implemented method for predicting a monoclonal antibody specific for a certain antigen of a pathogen

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050302

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070828

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080318