Nothing Special   »   [go: up one dir, main page]

JPH10105154A - Graphic display device and graphic processor - Google Patents

Graphic display device and graphic processor

Info

Publication number
JPH10105154A
JPH10105154A JP8258725A JP25872596A JPH10105154A JP H10105154 A JPH10105154 A JP H10105154A JP 8258725 A JP8258725 A JP 8258725A JP 25872596 A JP25872596 A JP 25872596A JP H10105154 A JPH10105154 A JP H10105154A
Authority
JP
Japan
Prior art keywords
display
access
graphics
memory
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8258725A
Other languages
Japanese (ja)
Other versions
JP3683657B2 (en
Inventor
Shigeru Matsuo
松尾  茂
Tetsuya Shimomura
哲也 下村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP25872596A priority Critical patent/JP3683657B2/en
Priority to TW086113390A priority patent/TW360823B/en
Priority to US08/942,689 priority patent/US6333745B1/en
Priority to KR1019970049589A priority patent/KR100450980B1/en
Publication of JPH10105154A publication Critical patent/JPH10105154A/en
Priority to US09/991,705 priority patent/US6717583B2/en
Priority to US10/669,562 priority patent/US6954206B2/en
Priority to US11/182,944 priority patent/US7333116B2/en
Application granted granted Critical
Publication of JP3683657B2 publication Critical patent/JP3683657B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Input (AREA)
  • Digital Computer Display Output (AREA)
  • Image Generation (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the access efficiency of" a graphic memory and improve the picture quality of a enjoying picture on a memory integrated type graphic, display device by controlling display access by the graphic processor adaptively to the cache mode of' a CPU. SOLUTION: Of the memory integrated type graphic display device wherein the CPU 10 and graphic processor 20 accesses the common graphic memory 40, the graphic processor 20 is provided with a bit specifying the cache system of the CPLI 10 and according to this specification, the time of' single-time maximum display access is varied. Namely, when a copy-back system is adopted, write access by the CPU is shorter than that of' a store-through system, so the display access time of the graphic processor 20 is shortened.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はグラフィックス表示
装置に係り、特に動画の表示に必要な複数の情報を同一
メモリに統合したグラフィックス表示装置とグラフイッ
クスプロセッサに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a graphics display device, and more particularly to a graphics display device and a graphics processor in which a plurality of pieces of information necessary for displaying a moving image are integrated in the same memory.

【0002】[0002]

【従来の技術】高速な三次元グラフイックスを処理する
プロセッサとして、「3次元CG描画LSI−パソコン
で30万ポリゴン/秒実現−(日経エレクトロニクス;
No.640,1995.7.17,pp109−120)」に記載の
例(引用例1)がある。このプロセッサは、プロセッサ
専用メモリとして、テクスチュア用メモリ、フレームバ
ッファ用メモリ、ローカル用メモリの3種類を設けてい
る。このアーキテクチャは性能向上の上で有利である
が、メモリが複数になるため個人向け携帯機器等の小
形、低廉の装置には向かない。
2. Description of the Related Art As a processor for processing high-speed three-dimensional graphics, "3D CG drawing LSI-300,000 polygons / sec realized by a personal computer-(Nikkei Electronics;
No. 640, 1995. 7.17, pp. 109-120) "(Cited Example 1). This processor is provided with three types of memories dedicated to the processor: a texture memory, a frame buffer memory, and a local memory. Although this architecture is advantageous in terms of improving performance, it is not suitable for small and inexpensive devices such as personal portable devices due to the use of multiple memories.

【0003】一方、グラフイックス情報を一元化し、引
用例1に比べてメモリ個数を削減できる例に、特開平5
−257793号公報(引用例2)がある。このグラフ
ィックスシステムでは、CPUの主メモリ中にCPUの
プログラム、テクスチャデータ、フレームバッファ等を
統合して持つ。
On the other hand, an example in which graphics information is unified and the number of memories can be reduced as compared with the cited reference 1 is disclosed in
No. 257793 (Reference 2). In this graphics system, a CPU program, texture data, a frame buffer, and the like are integrated in a main memory of the CPU.

【0004】[0004]

【発明が解決しようとする課題】上記した従来技術にお
いては、メモリのアクセス能力が数百MB/sといった
十分高速のメモリシステムを備え、表示データ読出しの
時間は十分に確保できていることが実現の前提となる。
このことは、高価なメモリシステムを必要とし、小型
化、低価格化の妨げとなる。
In the above-mentioned prior art, it is realized that a sufficiently high-speed memory system having a memory access capability of several hundred MB / s is provided, and a sufficient time for reading display data is ensured. It is a premise of.
This requires an expensive memory system and hinders miniaturization and cost reduction.

【0005】引用例2の構成において、もし、安価なメ
モリシステムを用いてメモリのアクセス能力を下げる
と、動画に必要な表示データの読出し時間の確保のため
に、表示以外の描画やCPUアクセスとの調整が必要に
なる。CPUからのライトアクセスの時間はデータ量に
よって変化するが、高速グラフイックスのための時間当
たりのデータ量は増大し、1画面当たりのアクセス時間
も長くなる。
In the configuration of the cited reference 2, if the access capability of the memory is reduced by using an inexpensive memory system, in order to secure the readout time of the display data necessary for the moving image, the drawing and CPU access other than the display need to be performed. Needs to be adjusted. The write access time from the CPU varies depending on the data amount, but the data amount per time for high-speed graphics increases, and the access time per screen also increases.

【0006】このため、メモリ統合タイプでは表示アク
セスを優先する。しかし、グラフイックスメモリから描
画データを読み出す(以下、表示アクセスと呼ぶ)のア
クセス要求が発行されても、CPUなど他のアクセスの
実行中はそれが終了するまで待たされることになり、そ
の間に表示バッファのデータが空になると、動画の表示
画面が乱れてしまう。そこで、表示アクセス時間に余裕
を持たせて、表示バッファのデータ蓄積量を高めて、動
画の画質を維持している。しかし、従来の表示アクセス
優先方式ではグラフイックスメモリのアクセス効率が低
下するために、CPUによる高速グラフイックスの処理
が困難になる。
For this reason, display access is prioritized in the memory integrated type. However, even if an access request for reading out the drawing data from the graphics memory (hereinafter referred to as display access) is issued, during execution of another access such as a CPU, the process waits until the access is completed. When the data in the buffer becomes empty, the display screen of the moving image is disturbed. Therefore, the display access time has a margin, the data storage amount of the display buffer is increased, and the image quality of the moving image is maintained. However, in the conventional display access priority method, the access efficiency of the graphics memory is reduced, so that it becomes difficult for the CPU to process high-speed graphics.

【0007】一般に、CPUは出力データを転送するた
めのキャッシュメモリを内蔵し、そのキャッシュ方式に
よってメモリアクセスのタイミングが相違する。たとえ
ば、1ワードのみを転送するライトスルー方式に対し、
複数ワード連続して転送するコピーバック方式は、描画
手続き情報(以下では、描画コマンド)をまとめて転送
できるのでアクセス時間を短縮できるにもかかわらず、
アクセス時間の長いライトスルー方式において余裕のあ
る表示アクセス時間の確保を行なっている。即ち、キャ
ッシュ方式の違いに対する考慮がなされていないため
に、メモリのアクセス効率が低下し、コピーバック方式
で可能な高速のグラフイックス表示が犠牲にされてい
た。
Generally, a CPU has a built-in cache memory for transferring output data, and the timing of memory access differs depending on the cache system. For example, for a write-through method that transfers only one word,
In the copy-back method in which a plurality of words are continuously transferred, the drawing procedure information (hereinafter referred to as a drawing command) can be transferred collectively.
In the write-through method having a long access time, a sufficient display access time is secured. That is, since no consideration is given to the difference between the cache methods, the memory access efficiency is reduced, and the high-speed graphic display that can be performed by the copy-back method is sacrificed.

【0008】本発明の目的は、CPUとグラフィックス
プロセッサの双方からアクセスする1つのグラフイック
スメモリを用いる場合に、CPUのキャッシュ方式に応
じて1回の表示アクセスの連続時間を最適化して、メモ
リのアクセス効率を高め、高速のグラフイックス表示を
実現する表示装置と、そのグラフイックスプロセッサを
提供することにある。
An object of the present invention is to optimize the continuous time of one display access according to the cache system of a CPU when using one graphics memory accessed from both a CPU and a graphics processor. It is an object of the present invention to provide a display device which increases the access efficiency of the device and realizes a high-speed graphic display, and a graphic processor for the display device.

【0009】[0009]

【課題を解決するための手段】上記目的を達成する本発
明のグラフィックス表示装置は、表示すべきグラフィッ
クス図形の種類や頂点パラメータ等で構成される描画手
続き情報(描画コマンド)を生成するCPUと、そのC
PUから書き込まれる(ライトアクセス)前記描画手続
き情報や表示器に出力する描画データ(ビットマップ情
報)を記憶する1つのメモリと、前記描画手続き情報に
対する描画アクセスを行なって前記メモリに描画データ
を記憶し、さらに前記描画データを前記表示器に出力す
る表示読み出し(表示アクセス)を行うグラフィックス
プロセッサを備え、さらに、前記グラフィックスプロセ
ッサは、前記CPUに具備され前記メモリへデータを転
送するキャッシュメモリのキャッシュ方式に応じて、前
記メモリに対する表示読み出しタイミングを変化させる
ことを特徴とする。
A graphics display device according to the present invention, which achieves the above object, has a CPU for generating drawing procedure information (drawing command) including a type of a graphics figure to be displayed, a vertex parameter, and the like. And its C
One memory for storing the drawing procedure information written from the PU (write access) and the drawing data (bitmap information) to be output to the display, and performing drawing access to the drawing procedure information and storing the drawing data in the memory A graphics processor that performs display reading (display access) for outputting the drawing data to the display device; and the graphics processor is a cache memory that is provided in the CPU and transfers data to the memory. The display read timing for the memory is changed according to a cache method.

【0010】前記グラフイックスプロセッサは、前記キ
ャッシュ方式が前記メモリに対して、複数ワードのデー
タを連続して転送する方式か又は1ワード毎に転送する
方式かを示すキャッシュ方式情報を前記CPUから与え
られ、前者の場合は後者に比べて1回の表示読み出しの
連続時間を短くすることを特徴とする。
[0010] The graphics processor provides cache system information from the CPU indicating whether the cache system is a system for continuously transferring a plurality of words of data to the memory or a system for transferring one word at a time. In the former case, the continuous time of one display readout is shorter than that in the latter case.

【0011】上記目的を達成する本発明のグラフイック
スプロセッサは、表示すべきグラフィックス図形の種類
や頂点パラメータ等で構成される描画手続き情報(描画
コマンド)の記憶エリア及び表示器に出力するビットマ
ップ情報を記憶するエリアを有するグラフイックスメモ
リに対して、前記ビットマップ情報を生成するための描
画アクセス及び、表示器に表示データを出力するための
表示アクセスを行うものであって、さらに、前記グラフ
イックスメモリに対する前記描画手続き情報のライトア
クセスが複数ワードのデータを連続アドレスで転送する
方式か又は、1ワード毎に転送する方式かを示す転送方
式情報を設定され、前者の場合は後者に比べて1回の前
記表示アクセスの連続時間を短くすることを特徴とす
る。
A graphics processor according to the present invention, which achieves the above object, comprises: a storage area for drawing procedure information (drawing command) including a type of a graphics figure to be displayed and vertex parameters; A graphics memory having an area for storing information, a drawing access for generating the bitmap information, and a display access for outputting display data to a display device, further comprising: Transfer method information indicating whether the write access of the drawing procedure information to the Ix memory is a method of transferring data of a plurality of words at a continuous address or a method of transferring data for each word is set, and in the former case, compared to the latter, A continuous time of one display access is shortened.

【0012】また、前記グラフイックスプロセッサは、
前記描画アクセスを行なう描画ユニットと前記表示アク
セスを行なう表示コントローラと、CPUからのデータ
転送を受信し前記ライトアクセスを行なうインターフェ
イス手段と、それらのメモリアクセス要求を受付け前記
表示アクセスを優先するように制御するメモリコントロ
ーラ手段を備え、前記描画手続き情報を転送する前記C
PUのキャッシュ方式によって前記転送方式情報を設定
し、前記キャッシュ方式がコピーバック方式の場合はラ
イトスルー方式に比べて1回の表示アクセスの連続時間
を短くすることを特徴とする。
Further, the graphics processor comprises:
A drawing unit for performing the drawing access, a display controller for performing the display access, an interface unit for receiving data transfer from a CPU and performing the write access, and controlling such that the memory access request is accepted and the display access is prioritized. Memory controller means for transferring the drawing procedure information.
The transfer method information is set according to the PU cache method, and when the cache method is the copy-back method, the continuous time of one display access is shortened as compared with the write-through method.

【0013】さらに、前記グラフイックスプロセッサ
は、前記表示アクセスによって前記グラフイックスメモ
リから読み出されたビットマップ情報を一時記憶し、表
示器のタイミングによって出力する表示バッファを備
え、前記1回の表示アクセスによる連続ワード数を前記
表示バッファのデータ保持数の最大値とし、前記表示ア
クセスの要求発行のタイミングを前記データ保持数未満
のしきい値とし、これらの最大値としきい値を前記転送
方式情報に応じて変化させることを特徴とする。
Further, the graphics processor includes a display buffer for temporarily storing bitmap information read from the graphics memory by the display access and outputting the bitmap information at the timing of a display, and The number of consecutive words according to the maximum value of the number of data held in the display buffer, the timing of the display access request issuance is a threshold value less than the number of data holding, these maximum value and the threshold value in the transfer method information It is characterized in that it is changed according to it.

【0014】本発明の構成によれば、CPUがコピーバ
ック方式の場合に、CPUのグラフィックスメモリに対
するデータの書き込みは連続アドレスとなるので、同一
データ量に対するライトアクセス時間が短くてすむ。そ
の分、表示アクセスの優先確保のための余裕時間が少な
くてすみ、全体として1回のライトアクセス時間と表示
アクセス時間は、ライトスルー方式の場合に比べて短縮
できるので、メモリのアクセス効率が高まり、高速のグ
ラフイックス処理が可能になる。言い替えれば、CPU
側が高速のコピーバック方式によって、描画データのラ
イトアクセスを行なうのに追随して、高速の描画処理を
行なうことができる。
According to the configuration of the present invention, when the CPU uses the copy-back method, the writing of data to the graphics memory of the CPU is a continuous address, so that the write access time for the same data amount can be shortened. As a result, a margin time for ensuring display access priority can be reduced, and the overall write access time and display access time can be reduced as compared with the case of the write-through method, so that the memory access efficiency increases. , High-speed graphics processing becomes possible. In other words, CPU
The high-speed copy-back method enables high-speed drawing processing to follow write access to drawing data.

【0015】[0015]

【発明の実施の形態】以下、本発明による一実施形態を
図面にしたがって詳細に説明する。図1は、本発明を適
用する図形処理システムの構成図を示す。CPU10は
装置全体の制御を行うと共に、表示器51に図形を表示
するためのプログラムを実行する。主メモリ11は、C
PU10が処理するデータやプログラムを記憶する。C
D−ROMコントローラ12はCD−ROMの図形情報
をアクセスし、通信コントローラ13は図示しない他の
装置との情報を送受する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment according to the present invention will be described below in detail with reference to the drawings. FIG. 1 shows a configuration diagram of a graphic processing system to which the present invention is applied. The CPU 10 controls the entire apparatus and executes a program for displaying a graphic on the display 51. The main memory 11 is
The data and programs to be processed by the PU 10 are stored. C
The D-ROM controller 12 accesses the graphic information on the CD-ROM, and the communication controller 13 sends and receives information to and from another device (not shown).

【0016】グラフイックスプロセッサ20は、グラフ
イックスメモリ40内の表示領域に図形を描画し、さら
に描画したデータを読み出して表示器51に図形を表示
する。DAC(Digital to Analog Converter)10
は、グラフイックスプロセッサ20が出力するディジタ
ル形式の表示データをアナログデータに変換する。
The graphics processor 20 draws a figure in a display area in the graphics memory 40, reads out the drawn data, and displays the figure on a display 51. DAC (Digital to Analog Converter) 10
Converts the digital display data output from the graphics processor 20 into analog data.

【0017】グラフィックスメモリ40を構成する素子
としては、DRAMを用いるのが望ましい。DRAMは
他のメモリに比べて、チップ面積に対するトランジスタ
の集積度が高いためである。また、高速ページモードア
クセスというアクセス方式を持っており、アドレスの上
位部分(例えばビット9以上)が一致している場合の連
続アクセスでは、高速なアクセスが可能になる。
It is desirable to use a DRAM as an element constituting the graphics memory 40. This is because the DRAM has a higher degree of integration of transistors with respect to the chip area than other memories. In addition, it has an access method called high-speed page mode access, and high-speed access is possible in continuous access when the upper part of the address (for example, bit 9 or more) matches.

【0018】本装置で表示する図形は、1/60秒また
は1/30秒周期で、図形の大きさや位置を少しずつ変
化させ、画面を連続的に見せることでグラフィックス図
形の動画表示を行う。このため、CPU10やグラフイ
ックスプロセッサ20は、1/60秒または1/30秒
内に1画面分の描画を行なう。図形の描画は、次の手順
で行なわれ、1画面分を繰返し処理する。
The graphics displayed by the present apparatus are displayed in a moving image of graphics graphics by changing the size and position of the graphics little by little at a period of 1/60 seconds or 1/30 seconds, and showing the screen continuously. . Therefore, the CPU 10 and the graphics processor 20 perform drawing for one screen within 1/60 second or 1/30 second. Drawing of a figure is performed in the following procedure, and processing for one screen is repeated.

【0019】(1)CPU10による図形データの座標
変換 表示すべき図形に対して、方向や大きさ等を計算し、図
形の頂点座標の計算を行う。三角形や四角形の単純図形
を多数組合せて構成した複雑な図形の場合、その全ての
単純図形の頂点座標を計算する。
(1) Coordinate conversion of graphic data by CPU 10 For a graphic to be displayed, the direction, size, etc. are calculated, and the vertex coordinates of the graphic are calculated. In the case of a complicated figure formed by combining a large number of simple figures such as triangles and squares, the vertex coordinates of all the simple figures are calculated.

【0020】(2)CPU10によるディスプレイリス
トの作成 多数の単純図形からなる複雑な図形をグラフィックスメ
モリ40に描画するために、CPU10は描画コマンド
(以下では単に、コマンドと呼ぶ)をグラフイックスプ
ロセッサ20が実行できるコマンド形式に変換して、グ
ラフィックスメモリ40に転送する。通常は、単純図形
単位のコマンドを組み合わせ1図形分のコマンドに連結
する。このコマンドが連結したものをディスプレイリス
トと呼ぶ。ディスプレイリストは数10〜数100Kバ
イトの大きさで、ディスプレイリスト領域401に格納
される。
(2) Creation of Display List by CPU 10 In order to draw a complicated figure composed of a large number of simple figures in the graphics memory 40, the CPU 10 sends a drawing command (hereinafter simply referred to as a command) to the graphics processor 20. Is converted into an executable command format and transferred to the graphics memory 40. Normally, commands in simple figure units are combined and linked to commands for one figure. A combination of these commands is called a display list. The display list has a size of several tens to several hundreds of kilobytes and is stored in the display list area 401.

【0021】(3)グラフイックスプロセッサ20によ
る描画 このディスプレイリストをグラフイックスプロセッサ2
0が順次、読み込み、リストに示されるコマンドに従っ
て、グラフィックスメモリ40内の描画・表示領域40
2に描画する。
(3) Drawing by the graphics processor 20
0 is sequentially read, and the drawing / display area 40 in the graphics memory 40 is read in accordance with the command shown in the list.
Draw on 2.

【0022】(4)グラフイックスプロセッサ20によ
る表示 描画・表示領域402に描画された図形は、グラフイッ
クスプロセッサ20により表示タイミングで読み出さ
れ、表示器51に表示される。描画・表示領域402は
ダブルバッファで構成され、描画と表示のバッファが交
互に切り替わる。
(4) Display by the graphics processor 20 The graphics drawn in the drawing / display area 402 are read out at the display timing by the graphics processor 20 and displayed on the display 51. The drawing / display area 402 is composed of a double buffer, and the drawing and display buffers are alternately switched.

【0023】以上の(1)〜(4)の処理を、1/60
秒または1/30秒周期で繰り返す。システムバス14
は、上記の周期でディスプレイリストのデータをで転送
する。
The above processes (1) to (4) are performed by
Repeat in second or 1/30 second cycle. System bus 14
Transfers the data of the display list in the above cycle.

【0024】次に、グラフイックスプロセッサ20の構
成と動作の概略を説明する。CPUI/F21は、CP
U10がシステム制御レジスタ32等のレジスタ類やグ
ラフイックスメモリ40をアクセスするための制御を行
う。描画ユニット23は、グラフイックスメモリ40内
のディスプレイリストをフェッチし、そのリストに示さ
れるコマンドに従って描画を行う。パラメータ変換部2
2は、必要に応じてコマンドのパラメータを変換する。
表示コントローラ24は、描画ユニット23が描画した
データを表示するための制御を行なう。
Next, an outline of the configuration and operation of the graphics processor 20 will be described. The CPU I / F 21 is a CP
U10 controls access to the registers such as the system control register 32 and the graphics memory 40. The drawing unit 23 fetches the display list in the graphics memory 40 and performs drawing according to the command indicated in the list. Parameter converter 2
2 converts command parameters as needed.
The display controller 24 performs control for displaying data drawn by the drawing unit 23.

【0025】このように、グラフイックスプロセッサ2
0はその各要素が何らかの処理を行う度にグラフィック
スメモリ40をアクセスするため、グラフィックスメモ
リ40のアクセス効率を高めることが処理速度の向上に
つながる。そこで、グラフイックスプロセッサ20は、
アクセス要求単位にキャッシュやFIFOを持つことで
アクセス効率を高める。
As described above, the graphics processor 2
Since 0 accesses the graphics memory 40 each time the element performs some processing, increasing the access efficiency of the graphics memory 40 leads to an improvement in the processing speed. Therefore, the graphics processor 20
Access efficiency is enhanced by providing a cache or FIFO for each access request.

【0026】CPUFIFO25は、CPU10による
グラフィックスメモリ40のアクセスを高速化する。キ
ャッシュ(1)26はコマンド専用、キャッシュ(2)
27はテクスチャ専用、キャッシュ(3)28は描画専
用である。また、表示データ用に表示バッファ29を持
つ。
The CPU FIFO 25 speeds up access to the graphics memory 40 by the CPU 10. Cache (1) 26 is dedicated to command, Cache (2)
27 is dedicated to texture, and cache (3) 28 is dedicated to drawing. Further, it has a display buffer 29 for display data.

【0027】メモリコントローラ30は、キャッシュ
(1)〜(3)やFIFO25等から、グラフィックス
メモリ40に対するアクセス要求を受け付け、その優先
順位を決定し、アクセスを制御する。メモリコントロー
ラ30は表示コントローラ24からのアクセスを最優先
する。しかし、CPU10や描画ユニット23からのア
クセスが行なわれている間は、それらは中断されずに表
示コントローラからのアクセスが待たされる。
The memory controller 30 receives an access request to the graphics memory 40 from the caches (1) to (3), the FIFO 25, and the like, determines a priority order, and controls access. The memory controller 30 gives the highest priority to access from the display controller 24. However, while the access from the CPU 10 or the drawing unit 23 is being performed, the access from the display controller is awaited without interruption.

【0028】システム制御レジスタ32は、グラフイッ
クスプロセッサ20の動作モードを指定するレジスタで
ある。レジスタ32は、CPU10のキャッシュモード
を指定するCAM(CPU Access Mode)ビッを有してい
る。
The system control register 32 is a register for designating the operation mode of the graphics processor 20. The register 32 has a CAM (CPU Access Mode) bit that specifies the cache mode of the CPU 10.

【0029】図2に、グラフイックスプロセッサ20の
端子機能(1)〜(5)を示す。
FIG. 2 shows the terminal functions (1) to (5) of the graphics processor 20.

【0030】(1)System系 システムモードの設定とクロック及びリセットを入力す
る端子である。グラフイックスプロセッサ20は、描画
系と表示系で独立したクロックを入力でき、表示器51
の性能に関係なく、描画系は常に高速処理を行うことが
できる。
(1) System system This is a terminal for inputting a system mode setting and a clock and reset. The graphics processor 20 can input independent clocks for the drawing system and the display system,
Irrespective of the performance of the drawing, the drawing system can always perform high-speed processing.

【0031】(2)CPU系 CPUI/F21用の端子である。CPU10はグラフ
ィックスメモリ40の全空間と、システム制御レジスタ
32等の内部レジスタをアクセスすることができる。グ
ラフィックスメモリ40をアクセスする場合は、CS0
端子をLowに、レジスタをアクセスする場合はCS1
端子をLowにする。グラフィックスメモリ40へのラ
イトアクセスは、バイト単位が可能となるようにライト
イネーフ゛ルを2本持つ。このほか、DMA転送を制御
するDREQ,DACK端子や、バスサイクルを延長す
るWAIT端子、CPU10に対して割り込みを発生さ
せるIRL端子がある。
(2) CPU system This is a terminal for the CPU I / F 21. The CPU 10 can access the entire space of the graphics memory 40 and internal registers such as the system control register 32. To access the graphics memory 40, use CS0
Set the terminal to Low and CS1 to access the register.
Set the terminal to Low. Write access to the graphics memory 40 has two write enable files so that byte units can be used. In addition, there are DREQ and DACK terminals for controlling DMA transfer, a WAIT terminal for extending a bus cycle, and an IRL terminal for generating an interrupt to the CPU 10.

【0032】(3)Power系 電源を供給する端子は、クロック制御を行うPLL専用
の端子と、その他の一般用がある。
(3) Power System There are terminals for supplying power, a terminal dedicated to a PLL for performing clock control, and other terminals for general use.

【0033】(4)Display系 表示用の端子にはドットクロック出力(DCLK)、表
示データ出力(DD0−DD15)、同期信号の入出力
端子(HSYNC,VSYNC)等がある。
(4) Display system Display terminals include a dot clock output (DCLK), a display data output (DD0-DD15), and a synchronizing signal input / output terminal (HSYNC, VSYNC).

【0034】(5)Memory系 グラフィックスメモリ40とのI/Fとして、DRAM
を直結できる端子を備えている。
(5) Memory system A DRAM is used as an I / F with the graphics memory 40.
The terminal which can be directly connected is provided.

【0035】図3に、グラフイックスプロセッサの描画
コマンドを示す。四角形描画コマンドは、矩形のテクス
チャデータを任意の四角形に変形させながら描画する。
テクスチャデータが2値の場合はカラー拡張を行う。L
INEは単一の直線、または複数の直線を描画する。M
OVEは描画開始点の移動を行う。LOFSは描画座標
の原点をずらす。MOVEが実行された後のコマンド
は、ディスプレイリストに示される座標パラメータに対
して、このコマンドで指定した分だけ座標をずらして描
画する。AFFINは図形を描画する場合に、回転や拡
大、縮小を指定する。ディスプレイに示される座標パラ
メータに対して、AFFINで指定した分だけ座標を回
転(または拡大、縮小)して描画する。JUMPはディ
スプレイリストを分岐させる。GOSUBはディスプレ
イリストのサブルーチンをコールする。RETはサブル
ーチンから復帰する。TRAPはディスプレイリストの
フェッチを終了する。FLASHはテクスチャデータの
キャッシュであるキャッシュ(2)27内に存在するデ
ータを無効化し、新たにグラフィックスメモリ40から
データを読み込ませる。
FIG. 3 shows a drawing command of the graphics processor. The quadrangle drawing command draws the rectangular texture data while transforming it into an arbitrary quadrangle.
If the texture data is binary, color expansion is performed. L
INE draws a single line or a plurality of lines. M
OVE moves the drawing start point. LOFS shifts the origin of drawing coordinates. The command after the MOVE is executed draws the coordinate parameters shown in the display list with the coordinates shifted by the amount specified by the command. AFFIN designates rotation, enlargement, and reduction when drawing a figure. With respect to the coordinate parameters shown on the display, the coordinates are rotated (or enlarged or reduced) by the amount designated by AFFIN and drawn. JUMP branches the display list. GOSUB calls the display list subroutine. RET returns from the subroutine. TRAP ends the display list fetch. The FLASH invalidates data existing in the cache (2) 27 which is a cache of texture data, and newly reads data from the graphics memory 40.

【0036】図4に、グラフイックスプロセッサ内の各
レジスタのデータリストを示し、以下にその機能を説明
する。
FIG. 4 shows a data list of each register in the graphics processor, and its function will be described below.

【0037】(1)システム制御レジスタ SRESは、描画ユニット23をソフトウェアによって
初期化し、DRESは、表示コントローラ24をソフト
ウェアによって初期化する。DACは、表示領域(フレ
ームバッファ領域)を切り替える。RSは、ディスプレ
イリストのフェッチを開始させる。CAMはCPU10
内のキャッシュ101の種類を指定する。
(1) System control register SRES initializes the drawing unit 23 by software, and DRES initializes the display controller 24 by software. The DAC switches the display area (frame buffer area). The RS starts fetching the display list. CAM is CPU10
The type of the cache 101 is designated.

【0038】CPU10がグラフィックスメモリ40に
データをストアする動作の特徴として、キャッシュ10
1がコピーバック方式を採用している場合は、キャッシ
ュのラインサイズ分だけまとめてデータをライトする。
一方、ライトスルー方式を採用している場合は、1ワー
ド単位でデータをライトする。従って、CAMの設定に
よって、CPUのキャッシュ方式の指定や切り換えが可
能になる。
As a feature of the operation in which the CPU 10 stores data in the graphics memory 40, the cache 10
In the case where the copy back method 1 is employed, data is written collectively by the cache line size.
On the other hand, when the write-through method is adopted, data is written in units of one word. Therefore, it is possible to specify or switch the cache method of the CPU by setting the CAM.

【0039】(2)ステータスレジスタ VBKは、表示のフレーム切り替えを通知する。TRA
は、TRAPコマンドを実行しディスプレイリストのフ
ェッチを終了したことを通知する。DBFは、2つのフ
レームバッファに対し、現在どちらを表示中かを示す。
(2) Status register VBK notifies switching of the display frame. TRA
Notifies that the TRAP command has been executed and display list fetching has been completed. The DBF indicates which of the two frame buffers is currently being displayed.

【0040】(3)ステータスレジスタ・クリアレジス
タ 対応するステータスレジスタのビットをクリアする。
(3) Status register / clear register The corresponding status register bit is cleared.

【0041】(4)割り込み許可レジスタ 対応するステータスレジスタの各ビットによって、CP
U10に割り込みを発生させることを指定する。
(4) Interrupt enable register According to each bit of the corresponding status register, CP
Specifies that an interrupt is to be generated in U10.

【0042】(5)レンダリングモード MWXは、画面の横幅が512画素以下であるか、それ
とも513画素以上1024画素以下であるかを指定す
る。GBMは、1画素が8ビットであるか16ビットで
あるかを指定する。
(5) Rendering Mode MWX specifies whether the horizontal width of the screen is 512 pixels or less, or 513 pixels or more and 1024 pixels or less. GBM specifies whether one pixel is 8 bits or 16 bits.

【0043】(6)表示モード SCMは、表示がインタレースであるか、ノンインタレ
ースであるかを指定する。TVMは、TV同期モードで
あるかそれともマスタモードであるかを指定する。RC
YNは、グラフィックスメモリ40のリフレッシュサイ
クル数を指定する。
(6) Display Mode The SCM specifies whether the display is interlaced or non-interlaced. The TVM specifies whether the mode is the TV synchronous mode or the master mode. RC
YN designates the number of refresh cycles of the graphics memory 40.

【0044】(7)表示サイズ 表示画面のX方向とY方向の大きさを指定する。(7) Display Size The size of the display screen in the X and Y directions is specified.

【0045】(8)表示開始アドレス グラフィックスメモリ40上の2つのフレームバッファ
の開始アドレスを指定する。
(8) Display Start Address The start addresses of the two frame buffers on the graphics memory 40 are specified.

【0046】(9)ディスプレイリストアドレス グラフィックスメモリ40上のディスプレイリストのス
タートアドレスを指定する。
(9) Display List Address The start address of the display list on the graphics memory 40 is specified.

【0047】(10)ソース領域開始アドレス テクスチャデータの格納領域の開始アドレスを指定す
る。
(10) Source area start address Designates the start address of the texture data storage area.

【0048】(11)表示制御関係レジスタ レジスタ番号10から1Aは、表示制御に関するレジス
タである。表示画面の大きさ等に合わせて表示データを
読み出すタイミングの設定や、水平/垂直同期信号の周
期等を設定する。また、表示リセット時出力レジスタ
は、表示読み出しを行っていない時に画面に表示するカ
ラー値を設定する。例えば、表示動作を停止中は画面を
ブルーバック(青色表示)にすることができる。
(11) Display Control Registers Register numbers 10 to 1A are registers relating to display control. The timing of reading the display data is set according to the size of the display screen, and the cycle of the horizontal / vertical synchronization signal is set. The display reset output register sets a color value to be displayed on the screen when display reading is not performed. For example, the screen can be set to blue back (blue display) while the display operation is stopped.

【0049】(12)コマンドステータスレジスタ ディスプレイリストのフェッチを停止した時のメモリア
ドレスを通知するレジスタである。
(12) Command status register This register notifies the memory address when the fetch of the display list is stopped.

【0050】次に、CPU10がグラフィックスメモリ
40をアクセスするためのCPUFIFO25の構成と
動作を説明する。
Next, the configuration and operation of the CPU FIFO 25 for allowing the CPU 10 to access the graphics memory 40 will be described.

【0051】図5は、CPUFIFOの機能ブロック図
である。CPU10がグラフィックスメモリ40へのス
トア動作を行う度に、CPUI/F部21からライトリ
クエスト信号がくる。すると、カウンタ252がカウン
トアップされるとともに、その時のCPU10のライト
アドレスとデータがFIFO250に格納される。一致
検出部253で、カウンタ252の値とFIFO容量を
比較し、FIFOが満杯になったことがわかると、フリ
ップフロップ258をセットする。その結果、CPUI
/F部21にはFIFO250のビジーが通知され、C
PU10がこれ以上データをストアしないようにする。
FIG. 5 is a functional block diagram of the CPU FIFO. Each time the CPU 10 performs a store operation to the graphics memory 40, a write request signal is sent from the CPU I / F unit 21. Then, the counter 252 counts up, and the write address and data of the CPU 10 at that time are stored in the FIFO 250. The coincidence detection unit 253 compares the value of the counter 252 with the FIFO capacity. When it is found that the FIFO is full, the flip-flop 258 is set. As a result, CPUI
/ F section 21 is notified of the busy state of FIFO 250, and C
Prevent PU 10 from storing data anymore.

【0052】一方で、メモリコントローラ30には、グ
ラフィックスメモリ40への書き込み要求を出力する。
メモリコントローラ30は1ワードのデータを書き込む
度に、カウンタ256を更新するFIFOカウンタ更新
信号を出力する。カウンタ256の値は一致検出器25
5によってカウンタ252の値と比較される。カウンタ
256はFIFO250の読み出しカウンタであり、カ
ウンタ252はFIFOの書き込みカウンタである。こ
の2つの値が一致すると(即ち、CPU10によって書
き込まれたワード数だけ、メモリコントローラ30が読
み出すと)、グラフィックスメモリ40への書き込みを
停止するためフリップフロップ258をリセットする。
On the other hand, a write request to the graphics memory 40 is output to the memory controller 30.
The memory controller 30 outputs a FIFO counter update signal for updating the counter 256 every time one word of data is written. The value of the counter 256 is the coincidence detector 25
5 is compared with the value of the counter 252. The counter 256 is a read counter of the FIFO 250, and the counter 252 is a write counter of the FIFO. When the two values match (that is, when the memory controller 30 reads the number of words written by the CPU 10), the flip-flop 258 is reset to stop writing to the graphics memory 40.

【0053】フリーランカウンタ254は、一定期間C
PU10による書き込みがなかった場合に、FIFO2
50のデータをグラフィックスメモリ40に書き込むよ
うに動作する。また、CPU10がグラフィックスメモ
リ40を読み出す場合や、描画ユニット23がディスプ
レイリストのフェッチを開始する場合は、これらに先駆
けてFIFO250のデータをグラフィックスメモリ4
0に書き込むように動作する。
The free-run counter 254 indicates that the predetermined period C
When there is no writing by PU10, FIFO2
It operates to write 50 data into the graphics memory 40. Further, when the CPU 10 reads the graphics memory 40 or when the drawing unit 23 starts fetching the display list, the data of the FIFO 250 is stored in the graphics memory 4 in advance.
Operate to write 0.

【0054】ここで、CPU10の内部キャッシュ10
1の方式の違いによる、グラフィックスメモリ40のア
クセス時間の違いについて説明する。CPU10のキャ
ッシュ方式として、コピーバック方式とライトスルー方
式が知られている。
Here, the internal cache 10 of the CPU 10
The difference in the access time of the graphics memory 40 due to the difference in the first method will be described. As a cache method of the CPU 10, a copy-back method and a write-through method are known.

【0055】コピーバック方式では、CPU10がメモ
リ40に対するストア命令を実行しても、CPU10内
のキャッシュ101のみ変更され、メモリ40内のデー
タはすぐには変更されない。メモリ40が変更されるの
はキャッシュラインと呼ばれる複数ワードのデータがま
とめてキャッシュ101からメモリ40に追い出される
場合である。キャッシュラインのデータは連続アドレス
の複数ワードである。即ち、FIFO250を経由して
グラフィックスメモリ40に書き込まれるデータのアド
レスが連続している。従って、DRAMの高速ページモ
ードアクセスによって、FIFO25から短時間でグラ
フィックスメモリ40への書き込みができる。
In the copy-back method, even if the CPU 10 executes a store instruction to the memory 40, only the cache 101 in the CPU 10 is changed, and the data in the memory 40 is not changed immediately. The memory 40 is changed when data of a plurality of words called a cache line is flushed from the cache 101 to the memory 40 at a time. The data of the cache line is a plurality of words of a continuous address. That is, addresses of data written to the graphics memory 40 via the FIFO 250 are continuous. Therefore, writing to the graphics memory 40 from the FIFO 25 can be performed in a short time by the high-speed page mode access of the DRAM.

【0056】一方、ライトスルー方式は、CPU10が
メモリ40に対するストア命令を実行すると、1ワード
単位で直ちにデータがメモリ40に書き込まれる。従っ
て、前記FIFO250には、グラフィックスメモリ4
0に書き込むデータが不連続なアドレスとなる場合があ
る。最悪の場合は全てが不連続となることもある。アド
レスが不連続の場合は、DRAMの特性によりFIFO
25からグラフィックスメモリ40に書き込む時間が長
くなる。最悪なケースでは、コピーバック方式に比べ4
倍くらいの時間(最大80サイクル)となる。
On the other hand, in the write-through method, when the CPU 10 executes a store instruction for the memory 40, data is immediately written to the memory 40 in word units. Therefore, the FIFO memory 250 has the graphics memory 4
Data written to 0 may be a discontinuous address. In the worst case, everything may be discontinuous. If the address is discontinuous, the FIFO
From 25, the writing time to the graphics memory 40 becomes longer. In the worst case, 4
This is about twice as long (up to 80 cycles).

【0057】次に、描画用キャッシュ28の構成と動作
を説明する。図6は、描画用キャッシュのブロック図で
ある。キャッシュ(3)は描画専用であるが、描画ユニ
ット23がキャッシュ(3)28内のデータを読むこと
はしない。つまり、描画先の下絵とのデータ演算を行う
機能を持っていないので、書き込み動作のみとなる。下
絵をリードする必要がないので、メモリアクセス量を極
端に低減した高速動作が可能となる。
Next, the configuration and operation of the drawing cache 28 will be described. FIG. 6 is a block diagram of a drawing cache. The cache (3) is dedicated to drawing, but the drawing unit 23 does not read data in the cache (3) 28. That is, since it does not have a function of performing data calculation with a sketch at a drawing destination, only a write operation is performed. Since there is no need to read a sketch, high-speed operation with extremely reduced memory access is possible.

【0058】描画ユニット23がデータを書き込むと、
レジスタファイル2900に描画アドレスと描画データ
が記憶され、カウンタ2901がカウントアップされ
る。カウンタ2901の値が一致検出部2902で比較
され、レジスタファイル2900が満杯になると、フリ
ップフロップ2903を介してメモリコントローラ30
に書き込みリクエストを出力する。描画ユニット23
は、キャッシュ(3)28に空きのある状態で、1つの
図形描画コマンドが終了した場合は、キャッシュのデー
タをフラッシュさせる機能を持つ。フラッシュ信号がア
クティブになると、キャッシュ28はカウンタ2901
の示すワード数だけ、グラフィックスメモリ40にデー
タを書き込む。
When the drawing unit 23 writes the data,
The drawing address and the drawing data are stored in the register file 2900, and the counter 2901 is counted up. The value of the counter 2901 is compared by the coincidence detection unit 2902, and when the register file 2900 is full, the memory controller 30 via the flip-flop 2903
Output write request to. Drawing unit 23
Has a function of flushing data in the cache when one graphic drawing command is completed in a state where the cache (3) 28 is empty. When the flash signal becomes active, the cache 28 stores the counter 2901
The data is written into the graphics memory 40 by the number of words indicated by.

【0059】これらCPUFIFO25やキャッシュ2
8に共通する点として、カウンタ252またはカウンタ
2901で検出したワード数分だけの書き込みデータの
転送を行ない、無駄なデータ転送を行なわないことであ
る。この点、CPU等で用いられる一般的なキャッシュ
は、ラインサイズ単位での書き込みとなるので、書き換
えを行わない部分のデータも転送する。
The CPU FIFO 25 and the cache 2
8 is that write data is transferred by the number of words detected by the counter 252 or the counter 2901 and unnecessary data transfer is not performed. In this regard, a general cache used in a CPU or the like performs writing in units of a line size, and therefore also transfers a portion of data that is not rewritten.

【0060】図7は、CPUのアドレスマッピングを示
したものである。CPU10のソフトウェアは、グラフ
ィックスメモリ40を主メモリ11と区別することなく
アクセスできる。
FIG. 7 shows the address mapping of the CPU. The software of the CPU 10 can access the graphics memory 40 without distinguishing it from the main memory 11.

【0061】グラフィックスメモリ領域では、フレーム
バッファ0とフレームバッファ1を設けている。グラフ
ィックスの動画表示を行う場合、1/60秒単位(ある
いは1/30秒)で、フレームバッファ領域0,1を切
り替えて表示を行う。描画ユニット23は常に、表示を
行っていない方のフレームバッファに描画する。これに
よって、描画の途中状態を表示することがなく、高品質
の動画表示が可能となる。ディスプレイリスト領域も2
つ設け、描画ユニット23とCPU10が交互に使用す
る。
In the graphics memory area, a frame buffer 0 and a frame buffer 1 are provided. When displaying a moving image of graphics, the display is performed by switching the frame buffer areas 0 and 1 in units of 1/60 seconds (or 1/30 seconds). The drawing unit 23 always draws on the frame buffer that is not displaying. This makes it possible to display a high-quality moving image without displaying an intermediate state of drawing. Display list area is also 2
And the drawing unit 23 and the CPU 10 alternately use them.

【0062】次に、表示コントローラ24による、グラ
フィックスメモリ40の表示アクセスと表示バッファ2
9の制御方法について説明する。
Next, the display access of the graphics memory 40 by the display controller 24 and the display buffer 2
9 will be described.

【0063】図8は、表示コントローラの機能ブロック
図である。表示コントローラ24は表示器51に対して
同期信号(HSYNC,VSYNC)と表示データを出
力し、表示器51の画面に図形を表示する。タイミング
制御部246は、同期信号(HSYNC,VSYNC)
を生成すると共に、表示データ出力制御245に対し
て、表示バッファ29内のデータの出力タイミングを通
知する。
FIG. 8 is a functional block diagram of the display controller. The display controller 24 outputs a synchronization signal (HSYNC, VSYNC) and display data to the display 51 and displays a graphic on the screen of the display 51. The timing control unit 246 includes a synchronization signal (HSYNC, VSYNC)
Is generated, and the output timing of the data in the display buffer 29 is notified to the display data output control 245.

【0064】表示バッファ29はグラフイックスメモリ
40の表示領域のデータの一部をバッファリングする。
たとえば表示バッファ29が128ワードであれば、1
画素が1バイトのシステムでは256画素分のデータを
保持していることになる。
The display buffer 29 buffers a part of the data in the display area of the graphics memory 40.
For example, if the display buffer 29 has 128 words, 1
In a system in which the pixel is one byte, data of 256 pixels is held.

【0065】また、グラフイックスメモリ40から表示
バッファ29へのデータ転送速度は、表示バッファ29
から表示器51へのそれより十分に高速である。例え
ば、前者は28MHzで動作し、後者は14MHz以下
で動作する。従って、グラフイックスメモリ40からの
表示データの読み出しタイミングが多少ずれても、表示
器51へのデータ転送タイミングは常に一定に保つこと
ができる。
The data transfer speed from the graphics memory 40 to the display buffer 29 depends on the display buffer 29.
Is much faster than that from to. For example, the former operates at 28 MHz and the latter operates below 14 MHz. Therefore, even if the readout timing of the display data from the graphics memory 40 is slightly shifted, the data transfer timing to the display 51 can always be kept constant.

【0066】表示バッファ29の読み出しと書き込み
は、以下のように行なわれる。表示データ出力制御部2
45は、表示ドットクロック(グラフイックスプロセッ
サ20のDCLK端子の出力で、表示器51の1画素単
位のクロック)に合わせて、読み出しアドレスレジスタ
242が示すアドレスから順次、表示バッファ29を読
み出して、表示データを表示器51に出力すると共に、
読み出しアドレスレジスタ242を更新する。
Reading and writing of the display buffer 29 are performed as follows. Display data output control unit 2
Reference numeral 45 denotes the display buffer 29 which is sequentially read from the address indicated by the read address register 242 in accordance with the display dot clock (the output of the DCLK terminal of the graphics processor 20 and the clock of one pixel of the display 51). Outputting the data to the display 51,
Update the read address register 242.

【0067】一方、グラフィックスメモリアクセス制御
部240は、グラフィックスメモリアクセストリガ信号
によって起動され、連続アクセスワード数(例えば、3
2ワード/64ワード)に設定されるワード数分だけ、
メモリコントローラ30を介してグラフィックスメモリ
40を読み出し、読み出したデータを表示バッファ29
に書き込む。書き込むアドレスは、書き込みアドレスレ
ジスタ241から指示される。
On the other hand, the graphics memory access control section 240 is activated by the graphics memory access trigger signal, and the number of continuous access words (for example, 3
2 words / 64 words)
The graphics memory 40 is read through the memory controller 30 and the read data is displayed in the display buffer 29.
Write to. The write address is specified from the write address register 241.

【0068】書き込みアドレスレジスタ241と読み出
しアドレスレジスタ242は、減算器243で常に減算
されていて、その差分値は比較器244で定数値と比較
されている。つまり、差分値が設定されている定数値
(例えば、12ワード/48ワード)以下になると、上
記のトリガ信号が出力されて、グラフィックスメモリア
クセス制御部240はグラフイックスメモリ40を表示
アクセスし、表示データを表示バッファ29に蓄える。
The write address register 241 and the read address register 242 are always subtracted by a subtractor 243, and the difference value is compared with a constant value by a comparator 244. That is, when the difference value becomes equal to or less than the set constant value (for example, 12 words / 48 words), the trigger signal is output, and the graphics memory access control unit 240 accesses the graphics memory 40 for display, The display data is stored in the display buffer 29.

【0069】図9は、以上の動作を示すタイムチャート
である。グラフィックスメモリ40に対する表示アクセ
スの最初の動作はHSYNC信号によって開始される。
この表示アクセスによって表示バッファ29のデータ保
持数が上昇し、1回の表示アクセスで読み出す連続アク
セスワード数(図では、32ワード)に達すると表示ア
クセスは中断し、バッファ29に蓄積されている表示デ
ータは表示器51に転送されて次第に減少する。そし
て、定数A(図では、12ワード)以下に減少すると、
表示コントローラ24からメモリコントローラ30に表
示アクセスのリクエストが発行され、リクエストが許可
されるとグラフィックスメモリ40に対する表示アクセ
スが再び行なわれる。この例で、1画面が320×24
0ドットの場合、1画面分の表示のためには1200回
の表示アクセスが繰り返される。
FIG. 9 is a time chart showing the above operation. The first operation of the display access to the graphics memory 40 is started by the HSYNC signal.
With this display access, the number of data held in the display buffer 29 increases, and when the number of continuous access words (32 words in the figure) read in one display access is reached, the display access is interrupted and the display stored in the buffer 29 is stopped. The data is transferred to the display 51 and gradually decreases. Then, when the number decreases below the constant A (12 words in the figure),
A display access request is issued from the display controller 24 to the memory controller 30. When the request is permitted, the display access to the graphics memory 40 is performed again. In this example, one screen is 320 × 24
In the case of 0 dot, display access is repeated 1200 times for displaying one screen.

【0070】表示バッファ29への書き込みは読み出し
に比べて高速となるので、表示アクセスリクエスト信号
が発行されてから、表示アクセスが開始されるまでに時
間的な余裕がある。図示の表示アクセス猶予時間Tdが
これに相当し、Tdを経過しても表示アクセスが開始さ
れないと、表示バッファ29が空になり、表示器51の
画面が乱れることになる。上述のように、メモリコント
ローラ30は表示アクセスを最優先に行なうが、そのリ
クエスト時にCPU等の他のアクセスが実行中の場合
は、その終了まで表示アクセスが待たされる。
Since writing to the display buffer 29 is faster than reading, there is ample time from when a display access request signal is issued to when display access is started. The illustrated display access delay time Td corresponds to this, and if the display access is not started even after the elapse of Td, the display buffer 29 becomes empty and the screen of the display device 51 is disturbed. As described above, the memory controller 30 gives the highest priority to the display access, but if another access such as the CPU is being executed at the time of the request, the display access waits until the end.

【0071】従って、表示バッファ29が空になるのを
回避するためには、グラフイックスプロセッサ40の他
のアクセス時間Ta<Tdの関係を維持する必要があ
る。このTaの最大時間から定数Aが決定される。
Therefore, in order to prevent the display buffer 29 from being emptied, it is necessary to maintain the relationship of another access time Ta <Td of the graphics processor 40. The constant A is determined from the maximum time of Ta.

【0072】他からのアクセス、特にCPU10による
描画コマンドのライトアクセスは頻度が高く、そのアク
セス時間はキャッシュ方式によって相違し、コピーバッ
ク方式とライトスルー方式では最大で約4倍も相違す
る。
Accesses from other sources, in particular, write accesses of drawing commands by the CPU 10 are frequent, and their access times differ depending on the cache system, and differ at most about four times between the copy-back system and the write-through system.

【0073】図10は、図9に比べてTaが4倍となる
例の動作を示すタイムチャートである。表示アクセスの
リクエストを発行する定数Bは、定数Aの4倍の48ワ
ードになる。また、1回の表示アクセスで読み出す連続
ワード数も増加し、この例では64ワードとしている。
ちなみに、この例における1画面分の表示アクセスは6
00回となる。
FIG. 10 is a time chart showing an operation of an example in which Ta is quadrupled as compared with FIG. The constant B for issuing the display access request is 48 words, which is four times the constant A. In addition, the number of continuous words read in one display access also increases, and in this example, the number is 64 words.
Incidentally, the display access for one screen in this example is 6
00 times.

【0074】本実施例では図8のように、表示コントロ
ーラ24では比較器244に設定する定数にA=12と
B=48の2通り、グラフイックスメモリアクセス制御
部240に設定する連続アクセスワード数にa=32、
b=64の2通りを用意し、CPU10のキャッシュ方
式に応じて、上述したシステム制御レジスタのCAMビ
ット(図4)の指定に対応して、選択するように構成さ
れている。即ち、CAMビットの値がコピーバック方式
を示す場合はA,aの値を、ライトスルー方式を示す場
合はB,bの値を選択する。
In this embodiment, as shown in FIG. 8, the display controller 24 sets two constants, A = 12 and B = 48, in the comparator 244, and sets the number of continuous access words to be set in the graphics memory access control unit 240. A = 32,
b = 64 are prepared, and are selected in accordance with the designation of the CAM bit (FIG. 4) of the above-described system control register according to the cache system of the CPU 10. That is, if the value of the CAM bit indicates the copy-back method, the values of A and a are selected, and if the value of the CAM bit indicates the write-through method, the values of B and b are selected.

【0075】これによれば、CPUがコピーバック方式
を採用する場合に、ライトスルー方式の場合に比べて1
回の表示アクセス時間を1/4に短縮でき、その分CP
Uのライトアクセスの回数を増加できるので、高速のグ
ラフイックスが高速のメモリシステムによらずに実現で
きる。
According to this, when the CPU adopts the copy-back method, the CPU is one unit smaller than in the case of the write-through method.
Display access time can be reduced to 1/4 and CP
Since the number of U write accesses can be increased, high-speed graphics can be realized without using a high-speed memory system.

【0076】また、CAMビット値を切り替えるだけ
で、異なるキャッシュ方式に対応できるので、グラフイ
ックスプロセッサの汎用性が高まる。さらに、キャッシ
ュ方式異なる複数のCPUによってグラフイックスメモ
リがライトされるシステムにおいて、ライトアクセスを
発行したCPUのキャッシュ方式に応じて、グラフイッ
クスプロセッサの表示アクセス方式を切り換えるので、
高速のキャッシュ方式によるグラフイックスを犠牲にす
ることがない。
Further, since it is possible to cope with different cache systems only by switching the CAM bit value, the versatility of the graphics processor is enhanced. Further, in a system in which the graphics memory is written by a plurality of CPUs having different cache schemes, the display access scheme of the graphics processor is switched according to the cache scheme of the CPU that issued the write access.
There is no sacrifice of graphics due to the high-speed cache method.

【0077】[0077]

【発明の効果】本発明によれば、グラフィックスプロセ
ッサに対してCPUのキャッシュ方式の違いを設定する
ことによって、グラフィックスメモリを効率良くアクセ
スすることが可能となる。従って、グラフィックス表示
処理の高速化を図ることができる。
According to the present invention, it is possible to efficiently access the graphics memory by setting the difference in the cache system of the CPU for the graphics processor. Therefore, the speed of the graphics display processing can be increased.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の位置実施形態による図形処理装置のシ
ステム構成図。
FIG. 1 is a system configuration diagram of a graphic processing apparatus according to an embodiment of the present invention.

【図2】グラフィックスプロセッサの端子機能の説明
図。
FIG. 2 is an explanatory diagram of a terminal function of the graphics processor.

【図3】グラフィックスプロセッサの描画コマンドの説
明図。
FIG. 3 is an explanatory diagram of a drawing command of the graphics processor.

【図4】グラフィックスプロセッサレジスタ機能の説明
図。
FIG. 4 is an explanatory diagram of a graphics processor register function.

【図5】CPUFIFOの機能ブロック図。FIG. 5 is a functional block diagram of a CPU FIFO.

【図6】描画用キャッシュ(3)の機能ブロック図。FIG. 6 is a functional block diagram of a drawing cache (3).

【図7】CPUのアドレスマッピングの説明図。FIG. 7 is an explanatory diagram of CPU address mapping.

【図8】表示コントローラの構成図。FIG. 8 is a configuration diagram of a display controller.

【図9】グラフィックスメモリのアクセスと表示バッフ
ァの制御の一例を示すタイムチャート。
FIG. 9 is a time chart showing an example of access to a graphics memory and control of a display buffer.

【図10】グラフィックスメモリのアクセスと表示バッ
ファの制御の他の例を示すタイムチャート。
FIG. 10 is a time chart showing another example of access to the graphics memory and control of the display buffer.

【符号の説明】[Explanation of symbols]

10…CPU、11…主メモリ、20…グラフィックス
プロセッサ、21…CPUI/F、22…パラメータ変
換部、23…描画ユニット、24…表示コントローラ、
25…CPUFIFO、26…キャッシュ(1)、27
…キャッシュ(2)、28…キャッシュ(3)、29…
表示バッファ、30…メモリコントローラ、40…グラ
フィックスメモリ、50…DAC(Digital to Analog
Converter)、51…表示器、101…CPU内蔵キャ
ッシュ、320…CAMビット。
10 CPU, 11 main memory, 20 graphics processor, 21 CPU I / F, 22 parameter converter, 23 drawing unit, 24 display controller,
25: CPU FIFO, 26: Cache (1), 27
... Cache (2), 28 ... Cache (3), 29 ...
Display buffer, 30: memory controller, 40: graphics memory, 50: DAC (Digital to Analog)
Converter), 51: display unit, 101: CPU built-in cache, 320: CAM bit.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G09G 5/18 G06F 15/72 A ──────────────────────────────────────────────────の Continued on the front page (51) Int.Cl. 6 Identification code FI G09G 5/18 G06F 15/72 A

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 表示すべきグラフィックス図形の種類や
頂点パラメータ等で構成される描画手続き情報を生成す
るCPUと、そのCPUから書き込まれる前記描画手続
き情報や表示器に出力する描画データを記憶するメモリ
と、前記描画手続き情報に対する描画アクセスを行なっ
て前記メモリに描画データを記憶し、さらに前記描画デ
ータを前記表示器に出力する表示読み出しを行うグラフ
ィックスプロセッサを備え、前記CPUと前記グラフィ
ックスプロセッサの双方から前記メモリをアクセスする
グラフィックス表示装置において、 前記グラフィックスプロセッサは、前記CPUに具備さ
れ前記グラフイックスメモリへデータを転送するキャッ
シュメモリのキャッシュ方式に応じて、前記グラフイッ
クスメモリに対する表示読み出しタイミングを変化させ
ることを特徴とするグラフィックス表示装置。
1. A CPU for generating drawing procedure information including a type of a graphics figure to be displayed, a vertex parameter, and the like, and storing the drawing procedure information written from the CPU and drawing data to be output to a display. A memory and a graphics processor for performing drawing access to the drawing procedure information, storing drawing data in the memory, and further performing display reading for outputting the drawing data to the display device, wherein the CPU and the graphics processor A graphics display device that accesses the memory from both of them. The graphics processor reads and displays the graphics memory according to a cache system of a cache memory provided in the CPU and transferring data to the graphics memory. Thailand Graphics display device characterized by varying the ring.
【請求項2】 請求項1において、 前記グラフイックスプロセッサは、前記キャッシュ方式
が前記グラフイックスメモリに対して、複数ワードのデ
ータを連続して転送する方式か又は1ワード毎に転送す
る方式かを示すキャッシュ方式情報を前記CPUから与
えられ、前者の場合は後者に比べて1回の表示読み出し
の連続時間を短くすることを特徴とするグラフィックス
表示装置。
2. The graphics processor according to claim 1, wherein the graphics processor determines whether the cache system transfers a plurality of words of data to the graphics memory continuously or by word. A graphics display device, wherein cache system information is provided from the CPU, and in the former case, the continuous time of one display reading is shortened as compared with the latter.
【請求項3】 表示すべきグラフィックス図形の種類や
頂点パラメータ等で構成される描画手続き情報の記憶エ
リア及び表示器に出力するビットマップ情報を記憶する
エリアを有するグラフイックスメモリに対して、前記ビ
ットマップ情報を生成するための描画アクセス及び、表
示器に表示データを出力するための表示アクセスを行う
グラフィックスプロセッサにおいて、 前記グラフイックスメモリに対する前記描画手続き情報
のライトアクセスが複数ワードのデータを連続アドレス
で転送する方式か又は、1ワード毎に転送する方式かを
示す転送方式情報を設定され、前者の場合は後者に比べ
て1回の表示アクセスの連続時間を短くすることを特徴
とするグラフィックスプロセッサ。
3. A graphics memory having an area for storing drawing procedure information including a type of a graphics figure to be displayed and a vertex parameter and an area for storing bitmap information to be output to a display device. In a graphics processor that performs drawing access for generating bitmap information and display access for outputting display data to a display, a write access of the drawing procedure information to the graphics memory continuously performs data of a plurality of words. A transfer method is set which indicates whether transfer is to be performed by an address or a transfer method for each word. In the former case, the continuous time of one display access is shortened compared to the latter. Processor.
【請求項4】 請求項3において、 前記グラフイックスプロセッサは、前記描画アクセスを
行なう描画ユニットと前記表示アクセスを行なう表示コ
ントローラと、CPUからのデータ転送を受信し前記ラ
イトアクセスを行なうインターフェイス手段と、それら
のメモリアクセス要求を受付け前記表示アクセスを優先
して制御するメモリコントローラ手段を備え、 前記描画手続き情報を転送する前記CPUのキャッシュ
方式によって前記転送方式情報を設定し、前記キャッシ
ュ方式がコピーバック方式の場合はライトスルー方式に
比べて1回の表示アクセスの連続時間を短くすることを
特徴とするグラフィックスプロセッサ。
4. The graphics processor according to claim 3, wherein the graphics processor comprises: a rendering unit for performing the rendering access; a display controller for performing the display access; and interface means for receiving data transfer from a CPU and performing the write access; A memory controller for receiving the memory access request and controlling the display access with priority; setting the transfer mode information according to a cache mode of the CPU for transferring the drawing procedure information; In the graphics processor, the continuous time of one display access is shortened as compared with the write-through system.
【請求項5】 請求項3または4において、 前記グラフイックスプロセッサは、前記表示アクセスに
よって前記グラフイックスメモリから読み出されたビッ
トマップ情報を一時記憶し、表示器のタイミングに応じ
て出力する表示バッファを備え、 前記1回の表示アクセスによる連続ワード数を前記表示
バッファのデータ保持数の最大値とし、前記表示アクセ
スの要求発行のタイミングを前記データ保持数未満のし
きい値とし、これらの最大値としきい値を前記転送方式
情報に応じて変化させることを特徴とするグラフィック
スプロセッサ。
5. The display buffer according to claim 3, wherein the graphics processor temporarily stores bitmap information read from the graphics memory by the display access, and outputs the bitmap information according to a timing of a display. The number of continuous words by the one display access is set to the maximum value of the number of data held in the display buffer, the timing of issuing the display access request is set to a threshold value less than the number of data held, And a threshold value that changes according to the transfer method information.
JP25872596A 1996-09-30 1996-09-30 Graphics display device and graphics processor Expired - Fee Related JP3683657B2 (en)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP25872596A JP3683657B2 (en) 1996-09-30 1996-09-30 Graphics display device and graphics processor
TW086113390A TW360823B (en) 1996-09-30 1997-09-15 Data processor and graphic processor
KR1019970049589A KR100450980B1 (en) 1996-09-30 1997-09-29 Data processor and graphics processor
US08/942,689 US6333745B1 (en) 1996-09-30 1997-09-29 Data processor having unified memory architecture providing priority memory access
US09/991,705 US6717583B2 (en) 1996-09-30 2001-11-26 Data processor having unified memory architecture providing priority memory access
US10/669,562 US6954206B2 (en) 1996-09-30 2003-09-25 Data processor having unified memory architecture using register to optimize memory access
US11/182,944 US7333116B2 (en) 1996-09-30 2005-07-18 Data processor having unified memory architecture using register to optimize memory access

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25872596A JP3683657B2 (en) 1996-09-30 1996-09-30 Graphics display device and graphics processor

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005071366A Division JP4137903B2 (en) 2005-03-14 2005-03-14 Graphics display device and graphics processor

Publications (2)

Publication Number Publication Date
JPH10105154A true JPH10105154A (en) 1998-04-24
JP3683657B2 JP3683657B2 (en) 2005-08-17

Family

ID=17324227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25872596A Expired - Fee Related JP3683657B2 (en) 1996-09-30 1996-09-30 Graphics display device and graphics processor

Country Status (1)

Country Link
JP (1) JP3683657B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132489A (en) * 2000-08-23 2002-05-10 Nintendo Co Ltd Graphics system
JP2006330700A (en) * 2005-04-28 2006-12-07 Semiconductor Energy Lab Co Ltd Image output apparatus and operation method thereof
JP2008503829A (en) * 2004-06-23 2008-02-07 エヌエイチエヌ コーポレーション Image resource loading method and image resource loading system
GB2462860A (en) * 2008-08-22 2010-02-24 Advanced Risc Mach Ltd Apparatus for communicating between a cpu and a gpu
JP2011199804A (en) * 2010-03-24 2011-10-06 Seiko Epson Corp Image display apparatus, projector, and data acquiring method in image display apparatus
WO2015083279A1 (en) * 2013-12-06 2015-06-11 三菱電機株式会社 Information processing device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132489A (en) * 2000-08-23 2002-05-10 Nintendo Co Ltd Graphics system
JP2008503829A (en) * 2004-06-23 2008-02-07 エヌエイチエヌ コーポレーション Image resource loading method and image resource loading system
US8434089B2 (en) 2004-06-23 2013-04-30 Nhn Corporation Method and system for loading of image resource
JP2006330700A (en) * 2005-04-28 2006-12-07 Semiconductor Energy Lab Co Ltd Image output apparatus and operation method thereof
GB2462860A (en) * 2008-08-22 2010-02-24 Advanced Risc Mach Ltd Apparatus for communicating between a cpu and a gpu
GB2462860B (en) * 2008-08-22 2012-05-16 Advanced Risc Mach Ltd Apparatus and method for communicating between a central processing unit and a graphics processing unit
US8675006B2 (en) 2008-08-22 2014-03-18 Arm Limited Apparatus and method for communicating between a central processing unit and a graphics processing unit
JP2011199804A (en) * 2010-03-24 2011-10-06 Seiko Epson Corp Image display apparatus, projector, and data acquiring method in image display apparatus
WO2015083279A1 (en) * 2013-12-06 2015-06-11 三菱電機株式会社 Information processing device
JPWO2015083279A1 (en) * 2013-12-06 2017-03-16 三菱電機株式会社 Information processing device

Also Published As

Publication number Publication date
JP3683657B2 (en) 2005-08-17

Similar Documents

Publication Publication Date Title
KR100450980B1 (en) Data processor and graphics processor
JP4071196B2 (en) Automatic memory management for zone rendering
JP2662168B2 (en) Systems and methods for managing graphics system rendering context data
EP2936492B1 (en) Multi-mode memory access techniques for performing graphics processing unit-based memory transfer operations
KR100226088B1 (en) Address-translatable graphic processor, data processor and drawing method with employment of the same
JPH0348370A (en) Memory access control circuit
JPS63200230A (en) Graphic display adaptor
US7760205B2 (en) Information processing apparatus for efficient image processing
JPH08212382A (en) Z-buffer tag memory constitution
US6952217B1 (en) Graphics processing unit self-programming
JPH09282470A (en) Graphic processing system
US6927776B2 (en) Data transfer device and method
JP3683657B2 (en) Graphics display device and graphics processor
US20060061579A1 (en) Information processing apparatus for efficient image processing
KR20190076709A (en) Graphic processor performing warping process, Rendering system having the same and Operating method of graphic processor
JP4137903B2 (en) Graphics display device and graphics processor
JP3454113B2 (en) Graphics display
JPH11133943A (en) Data processor and data processing system
JPH08194826A (en) Graphic controller
JPH10161636A (en) Graphics display device
JP2829051B2 (en) Character display method
JP2624667B2 (en) Graphic processing unit
JPH0877367A (en) Image processor and image data processor using it
JP2001195569A (en) Image data compression and control system
JPH06282657A (en) Graphic display method and device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050526

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080603

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees