JP2011507347A - System and method for storing program code and data in an application hosting center - Google Patents
System and method for storing program code and data in an application hosting center Download PDFInfo
- Publication number
- JP2011507347A JP2011507347A JP2010537086A JP2010537086A JP2011507347A JP 2011507347 A JP2011507347 A JP 2011507347A JP 2010537086 A JP2010537086 A JP 2010537086A JP 2010537086 A JP2010537086 A JP 2010537086A JP 2011507347 A JP2011507347 A JP 2011507347A
- Authority
- JP
- Japan
- Prior art keywords
- video
- game
- user
- frame
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 230000002452 interceptive effect Effects 0.000 claims abstract description 26
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000007906 compression Methods 0.000 description 140
- 230000006835 compression Effects 0.000 description 133
- 230000033001 locomotion Effects 0.000 description 41
- 230000009471 action Effects 0.000 description 35
- 238000003860 storage Methods 0.000 description 32
- 230000005540 biological transmission Effects 0.000 description 28
- 238000004422 calculation algorithm Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 28
- 230000006837 decompression Effects 0.000 description 27
- 239000000872 buffer Substances 0.000 description 25
- 230000007547 defect Effects 0.000 description 23
- 238000012545 processing Methods 0.000 description 23
- 230000000007 visual effect Effects 0.000 description 22
- 230000003111 delayed effect Effects 0.000 description 21
- 230000018109 developmental process Effects 0.000 description 21
- 230000003287 optical effect Effects 0.000 description 20
- 230000000694 effects Effects 0.000 description 19
- 238000004519 manufacturing process Methods 0.000 description 18
- 230000008901 benefit Effects 0.000 description 17
- 230000008859 change Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 17
- 238000003491 array Methods 0.000 description 16
- 238000011161 development Methods 0.000 description 16
- 230000006399 behavior Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 230000002829 reductive effect Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 238000012546 transfer Methods 0.000 description 12
- 230000001413 cellular effect Effects 0.000 description 11
- 238000012937 correction Methods 0.000 description 11
- 230000001934 delay Effects 0.000 description 11
- 238000013461 design Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 238000010276 construction Methods 0.000 description 7
- 239000000835 fiber Substances 0.000 description 6
- 238000012856 packing Methods 0.000 description 6
- 230000004888 barrier function Effects 0.000 description 5
- 125000004122 cyclic group Chemical group 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000013307 optical fiber Substances 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 238000012384 transportation and delivery Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 241000209202 Bromus secalinus Species 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000013341 scale-up Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 241000238876 Acari Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 101100346764 Mus musculus Mtln gene Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 240000007591 Tilia tomentosa Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000006397 emotional response Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000009046 primary transport Effects 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8545—Content authoring for generating interactive applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
- H04N21/23106—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion involving caching operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/24—Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
- H04N21/2402—Monitoring of the downstream path of the transmission network, e.g. bandwidth available
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4781—Games
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
アプリケーションホスティングセンター内にプログラムコード及びデータを記憶するためのシステム及び方法を提供する。コンピュータ実施方法の一実施形態では、オンラインアプリケーションを実行するのに使用されるプログラムコード及び/又はデータを第1形式及び第2形式へと細分化し、第1形式のプログラムコード及びデータを、比較的短待ち時間のメモリアクセスを与える第1形式のメモリに記憶し、第2形式のプログラムコード及びデータを、第1形式のメモリに比して比較的長待ち時間のメモリアクセスを与える第2形式のメモリに記憶し、オンラインアプリケーションを実行するためのクライアント要求に応答して第1メモリ及び第2メモリからプログラムコード及びデータを検索し、アプリケーションにより発生された映像を表すストリーミング双方向ビデオストリームをクライアントへ送信する。
【選択図】図2aSystems and methods for storing program code and data within an application hosting center are provided. In one embodiment of a computer-implemented method, program code and / or data used to execute an online application is subdivided into a first format and a second format, and the first format of program code and data is relatively A first type of memory that provides a low latency memory access and a second type of program code and data that provides a relatively long latency memory access compared to the first type of memory. A streaming interactive video stream representing the video generated by the application is retrieved from the first memory and the second memory in response to a client request to store in the memory and execute the online application to the client. Send.
[Selection] Figure 2a
Description
本発明は、一般的に、オーディオ及びビデオメディアを操作し及びそれにアクセスするユーザの能力を改善するデータ処理システムの分野に係る。 The present invention relates generally to the field of data processing systems that improve the ability of users to manipulate and access audio and video media.
関連出願:本出願は、本出願の譲受人に譲渡された“APPARATUS AND METHOD FOR WIRELESS VIDEO GAMING”と題する2002年12月10日出願の第10/315,460号の一部継続(CIP)出願である。 Related Application: This application is a continuation-in-part (CIP) application of No. 10 / 315,460 filed Dec. 10, 2002 entitled “APPARATUS AND METHOD FOR WIRELESS VIDEO GAMING” assigned to the assignee of the present application. It is.
記録音声及び動画メディアは、トーマスエジソンの時代から世相を表している。20世紀の初頭に、記録音声メディア(シリンダー及びレコード)及び動画メディア(ニコロデオン及び映画)が広く配給されたが、両技術は、まだ幼時期であった。1920年代後期に、動画が大量市場ベースで音声と結合され、その後、音声を伴うカラー動画となった。ラジオ放送は、大規模な広告支援形態の放送大量市場音声メディアへと徐々に進化した。1940年代中期にテレビ(TV)放送規格が確立されると、テレビは、予め録画された又は生の動画を家庭へ届ける放送大量市場メディアの一形式としてラジオに加わった。 Recorded audio and video media have represented the world since the time of Thomas Edison. At the beginning of the 20th century, recorded audio media (cylinders and records) and video media (nickelodeon and movies) were widely distributed, but both technologies were still in their infancy. In the late 1920s, video was combined with audio on a mass market basis, and then became a color video with audio. Radio broadcasting has gradually evolved into a broadcast mass market audio media with a large advertising support form. With the establishment of the television (TV) broadcast standard in the mid 1940s, television joined the radio as a form of broadcast mass market media that delivered pre-recorded or live video to the home.
20世紀中期までは、米国の家庭の大部分は、記録音声メディアを再生する蓄音器レコードプレーヤ、生放送音声を受信するラジオ、及び生放送オーディオ/ビデオ(A/V)メディアを上映するテレビ受像機を有していた。多くの場合に、これら3つの「メディアプレーヤ」(レコードプレーヤ、ラジオ及びTV)は、共通のスピーカを共有する1つのキャビネットに結合されて、家庭の「メディアセンター」となった。メディアの選択肢は、消費者に制限されるが、メディア「エコシステム」は、かなり安定したものであった。ほとんどの消費者は、「メディアプレーヤ」をどのように使用するか知っており、それらの能力をフルに楽しむことができた。同時に、メディアの発行者(主に動画及びテレビスタジオ、並びに音楽会社)は、一般に普及した海賊版又は「二次販売」即ち中古メディアの再販から悩まされることなく、それらのメディアを劇場及び家庭の両方に配給することができた。典型的に、発行者は、二次販売から収入を得ず、従って、そうでなければ新規販売のために中古メディアの買い手から発行者が得るかもしれない収入が減少した。20世紀の中期に販売された中古レコードは確かにあるが、そのような販売は、レコード発行者に大きな影響を及ぼさなかった。というのは、典型的に大人が一度又は数回見るだけの動画又はビデオ番組とは異なり、音楽トラックは、数百回又は数千回も聞かれるからである。従って、音楽メディアは、動画/ビデオメディアより遥かに「腐敗」しない(即ち、大人の消費者にとって価値が継続する)。レコードを購入すると、消費者がその音楽が好きな場合、消費者は、おそらくそれを長期間保持する。 Until the middle of the 20th century, most homes in the United States had a gramophone record player that played recorded audio media, a radio that received live broadcast audio, and a television receiver that showed live audio / video (A / V) media. Was. In many cases, these three “media players” (record player, radio and TV) have been combined into a single cabinet sharing a common speaker to become a home “media center”. Media options are limited to consumers, but the media “ecosystem” was fairly stable. Most consumers knew how to use "media players" and were able to fully enjoy their abilities. At the same time, publishers of media (mainly video and television studios and music companies) can distribute their media, both in theater and home, without suffering from the popular pirated or “secondary sale” or resale of used media. Could be distributed. Typically, the issuer does not earn revenue from secondary sales, and therefore the revenue that the issuer may otherwise earn from second-hand media buyers for new sales has decreased. Although there are certainly used records sold in the middle of the 20th century, such sales did not have a major impact on record issuers. This is because music tracks are heard hundreds or thousands of times, unlike videos or video programs that adults typically only watch once or several times. Thus, music media does not “corrupt” much more than video / video media (ie, continues to be valuable to adult consumers). When purchasing a record, if the consumer likes the music, the consumer will probably hold it for an extended period of time.
20世紀の中期から今日にかけて、メディアエコシステムは、消費者及び発行者の利益及び損害の両方にとって一連の根本的な変化を受けた。オーディオレコーダー、特に、高品質ステレオサウンド付きのカセットテープが広く導入されると、確かに高度の消費者便宜性があった。しかし、それは、消費者メディアと共に今や広く普及したもの、即ち海賊版の始まりも印した。確かに、大勢の消費者が彼ら自身のレコードを純粋に便宜性のためにテープ記録するのにカセットテープを使用したが、次第に多くの消費者(例えば、互いのレコードコレクションに手早くアクセスできる寄宿舎の学生)が海賊版コピーを作成した。又、消費者は、発行者からレコードやテープを買うのではなく、ラジオを経て演奏される音楽もテープ記録した。 From the mid-20th century to today, the media ecosystem has undergone a series of fundamental changes in both consumer and issuer profits and damages. When audio recorders, especially cassette tapes with high-quality stereo sound, were widely introduced, there was certainly a high degree of consumer convenience. However, it also marked the beginning of the pirated version, which is now widely spread with consumer media. Certainly, many consumers have used cassette tapes to tape their own records purely for convenience, but more and more consumers (eg, in dormitories with quick access to each other's record collection). Student) made a pirated copy. Consumers also taped music played over the radio rather than buying records and tapes from publishers.
消費者向けVCRの出現は、新規なVCRがTVショーを録画するようにセットでき、後で見ることができるので、更なる消費者便宜性を導くと共に、映画やTV番組に「オンデマンド」ベースでアクセスできるビデオレンタルビジネスの創設も導いた。1980年代中期以来の大量市場家庭用メディア装置の急速な開発は、かつてない選択肢レベル及び消費者にとっての便宜性を導くと共に、メディア発行市場の急速な膨張も導いた。 The advent of consumer-oriented VCRs can be set to record new TV VCRs to watch TV shows and can be viewed later, leading to further consumer convenience and “on-demand” basis for movies and TV programs It also led to the creation of a video rental business that can be accessed on the Internet. The rapid development of mass market home media devices since the mid 1980s has led to an unprecedented level of choice and consumer convenience, as well as a rapid expansion of the media publishing market.
今日、消費者は、過度のメディア選択肢及び過度のメディア装置に直面し、その多くは、特定の形式のメディア又は特定の発行者に結び付いたものである。熱心なメディア消費者は、家の種々の部屋にTV及びコンピュータに接続された装置を積み重ねて有し、その結果、1つ以上のTV受像機及び/又はパーソナルコンピュータ(PC)へのケーブルの「ネズミの巣穴」、並びにリモートコントローラのグループが生じている。(本出願に関して、「パーソナルコンピュータ」又は「PC」という語は、デスクトップ、Macintosh(登録商標)又は他の非Windows(登録商標)コンピュータ、Windows適合装置、Unix(登録商標)バリエーション、ラップトップ、等を含めて、家庭又はオフィスで使用するのに適した任意の種類のコンピュータを指す。)これらの装置は、ビデオゲームコンソール、VCR、DVDプレーヤ、オーディオサラウンド−サウンドプロセッサ/増幅器、衛星セットトップボックス、ケーブルTVセットトップボックス、等を含む。そして、熱心な消費者にとって、互換性の問題があるために、複数の類似機能装置が存在する。例えば、消費者は、HD−DVD及びBlu−ray DVDプレーヤの両方を所有したり、又はMicrosoft Xbox(登録商標)及びSony Playstation(登録商標)の両ビデオゲームシステムを所有したりすることがある。実際に、あるゲームはゲームコンソールのバージョンにわたって互換性がないために、消費者は、XBoxと、その後のバージョン、例えば、Xbox360(登録商標)との両方を所有することがある。多くの場合、消費者は、どのビデオ入力及びどのリモートコントローラを使用すべきか混乱する。ディスクが正しいプレーヤ(例えば、DVD、HD−DVD、Blu−ray、Xbox又はPlaystation)に入れられ、その装置に対してビデオ及びオーディオ入力が選択され、そして正しいリモートコントローラが見つかった後でも、消費者は、まだ、技術的な挑戦に直面する。例えば、ワイドスクリーンDVDのケースでは、ユーザは、先ず、自分のTV又はモニタスクリーンにおける正しいアスペクト比(例えば、4:3、フル、ズーム、ワイドズーム、シネマワイド、等)を決定し、次いで、セットすることが必要になる。同様に、ユーザは、先ず、正しいオーディオサラウンドサウンドシステムフォーマット(例えば、AC−3、ドルビーデジタル、DTS、等)を決定し、次いで、セットすることが必要になる。多くの場合、消費者は、彼等のテレビ又はオーディオシステムのフル能力でメディアコンテンツを楽しんでいないことに気付かない(例えば、間違ったアスペクト比で押しつぶされた映画を見たり、又はサラウンドサウンドではなくステレオでオーディオを聞いたりしている)。 Today, consumers face excessive media choices and excessive media devices, many of which are tied to specific types of media or specific publishers. Enthusiastic media consumers have stacks of devices connected to TVs and computers in various rooms of the house, so that the cable “to one or more TV receivers and / or personal computers (PCs)”. A mouse burrow ", as well as a group of remote controllers, has arisen. (For the purposes of this application, the term “personal computer” or “PC” refers to desktops, Macintosh® or other non-Windows® computers, Windows compatible devices, Unix® variations, laptops, etc. Any device suitable for use at home or in the office, including: video game consoles, VCRs, DVD players, audio surround-sound processors / amplifiers, satellite set-top boxes, Cable TV set top box, etc. And since there are compatibility issues for enthusiastic consumers, there are multiple similar function devices. For example, a consumer may own both an HD-DVD and a Blu-ray DVD player, or have both a Microsoft Xbox® and Sony Playstation® video game system. Indeed, because some games are not compatible across game console versions, consumers may own both XBox and subsequent versions, for example, Xbox 360®. In many cases, consumers are confused as to which video input and which remote controller to use. Even after the disc is placed in the correct player (eg DVD, HD-DVD, Blu-ray, Xbox or Playstation), video and audio inputs are selected for the device and the correct remote controller is found. Still face technical challenges. For example, in the case of a wide screen DVD, the user first determines the correct aspect ratio (eg, 4: 3, full, zoom, wide zoom, cinema wide, etc.) on his TV or monitor screen and then sets It becomes necessary to do. Similarly, the user will first need to determine the correct audio surround sound system format (eg, AC-3, Dolby Digital, DTS, etc.) and then set it. In many cases, consumers are unaware that they are not enjoying the media content at their full capability of their television or audio system (for example, watching movies crushed with the wrong aspect ratio or not surround sound) Or listening to audio in stereo).
装置の積み重ね体には、インターネットベースのメディア装置が益々追加されている。Sonos(登録商標)デジタルミュージックシステムのようなオーディオ装置は、インターネットからオーディオを直接ストリーミングしている。同様に、Slingbox(登録商標)エンターテイメントプレーヤのような装置は、ビデオを録画し、そしてホームネットワーク又はインターネットを通してそれをストリーミングし、遠隔位置でPCにおいてそれを見ることができる。インターネットプロトコルテレビジョン(IPTV)サービスは、デジタルサブスクライバーライン(DSL)又は他のホームインターネット接続を通してケーブルTV型のサービスを提供している。又、最近では、Moxi(登録商標)メディアセンターや、Windows XPメディアセンターエディションを実行するPCのような単一の装置へ複数のメディアファンクションを一体化する努力もなされている。これらの装置は、各々、それが遂行するファンクションに対する便宜性の要素を与えるが、偏在性及びほとんどのメディアへの簡単なアクセス性が欠如している。更に、このような装置は、多くの場合に高価な処理及び/又はローカル記憶が必要なために、製造コストがしばしば数百ドルに達する。更に、これらの近代的な消費者向け電子装置は、典型的に、アイドル状態である間も、多量の電力を消費し、これは、時間と共に経費高となり且つエネルギーリソースを浪費することを意味する。例えば、ある装置は、消費者がそれをターンオフするのを怠るか又は異なるビデオ入力へスイッチした場合に動作し続けることがある。そして、どの装置も完全な解決策ではないので、家庭内の装置の他の積み重ね体と一体化しなければならず、これでは、依然、ユーザをワイヤのネズミの巣穴及びリモートコントローラの海に残すことになる。 More and more Internet-based media devices have been added to the device stack. Audio devices such as the Sonos® digital music system stream audio directly from the Internet. Similarly, a device such as a Slingbox® entertainment player can record a video and stream it through a home network or the Internet and view it on a PC at a remote location. Internet Protocol Television (IPTV) services provide cable TV-type services through a digital subscriber line (DSL) or other home Internet connection. Recently, efforts have also been made to integrate multiple media functions into a single device, such as a Moxi® Media Center or a PC running Windows XP Media Center Edition. Each of these devices provides an element of convenience for the functions it performs, but lacks ubiquity and easy access to most media. Moreover, such devices often require hundreds of dollars in manufacturing costs due to the need for expensive processing and / or local storage. In addition, these modern consumer electronic devices typically consume large amounts of power while idle, meaning that they become expensive over time and waste energy resources. . For example, a device may continue to operate if the consumer neglects to turn it off or switches to a different video input. And since none of the devices is a complete solution, they must be integrated with other stacks of devices in the home, which still leaves the user in the wire's mouse burrow and remote control sea It will be.
更に、多くの新しいインターネットベースの装置は、それが適切に機能するときには、典型的に、メディアを、それが入手できる以上に一般的な形態で提供する。例えば、インターネットを通してビデオをストリーミングする装置は、多くの場合、ビデオ、ゲームの「制作」又は演出家の解説のようなDVDをしばしば付随する双方向「エキストラ」ではなく、ビデオ資料だけをストリーミングする。これは、多くの場合、双方向性をローカルに取り扱う特定の装置に意図された特定のフォーマットで双方向資料が発生されることによるものである。例えば、DVD、HD−DVD及びBlu−rayディスクは、それら自身の特定の双方向フォーマットを有している。普及型フォーマットを全てサポートするように開発されるホームメディア装置又はローカルコンピュータは、おそらく消費者が動作するには法外なほど高価で且つ複雑なものにするレベルの精巧さ及び融通性を要求することになる。 Moreover, many new Internet-based devices typically provide media in a more general form than it is available when it functions properly. For example, devices that stream video over the Internet often stream only video material, rather than interactive “extra” that often accompany a DVD, such as video, game “production” or director commentary. This is often due to the fact that the interactive material is generated in a specific format intended for the specific device that handles it interactively. For example, DVD, HD-DVD and Blu-ray discs have their own specific bidirectional format. Home media devices or local computers that are developed to support all popular formats require a level of sophistication and flexibility that would probably be prohibitively expensive and complex for consumers to operate. It will be.
この問題に加えて、将来的に新規なフォーマットが導入された場合には、ローカル装置は、その新規なフォーマットをサポートするハードウェア能力をもたないことがあり、これは、消費者がアップグレード型のローカルメディア装置を購入しなければならないことを意味する。例えば、高解像度ビデオ又はステレオビデオ(例えば、各目に対して1つのビデオストリーム)が後日に導入された場合には、ローカル装置は、そのビデオをデコードする計算能力をもたないか、又は新たなフォーマットでビデオを出力するためのハードウェアをもたないことがある(例えば、各目に60fpsが与えられて、120fpsのビデオがシャッター付き眼鏡と同期されることでステレオ感が達成されると仮定すれば、消費者のビデオハードウェアが60fpsビデオしかサポートできない場合、このオプションは、アップグレード型ハードウェアを購入しなければ、利用できない)。 In addition to this issue, if a new format is introduced in the future, the local device may not have the hardware capability to support the new format, which means that consumers can upgrade Means you have to buy a local media device. For example, if high-resolution video or stereo video (eg, one video stream for each eye) is introduced at a later date, the local device may not have the computing power to decode the video or may be new May not have hardware to output video in different formats (for example, if each eye is given 60fps and 120fps video is synchronized with shuttered glasses, stereo feeling is achieved) Assuming that if the consumer's video hardware can only support 60 fps video, this option is not available without purchasing upgrade hardware).
メディア装置の老朽化及び複雑さの問題は、精巧な双方向メディア、特に、ビデオゲームに至ったときには、重大な問題となる。 The aging and complexity issues of media devices become a serious problem when it comes to sophisticated interactive media, especially video games.
近代的なビデオゲームアプリケーションは、主として、4つの主要な非ポータブルハードウェアプラットホーム:即ち、Sony Playstation(登録商標)1、2及び3(PS1、PS2及びPS3)、Microsoft Xbox(登録商標)及びXbox 360(登録商標)、Nintendo Gamecube(登録商標)及びWiiTM、並びにPCベースのゲーム、に分割される。これらプラットホームの各々は、他のものとは異なり、1つのプラットホームで実行するように書かれたゲームは、別のプラットホームでは実行されない。又、装置のある世代から次の世代への互換性の問題もある。ソフトウェアゲーム開発者の大半が、特定のプラットホームとは独立して設計されたソフトウェアゲームを創作しても、特定のゲームを特定のプラットホームで実行するためには、特定のプラットホームで使用するようにゲームを適応させるのに、ソフトウェアの専有レイヤ(しばしば「ゲーム開発エンジン」と称される)が必要になる。各プラットホームは、消費者へ「コンソール」(即ち、TV又はモニタ/スピーカに取り付けられるスタンドアローンボックス)として販売されるか、或いはPCそれ自体である。典型的に、ビデオゲームは、精巧なリアルタイムソフトウェアアプリケーションとして実施されるビデオゲームを含むBlu−ray DVD、DVD−ROM、又はCD−ROMのような光学的メディアで販売される。家庭用ブロードバンドの速度が高まるにつれて、ビデオゲームは、ダウンロードに利用されることが益々増えている。 Modern video game applications consist primarily of four major non-portable hardware platforms: Sony Playstation® 1, 2 and 3 (PS1, PS2 and PS3), Microsoft Xbox® and Xbox 360. (Registered trademark), Nintendo Gamecube (registered trademark) and Wii ™ , and PC-based games. Each of these platforms, unlike the others, games that are written to run on one platform will not run on another platform. There is also a compatibility problem from one generation of devices to the next. While most software game developers create software games that are designed independently of a specific platform, in order to run a specific game on a specific platform, the game should be used on a specific platform. In order to adapt, a dedicated layer of software (often referred to as a “game development engine”) is required. Each platform is sold to the consumer as a “console” (ie, a stand-alone box attached to a TV or monitor / speaker) or is the PC itself. Typically, video games are sold on optical media such as Blu-ray DVD, DVD-ROM, or CD-ROM, including video games implemented as sophisticated real-time software applications. As home broadband speeds increase, video games are increasingly being used for download.
ビデオゲームソフトウェアとのプラットホーム互換性を得るための特定の要件は、進歩型ビデオゲームのリアルタイム性及び高計算要件のために極めて厳しいものである。例えば、あるPCから、より速い処理ユニット又はコアをもつ別のPCへの製造アプリケーション(例えば、マイクロソフトワード)の一般的な互換性と同様に、ビデオゲームのある世代から次の世代への(例えば、XBoxからXBox360への、又はPlaystation2(PS2)からPlaystation3(PS3)への)完全なゲーム互換性が期待される。しかしながら、ビデオゲームでは、このようにならない。ビデオゲームの製造者は、典型的に、あるビデオゲーム世代が発売になるときに所与の価格点に対して考えられる最高の性能を求めているので、前世代システムに対して書かれた多くのゲームが後世代システムでは機能しないような急激なアーキテクチャー変更がシステムに対してしばしばなされる。例えば、XBoxは、プロセッサのx86ファミリーをベースとしたものであり、一方、XBox360は、PowerPCファミリーをベースとしたものである。 The specific requirements for platform compatibility with video game software are extremely demanding due to the real-time nature and high computational requirements of advanced video games. For example, the general compatibility of manufacturing applications (eg, Microsoft Word) from one PC to another with a faster processing unit or core, as well as from one generation of video games to the next (eg, Full game compatibility is expected from XBox to XBox 360 or from Playstation 2 (PS2) to PlayStation 3 (PS3). However, this is not the case with video games. Video game manufacturers typically seek the best possible performance for a given price point when a video game generation goes on sale, so many written for previous generation systems There are often rapid architectural changes to the system that will not work on later generation systems. For example, XBox is based on the x86 family of processors, while XBox 360 is based on the PowerPC family.
従来のアーキテクチャーをエミュレートするための技術を利用できるが、ビデオゲームがリアルタイムアプリケーションであるとすれば、エミュレーションにおいて厳密に同じ挙動を達成することはしばしば不可能である。これは、消費者、ビデオゲームコンソール製造者、及びビデオゲームソフトウェア発行者にとって損害である。消費者については、全てのゲームをプレイできるようにするために、ビデオゲームコンソールの新旧の世代をTVに接続したままにする必要があることを意味する。コンソールの製造者については、エミュレーションに関連したコスト、及び新規コンソールの採用に手間取ることを意味する。又、発行者については、全ての潜在的な消費者に届くように、新たなゲームの複数のバージョンを発売する必要があり、即ちビデオゲームのブランド(例えば、XBox、Playstation)ごとのバージョンを発売するだけでなく、所与のブランドのバージョン(例えば、PS2及びPS3)ごとのバージョンをしばしば発売する必要がある。例えば、他のプラットホームの中でも、XBox、XBox 360、PS2、PS3、Gamecube、Wii及びPCに対して、エレクトロニックアーツ“Madden NFL 08”の個別バージョンが開発されている。 Although techniques for emulating traditional architectures can be used, it is often impossible to achieve exactly the same behavior in emulation if the video game is a real-time application. This is detrimental to consumers, video game console manufacturers, and video game software publishers. For consumers, this means that old and new generations of video game consoles need to remain connected to the TV in order to be able to play all games. For console manufacturers, this means the costs associated with emulation and the hassle of adopting a new console. In addition, publishers need to release multiple versions of new games to reach all potential consumers, that is, release versions for each video game brand (eg XBox, Playstation). In addition, it is often necessary to release a version for a given brand version (eg, PS2 and PS3). For example, separate versions of the electronic arts “Madden NFL 08” have been developed for XBox, XBox 360, PS2, PS3, Gamecube, Wii and PC, among other platforms.
セルラー(セル)電話及びポータブルメディアプレーヤのようなポータブル装置も、ゲーム開発者への挑戦を提示する。次第に、このような装置は、ワイヤレスデータネットワークに接続されており、ビデオゲームをダウンロードできるようになっている。しかし、市場には、広範囲な異なる表示解像度及び計算能力をもつ種々様々なセル電話及びメディア装置が出回っている。又、このような装置は、典型的に、電力消費、コスト及び重量に制約があるので、カリフォルニア州サンタクララのNVIDIAで製造される装置、等のグラフィックプロセッシングユニット(GPU)のような進歩型グラフィック加速ハードウェアに欠けるものである。その結果、ゲームソフトウェアの開発者は、典型的に、多数の異なる形式のポータブル装置に対して所与のゲームタイトルを同時に開発する。ユーザは、自分の特定のセル電話又はポータブルメディアプレーヤに対して所与のゲームタイトルが得られないことが分かる。 Portable devices such as cellular (cell) phones and portable media players also present challenges to game developers. Increasingly, such devices are connected to a wireless data network and are capable of downloading video games. However, there are a wide variety of cell phones and media devices on the market with a wide range of different display resolutions and computing capabilities. Also, such devices typically have constraints on power consumption, cost and weight, so advanced graphics such as graphics processing units (GPUs) such as those manufactured at NVIDEO in Santa Clara, California. It lacks acceleration hardware. As a result, game software developers typically develop a given game title simultaneously for many different types of portable devices. The user knows that a given game title is not available for his particular cell phone or portable media player.
家庭用ゲームコンソールの場合には、ハードウェアプラットホームの製造者は、典型的に、彼等のプラットホームでゲームを発行する能力についてソフトウェアゲーム開発者にロイヤリティを課する。セル電話の電信会社も、典型的に、ゲームをセル電話にダウンロードするためにゲーム発行者にロイヤリティを課する。PCゲームの場合には、ゲームを発行するために支払われるロイヤリティはないが、ゲームの開発者は、典型的に、生じ得る広範囲のPCコンフィギュレーション及びインストール問題をサポートするための消費者サービス負担が大きいために、高いコストに直面する。又、PCは、典型的に、ゲームソフトウェアの海賊行為に対してバリアがほとんどない。というのは、それらは、技術的知識のあるユーザによって再プログラムが容易であり、ゲームの海賊版を容易に作成して(例えば、インターネットを通して)容易に配布することができる。従って、ソフトウェアゲーム開発者については、ゲームコンソール、セル電話及びPCにおいて発行する上でコストがかかり且つ欠点があることになる。 In the case of home game consoles, hardware platform manufacturers typically impose royalty on software game developers for their ability to publish games on their platform. Cell phone telegraph companies also typically impose royalties on game publishers to download games to cell phones. In the case of PC games, there are no royalties paid to publish the game, but game developers typically have a consumer service burden to support a wide range of possible PC configuration and installation issues. Because it is large, it faces high costs. Also, PCs typically have few barriers to game software piracy. They are easy to reprogram by technically knowledgeable users, and can easily create pirated versions of games (eg, via the Internet) for easy distribution. Thus, software game developers are costly and disadvantageous for publishing on game consoles, cell phones and PCs.
コンソール及びPCソフトウェアのゲーム発行者にとって、コストは、これだけでは終わらない。小売チャンネルを通してゲームを配布するために、発行者は、利ざやを得るように小売店の販売価格より低い卸売価格を課する。又、発行者は、典型的に、製造コストを支払いそしてゲームを保持する物理的メディアを配布しなければならない。又、発行者は、例えば、ゲームが売れない場合、ゲームの価格が下がった場合、或いは小売店が卸売価格の一部又は全部を払い戻し及び/又はゲームを買い手から引き取らねばならない場合に考えられる不測の事態をカバーするために小売店により「価格保護費用」がしばしば課せられる。更に、小売店は、典型的に、広告チラシでゲームを市場に出す上で助けとなるように発行者に費用を課する。更に、小売店は、ゲームをプレイし終えたユーザからゲームを買い戻して、それを中古ゲームとして販売し、典型的に、中古ゲームの収入をゲーム発行者と分配しないことが増えている。ゲーム発行者に課せられるコスト負担に加えて、しばしばゲームの海賊版が作成されてインターネットを通して配布され、ユーザがそれをダウンロードして無料でコピーする事態になっている。 For console and PC software game publishers, this is not the only cost. In order to distribute the game through the retail channel, the issuer imposes a wholesale price that is lower than the retail price of the retail store to gain a margin. Publishers also typically have to pay for manufacturing costs and distribute physical media that holds the game. The issuer may also consider, for example, a contingency that may occur if the game cannot be sold, if the price of the game falls, or if the retailer has to refund part or all of the wholesale price and / or take the game from the buyer. “Price protection costs” are often imposed by retailers to cover this situation. In addition, retail stores typically charge publishers to help market a game with advertising flyers. Furthermore, retail stores are increasingly buying back games from users who have finished playing the games and selling them as used games, and typically do not share used game revenue with game publishers. In addition to the cost burden imposed on game publishers, pirated versions of games are often created and distributed over the Internet, where users download and copy them for free.
インターネットのブロードバンド速度が高まりつつあり、そして米国内及び世界中で、特に、家庭や、インターネット接続PCがレンタルされるインターネット「カフェー」へのブロードバンド接続がより一般的になってきているので、ゲームは、PC又はコンソールへのダウンロードを経て益々配布されてきている。又、マルチプレーヤ及び大規模マルチプレーヤのオンラインゲームをプレイするためにブロードバンド接続が益々使用されてきている(それらは、両方とも、本開示では頭文字“MMOG”で参照される)。これらの変更は、小売配布に関連した問題及びコストをある程度軽減する。オンラインゲームをダウンロードすることは、配布コストが典型的に僅かであり且つ売れ残りメディアからのコストがほとんど又は全くないという点で、幾つかの欠点をゲーム発行者に差し向ける。しかし、ダウンロードされたゲームは、依然、海賊行為を受け、そしてそのサイズ(しばしば数ギガバイトのサイズ)のために、ダウンロードするのに非常に長い時間を要する。更に、ポータブルコンピュータ又はビデオゲームコンソールと共に販売されるような小さなディスク装置は複数のゲームで埋め尽くされる。しかしながら、ゲーム又はMMOGがプレイ可能なゲームのためのオンライン接続を要求する程度まで、海賊版の問題は、軽減されている。というのは、ユーザが、通常、有効なユーザアカウントを有することが要求されるからである。ディスプレイスクリーンのビデオを撮影するカメラ又はスピーカからの音声を録音するマイクロホンによりコピーできるリニアメディア(例えば、ビデオ及び音楽)とは異なり、各ビデオゲームの経験は独特なものであり、簡単なビデオ/オーディオ記録を使用してコピーすることができない。従って、著作権法が強力に施行されておらず、海賊行為が横行する地域でも、MMOGは、海賊行為から遮蔽され、それ故、ビジネスをサポートすることができる。例えば、Vivendi SAの“World of Warcraft”MMOGは、世界中にわたって海賊行為で悩まされずに首尾良く展開された。そして、多くのオンライン又はMMOGゲーム、例えば、Linden Labの“Second Life”MMOGは、オンラインツールを使用して資産を買い、売り、そして形成するゲームに内蔵された経済的モデルを通してゲームのオペレータのための収入を発生する。従って、従来のゲームソフトウェアの購入又は契約に加えて、メカニズムを使用して、オンラインゲームを使用するための支払をすることができる。 As Internet broadband speeds are increasing and broadband connections to the Internet and “cafes” where Internet-connected PCs are rented, especially in the United States and around the world, games are becoming more common It has been increasingly distributed via download to a PC or console. Also, broadband connections are increasingly being used to play multiplayer and large scale multiplayer online games (both of which are referred to by the acronym “MMOG” in this disclosure). These changes alleviate some of the problems and costs associated with retail distribution. Downloading online games presents several drawbacks to game publishers in that distribution costs are typically small and little or no cost from unsold media. However, downloaded games are still pirated and due to their size (often gigabytes in size) take a very long time to download. In addition, small disk devices such as those sold with portable computers or video game consoles are filled with multiple games. However, to the extent that games or MMOGs require an online connection for playable games, the problem of piracy is mitigated. This is because the user is usually required to have a valid user account. Unlike linear media (eg video and music) that can be copied by a camera that shoots video on a display screen or a microphone that records audio from speakers, each video game experience is unique and simple video / audio Cannot copy using record. Therefore, even in areas where copyright laws are not enforced and piracy is rampant, MMOG is shielded from piracy and can therefore support business. For example, Vivendi SA's “World of Warcraft” MMOG has been successfully deployed around the world without suffering from piracy. And many online or MMOG games, such as Linden Lab's “Second Life” MMOG, for game operators through an economic model built into the game to buy, sell and form assets using online tools. Generate revenue. Thus, in addition to conventional game software purchases or contracts, mechanisms can be used to pay for using online games.
オンラインの性質又はMMOGにより海賊行為をしばしば軽減できるが、オンラインゲームオペレータは、依然、残りの挑戦に直面している。多くのゲームは、オンライン又はMMOGが適切に機能するために実質的なローカル(即ち、家庭内)処理リソースを要求する。ユーザは、性能の低いローカルコンピュータ(例えば、ローエンドラップトップのような、GPUをもたないもの)を有する場合に、ゲームをプレイできないことがある。更に、ゲームコンソールが古くなるにつれて、最新型から徐々に後退し、より進歩したゲームを取り扱うことができなくなる。ユーザのローカルPCがゲームの計算要求を取り扱いできると仮定しても、しばしばインストールの複雑さがある。ドライバの互換性がないことがある(例えば、新たなゲームがダウンロードされる場合に、グラフィックドライバの新たなバージョンがインストールされ、これは、グラフィックドライバの古いバージョンに基づく以前にインストールされたゲームを不作動にすることがある)。コンソールは、より多くのゲームがダウンロードされるにつれて、ローカルディスクスペースを使い果たす。複雑なゲームは、典型的に、バグが見つかって修理されたとき、又はゲームに変更がなされた場合に(例えば、ゲームのレベルがプレイするのに難し過ぎるか又は容易過ぎるとゲーム開発者が分かった場合に)、ゲーム開発者から時間と共にダウンロードされたパッチを受け取る。これらのパッチは、新たなダウンロードを要求する。しかし、時々、全てのユーザが全てのパッチのダウンロードを完了するのではない。他のときには、ダウンロードされたパッチが他の互換性又はディスクスペース消費の問題を導入する。 Although online nature or MMOG can often mitigate piracy, online game operators still face the remaining challenges. Many games require substantial local (ie, in-home) processing resources for online or MMOG to function properly. A user may not be able to play a game if they have a low-performance local computer (eg, one that does not have a GPU, such as a low-end laptop). In addition, as game consoles become older, they will gradually retreat from the latest and become unable to handle more advanced games. Even assuming that the user's local PC can handle the computational demands of the game, there is often installation complexity. The driver may not be compatible (for example, if a new game is downloaded, a new version of the graphics driver is installed, which may cause a previously installed game based on the old version of the graphics driver to be May be activated). The console runs out of local disk space as more games are downloaded. Complex games are typically found by game developers when bugs are found and fixed, or when changes are made to the game (eg, the game level is too difficult or too easy to play) You receive patches downloaded over time from game developers. These patches require a new download. However, sometimes not all users complete the download of all patches. At other times, downloaded patches introduce other compatibility or disk space consumption issues.
又、ゲームのプレイ中に、グラフィック又は挙動情報をローカルPC又はコンソールに与えるために大きなデータダウンロードが要求されることがある。例えば、ユーザがMMOGの部屋に入り、そしてグラフィックデータで作られるか又はユーザのローカルマシンでは得られない挙動をもつシーン又はキャラクタに遭遇する場合には、そのシーン又はキャラクタのデータをダウンロードしなければならない。その結果、インターネット接続が充分に高速でない場合には、ゲームのプレイ中に実質的な遅延を招く。そして、遭遇したシーン又はキャラクタが、ローカルPC又はコンソールを越えるような記憶スペース又は計算能力を要求する場合には、ユーザがゲームを進められないか又は質の低いグラフィックで続けねばならない事態を招く。従って、オンライン又はMMOGゲームは、それらの記憶及び/又は計算の複雑さの要件をしばしば制限する。更に、それらは、ゲーム中のデータ転送の量をしばしば制限する。又、オンライン又はMMOGは、ゲームをプレイできるユーザの市場を狭めることもある。 Also, during game play, large data downloads may be required to provide graphics or behavior information to the local PC or console. For example, if a user enters a MMOG room and encounters a scene or character that has behaviors that are created with graphic data or are not available on the user's local machine, the scene or character data must be downloaded. Don't be. As a result, if the internet connection is not fast enough, there will be a substantial delay during game play. And if the scene or character encountered encounters storage space or computing power that goes beyond the local PC or console, the user may not be able to proceed with the game or continue with poor quality graphics. Thus, online or MMOG games often limit their memory and / or computational complexity requirements. In addition, they often limit the amount of data transfer during the game. Online or MMOG may also narrow the market for users who can play games.
更に、技術的知識のあるユーザがゲームのローカルコピーをリバースエンジニアリングし、そしてチートできるようにゲームを変更することが次第に増えてきている。チートは、人間的に可能である以上に速くボタン押しを繰り返すのと同程度に簡単である(例えば、銃を非常に速く撃つように)。ゲーム内資産トランザクションをサポートするゲームでは、チートが、実際の経済的価値の資産を含む詐欺的トランザクションを生じるレベルの精巧さに到達する。オンライン又はMMOG経済的モデルがそのような資産トランザクションに基づくものであるときは、これは、ゲームオペレータに実質的に有害な結果をもたらす。 In addition, it is becoming increasingly common for users with technical knowledge to modify the game so that a local copy of the game can be reverse engineered and cheated. A cheat is as simple as repeating a button press faster than humanly possible (eg, shooting a gun very fast). In games that support in-game asset transactions, cheats reach a level of sophistication that results in fraudulent transactions involving assets of actual economic value. When online or MMOG economic models are based on such asset transactions, this has a substantially detrimental effect on the game operator.
新たなゲームを開発するコストは、PC及びコンソールが(例えば、リアルタイムレイトレーシングのようなより現実的なグラフィック、及びリアルタイム物理的シミュレーションのようなより現実的な挙動と共に)益々精巧なゲームを作成できるのにつれて増大している。ビデオゲーム産業の初期には、ビデオゲーム開発は、アプリケーションソフトウェア開発に非常に類似したプロセスであり、即ち開発コストの大部分は、ソフトウェアの開発であり、グラフィック、オーディオ、及び挙動エレメント又は「資産」の開発、例えば、広範囲な特殊効果をもつ動画に対して開発されるものではない。今日、多くの精巧なビデオゲーム開発努力は、ソフトウェア開発よりも、特殊効果に富んだ動画開発に厳密に似ている。例えば、多くのビデオゲームは、3D世界のシミュレーションを与え、そして益々ホトリアリスティックな(即ち、生きた動きの映像写真撮影と同程度に現実的に見えるコンピュータグラフィックの)キャラクタ、プロップ及び環境を発生する。ホトリアリスティックなゲーム開発の最も挑戦的な観点の1つは、生きた動きの人間の顔と見分けがつかないようなコンピュータ発生の人間の顔を創作することである。カリフォルニア州サンフランシスコのMovaにより開発されたContourTMリアリティキャプチャーのような顔捕獲技術は、演技者の顔の正確な形状を運動中に高い解像度で捕獲し追跡する。この技術は、捕獲された生きた動きの顔と実質上区別できない3Dの顔をPC又はゲームコンソール上にレンダリングできるようにする。「ホトリアル」な人間の顔を捕獲してレンダリングすることは、多数の観点で有用である。第1に、非常に認識し易い有名人又はスポーツプレーヤ(多くの場合に高い費用で雇われた)がビデオゲームにしばしば使用され、不完全さがユーザにとって明らかで、視覚体験(viewing experience)を混乱させ又は不快にさせることがある。又、多くの場合に、高度のホトリアリズムを達成するには高度の細部が要求され、即ち、潜在的に、顔が動くときに多角形及び/又はテクスチャがフレームごとに変化するようにして、多数の多角形及び高解像度テクスチャをレンダリングすることが要求される。 The cost of developing new games allows PCs and consoles to create increasingly sophisticated games (with more realistic graphics such as real-time ray tracing and more realistic behavior such as real-time physical simulation). It is increasing as In the early days of the video game industry, video game development is a process very similar to application software development, i.e., the majority of development costs are software development, and graphic, audio, and behavioral elements or "assets". For example, it is not developed for moving images having a wide range of special effects. Today, many sophisticated video game development efforts closely resemble special effects video development rather than software development. For example, many video games provide 3D world simulations and generate increasingly photorealistic (ie computer graphics that look as realistic as live-motion video photography) characters, props and environments. To do. One of the most challenging aspects of photorealistic game development is to create a computer-generated human face that is indistinguishable from a living human face. Face capture technology, such as Contour ™ reality capture, developed by Mova, San Francisco, California, captures and tracks the exact shape of the performer's face at high resolution during exercise. This technique allows 3D faces to be rendered on a PC or game console that are virtually indistinguishable from captured live motion faces. Capturing and rendering “photoreal” human faces is useful in a number of ways. First, very recognizable celebrities or sports players (often hired at high costs) are often used in video games, where imperfections are obvious to the user and disrupt the viewing experience May cause discomfort or discomfort. Also, in many cases, a high degree of detail is required to achieve a high degree of photorealism, i.e., as polygons and / or textures change from frame to frame as the face moves, It is required to render a large number of polygons and high resolution textures.
詳細なテクスチャを伴う多数の多角形のシーンが急速に変化するときには、ゲームをサポートするPC又はゲームコンソールは、ゲームセグメントで発生される所要数のアニメーションフレームに対して充分な多角形及びテクスチャデータを記憶するに足るRAMを有していないことがある。更に、PC又はコンソールに典型的に利用できる単一の光学的ドライブ又は単一のディスクドライブは、通常、RAMより非常に低速であり、そして典型的に、多角形及びテクスチャをレンダリングする際にGPUが受け容れられる最大データレートを維持することができない。現在のゲームは、典型的に、多角形及びテクスチャの大部分をRAMにロードし、これは、所与のシーンの複雑さ及び時間巾が主としてRAMの容量により制限されることを意味する。例えば、顔のアニメーションの場合に、これは、ゲームが休止して多角形及びテクスチャ(及び他のデータ)をより多くのフレームに対してロードする前に、PC又はゲームコンソールを、ホトリアルでない低解像度の顔、又は限定された数のフレームについてのみアニメ化できるホトリアルな顔、のいずれかに制限する。 When a large number of polygonal scenes with detailed textures change rapidly, the PC or game console supporting the game will have enough polygon and texture data for the required number of animation frames generated in the game segment. You may not have enough RAM to store. In addition, a single optical drive or single disk drive typically available on a PC or console is usually much slower than RAM and typically has a GPU in rendering polygons and textures. Cannot maintain the maximum data rate that is acceptable. Current games typically load most of the polygons and textures into RAM, which means that the complexity and duration of a given scene is primarily limited by the capacity of the RAM. For example, in the case of facial animation, this can cause the PC or game console to have a non-photoreal low resolution before the game pauses and loads polygons and textures (and other data) for more frames. Or a photoreal face that can be animated only for a limited number of frames.
“Loading...”に類似したメッセージをPC又はコンソールが表示するときに進行バーがスクリーンを横切ってゆっくり移動するのを見ていることは、複雑なビデオゲームの今日のユーザによって固有の欠点として容認されている。次のシーンがディスク(ここで、「ディスク」とは、特に指示のない限り、不揮発性の光学又は磁気メディア、並びに非ディスクメディア、例えば、半導体「フラッシュ」メモリを指す)からロードする間の遅延は、数秒又は数分を要する。これは、時間の浪費であり、ゲームプレーヤにとってかなりのフラストレーションとなる。上述したように、多くの又は全ての遅延は、多角形、テクスチャ又は他のデータをディスクからロードする時間によるものであるが、PC又はコンソール内のプロセッサ及び/又はGPUがシーンのためのデータを準備する間にロード時間の一部分が費やされる場合もある。例えば、サッカービデオゲームは、プレーヤが、多数の選手、チーム、スタジアム及び天候条件の中から選択を行えるようにする。従って、どんな特定の組合せが選択されるかに基づいて、異なる多角形、テクスチャ及び他のデータ(集合的に「オブジェクト」)がシーンに対して要求される(例えば、異なるチームは、そのユニホームに異なるカラー及びパターンを有する)。多数の又は全ての種々の順列を列挙し、多数の又は全てのオブジェクトを前もって予め計算し、そしてそれらオブジェクトを、ゲームを記憶するのに使用されるディスクに記憶することができる。しかし、順列の数が多い場合には、全オブジェクトに対して要求される記憶の量が、ディスクに適合するには大き過ぎる(ダウンロードするには不可能である)ことがある。従って、既存のPC及びコンソールシステムは、典型的に、所与のシーンの複雑さ及びプレイ時間巾の両方について制約があり、複雑なシーンに対する長いロード時間で悩まされている。 Watching the progress bar move slowly across the screen when the PC or console displays a message similar to "Loading ..." is an inherent drawback by today's users of complex video games It is tolerated. Delay while the next scene loads from disk (where "disk" refers to non-volatile optical or magnetic media, as well as non-disk media, eg, semiconductor "flash" memory, unless otherwise indicated) Takes several seconds or minutes. This is a waste of time and is quite frustrating for the game player. As mentioned above, many or all of the delays are due to the time it takes to load polygons, textures or other data from the disk, but the processor and / or GPU in the PC or console will have data for the scene. Some load time may be spent during preparation. For example, a soccer video game allows a player to select from a number of players, teams, stadiums, and weather conditions. Thus, different polygons, textures and other data (collectively “objects”) are required for a scene based on what particular combination is selected (eg, different teams are required to With different colors and patterns). Many or all of the various permutations can be listed, many or all objects can be pre-calculated and stored on the disk used to store the game. However, if the number of permutations is large, the amount of storage required for all objects may be too large to fit on the disk (impossible to download). Thus, existing PC and console systems are typically limited in both the complexity and play duration of a given scene and are plagued with long load times for complex scenes.
従来のビデオゲームシステム及びアプリケーションソフトウェアシステムに伴う別の顕著な制限は、それらが、例えば、PC又はゲームコンソールへ処理のためにロードされる必要のある多角形及びテクスチャのような3Dオブジェクトの大きなデータベースを次第に使用してきていることである。上述したように、このようなデータベースは、ディスクにローカルに記憶されるときに長いロード時間を要する。しかしながら、ロード時間は、通常、データベースがリモート位置に記憶されそしてインターネットを通してアクセスされる場合には更に厳しいものとなる。このような状態では、大きなデータベースをダウンロードするのに、数分、数時間、又は数日を要することがある。更に、このようなデータベースは、多くの場合に多大な費用で生成され(例えば、ゲーム、映画又は歴史ドキュメンタリーに使用するための詳細な高いマスト付きの帆船の3Dモデル)、そしてローカルエンドユーザに販売するように意図される。しかしながら、データベースは、ローカルユーザへダウンロードされると、海賊行為を受けるおそれがある。多くの場合、ユーザは、データベースを評価してそれがユーザのニーズに合うか(例えば、ユーザが特定の動きをするときにゲームキャラクタの3Dコスチュームが満足な見掛け又は外観を有するか)どうか調べるだけのためにデータベースのダウンロードを希望する。長いロード時間は、購入することを決断する前に3Dデータベースを評価するユーザにとって妨げになる。 Another significant limitation with conventional video game systems and application software systems is the large database of 3D objects such as polygons and textures that need to be loaded for processing to a PC or game console, for example. Is being used gradually. As mentioned above, such databases require a long load time when stored locally on disk. However, load times are usually more severe when the database is stored at a remote location and accessed through the Internet. In such a situation, downloading a large database may take minutes, hours, or days. In addition, such databases are often generated at great expense (eg 3D models of detailed high-masted sailing vessels for use in games, movies or historical documentaries) and sold to local end users Is intended to be. However, if the database is downloaded to a local user, it may be subject to piracy. In many cases, the user simply evaluates the database to see if it meets the user's needs (eg, whether the 3D costume of the game character has a satisfactory look or appearance when the user makes a particular move). I would like to download a database for Long load times are a hindrance for users who evaluate 3D databases before making a decision to purchase.
MMOGでは、特に、ユーザがカスタマイズされたキャラクタを次第に使用できるようなゲームとして、同様の問題が発生する。キャラクタを表示するためのPC又はゲームコンソールの場合に、3D幾何学(多角形、テクスチャ、等)のデータベースへのアクセス及びそのキャラクタに対する挙動(例えば、キャラクタが盾を有する場合に、その盾が槍をそらすに充分な強度であるかどうか)を得ることが必要である。典型的に、MMOGがユーザにより最初にプレイされるときには、キャラクタに対する多数のデータベースが、ゲームの初期コピーと共に予め入手でき、これは、ゲームの光学的ディスクにローカルで入手できるか又はディスクへダウンロードされる。しかし、ゲームが進行するにつれて、データベースがローカルで入手できないキャラクタ又はオブジェクトにユーザが遭遇する場合には(例えば、別のユーザがカスタマイズされたキャラクタを生成した場合には)、そのキャラクタ又はオブジェクトを表示できるまでに、そのデータベースがダウンロードされねばならない。これは、ゲームの実質的な遅延を生じさせる。 In MMOG, a similar problem occurs particularly as a game in which a user can gradually use customized characters. In the case of a PC or game console for displaying a character, access to a database of 3D geometry (polygons, textures, etc.) and behavior for that character (eg, if the character has a shield, It is necessary to obtain whether or not the strength is sufficient to divert. Typically, when the MMOG is first played by the user, a large number of databases for the characters are available in advance along with an initial copy of the game, which is available locally on the game's optical disc or downloaded to the disc. The However, as the game progresses, if the user encounters a character or object whose database is not locally available (for example, if another user generates a customized character), that character or object is displayed. By the time, the database must be downloaded. This causes a substantial delay in the game.
ビデオゲームの精巧さ及び複雑さがあるとすれば、従来のビデオゲームコンソールでのビデオゲーム開発者及び発行者の別の挑戦は、多くの場合、数千万ドルのコストで2ないし3年を掛けてビデオゲームを開発することである。新規なビデオゲームコンソールプラットホームがほぼ5年毎に一度の割合で導入されると仮定すれば、ゲーム開発者は、新規なプラットホームが発売されるのと同時にビデオゲームを入手できるようにするために、新規なゲームコンソールの発売よりこれらゲーム年だけ前に開発作業をスタートする必要がある。ほぼ同じ時期に(例えば、互いに1年又は2年以内に)競合する製造者から多数のコンソールが時々発売されるが、調べなければならないものは、各コンソールの人気であり、例えば、どのコンソールがビデオゲームソフトウェアの最大売り上げを生じるかである。例えば、近年のコンソールサイクルでは、Microsoft XBox360、Sony Playstation3及びNintendo Wiiがほぼ同じ一般的な時間枠で導入されるようにスケジュールされている。しかし、導入の何年か前に、ゲーム開発者は、どのコンソールプラットホームが他のものより成功するか本質的に「賭け」をし、それに応じて、開発リソースを捧げなければならない。又、動画制作会社も、映画の封切りの充分前に映画の成功の見込みの推定に基づいて限られた制作リソースを配分しなければならない。ビデオゲームに要求される投資レベルの増大を仮定すれば、ゲーム制作は、動画制作と益々類似してきており、ゲーム制作会社は、特定のビデオゲームの将来の成功の推定に基づいて制作リソースを日常的に捧げる。しかし、動画会社とは異なり、この賭けは、単に制作それ自体の成功に基づくものではなく、むしろ、ゲームの実行が意図されたゲームコンソールの成功に基づいたものである。複数のコンソールに対するゲームを一度に発売することでリスクを軽減できるが、この付加的な努力がコストを増大し、ゲームの実際の発売をしばしば遅らせる。 Given the sophistication and complexity of video games, another challenge for video game developers and publishers with traditional video game consoles often costs two to three years at a cost of tens of millions of dollars. Multiply it to develop a video game. Assuming that a new video game console platform is introduced approximately once every five years, game developers will be able to obtain video games at the same time that the new platform is launched. It is necessary to start development work just before the launch of a new game console just before these game years. Many consoles are sometimes released from competing manufacturers at about the same time (eg, within one or two years of each other), but what must be examined is the popularity of each console, for example which consoles Is it the biggest sales of video game software? For example, in recent console cycles, Microsoft XBox 360, Sony Playstation 3 and Nintendo Wii are scheduled to be introduced in approximately the same general time frame. However, some years before its introduction, game developers must essentially “bet” which console platforms will be more successful than others and devote development resources accordingly. Video production companies must also allocate limited production resources based on an estimate of the movie's success potential well before the movie's release. Given the increased level of investment required for video games, game production is becoming increasingly similar to video production, and game production companies routinely allocate production resources based on estimates of the future success of a particular video game. Dedicated. However, unlike a video company, this bet is not based solely on the success of the production itself, but rather on the success of the game console intended to run the game. Although launching games for multiple consoles at once can mitigate risk, this additional effort increases costs and often delays the actual launch of the game.
PCにおけるアプリケーションソフトウェア及びユーザ環境は、ユーザに対してより視覚的に訴えるだけでなく、より有効で且つ直感的なものにするために、計算上より集中的で、動的で且つ双方向のものとなる。例えば、新規なWindows VistaTMオペレーティングシステム、及びMacintosh(登録商標)オペレーティングシステムの次々のバージョンは、視覚アニメーション効果を合体している。Autodesk社からのMayaTMのような進歩型グラフィックツールは、最新のCPU及びGPUの限界を押し進める非常に精巧な3Dレンダリング及びアニメーション能力を与える。しかしながら、これら新規なツールの計算上の要件は、そのような製品のユーザ及びソフトウェア開発者にとって多数の実際上の問題を生じさせる。 The application software and user environment on the PC is not only more visually appealing to the user, but also more computationally intensive, dynamic and interactive in order to be more effective and intuitive It becomes. For example, the new Windows Vista ™ operating system and successive versions of the Macintosh® operating system incorporate visual animation effects. Advanced graphics tools such as Maya ™ from Autodesk provide very sophisticated 3D rendering and animation capabilities that push the limits of modern CPUs and GPUs. However, the computational requirements of these new tools create a number of practical problems for users and software developers of such products.
オペレーティングシステム(OS)の視覚表示は、もはや販売されていないが新規なOSで依然アップグレード可能である前世代のコンピュータを含めて、広範囲な種類のコンピュータにおいて機能しなければならないので、OSグラフィック要件は、典型的にGPUを含まないコンピュータを含めたOSのターゲットであるコンピュータの最小公分母によって大きく制限される。これは、OSのグラフィック能力を甚だしく制限する。更に、バッテリ作動式のポータブルコンピュータ(例えば、ラップトップ)は、視覚表示能力を制限する。というのは、CPU又はGPUにおける高い計算上のアクティビティが、典型的に、電力消費を高め、バッテリ寿命を短くするからである。ポータブルコンピュータは、典型的に、プロセッサが利用されないときに消費電力を下げるためにプロセッサのアクティビティを自動的に下げるソフトウェアを含む。あるコンピュータモデルでは、ユーザは、プロセッサのアクティビティを手動で下げることができる。例えば、ソニーのVGN−SZ280Pラップトップは、(低性能、長バッテリ寿命のために)片側に“Stamina”と表示され且つ(高性能、短バッテリ寿命のために)他側に“Speed”と表示されたスイッチを含む。ポータブルコンピュータで実行されるOSは、コンピュータがそのピーク性能能力の一部分で実行される場合でも、有用に機能することができねばならない。従って、OSグラフィック性能は、入手可能な最新の計算能力より遥かに下に留まることがしばしばある。 Since the visual representation of the operating system (OS) must function on a wide variety of computers, including previous generation computers that are no longer sold but can still be upgraded with a new OS, OS graphics requirements are It is largely limited by the lowest common denominator of the computer that is the target of the OS, typically including computers that do not include a GPU. This severely limits the graphics capabilities of the OS. In addition, battery-operated portable computers (eg, laptops) limit visual display capabilities. This is because high computational activity in the CPU or GPU typically increases power consumption and shortens battery life. Portable computers typically include software that automatically reduces processor activity to reduce power consumption when the processor is not utilized. In some computer models, the user can manually reduce processor activity. For example, Sony's VGN-SZ280P laptop displays “Stana” on one side (for low performance, long battery life) and “Speed” on the other side (for high performance, short battery life) Included switches. An OS running on a portable computer must be able to function usefully even when the computer runs at part of its peak performance capability. Thus, OS graphics performance often remains far below the latest computing power available.
Mayaのようなハイエンドの計算に強いアプリケーションは、高性能PCに使用されるという期待でしばしば販売される。これは、典型的に、非常に高い性能と、より高価で且つ低ポータブル性の最小公分母要求を確立する。その結果、このようなアプリケーションは、汎用のOS(又はMicrosoft Officeのような汎用の生産アプリケーション)より非常に限定されたターゲット視聴者を有し、典型的に、汎用のOSソフトウェア又は汎用のアプリケーションソフトウェアより相当に少ない量で販売される。又、多くの場合、見込みのあるユーザがこのような計算に強いアプリケーションを前もって試すことは困難であるから、潜在的な視聴者は更に限定される。例えば、学生がMayaの使い方を学習することを希望し、又はこのようなアプリケーションについて既に知識のある潜在的な買い手が購入(Mayaを実行できるハイエンドコンピュータを買うことも含む)に投資する前にMayaを試すことを希望すると仮定する。学生又は潜在的な買い手は、Mayaのデモバージョンをダウンロードするか又はその物理的メディアコピーを得ることはできるが、Mayaをそのフル能力(例えば、複雑な3Dシーンを取り扱う)で実行できるコンピュータがない場合には、製品の完全なインフォームドアセスメントを行うことができない。これは、このようなハイエンドアプリケーションの視聴者を制限するものである。又、これは、高い販売価格にも貢献する。というのは、開発コストは、通常、汎用アプリケーションより非常に少数の購入にわたって割賦されるからである。 Applications that are resistant to high end computing such as Maya are often sold with the expectation that they will be used in high performance PCs. This typically establishes the lowest common denominator requirement of very high performance, more expensive and less portable. As a result, such applications have target viewers that are much more limited than general purpose OSs (or general purpose production applications such as Microsoft Office), and are typically general purpose OS software or general purpose application software. They are sold in much smaller quantities. Also, in many cases, it is difficult for prospective users to try out applications that are robust to such calculations in advance, further limiting the potential audience. For example, before a student wants to learn how to use Maya, or a potential buyer who is already knowledgeable about such applications invests in a purchase (including buying a high-end computer that can run Maya), Maya Suppose you want to try. A student or potential buyer can download a demo version of Maya or get a physical media copy of it, but there is no computer that can run Maya with its full capabilities (eg, handling complex 3D scenes) In some cases, a complete inform assessment of the product cannot be performed. This limits the audience of such high-end applications. This also contributes to high selling prices. This is because development costs are usually amortized over a much smaller number of purchases than general purpose applications.
又、高価格アプリケーションは、個人や企業がアプリケーションソフトウェアの海賊版コピーを使用する大きな誘因も生み出す。その結果、ハイエンドのアプリケーションソフトウェアは、種々の技術を通して海賊行為を軽減するためにそのようなソフトウェアの発行者による顕著な努力にも関わらず、海賊版がはびこることで悩まされている。海賊版のハイエンドのアプリケーションを使用するときでも、ユーザは、海賊版コピーを実行するために高価な最新のPCに投資する必要性を排除することはできない。従って、海賊版ソフトウェアのユーザは、その実際の小売価格の一部分でソフトウェアアプリケーションを使用できるが、そのアプリケーションをフルに利用するためには、高価なPCを購入又は入手することが依然要求される。 High-priced applications also create a great incentive for individuals and businesses to use pirated copies of application software. As a result, high-end application software has been plagued by the proliferation of pirated copies, despite significant efforts by publishers of such software to mitigate piracy through various technologies. Even when using pirated high-end applications, users cannot eliminate the need to invest in expensive modern PCs to perform pirated copies. Thus, pirated software users can use software applications at a fraction of their actual retail price, but still need to purchase or obtain expensive PCs in order to fully utilize the application.
高性能の海賊版ビデオゲームのユーザについても同じことが言える。海賊行為者は、ゲームをそれらの実際の価格の一部分で得ることはできるが、ゲームを適切にプレイするのに必要な高価なコンピューティングハードウェア(例えば、GPU増強型PC、又はXBox360のようなハイエンドのビデオゲームコンソール)を購入することが依然要求される。ビデオゲームが典型的に消費者にとって気晴らしであると仮定すれば、ハイエンドのビデオゲームシステムのための付加的なコストが法外なものとなる。この事態は、現在の労働者の平均年収が米国に比してかなり低い国(例えば、中国)では、一層悪いものである。その結果、ハイエンドのビデオゲームシステム又はハイエンドのPCを所有するのは、人口の非常に僅かな割合だけとなる。このような国々では、インターネットに接続されたコンピュータを使用するための料金をユーザが支払う「インターネットカフェ」が極めて一般的となる。多くの場合に、このようなインターネットカフェは、プレーヤが計算に強いビデオゲームをプレイできるようにするGPUのような高性能特徴をもたない旧モデル又はローエンドPCしか有していない。これは、中国で非常に成功し、そこのインターネットカフェで一般にプレイされるVivendiの“World of Warcraft”のような、ローエンドPCで実行されるゲームの成功における重要なファクタである。それと対照的に、“Second Life”のような計算に強いゲームは、中国のインターネットカフェにインストールされたPCでプレイできる見込みが極めて低い。このようなゲームは、インターネットカフェの低性能PCにしかアクセスできないユーザには、実質上アクセス不能である。 The same is true for users of high-performance pirated video games. Pirates can get the game at a fraction of their actual price, but expensive computing hardware (such as a GPU-enhanced PC or XBox 360) required to play the game properly It is still required to purchase a high-end video game console. Assuming video games are typically a distraction for consumers, the additional cost for high-end video game systems becomes prohibitive. This situation is even worse in countries where the average annual salary of current workers is much lower than in the United States (eg, China). As a result, only a very small percentage of the population owns high-end video game systems or high-end PCs. In such countries, “Internet cafes” in which users pay a fee for using a computer connected to the Internet are very common. In many cases, such Internet cafes have only older models or low-end PCs that do not have high performance features such as GPUs that allow players to play computationally intensive video games. This is an important factor in the success of games running on low-end PCs, such as Vivendi's “World of Warcraft”, which has been very successful in China and is commonly played in Internet cafes there. In contrast, computationally strong games such as “Second Life” are very unlikely to be played on a PC installed in a Chinese internet cafe. Such a game is virtually inaccessible to users who can only access a low-performance PC in an Internet cafe.
又、ビデオゲームの購入を考えており、先ず、インターネットを経て自分の家にゲームのデモバージョンをダウンロードすることによりそれを試してみたいユーザにとってもバリアが存在する。ビデオゲームのデモは、多くの場合、幾つかの特徴がディスエイブルされるか又はゲームのプレイ量に限度が課せられたゲームの一人前のバージョンである。これは、PC又はコンソールのいずれかにゲームをインストールして実行できるまでにギガバイトのゲームをダウンロードする長いプロセス(おそらく数時間)を伴うことがある。PCの場合には、ゲームに対して必要とされる特殊なドライバ(例えば、DirectX又はOpenGLドライバ)を計算し、正しいバージョンをダウンロードして、それらをインストールし、次いで、PCがゲームをプレイできるかどうか決定することを含む。この後者のステップは、PCが充分な処理(CPU及びGPU)能力、充分なRAM、及び互換性のあるOS(例えば、あるゲームは、Windows XPで実行されるが、Vistaでは実行されない)を有するかどうか決定することを含む。従って、ビデオゲームデモを実行するよう試みる長いプロセスの後に、ユーザは、ユーザのPCコンフィギュレーションを仮定すれば、ビデオゲームデモがおそらくプレイできないことを充分見出すことができる。悪いことに、ユーザが、デモを試すために新規なドライバダウンロードすると、それらのドライババージョンは、ユーザがPCにおいて普通に使用している他のゲーム又はアプリケーションとの互換性がないことがあり、従って、デモをインストールすると、以前に動作できたゲーム又はアプリケーションが不作動になることがある。これらのバリアは、ユーザにフラストレーションを与えるだけでなく、ゲームを市場に出すビデオゲームソフトウェア発行者及びビデオゲーム開発者にとってもバリアとなる。 There is also a barrier for users who are considering buying a video game and want to try it out by first downloading a demo version of the game to their home via the Internet. Video game demos are often full-featured versions of games where some features are disabled or the amount of play on the game is limited. This may involve a long process (possibly hours) of downloading a gigabyte game before it can be installed and run on either a PC or console. In the case of a PC, calculate the special drivers needed for the game (eg DirectX or OpenGL drivers), download the correct version and install them, then the PC can play the game Including determining if. This latter step is where the PC has sufficient processing (CPU and GPU) capability, sufficient RAM, and a compatible OS (for example, some games run on Windows XP but not Vista). Including determining whether or not. Thus, after a long process of trying to run a video game demo, the user can find that the video game demo is probably not playable given the user's PC configuration. Unfortunately, when a user downloads a new driver to try out the demo, those driver versions may not be compatible with other games or applications that the user normally uses on the PC, so If you install the demo, games or applications that were able to run before may become inoperable. These barriers not only frustrate the user, but also become a barrier for video game software publishers and video game developers who bring games to market.
経済的な非効率さを招く別の問題は、所与のPC又はゲームコンソールが、通常、アプリケーション及び/又はゲームに対するあるレベルの性能要件を受け容れるように設計されていることに関する。例えば、あるPCは、多少のRAMを有し、低速又は高速のCPUを有し、そしてGPUを有する場合には低速又は高速のGPUを有する。あるゲーム又はアプリケーションは、所与のPC又はコンソールの全計算パワーの利点を取り入れるが、多くのゲーム又はアプリケーションは、そうではない。ゲーム又はアプリケーションについてのユーザの選択が、ローカルPC又はコンソールのピーク性能能力に達しない場合には、ユーザは、利用されない特徴に関してPC又はコンソール上で金銭を浪費することになる。コンソールの場合には、コンソールの製造者は、コンソールコストを助成するために必要であった以上に支払ったことになる。 Another problem that leads to economic inefficiencies relates to the fact that a given PC or game console is typically designed to accept a certain level of performance requirements for applications and / or games. For example, some PCs have some RAM, have a slow or fast CPU, and if they have a GPU, have a slow or fast GPU. Some games or applications take advantage of the total computational power of a given PC or console, but many games or applications do not. If the user's choice for a game or application does not reach the peak performance capability of the local PC or console, the user will waste money on the PC or console for features that are not used. In the case of a console, the console manufacturer has paid more than needed to subsidize the console cost.
ビデオゲームを買って楽しむ際に存在する別の問題は、ユーザがゲームの購入を決める前に他の者がそのゲームをプレイしているのをユーザが見ることができるようにすることに関する。ビデオゲームを記録して後で再生するための多数の従来の解決策が存在する。例えば、米国特許第5,558,339号は、(同じユーザ又は異なるユーザにより所有された)ビデオゲームクライアントコンピュータでの「ゲームプレイ」中にゲームコントローラのアクションを含むゲーム情報体情報を記録することを教示している。この状態情報を後で使用して、ビデオゲームクライアントコンピュータ(例えば、PC又はコンソール)上で幾つか又は全てのゲームアクションを再生することができる。この解決策の顕著な欠点は、ユーザが記録されたゲームを見るために、ユーザは、ゲームをプレイできるビデオゲームクライアントコンピュータを所有すると共に、記録されたゲーム状態が再生されたときにゲームプレイが同一となるようにそのコンピュータ上で実行されるビデオゲームアプリケーションを有していなければならないことである。この他に、ビデオゲームアプリケーションは、記録されたゲームと再生されるゲームとの間に実行の相違がないように書かれねばならない。 Another problem that exists when buying and enjoying a video game relates to allowing the user to see others playing the game before the user decides to purchase the game. There are a number of conventional solutions for recording video games for later playback. For example, US Pat. No. 5,558,339 records game information body information including game controller actions during “game play” on video game client computers (owned by the same user or different users). Teaches. This status information can later be used to play some or all game actions on a video game client computer (eg, a PC or console). A significant disadvantage of this solution is that in order for the user to view the recorded game, the user has a video game client computer that can play the game, and the game play is not played when the recorded game state is played. You must have a video game application running on that computer to be identical. In addition, the video game application must be written so that there is no difference in execution between the recorded game and the played game.
例えば、ゲームグラフィックは、一般的に、フレームごとに計算される。多くのゲームの場合に、ゲームロジックは、時々、シーンが特に複雑であるかどうか、又は実行速度を下げる他の遅延があるかどうか(例えば、PCにおいて、ゲームアプリケーションからCPUサイクルを取り去る別のプロセスが実行されるかどうか)に基づいて、次のフレームに対して表示されるグラフィックを計算するのに1フレームより短い又は長い時間を要する。このようなゲームでは、1フレーム時間より若干短く(例えば、数CPUクロックサイクル短く)計算された「スレッシュホールド」フレームが最終的に発生する。その同じシーンが、全く同じゲーム状態情報を使用して再び計算されたときには、1フレーム時間より数CPUクロックサイクル長くかかることが容易に起きる(例えば、内部CPUバスが外部DRAMバスと若干位相ずれし、そしてゲーム処理から数ミリ秒のCPU時間を取り去る別のプロセスによる大きな遅延がなくても、数CPUサイクルの時間遅延を導入する場合には)。それ故、ゲームが再生されるときには、フレームは、1つのフレーム時間ではなく、2つのフレーム時間で計算される。幾つかの挙動は、ゲームがどれほど頻繁に新たなフレームを計算するか(例えば、いつゲームがゲームコントローラから入力をサンプルするか)に基づいている。ゲームが表示されている間には、異なる挙動に対する時間基準のこの相違は、ゲームのプレイに影響しないが、再生されたゲームが異なる結果を生じさせることを招く。例えば、バスケットボールの弾道は、一定の60fps速度で計算されるが、ゲームコントローラの入力が、計算されたフレームの速度に基づいてサンプリングされる場合には、計算されたフレームの速度は、ゲームが記録されたときは53fpsであるが、ゲームが再生されるときは52fpsとなり、これは、バスケットボールがバスケットへ入ることが阻止されるかどうかに差を生じさせ、異なる結果を招くことになる。従って、ゲーム状態を使用してビデオゲームを記録するには、同じゲーム状態情報を使用した再生が全く同じ結果を生じさせるよう保証するために非常に入念なゲームソフトウェア設計が要求される。 For example, game graphics are generally calculated for each frame. For many games, the game logic sometimes determines whether the scene is particularly complex or if there are other delays that slow down execution (eg, another process of removing CPU cycles from a game application on a PC). Takes less than or longer than one frame to calculate the graphic to be displayed for the next frame. In such a game, a “threshold” frame is finally generated which is calculated slightly shorter than one frame time (for example, several CPU clock cycles shorter). When the same scene is recalculated using exactly the same game state information, it can easily take several CPU clock cycles longer than one frame time (for example, the internal CPU bus is slightly out of phase with the external DRAM bus). And if you introduce a time delay of a few CPU cycles, even if there is no significant delay due to another process that takes a few milliseconds of CPU time out of the game processing). Therefore, when the game is played, the frame is calculated in two frame times instead of one frame time. Some behaviors are based on how often the game calculates new frames (eg, when the game samples input from the game controller). While the game is being displayed, this difference in time reference for different behaviors does not affect game play, but causes the played game to produce different results. For example, if a basketball trajectory is calculated at a constant 60 fps speed, but the game controller input is sampled based on the calculated frame speed, the calculated frame speed is recorded by the game. 53fps when played, but 52fps when the game is played, which will make a difference in whether basketball is prevented from entering the basket, resulting in different results. Thus, recording a video game using game state requires a very careful game software design to ensure that playback using the same game state information produces exactly the same results.
ビデオゲームを記録するための別の従来の解決策は、PC又はビデオゲームシステムのビデオ出力を(例えば、VCR、DVDレコーダへ、又はPC上のビデオ捕獲ボードへ)単に記録することである。次いで、ビデオは、巻き戻して再生することもできるし、或いは記録されたビデオを、典型的に、圧縮した後にインターネットへアップロードすることもできる。この解決策の欠点は、3Dゲームシーケンスが再生されるときに、ユーザは、シーケンスが記録された視点のみからシーケンスを見ることに限定されることである。換言すれば、ユーザは、シーンの視点を変更することができない。 Another conventional solution for recording video games is to simply record the video output of a PC or video game system (eg, to a VCR, DVD recorder, or to a video capture board on the PC). The video can then be rewound and played, or the recorded video can typically be compressed and uploaded to the Internet. The drawback of this solution is that when the 3D game sequence is played, the user is limited to viewing the sequence only from the viewpoint where the sequence was recorded. In other words, the user cannot change the viewpoint of the scene.
更に、家庭用PC又はゲームコンソールで再生される記録されたゲームシーケンスの圧縮ビデオがインターネットを通して他のユーザに利用されるときには、ビデオがリアルタイムで圧縮された場合でも、その圧縮されたビデオをリアルタイムでインターネットにアップロードすることは不可能である。その理由は、インターネットに接続された世界中の多数の家庭が、極めて非対称的なブロードバンド接続を有する(例えば、DSL及びケーブルモデムは、典型的に、アップストリーム帯域巾よりも遥かに広いダウンストリーム帯域巾を有する)からである。圧縮された高解像度ビデオシーケンスは、多くの場合に、ネットワークのアップストリーム帯域巾容量より広い帯域巾を有し、それらをリアルタイムでアップロードするのを不可能にする。従って、ゲームシーケンスが再生された後、インターネットの別のユーザがゲームを見ることができるまでに著しい遅延が生じる(おそらく数分又は数時間)。この遅延は、ある状況(例えば、以前に生じたゲームプレーヤの成績を見る)では許容できるが、ゲーム(例えば、チャンピオンプレーヤによりプレイされるバスケットボールトーナメント)を生で見る能力、又はゲームが生でプレイされるときの「瞬時再生」能力を排除する。 Furthermore, when a compressed video of a recorded game sequence that is played on a home PC or game console is available to other users over the Internet, the compressed video can be viewed in real time even if the video is compressed in real time. It is impossible to upload to the Internet. The reason is that many homes around the world connected to the Internet have very asymmetric broadband connections (eg, DSL and cable modems typically have a much wider downstream bandwidth than the upstream bandwidth). Because it has a width). Compressed high resolution video sequences often have a bandwidth that is wider than the upstream bandwidth capacity of the network, making them impossible to upload in real time. Thus, after the game sequence is played, there will be a significant delay (possibly minutes or hours) before another user on the Internet can watch the game. This delay can be tolerated in certain situations (eg, looking at a previously played game player's performance), but the ability to see a game (eg, a basketball tournament played by a champion player) live, or a game played live Eliminate the “instant play” ability when done.
別の従来の解決策は、テレビジョン制作員の管理下でのみ、視聴者が、テレビ受像機でビデオゲームを生で見ることができるようにする。米国及び他の国々における幾つかのチャンネルは、ビデオゲーム視聴チャンネルを提供し、テレビ視聴者は、ビデオゲームチャンネル上で何人かのビデオゲームユーザ(例えば、トーナメントでプレイする最高評価プレーヤ)を見ることができる。これは、テレビジョンチャンネル用のビデオ配信及び処理装置へビデオゲームシステム(PC及び/又はコンソール)のビデオ出力をフィードすることにより達成される。これは、多数のカメラがバスケットボールコートの周囲で異なるアングルから生映像を送る生のバスケットボールゲームをテレビチャンネルが放送するときとは異なる。従って、テレビチャンネルは、それらのビデオ/オーディオ処理を活用して、種々のビデオゲームシステムからの出力を操作するように装置に作用することができる。例えば、テレビチャンネルは、異なるプレーヤの状態を示すテキストをビデオゲームからのビデオの上に重畳することができ(生のバスケットボールゲーム中のオーバーレイテキストであるかのように)、そしてテレビチャンネルは、ゲーム中に生じるアクションについて論じることのできるコメンテータからの音声をかぶせて録音することができる。更に、ビデオゲーム出力を、ゲームの実際のプレーヤのビデオを記録するカメラと合成することができる(例えば、ゲームに対する感情的応答を示す)。 Another conventional solution allows viewers to watch video games live on a television set only under the control of a television producer. Some channels in the United States and other countries offer video game viewing channels, and television viewers watch some video game users (eg, top rated players playing in tournaments) on the video game channel. Can do. This is accomplished by feeding the video output of the video game system (PC and / or console) to a video distribution and processing device for the television channel. This is different from when a television channel broadcasts a live basketball game where multiple cameras send live video from different angles around the basketball court. Thus, television channels can take advantage of their video / audio processing to act on the device to manipulate the output from various video game systems. For example, a television channel can superimpose text indicating the status of different players on top of the video from the video game (as if it were overlay text in a live basketball game), and the television channel You can record audio from commentators who can discuss the actions that occur inside. In addition, the video game output can be combined with a camera that records the video of the actual player of the game (eg, showing an emotional response to the game).
この解決策に伴う1つの問題は、生放送の興奮を得るために、このような生のビデオフィードがテレビチャンネルのビデオ配信及び処理装置にリアルタイムで得られねばならないことである。しかしながら、上述したように、これは、ビデオゲームシステムが家庭から実行されるとき、特に、放送の一部分が、ゲームプレーヤの実世界ビデオを捕獲するカメラからの生ビデオを含む場合には、しばしば不可能である。更に、トーナメント状態において、上述したように、家庭内のゲーム遊技者がゲームを変更し及びチートする問題もある。これらの理由で、テレビチャンネルを経てのこのようなビデオゲーム放送は、プレーヤ及びビデオゲームシステムが共通の位置(例えば、テレビスタジオ又は競技場)に集合し、そこで、テレビ制作装置が多数のビデオゲームシステム及び潜在的な生カメラからのビデオフィードを受け容れることができるように、しばしば構成される。 One problem with this solution is that in order to gain live broadcast excitement, such a live video feed must be available in real time to the video distribution and processing device on the television channel. However, as noted above, this is often not useful when the video game system is run from home, especially if a portion of the broadcast includes live video from a camera that captures the game player's real-world video. Is possible. Further, in the tournament state, as described above, there is a problem that a game player in the home changes and cheats the game. For these reasons, such video game broadcasts over television channels are where players and video game systems gather at a common location (eg, a television studio or stadium), where the television production device has multiple video games. Often configured to accept video feeds from the system and potential live cameras.
このような従来のビデオゲームテレビチャンネルは、ビデオゲームの世界におけるアクション及び実世界におけるアクションの両方に関して、例えば、ビデオゲームプレーヤが「アスリート」として描かれるようにして、生のスポーツイベントに類似した体験である非常に興奮させる上映をテレビの視聴者に与えることができるが、これらのビデオゲームシステムは、プレーヤが互いに物理的に非常に接近した状態にしばしば限定される。そして、テレビチャンネルが放送されて以来、各放送チャンネルは、テレビチャンネルの制作員により選択された1つのビデオストリームしか示すことができない。これらの制限や、放送時間、制作装置及び制作員の高いコストのために、テレビチャンネルは、典型的に、トップトーナメントでプレイする最高評価プレーヤしか示さない。 Such traditional video game TV channels are similar in experience to live sporting events, for example, video game players are depicted as “athletes” for both action in the video game world and action in the real world. However, these video game systems are often limited to players that are physically very close to each other. And since a television channel was broadcast, each broadcast channel can only show one video stream selected by the producer of the television channel. Because of these limitations and the high cost of airtime, production equipment, and production personnel, television channels typically show only the highest rated players that play in top tournaments.
更に、ビデオゲームのフルスクリーン映像を全テレビ視聴者に放送する所与のテレビチャンネルは、一度に1つのビデオゲームしか示さない。これは、テレビ視聴者の選択肢を甚だしく制限する。例えば、テレビ視聴者は、所与の時間に映されるゲームに関心がないことがある。別の視聴者は、所与の時間にテレビチャンネルによって特集されない特定のプレーヤのゲームプレイを見ることにしか関心がない。他のケースでは、視聴者は、専門プレーヤがゲームにおける特定のレベルをどのように取り扱うか見ることにしか関心がない。更に他の視聴者は、制作チーム等により選択されたものとは異なる、ビデオゲームを見る視点をコントロールすることを希望する。手短に言えば、テレビ視聴者は、多数の異なるテレビチャンネルが見られる場合でも、テレビネットワークの特定の放送によって受け容れられないビデオゲームを見ることに無数の好みをもっている。上述した全ての理由で、従来のビデオゲームテレビチャンネルは、テレビ視聴者にビデオゲームを示す上で著しい制限がある。 Furthermore, a given television channel that broadcasts a full screen video of a video game to all television viewers shows only one video game at a time. This severely limits television viewer options. For example, a television viewer may not be interested in a game that is played at a given time. Another viewer is only interested in watching a particular player's game play not featured by the television channel at a given time. In other cases, the viewer is only interested in seeing how a specialized player handles a particular level in the game. Still other viewers desire to control the viewpoint of viewing the video game, which is different from that selected by the production team or the like. In short, television viewers have countless preferences for watching video games that are unacceptable by certain broadcasts on the television network, even when many different television channels are viewed. For all the reasons described above, conventional video game television channels have significant limitations in presenting video games to television viewers.
従来のビデオゲームシステム及びアプリケーションソフトウェアシステムの別の欠点は、それらが複雑であり、且つエラー、クラッシュ及び/又は意図されない及び望ましからぬ挙動(集合的に「バグ」)により通常悩まされていることである。ゲーム及びアプリケーションは、典型的に、発売までにデバッグ及びチューニングプロセス(しばしば「ソフトウェアクオリティアシュアランス」又はSQAと称される)に通されるが、ほぼ常に、ゲーム又はアプリケーションがその分野の広範囲な視聴者に発売されると、バグが突然現れる。不都合なことに、ソフトウェア開発者は、発売後に多くのバグを識別して追跡することは困難である。ソフトウェア開発者がバグに気付くことは困難である。バグについて学習したときでも、何がバグを生じさせたか識別するために利用できる情報は、限られた量しかない。例えば、ユーザは、ゲーム開発者の顧客サービスラインに電話し、ゲームをプレイするときに、スクリーンがフラッシュを開始し、次いで、濃い青色に変化し、PCがフリーズすることを示すメッセージを残す。これは、SQAチームに、バグを追跡するのに有用な非常に僅かな情報しか与えない。オンライン接続されたあるゲーム又はアプリケーションは、時々、幾つかのケースでは、多くの情報を与えることができる。例えば、ゲーム又はアプリケーションを「クラッシュ」について監視するために、時々「ウオッチドッグ」プロセスを使用することができる。ウオッチドッグプロセスは、ゲーム又はアプリケーションプロセスがクラッシュしたときにその状態(例えば、スタックの状態、メモリ使用状態、ゲーム又はアプリケーションがどれほど進行したか、等)に関する統計情報を収集し、次いで、その情報を、インターネットを経てSQAチームへアップロードすることができる。しかし、複雑なゲーム又はアプリケーションでは、このような情報は、クラッシュ時にユーザが何を行ったか正確に決定するために解読するのに非常に長時間を要する。従って、どんな事象シーケンスがクラッシュを招いたか決定することが不可能である。 Another drawback of conventional video game systems and application software systems is that they are complex and usually plagued by errors, crashes and / or unintended and undesired behavior (collectively “bugs”). That is. Games and applications are typically passed through a debugging and tuning process (often referred to as “Software Quality Assurance” or SQA) before launch, but almost always the games or applications are a wide audience in the field. Bugs suddenly appear when released. Unfortunately, it is difficult for software developers to identify and track many bugs after release. It is difficult for software developers to notice bugs. Even when learning about bugs, there is only a limited amount of information available to identify what caused the bug. For example, when a user calls the game developer's customer service line and plays a game, the screen begins to flash and then turns dark blue, leaving a message indicating that the PC is freezing. This gives the SQA team very little information useful for tracking bugs. A game or application that is connected online can sometimes provide a lot of information in some cases. For example, a “watchdog” process can sometimes be used to monitor a game or application for “crash”. The watchdog process collects statistical information about its state (eg, stack state, memory usage, how far the game or application has progressed, etc.) when the game or application process crashes, and then collects that information. You can upload to the SQA team via the Internet. However, in complex games or applications, such information can take a very long time to decipher to accurately determine what the user has done at the time of the crash. Therefore, it is impossible to determine what event sequence caused the crash.
PC及びゲームコンソールに関連した更に別の問題は、消費者に相当不便をかけるサービスの問題を受けることである。又、これらサービスの問題は、PC又はゲームコンソールの製造者に影響を及ぼす。というのは、製造者は、壊れたPC又はコンソールを安全に運搬するために特殊なボックスを送付し、PC又はコンソールが保証期間内である場合には修理のコストを負う必要があるからである。又、ゲーム又はアプリケーションソフトウェアの発行者は、PC及び/又はコンソールが修理の状態にあることによる販売の損失(又はオンラインサービス使用)によっても影響を受ける。 Yet another problem associated with PCs and game consoles is that they suffer from service problems that are very inconvenient for consumers. These service issues also affect PC or game console manufacturers. This is because the manufacturer needs to send a special box to safely carry a broken PC or console and bear the cost of repair if the PC or console is within the warranty period. . Game or application software publishers are also affected by lost sales (or online service usage) due to the PC and / or console being in repair.
図1は、Sony Playstation(登録商標)3、Microsoft XBox 360(登録商標)、Nintendo WiiTM、Windowベースのパーソナルコンピュータ、又はApple Macintoshのような従来のビデオゲームシステムを示す。これらシステムは、各々、プログラムコードを実行するための中央処理ユニット(CPU)、典型的に、進歩型グラフィックオペレーションを遂行するためのグラフィック処理ユニット(GPU)、並びに外部装置及びユーザと通信するための複数の形態の入力/出力(I/O)を備えている。簡単化のために、これらのコンポーネントは、単一のユニット100として一緒に結合されて示されている。又、図1の従来のビデオゲームシステムは、光学的メディアドライブ104(例えば、DVD−ROMドライブ)、ビデオゲームのプログラムコード及びデータを記憶するためのハードドライブ103、マルチプレーヤゲームをプレイし、ゲーム、パッチ、デモ又は他のメディアをダウンロードするためのネットワーク接続105、CPU/GPU100により現在実行されているプログラムコードを記憶するためのランダムアクセスメモリ(RAM)101、ゲームプレイ中にユーザからの入力コマンドを受け取るためのゲームコントローラ106、及びディスプレイ装置102(例えば、SDTV/HDTV又はコンピュータモニタ)を含むように示されている。 FIG. 1 shows a conventional video game system such as Sony Playstation® 3, Microsoft XBox 360®, Nintendo Wii ™ , Windows-based personal computer, or Apple Macintosh. Each of these systems is a central processing unit (CPU) for executing program code, typically a graphics processing unit (GPU) for performing advanced graphics operations, and for communicating with external devices and users. Multiple forms of input / output (I / O) are provided. For simplicity, these components are shown coupled together as a single unit 100. The conventional video game system of FIG. 1 also plays an optical media drive 104 (for example, a DVD-ROM drive), a hard drive 103 for storing video game program codes and data, a multiplayer game, , Network connection 105 for downloading patches, demos or other media, random access memory (RAM) 101 for storing program code currently being executed by the CPU / GPU 100, input commands from the user during game play And a display device 102 (eg, SDTV / HDTV or computer monitor).
図1に示す従来のシステムは、多数の制限で悩まされている。第1に、光学的ドライブ104及びハードドライブ103は、RAM101に比して非常に低速のアクセス速度を有する傾向がある。RAM101を通して直接機能するときには、CPU/GPU100は、実際に、プログラムコード及びデータがハードドライブ103又は光学ドライブ104から直接読み取られるときに可能であるより遥かに多くの多角形を毎秒処理することができる。というのは、RAM101は、一般的に、帯域巾が非常に広く、ディスクメカニズムの比較的長いシーク遅延で悩まされないからである。しかし、これら従来システムでは、限定された量のRAMしか設けられていない(例えば、256−512Mバイト)。それ故、ビデオゲームの次のシーケンスのためのデータでRAM101が周期的に埋められる“Loading...”シーケンスがしばしば要求される。 The conventional system shown in FIG. 1 suffers from a number of limitations. First, the optical drive 104 and the hard drive 103 tend to have a very low access speed compared to the RAM 101. When functioning directly through the RAM 101, the CPU / GPU 100 can actually process much more polygons per second than is possible when program code and data are read directly from the hard drive 103 or optical drive 104. . This is because RAM 101 is generally very wide in bandwidth and is not bothered by the relatively long seek delay of the disk mechanism. However, in these conventional systems, only a limited amount of RAM is provided (eg, 256-512 Mbytes). Therefore, a “Loading ...” sequence is often required in which the RAM 101 is periodically filled with data for the next sequence of the video game.
あるシステムは、ゲームプレイと同時にプログラムコードのローディングを重畳させるように試みているが、これは、既知の事象シーケンスがあるときしか行うことができない(例えば、車を運転して道路を下る場合に、車を運転しながら、路傍にある接近してくるビルの幾何学形状をロードすることができる)。複雑で及び/又は急速なシーンの変化については、この形式の重畳は、通常、機能しない。例えば、ユーザが戦いの最中であり、そしてその瞬間に視野内のオブジェクトを表すデータでRAM101が完全に埋められるケースでは、RAM101に現在ロードされていないオブジェクトを見るためにユーザが視野を素早く左へ動かした場合に、アクションの不連続状態が生じる。というのは、ハードドライブ103又は光学的メディア104から新たなオブジェクトをRAM101へロードするに充分な時間がないからである。 Some systems attempt to superimpose program code loading at the same time as gameplay, but this can only be done when there is a known sequence of events (for example, when driving a car and going down the road). , While driving, you can load the approaching building geometry by the roadside). For complex and / or rapid scene changes, this type of superposition usually does not work. For example, if the user is in the middle of a battle and the RAM 101 is completely filled with data representing objects in the field of view at that moment, the user quickly left the field of view to see objects that are not currently loaded in the RAM 101. If you move to, there will be a discontinuity of action. This is because there is not enough time to load a new object from the hard drive 103 or optical media 104 into the RAM 101.
図1のシステムでは、ハードドライブ103及び光学的メディア104の記憶容量に制限があるために別の問題が生じる。比較的大きな記憶容量(例えば、50ギガバイト以上)をもつディスク記憶装置を製造することはできるが、現在ビデオゲームで遭遇する幾つかのシーンについて充分な記憶容量をまだ与えることができない。例えば、上述したように、サッカーのビデオゲームは、世界中の多数のチーム、プレーヤ及びスタジアムの中からユーザが選択を行えるようにする。各チーム、各プレーヤ及び各スタジアムに対して、世界中の3D曲面を特徴付けるには非常に多数のテクスチャマップ及び環境マップが要求される(例えば、各チームが独特のジャージを有し、その各々が独特のテクスチャマップを要求する)。 In the system of FIG. 1, another problem arises due to the limited storage capacity of the hard drive 103 and optical media 104. Although disk storage devices with relatively large storage capacities (eg, 50 gigabytes or more) can be manufactured, they still cannot provide sufficient storage capacity for some scenes currently encountered in video games. For example, as described above, a soccer video game allows a user to select from a large number of teams, players and stadiums around the world. For each team, each player and each stadium, a very large number of texture maps and environment maps are required to characterize the 3D curved surface around the world (eg, each team has a unique jersey, each of which Requires a unique texture map).
この後者の問題に対処するために使用される1つの技術は、ユーザによってテクスチャ及び環境マップが選択されたときにゲームがそれらを予め計算することである。これは、映像の解凍、3Dマッピング、シェーディング、データ構造の編成、等を含めて、多数の計算上強いプロセスを含むことがある。その結果、ビデオゲームがこれらの計算を遂行する間にユーザにとって遅延が生じ得る。この遅延を減少するための1つの方法は、原理的に、ゲームが最初に開発されたときに、チーム、プレーヤ名簿及びスタジアムの各順列を含めて、これら計算の全てを遂行することである。従って、ゲームの発売バージョンは、光学的メディア104、又はインターネット上の1つ以上のサーバーに記憶された全てのこの前処理されたデータを、ユーザが選択を行うときにインターネットを通してハードドライブ103へダウンロードされる所与のチーム、プレーヤ名簿、スタジアム選択のための選択された前処理されたデータと共に含む。しかしながら、実際上の問題として、ゲームプレイにおいて考えられる各順列のこのような予めロードされるデータは、多分、今日の光学的メディア装置の容量を遥かに越えるテラバイトのデータになってしまう。更に、所与のチーム、プレーヤ名簿、スタジアム選択のためのデータは、多分、数百メガバイト以上のデータになってしまう。例えば、10Mbpsの家庭用ネットワーク接続では、ネットワーク接続105を通してこのデータをダウンロードするのに、データをローカルで計算する以上の時間を要することになる。 One technique used to address this latter problem is that the game pre-calculates textures and environment maps as they are selected by the user. This may involve a number of computationally intensive processes, including video decompression, 3D mapping, shading, data structure organization, etc. As a result, there may be a delay for the user while the video game performs these calculations. One way to reduce this delay is in principle to perform all of these calculations, including team, player roster, and stadium permutations when the game is first developed. Thus, the release version of the game downloads all this preprocessed data stored on the optical media 104 or one or more servers on the Internet to the hard drive 103 over the Internet when the user makes a selection. With a given pre-processed data for a given team, player directory, stadium selection. However, as a practical matter, such pre-loaded data for each possible permutation in game play will likely be terabytes of data that far exceeds the capacity of today's optical media devices. Furthermore, the data for a given team, player list, and stadium selection will probably be more than a few hundred megabytes. For example, in a 10 Mbps home network connection, downloading this data through the network connection 105 takes more time than calculating the data locally.
従って、図1に示す従来のゲームアーキテクチャーは、複雑なゲームの主要シーン移行間にユーザに著しい遅延を受けさせる。 Thus, the conventional game architecture shown in FIG. 1 causes the user to experience significant delays between major scene transitions in complex games.
図1に示す従来の解決策に伴う別の問題は、年々、ビデオゲームがより進歩する傾向にあり、より高いCPU/GPUパワーを要求することである。従って、限定された量のRAMを仮定しても、ビデオゲームハードウェアの要件は、これらシステムに得られる処理パワーのピークレベルを越えてしまう。その結果、ユーザは、歩調を合わせるためにゲームハードウェアを数年毎にアップグレードする必要がある(又は新たなゲームを質の低いレベルでプレイする)。ビデオゲームが絶えず進歩する傾向の1つの結果として、家庭で使用するためのビデオゲームプレイマシンは、典型的に、それらのコストが、通常、サポートできる最高性能ゲームの要件により決定されるので、経済的に効率が悪い。例えば、XBox 360は、高性能CPU、GPU、及び数百メガバイトのRAMを必要とする“Gears of War”のようなゲームをプレイするのに使用されるか、又はXBox 360は、数キロバイトのRAM及び非常に低性能のCPUしか要求しない1970年代のゲームであるPac Manをプレイするのに使用される。実際に、XBox 360は、Pac Manゲームを一度に多数同時にホストするに充分な計算パワーを有している。 Another problem with the conventional solution shown in FIG. 1 is that video games tend to be more advanced year by year, requiring higher CPU / GPU power. Therefore, even assuming a limited amount of RAM, video game hardware requirements exceed the peak processing power levels available for these systems. As a result, users need to upgrade their game hardware every few years to keep pace (or play new games at a lower quality level). As a result of the ever-increasing trend of video games, video game play machines for home use are typically economical because their cost is usually determined by the requirements of the highest performance game they can support. Inefficient. For example, XBox 360 is used to play games such as "Gears of War" that require a high performance CPU, GPU, and hundreds of megabytes of RAM, or XBox 360 is several kilobytes of RAM And is used to play Pac Man, a 1970s game that requires only a very low performance CPU. In fact, XBox 360 has enough computing power to host many Pac Man games at once.
ビデオゲームマシンは、典型的に、一週間のほとんどの時間中オフにされている。13年以上経った現役ゲームに関するニールセン・エンターテーメント・スタディ2006年7月号によれば、平均で、現役のゲームは、毎週14時間をコンソールビデオゲームのプレイに費やしており、即ち一週間の合計時間の12%に過ぎない。これは、平均でビデオゲームコンソールが88%の時間アイドル状態であり、高価なリソースの使用効率が悪いことを意味する。購入価格を下げるためにビデオゲームコンソールが製造者によりしばしば助成されると仮定すれば(その助成金が将来のビデオゲームソフトウェアの購入からのロイヤリティにより還元されることを期待して)、これは、特に意義深いことである。 Video game machines are typically turned off for most of the week. According to the Nielsen Entertainment Study July 2006 issue on active games over 13 years old, on average, active games spend 14 hours a week playing console video games, ie a week It is only 12% of the total time. This means that, on average, video game consoles are idle for 88% of the time, and expensive resources are inefficiently used. Assuming that video game consoles are often subsidized by manufacturers to reduce the purchase price (in the hope that the subsidy will be reduced by royalties from future video game software purchases) This is particularly significant.
又、ビデオゲームコンソールは、ほとんどの消費者電子装置に関連したコストを負っている。例えば、システムの電子装置及びメカニズムは、エンクロージャ内に収容する必要がある。製造者は、修理保証を提供する必要がある。システムを販売する小売店は、システムの販売及び/又はビデオゲームソフトウェアの販売において利ざやを収集する必要がある。これらのファクタは、全てビデオゲームコンソールのコストに追加され、これは、製造者によって助成されねばならないか、消費者へ回されるか、又はその両方である。 Video game consoles also incur costs associated with most consumer electronic devices. For example, system electronics and mechanisms need to be housed in an enclosure. The manufacturer needs to provide a repair warranty. The retail store that sells the system needs to collect margins in selling the system and / or selling video game software. All of these factors add to the cost of the video game console, which must be subsidized by the manufacturer, routed to the consumer, or both.
更に、ビデオゲーム産業にとって海賊版が主たる問題である。実質上全ての主要ビデオゲームシステムに使用されるセキュリティメカニズムは、年々「クラック」されて、ビデオゲームの無断コピーが取られている。例えば、XBox 360のセキュリティシステムは、2006年7月にクラックされ、ユーザは、今や、不正コピーをオンラインでダウンロードすることができる。ダウンロード可能なゲーム(例えば、PC又はMac用のゲーム)は、特に海賊行為を受け易い。海賊行為の取り締まりが弱い世界のある地域では、スタンドアローンビデオゲームソフトウェアのための成功が見込める市場が本質的にない。というのは、ユーザが海賊版コピーを合法的コピーと同程度に容易にそのコストのほんの一部分で買えるからである。又、世界の多くの地域では、ゲームコンソールのコストが収入の高い割合であり、海賊版を取り締まっても、最新のゲームシステムを買う余裕がある人は僅かに過ぎない。 Furthermore, piracy is a major problem for the video game industry. The security mechanisms used in virtually all major video game systems are “cracked” year by year and unauthorized copies of video games are taken. For example, the XBox 360 security system was cracked in July 2006 and users can now download unauthorized copies online. Downloadable games (eg, PC or Mac games) are particularly susceptible to piracy. In some parts of the world where piracy is weak, there is essentially no market for success for standalone video game software. This is because users can buy pirated copies as easily as legal copies at a fraction of the cost. Also, in many parts of the world, the cost of game consoles is a high percentage of revenue, and even if the pirated version is cracked, only a few people can afford the latest game system.
更に、中古ゲーム市場は、ビデオゲーム産業の収入を減少させる。ユーザは、ゲームに飽きると、ゲームを店に売ることができ、店は、ゲームを他のユーザに再販売する。この無許可であるが一般的な慣習は、ゲーム発行者の収入を著しく減少させる。同様に、数年毎にプラットホームの移行があるときには、通常、50%の販売量低下が生じる。これは、ユーザが、新規バージョンプラットホームが発売されようとしていることを知ると、旧型プラットホーム用のゲームの購入を止める(例えば、Playstation3が発売されようとしているときに、ユーザは、Playstation2のゲームの購入を止める)からである。新規のプラットホームに関連した販売の損失及び開発コストの増加が相まって、ゲーム開発者の利益に非常に大きな影響が及ぶことになる。 In addition, the used game market reduces revenue for the video game industry. When a user gets tired of the game, the user can sell the game to a store, and the store resells the game to other users. This unauthorized but general practice significantly reduces the game publisher's revenue. Similarly, when there is a platform transition every few years, there is usually a 50% drop in sales. This means that when the user knows that a new version platform is about to be released, it stops purchasing games for the old platform (eg, when Playstation 3 is about to be released, the user purchases a game for Playstation 2 Because it stops. The loss of sales and increased development costs associated with the new platform will have a huge impact on game developers' profits.
又、新規なゲームコンソールは、非常に高価である。XBox 360、Nintendo Wii、及びSony Playstation3は、全て、数百ドルで小売される。ハイパワーのパーソナルコンピュータゲームシステムは、その価格が$8000までである。これは、特に、ハードウェアが数年後に旧式となり且つ多くのシステムが子供のために購入されることを考えると、ユーザにとって著しい投資を表す。 Also, the new game console is very expensive. XBox 360, Nintendo Wii, and Sony Playstation 3 are all retailed for hundreds of dollars. High power personal computer game systems are priced up to $ 8000. This represents a significant investment for the user, especially considering that the hardware will become obsolete after a few years and many systems will be purchased for children.
以上の問題に対する1つの解決策は、ゲームプログラムコード及びデータがサーバーにホストされそしてオンデマンドでクライアントマシンへデジタルブロードバンドネットワークを経てストリーミングされる圧縮されたビデオ及びオーディオとして配信されるオンラインゲームである。フィンランドのG−Cluster(現在では、日本のソフトバンクブロードメディアの子会社)のような幾つかの会社は、これらのサービスをオンラインで提供する。同様のゲームサービスが、ホテル内にあるようなローカルネットワークにおいて利用でき、DSL及びケーブルテレビジョンプロバイダーによって提供されている。これらシステムの主たる欠点は、待ち時間(latency)、即ちオペレータの「ヘッドエンド」に典型的に配置されたゲームサーバーへ信号が進み且つそこから進むのに要する時間の問題である。高速アクションビデオゲーム(「ツイッチ」ビデオゲームとしても知られている)は、ユーザがゲームコントローラでアクションを遂行する時間と、ディスプレイスクリーンが更新されてユーザアクションの結果を示す時間との間に非常に短い待ち時間を要求する。ゲームが「即座」に応答するという感覚をユーザがもつようにするため、短い待ち時間が必要とされる。ユーザは、ゲームの形式及びユーザの熟練度レベルに基づいて異なる待ち時間間隔で満足することができる。例えば、ゆっくりしたカジュアルなゲーム(バックギャモンのような)又は低速アクションの役割を演じるゲームについては100msの待ち時間が許容できるが、高速アクションゲームでは、待ち時間が70又は80msを越えると、ユーザは、ゲームにおいて演技が不充分となり、受け容れられない。例えば、高速反応時間を要求するゲームでは、待ち時間が50から100msへ増加するにつれて、精度が鋭く低下する。 One solution to the above problem is an online game that is delivered as compressed video and audio where game program code and data are hosted on a server and streamed on demand to client machines over a digital broadband network. Some companies, such as the Finnish G-Cluster (currently a subsidiary of Softbank Broadmedia in Japan), offer these services online. Similar gaming services are available in local networks, such as in a hotel, and are provided by DSL and cable television providers. The main drawback of these systems is the latency, ie, the time it takes for the signal to travel to and from a game server typically located at the operator's “head end”. Fast action video games (also known as “twitch” video games) are very much between the time a user performs an action on the game controller and the time the display screen is updated to show the result of the user action. Require a short waiting time. In order for the user to feel like the game responds “instantly”, a short waiting time is required. Users can be satisfied with different waiting intervals based on the type of game and the level of proficiency of the user. For example, a slow casual game (such as backgammon) or a game that plays the role of slow action can tolerate a 100ms latency, but in a fast action game, if the latency exceeds 70 or 80ms, the user , The performance in the game is inadequate and unacceptable. For example, in a game that requires a fast reaction time, the accuracy sharply decreases as the waiting time increases from 50 to 100 ms.
ゲーム又はアプリケーションサーバーが、近傍のコントロールされたネットワーク環境にインストールされるか、又はユーザへのネットワーク経路が予想可能で及び/又は帯域巾ピークを許容できる環境にインストールされるときには、最大待ち時間と、待ち時間の一貫性の両方について、待ち時間をコントロールすることが遥かに容易である(例えば、ユーザがネットワークを通してストリーミングするデジタルビデオから一定の動きを観察するように)。このようなレベルのコントロールは、ケーブルTVネットワークのヘッドエンドとケーブルTV加入者の家庭との間、又はDSL中央オフィスからDSL加入者の家庭までの間、或いはサーバー又はユーザからの商業的オフィスのローカルエリアネットワーク(LAN)環境において、達成することができる。又、保証された帯域巾及び待ち時間を有する会社間に特殊グレードのポイント対ポイントプライベート接続を得ることができる。しかし、一般的なインターネットに接続されたサーバーセンターにおいてゲームをホストし、次いで、ブロードバンド接続を経てユーザへ圧縮ビデオをストリーミングするゲーム又はアプリケーションシステムでは、多数のファクタから待ち時間を招き、従来システムの展開に甚だしい制限を生じさせる。 When a game or application server is installed in a nearby controlled network environment or installed in an environment where the network path to the user is predictable and / or can tolerate bandwidth peaks, For both latency consistency, it is much easier to control latency (eg, as users observe certain movements from digital video streaming through the network). This level of control can be done between the cable TV network headend and the cable TV subscriber's home, or from the DSL central office to the DSL subscriber's home, or locally in the commercial office from the server or user. It can be achieved in an area network (LAN) environment. In addition, special grade point-to-point private connections can be obtained between companies with guaranteed bandwidth and latency. However, in a game or application system that hosts a game in a general server center connected to the Internet, and then streams compressed video to a user via a broadband connection, latency is incurred due to a number of factors, and the development of conventional systems Cause severe restrictions.
典型的なブロードバンド接続の家庭では、ユーザは、ブロードバンドサービスのためにDSL又はケーブルモデムをもつことができる。このようなブロードバンドサービスは、通常、ユーザの家庭と一般的なインターネットとの間に25ms程度(時々はそれ以上の)の往復待ち時間を被る。更に、インターネットを経てサーバーセンターへデータをルーティングすることからも往復遅延を被る。インターネットを通しての待ち時間は、データが与えられるルート及びそれがルーティングされるときに被る遅延に基づいて変化する。ルーティング遅延に加えて、ほとんどのインターネットを相互接続する光ファイバを経て進む光の速度のために、往復遅延も被る。例えば、1000マイルごとに、光ファイバを通る光の速度及び他のオーバーヘッドのために、約22msの往復待ち時間を被る。 In a typical broadband home, the user can have a DSL or cable modem for broadband services. Such broadband services typically incur a round trip latency of about 25 ms (sometimes more) between the user's home and the general Internet. In addition, there is a round trip delay from routing data to the server center via the Internet. Latency through the Internet varies based on the route the data is given and the delay incurred when it is routed. In addition to routing delays, round trip delays are also incurred due to the speed of light traveling through the optical fiber interconnecting most Internets. For example, every 1000 miles incurs a round trip latency of about 22 ms due to the speed of light through the optical fiber and other overhead.
インターネットを経てストリーミングされるデータのデータレートのために、付加的な待ち時間が生じる。例えば、ユーザが「6Mbps DSLサービス」として販売されるDSLサービスを有する場合に、実際に、ユーザは、おそらく、せいぜい5Mbps未満のダウンストリームスループットしか得ず、そしておそらく、デジタルサブスクライバーラインアクセスマルチプレクサ(DSLAM)におけるピークロード時間中の混雑のような種々のファクタのために、接続の質低下を周期的に見ることになる。又、ケーブルモデムシステムネットワークにおける隣接部又は他のどこかを経てループされるローカル共有同軸ケーブルに混雑が生じる場合には、「6Mbpsケーブルモデムサービス」として販売される接続に使用されるケーブルモデムのデータレートを遥かに低く減少する同様の問題が発生する。4Mbpsの一定レートでのデータパケットがサーバーセンターからこのような接続を経てユーザデータグラムプロトコル(UDP)フォーマットで一方向としてストリーミングされる場合には、全てがうまく機能すれば、データパケットが、付加的な待ち時間を被ることなく通過するが、混雑(又は他の障害)が存在し且つユーザへデータをストリーミングするのに3.5Mbpsしか利用できない場合には、典型的な状態において、パケットがドロップされてデータロスを生じるか、又はパケットを送ることができるまで混雑点にパケットがキューイングされて付加的な待ち時間を招くか、のいずれかである。異なる混雑点は、遅延パケットを保持する異なるキューイング容量を有し、従って、あるケースでは、混雑を通過できないパケットが直ちにドロップされる。他のケースでは、数メガビットのデータがキューイングされ、最終的に、送出される。しかし、ほぼ全てのケースにおいて、混雑点におけるキューは、容量限界があり、これらの限界を越えると、キューがオーバーフローし、パケットがドロップされる。従って、付加的な待ち時間(又は更に悪い場合は、パケットのロス)を被るのを回避するために、ゲーム又はアプリケーションサーバーからユーザへのデータレート容量を越えないようにする必要がある。 Additional latency occurs due to the data rate of data streamed over the Internet. For example, if a user has a DSL service sold as a “6 Mbps DSL service”, in fact, the user will probably only get a downstream throughput of less than 5 Mbps and probably a digital subscriber line access multiplexer (DSLAM). Due to various factors, such as congestion during peak load times, the connection quality will be seen periodically. Also, if the local shared coaxial cable that is looped through the adjacent part of the cable modem system network or somewhere else is congested, the data of the cable modem used for the connection sold as “6 Mbps cable modem service” A similar problem occurs that reduces the rate much lower. If data packets at a constant rate of 4 Mbps are streamed in one direction in the User Datagram Protocol (UDP) format via such a connection from the server center, if everything works well, the data packets are In typical situations, packets are dropped if they pass without incurring significant latency, but there is congestion (or other obstacles) and only 3.5 Mbps is available to stream data to the user. Either data loss occurs, or packets are queued at the congestion point until packets can be sent, resulting in additional latency. Different congestion points have different queuing capacities holding delayed packets, so in some cases, packets that cannot pass congestion are dropped immediately. In other cases, several megabits of data are queued and eventually sent out. However, in almost all cases, the queue at the congestion point has a capacity limit, and when these limits are exceeded, the queue overflows and packets are dropped. Therefore, in order to avoid incurring additional latency (or worse, packet loss), it is necessary not to exceed the data rate capacity from the game or application server to the user.
又、サーバーにおいてビデオを圧縮しそしてクライアント装置においてビデオを解凍するのに要求される時間によっても待ち時間を被る。更に、サーバー上で実行されているビデオゲームが、表示されるべき次のフレームを計算する間にも待ち時間を被る。現在入手できるビデオ圧縮アルゴリズムは、高いデータレート又は長い待ち時間のいずれかで悩まされている。例えば、モーションJPEGは、待ち時間が短いことを特徴とするイントラフレーム専用ロッシー(intra frame-only lossy)圧縮アルゴリズムである。各ビデオフレームは、互いのビデオフレームと独立して圧縮される。クライアント装置は、圧縮されたモーションJPEGビデオのフレームを受け取ると、そのフレームを直ちに解凍して表示し、待ち時間を非常に短くする。しかし、各フレームは、別々に圧縮されるので、アルゴリズムは、連続するフレーム間の類似性を利用することができず、その結果、イントラフレーム専用ビデオ圧縮アルゴリズムは、非常に高いデータレートで悩まされている。例えば、60fps(フレーム/秒)640x480モーションJPEGビデオは、40Mbps(メガビット/秒)以上のデータを要求する。このように低い解像度のビデオウインドウに対するこのように高いデータレートは、多くのブロードバンドアプリケーションにおいて(及び確実にほとんどの消費者インターネットベースのアプリケーションに対して)法外に高価なものとなる。更に、各フレームは独立して圧縮されるので、ロッシー圧縮から生じ得るフレーム内の欠陥は、おそらく、連続するフレームの異なる場所に現れる。これは、ビデオが解凍されたときに、動く視覚上の欠陥として視聴者に見える。 There is also latency due to the time required to compress the video at the server and decompress the video at the client device. In addition, the video game running on the server also incurs latency while calculating the next frame to be displayed. Currently available video compression algorithms are plagued by either high data rates or long latency. For example, Motion JPEG is an intra frame-only lossy compression algorithm characterized by a short waiting time. Each video frame is compressed independently of each other's video frame. When the client device receives a frame of compressed motion JPEG video, it immediately decompresses and displays the frame, greatly reducing latency. However, since each frame is compressed separately, the algorithm cannot take advantage of the similarity between successive frames, and as a result, intra-frame-only video compression algorithms are plagued by very high data rates. ing. For example, 60 fps (frames / second) 640 × 480 motion JPEG video requires data of 40 Mbps (megabits / second) or more. Such high data rates for such low resolution video windows can be prohibitively expensive in many broadband applications (and certainly for most consumer Internet-based applications). Furthermore, since each frame is compressed independently, defects in the frame that may result from lossy compression will likely appear at different locations in successive frames. This appears to the viewer as a moving visual defect when the video is decompressed.
マイクロソフト社からのMPEG2、H.264、又はVC9のような他の圧縮アルゴリズムは、従来の構成で使用されたときに、高い圧縮比を達成できるが、長い待ち時間が犠牲となる。このようなアルゴリズムは、インターフレーム及びイントラフレームの圧縮を使用する。周期的に、このようなアルゴリズムは、フレームのイントラフレーム専用圧縮を遂行する。このようなフレームは、キーフレーム(典型的に“I”フレームと称される)として知られている。次いで、これらのアルゴリズムは、典型的に、Iフレームを手前のフレーム及び連続するフレームの両方と比較する。手前のフレーム及び連続するフレームを独立して圧縮するのではなく、このアルゴリズムは、Iフレームから手前のフレーム及び連続するフレームへと映像の何が変化したか決定し、次いで、それらの変化を、Iフレームに先行する変化については“B”フレームとして、及びIフレームに続く変化については“P”フレームとして記憶する。これは、イントラフレーム専用圧縮よりも非常にゆっくりしたデータレートを生じさせる。しかし、これは、典型的に、長い待ち時間を犠牲とする。Iフレームは、典型的に、B又はPフレームより非常に大きく(しばしば10倍以上)、その結果、所与のデータレートで送信するのに比例的に長い時間を要する。 MPEG2, H.M. from Microsoft Corporation Other compression algorithms such as H.264 or VC9 can achieve high compression ratios when used in conventional configurations, but at the expense of long latency. Such an algorithm uses inter-frame and intra-frame compression. Periodically, such an algorithm performs intra-frame dedicated compression of the frame. Such a frame is known as a key frame (typically referred to as an “I” frame). These algorithms then typically compare the I frame with both the previous and successive frames. Rather than compressing the previous and successive frames independently, the algorithm determines what has changed in the video from the I frame to the previous and successive frames, and then determines those changes as The change preceding the I frame is stored as a “B” frame, and the change following the I frame is stored as a “P” frame. This results in a data rate that is much slower than intraframe-only compression. However, this typically comes at the expense of long latency. I frames are typically much larger than B or P frames (often more than 10 times), so that they take a proportionally longer time to transmit at a given data rate.
例えば、Iフレームが、B及びPフレームのサイズの10倍であり、単一のIイントラフレームごとに29個のBフレーム+30個のPフレーム=59個のインターフレームがあるか、又は「フレームグループ(GOP)」ごとに合計60個のフレームがある状態を考える。従って、60fpsでは、毎秒1つの60フレームGOPがある。送信チャンネルが2Mbpsの最大データレートを有すると仮定する。チャンネルに最高クオリティのビデオを得るために、圧縮アルゴリズムは、2Mbpsのデータストリームを発生し、上述した比を仮定すれば、これは、2メガビット(Mb)/(59+10)=30,394ビット/イントラフレーム及び303,935ビット/Iフレームを生じさせる。圧縮されたビデオストリームが解凍アルゴリズムによって受信されるときには、ビデオを着実にプレイするために、各フレームを規則的な間隔(例えば、60fps)で解凍して表示する必要がある。この結果を得るために、フレームが送信待ち時間を受ける場合には、全てのフレームを少なくともその待ち時間だけ遅延する必要があり、従って、最悪のケースのフレーム待ち時間は、各ビデオフレームに対する待ち時間を定義する。Iフレームは、最も大きなものであるから、最長の送信待ち時間を導入し、Iフレームを解凍して表示できるまでにIフレーム全体を受信しなければならない(又はインターフレームがIフレームに依存する)。チャンネルデータレートが2Mbpsであると仮定すれば、Iフレームを送信するのに、303,935/2Mb=145msを要することになる。 For example, if the I frame is 10 times the size of the B and P frames, there are 29 B frames + 30 P frames = 59 inter frames per single I intra frame, or “frame group Consider a state where there are a total of 60 frames for each (GOP) ". Therefore, at 60 fps, there is one 60 frame GOP per second. Assume that the transmission channel has a maximum data rate of 2 Mbps. In order to obtain the highest quality video on the channel, the compression algorithm generates a 2 Mbps data stream, which, given the above ratio, is 2 megabits (Mb) / (59 + 10) = 30,394 bits / intra Frame and 303,935 bits / I frame. When a compressed video stream is received by a decompression algorithm, each frame needs to be decompressed and displayed at regular intervals (eg, 60 fps) in order to play the video steadily. To obtain this result, if a frame experiences transmission latency, all frames need to be delayed by at least that latency, so the worst case frame latency is the latency for each video frame. Define Since I-frames are the largest, the longest transmission latency is introduced and the entire I-frame must be received before the I-frame can be decompressed and displayed (or the inter-frame depends on the I-frame) . Assuming that the channel data rate is 2 Mbps, 303,935 / 2 Mb = 145 ms is required to transmit the I frame.
送信チャンネルの帯域巾の大部分を使用する上述したインターフレームビデオ圧縮システムは、フレームの平均サイズに対してIフレームのサイズが大きいために長い待ち時間を受けることになる。又は、換言すれば、従来のインターフレーム圧縮アルゴリズムは、イントラフレーム専用圧縮アルゴリズムより低いフレーム当たり平均データレートを達成するが(例えば、2Mbps対40Mbps)、大きなIフレームのために、依然、高いフレーム当たりピークデータレートで悩まされている(例えば、303,935*60=18.2Mbps)。前記分析は、P及びBの両フレームがIフレームより非常に小さいと仮定していることを銘記されたい。これは、一般的には、真であるが、高い映像複雑さが手前のフレーム、高モーション又はシーンの変化に相関していないフレームについては真ではない。このような状態では、P又はBフレームがIフレームと同程度の大きさになる(P又はBフレームがIフレームより大きくなると、精巧な圧縮アルゴリズムが、典型的に、Iフレームを「強制(force)」し、そしてP又はBフレームをIフレームに置き換える)。従って、デジタルビデオストリームには、いつでも、Iフレームサイズのデータレートピークが生じる。従って、圧縮されたビデオでは、平均ビデオデータレートが送信チャンネルのデータレート容量に接近するときに(ビデオに対する高いデータレート要求を仮定すると、しばしばそうである)、Iフレーム或いは大きなP又はBフレームからの高いピークデータレートが長いフレーム待ち時間を生じさせる。 The inter-frame video compression system described above that uses most of the bandwidth of the transmission channel will experience long latency due to the large size of the I frame relative to the average size of the frame. Or, in other words, traditional interframe compression algorithms achieve a lower average data rate per frame than intraframe-only compression algorithms (eg, 2 Mbps vs. 40 Mbps) but still remain high per frame due to large I frames. Annoyed by peak data rates (eg, 303,935 * 60 = 18.2 Mbps). Note that the analysis assumes that both P and B frames are much smaller than I frames. This is generally true, but not true for frames where high video complexity is not correlated to previous frames, high motion or scene changes. In such a situation, the P or B frame is as large as the I frame (if the P or B frame is larger than the I frame, sophisticated compression algorithms typically “force” the I frame. And replace the P or B frame with an I frame). Thus, a digital video stream always has an I frame size data rate peak. Thus, for compressed video, when the average video data rate approaches the data rate capacity of the transmission channel (which is often the case, assuming high data rate requirements for video), from I frames or large P or B frames High peak data rates result in long frame latency.
もちろん、以上の説明は、GOPにおける大きなB、P又はIフレームによって生じる圧縮アルゴリズムの待ち時間を特徴付けるに過ぎない。Bフレームが使用される場合は、待ち時間がより長くなる。その理由は、Bフレームを表示できるまでに、Bフレーム及びIフレーム後の全てのBフレームを受信しなければならないからである。従って、各Iフレームの前に5個のBフレームがあるBBBBBIPPPPPBBBBBIPPPPPのような画像グループ(GOP)シーケンスにおいて、最初のBフレームは、その後のBフレーム及びIフレームが受信されるまでビデオデコンプレッサによって表示することができない。従って、ビデオが60fps(即ち、16.67ms/フレーム)でストリーミングされる場合には、最初のBフレームを解凍できるまでに、チャンネル帯域巾がどれほど速くても、5個のBフレーム及びIフレームは、受信するのに16.67*6=100msを要し、これは、ちょうど、5個のBフレームである。30個のBフレームをもつ圧縮されたビデオシーケンスは、極めて一般的である。そして、2Mbpsのような低いチャンネル帯域巾では、Iフレームのサイズにより生じる待ち時間の影響が、主として、Bフレームが到着するのを待機することによる待ち時間の影響に加えられる。従って、2Mbpsチャンネルにおいて、非常に多数のBフレームがある状態では、従来のビデオ圧縮技術を使用して、500ms以上の待ち時間を越えるのは極めて容易である。Bフレームが使用されない(所与のクオリティレベルに対して低い圧縮比を犠牲にして)場合には、Bフレームの待ち時間を被らないが、上述したピークフレームサイズにより生じる待ち時間は、依然、被る。 Of course, the above description only characterizes the compression algorithm latency caused by large B, P or I frames in a GOP. When B frames are used, the waiting time is longer. This is because all the B frames after the B frame and the I frame must be received before the B frame can be displayed. Thus, in a picture group (GOP) sequence such as BBBBBBIPPPPPBBBBBBIPPPPP with 5 B frames preceding each I frame, the first B frame is displayed by the video decompressor until subsequent B and I frames are received. Can not do it. Thus, if the video is streamed at 60 fps (ie 16.67 ms / frame), no matter how fast the channel bandwidth is before the first B frame can be decompressed, It takes 16.67 * 6 = 100 ms to receive, which is exactly 5 B frames. Compressed video sequences with 30 B frames are very common. And at low channel bandwidths, such as 2 Mbps, the latency effect caused by the size of the I frame is primarily added to the latency effect due to waiting for the B frame to arrive. Thus, in a 2 Mbps channel with a very large number of B frames, it is very easy to exceed 500 ms latency using conventional video compression techniques. If the B frame is not used (at the expense of a low compression ratio for a given quality level), it does not incur the B frame latency, but the latency caused by the peak frame size described above is still suffer.
この問題は、まさに多数のビデオゲームの性質により激化される。上述したGOP構造を使用するビデオ圧縮アルゴリズムは、主として、受動的な視聴に意図された生のビデオ又は動画資料で、使用上最適化されている。典型的に、カメラ(実際のカメラであるか、コンピュータ発生アニメーションの場合のバーチャルカメラであるかに関わらず)、及びシーンは、比較的安定である。というのは、単に、カメラ又はシーンがあまりに急に動く場合に、ビデオ又は映画資料が、(a)典型的に見るのに不快であり、そして(b)それを見る場合に、カメラが突然グイと動くときに、通常、視聴者がアクションを厳密に追従できないからである(例えば、バースディケーキのキャンドルに息を吹きかける子供を撮影するときにカメラがバンプされ、そして突然ケーキから離れて戻るようにグイと動かされる場合に、視聴者は、典型的に、子供及びケーキに集中し、カメラが突然動くときの短い中断は無視する)。ビデオのインタビュー又はビデオ遠隔会議のケースでは、カメラを固定位置に保持して、全く動かさず、非常に僅かなデータピークしか生じさせない。しかし、3D高アクションビデオゲームは、一定の動きにより特徴付けられる(例えば、レースの期間中に全フレームが迅速な動きにあるような3Dレースを考えるか、又はバーチャルカメラが常にグイと動くようなファーストパーソンシューター(first-person shooter)を考える)。このようなビデオゲームは、これらの突然の動きの間に何が起きたかユーザがはっきり見る必要があるところの大きなそして頻繁なピークを伴うフレームシーケンスを生じさせる。従って、3D高アクションビデオゲームでは、圧縮欠陥は、ほとんど許容できない。従って、多くのビデオゲームのビデオ出力は、それらの性質により、非常に高く且つ頻繁なピークをもつ圧縮ビデオストリームを発生する。 This problem is exacerbated by the nature of many video games. Video compression algorithms that use the GOP structure described above are optimized for use primarily with raw video or video material intended for passive viewing. Typically, the camera (whether it is a real camera or a virtual camera in the case of computer-generated animation) and the scene are relatively stable. Simply because if the camera or scene moves too suddenly, the video or movie material is (a) typically uncomfortable to watch, and (b) This is because the viewer usually cannot follow the action exactly when moving (e.g. when shooting a child blowing a candle on a birthday cake, the camera is bumped and suddenly moves away from the cake) When moved with a gui, the viewer typically concentrates on the child and the cake, ignoring short breaks when the camera suddenly moves). In the case of video interviews or video teleconferencing, the camera is held in a fixed position and does not move at all, producing very few data peaks. However, 3D high action video games are characterized by constant movement (eg, consider a 3D race where all frames are in rapid motion during the race, or the virtual camera always moves guilty) Think of a first-person shooter). Such a video game results in a frame sequence with large and frequent peaks where the user needs to see clearly what happened during these sudden movements. Thus, compression defects are almost unacceptable in 3D high action video games. Thus, the video output of many video games, due to their nature, produces a compressed video stream with very high and frequent peaks.
高速アクションビデオゲームのユーザが長い待ち時間に対してあまり寛容度がないと仮定し、又、上述した全ての待ち時間の原因を仮定すれば、今日まで、インターネットを経てビデオをストリーミングするサーバーホスト型ビデオゲームには制限があった。更に、高度の双方向性を要求するアプリケーションのユーザは、そのアプリケーションが一般的なインターネット及びストリームビデオでホストされる場合には、同様に制限で悩まされている。このようなサービスは、ホスティングサーバーが、商業的な設定において、ヘッドエンド(ケーブルブロードバンドの場合)、又は中央オフィス(デジタルサブスクライバーライン(DSL)の場合)、或いはLAN(又は特殊グレードのプライベート接続)内に直接設定されて、クライアント装置からサーバーへのルート及び距離が待ち時間を最小にするように制御され、且つ待ち時間を被ることなくピークを受け容れできるようなネットワークコンフィギュレーションを要求する。LAN(典型的に100Mbpsから1Gbps定格)及び充分な帯域巾の賃貸ラインは、典型的に、ピーク帯域巾要求をサポートすることができる(例えば、18Mbpsのピーク帯域巾は、100MbpsのLAN容量の小部分である)。 Assuming that users of fast action video games are not very tolerant of long latencies, and assuming all the causes of latencies mentioned above, to date, server-hosted streaming video over the Internet There were restrictions on video games. In addition, users of applications that require a high degree of interactivity are similarly plagued with limitations if the application is hosted on general internet and stream video. Such services include hosting servers in a commercial setting, headend (for cable broadband), or central office (for digital subscriber line (DSL)), or LAN (or a special grade private connection). Directly into the network, the route and distance from the client device to the server is controlled to minimize latency, and requires a network configuration that can accept peaks without incurring latency. LANs (typically rated at 100 Mbps to 1 Gbps) and sufficient bandwidth lease lines can typically support peak bandwidth requirements (eg, a peak bandwidth of 18 Mbps is a small LAN capacity of 100 Mbps). Part).
又、ピーク帯域巾要求は、特殊な受け容れがなされる場合には、住居用ブロードバンドインフラストラクチャーにより受け容れることができる。例えば、ケーブルTVシステムでは、デジタルビデオトラフィックに、大きなIフレームのようなピークを取り扱うことのできる専用帯域巾が与えられる。そしてDSLシステムでは、高速DSLモデムを準備して、高いピークを許すことができるか、又は高いデータレートを取り扱うことのできる特殊グレードの接続を準備することができる。しかし、一般的なインターネットに取り付けられる従来のケーブルモデム及びDSLインフラストラクチャーは、圧縮ビデオのピーク帯域要件に対して遥かに低い寛容度しか有していない。従って、クライアント装置から長距離にあるサーバーセンターにおいてビデオゲーム又はアプリケーションをホストし、次いで、インターネットを経て従来の住居用ブロードバンド接続を通して圧縮ビデオ出力をストリーミングするオンラインサービスは、特に、非常に短い待ち時間を要求するゲーム及びアプリケーション(例えば、ファーストパーソンシューター及び他のマルチユーザ双方向アクションゲーム、又は高速応答時間を要求するアプリケーション)に関して、顕著な待ち時間及びピーク帯域巾制限で悩まされている。 Also, the peak bandwidth request can be accepted by the residential broadband infrastructure if special acceptance is made. For example, in cable TV systems, digital video traffic is given a dedicated bandwidth that can handle peaks like large I frames. And in a DSL system, a high speed DSL modem can be prepared to allow for high peaks or a special grade connection that can handle high data rates. However, conventional cable modem and DSL infrastructures attached to the general Internet have a much lower tolerance for the peak bandwidth requirements of compressed video. Thus, online services that host video games or applications at a server center long distance from the client device and then stream the compressed video output over the Internet through a traditional residential broadband connection, in particular, have very low latency. With respect to games and applications that require it (eg, first person shooters and other multi-user interactive action games, or applications that require fast response time), they suffer from significant latency and peak bandwidth limitations.
本開示は、添付図面及び以下の詳細な説明から、より完全に理解されよう。しかしながら、ここに開示した要旨は、本発明を例示するものに過ぎず、ここに示す特定の実施形態に限定されるものではない。 The present disclosure will be more fully understood from the accompanying drawings and the following detailed description. However, the subject matter disclosed herein is merely illustrative of the invention and is not limited to the specific embodiments shown.
以下の説明では、本開示を完全に理解するために、装置の形式、システムコンフィギュレーション、通信方法、等の特定の細部について述べる。しかしながら、当業者であれば、ここに述べる実施形態を具現化するのに、これらの特定の細部は必要ないことが明らかであろう。 In the following description, specific details are set forth such as device types, system configurations, communication methods, etc., in order to provide a thorough understanding of the present disclosure. However, it will be apparent to one skilled in the art that these specific details are not required to implement the embodiments described herein.
図2a−bは、ビデオゲーム及びソフトウェアアプリケーションが、契約サービスのもとでインターネット206(或いは他のパブリック又はプライベートネットワーク)を経てユーザの家屋211(「ユーザの家屋」とは、ユーザが所在する場所を意味し、移動装置を使用する場合には屋外も含む)においてホスティングサービス210によりホストされそしてクライアント装置205によりアクセスされるような2つの実施形態の高レベルアーキテクチャーを示す。クライアント装置205は、内部又は外部ディスプレイ装置222を有していてインターネットにワイヤード又はワイヤレス接続されるMicrosoft Windows又はLinuxベースのPC又はApple社のMacintoshコンピュータのような汎用コンピュータでもよいし、又はビデオ及びオーディオをモニタ又はTV受像機222へ出力するセットトップボックス(インターネットにワイヤード又はワイヤレス接続される)のような専用クライアント装置でもよいし、或いはおそらくインターネットにワイヤレス接続される移動装置でもよい。 2a-b shows that the user's home 211 ("user's home" is where the user is located) via the Internet 206 (or other public or private network) under contract services. FIG. 2 illustrates a high-level architecture of two embodiments as hosted by the hosting service 210 and accessed by the client device 205 (including outdoor when using mobile devices). Client device 205 may be a general purpose computer such as a Microsoft Windows or Linux-based PC or Apple Macintosh computer that has an internal or external display device 222 and is wired or wirelessly connected to the Internet, or video and audio. May be a dedicated client device, such as a set top box (wired or wirelessly connected to the Internet), or a mobile device that is wirelessly connected to the Internet.
これらの装置は、いずれも、それ自身のユーザ入力装置(例えば、キーボード、ボタン、タッチスクリーン、トラックパッド又は慣性感知棒、ビデオ捕獲カメラ及び/又は運動追跡カメラ、等)を有してもよいし、又は有線又は無線で接続された外部入力装置221(例えば、キーボード、マウス、ゲームコントローラ、慣性感知棒、ビデオ捕獲カメラ、及び/又は運動追跡カメラ、等)を使用してもよい。以下に詳細に述べるように、ホスティングサービス210は、高パワーのCPU/GPU処理能力を伴うものを含めて、種々の性能レベルのサーバーを含む。ゲームのプレイ中、又はホスティングサービス210におけるアプリケーションの使用中に、家庭又はオフィス用のクライアント装置205は、ユーザからのキーボード及び/又はコントローラ入力を受け取り、次いで、インターネット206を通してホスティングサービス210へコントローラ入力を送信し、このホスティングサービス210は、それに応答してゲームプログラムを実行し、そしてゲーム又はアプリケーションソフトウェアのためのビデオ出力の連続フレーム(一連のビデオ映像)を発生する(例えば、ユーザがボタンを押して、スクリーン上のキャラクタを右へ移動するように指令する場合には、ゲームプログラムが、右へ移動するキャラクタを示す一連のビデオ映像を生成する)。この一連のビデオ映像は、次いで、短待ち時間のビデオコンプレッサを使用して圧縮され、次いで、ホスティングサービス210は、インターネット206を通して短待ち時間のビデオストリームを送信する。家庭又はオフィス用クライアント装置は、次いで、圧縮されたビデオストリームをデコードし、そしてモニタ又はTVにおいてその解凍されたビデオ映像をレンダリングする。その結果、クライアント装置205のコンピューティング及びグラフィックハードウェア要件が著しく緩和される。クライアント205は、キーボード/コントローラ入力をインターネット206へ転送し、そしてインターネット206から受け取った圧縮されたビデオストリームをデコードし解凍するための処理パワーを有するだけでよく、これは、実質上、パーソナルコンピュータが、今日、そのCPUにおいてソフトウケアで実行できることである(例えば、ほぼ2GHzで実行されるインテル社のCore Duo CPUは、H.264及びWindows Media VC9のようなコンプレッサを使用してエンコードされた720p HDTVを解凍することができる)。そして、クライアント装置のケースでは、専用のチップも、このような規格に対するビデオ解凍を、リアルタイムで、遥かに低いコストにおいて、且つ近代的なPCに要求されるような汎用CPUより遥かに低い消費電力で遂行することができる。特に、コントローラ入力を転送しそしてビデオを解凍する機能を遂行するために、家庭用クライアント装置205は、特殊なグラフィック処理ユニット(GPU)、光学的ドライブ又はハードドライブ、例えば、図1に示す従来のビデオゲームシステムを要求しない。 Any of these devices may have its own user input devices (eg, keyboard, buttons, touch screen, trackpad or inertial sensing rod, video capture camera and / or motion tracking camera, etc.). Alternatively, an external input device 221 (eg, keyboard, mouse, game controller, inertial sensing rod, video capture camera, and / or motion tracking camera, etc.) connected by wire or wireless may be used. As discussed in more detail below, the hosting service 210, including those with CPU / GPU processing power of high power, including a variety of performance levels server. While playing a game or using an application in the hosting service 210, the client device 205 for home or office receives keyboard and / or controller input from the user and then sends controller input to the hosting service 210 over the Internet 206. This hosting service 210 executes the game program in response and generates a continuous frame of video output (a series of video footage) for the game or application software (e.g., the user presses a button, when commanded to move the character on the screen to the right, the game program generates a sequence of video images showing the character moving to the right). This sequence of video images is then compressed using a video compressor low-latency, then the hosting service 210 transmits the video stream of low-latency through the Internet 206. Home or office client device then decodes the compressed video stream and renders the decompressed video images on a monitor or TV. As a result, the computing and graphics hardware requirements of client device 205 are significantly relaxed. The client 205 need only have the processing power to forward keyboard / controller input to the Internet 206 and to decode and decompress the compressed video stream received from the Internet 206, which is essentially Today, that CPU can run in software care (for example, Intel's Core Duo CPU running at approximately 2 GHz will run 720p HDTV encoded using compressors such as H.264 and Windows Media VC9. Can be thawed). And in the case of a client device, a dedicated chip also allows video decompression to such a standard in real time, at a much lower cost, and at a much lower power consumption than a general purpose CPU as required by modern PCs. Can be accomplished with In particular, to perform the functions of transferring controller input and decompressing video, the home client device 205 is a specialized graphics processing unit (GPU), optical drive or hard drive, such as the conventional one shown in FIG. Does not require a video game system.
ゲーム及びアプリケーションソフトウェアが、より複雑になり且つよりホトリアリスティックになるにつれて、それらは、高性能CPU、GPU、より多くのRAM、及びより大きくて高速のディスクドライブを要求し、且つホスティングサービス210のコンピューティングパワーは、アップグレードし続けるが、エンドユーザは、家庭又はオフィス用のクライアントプラットホーム205を更新することが要求されない。というのは、その処理要件は、所与のビデオ解凍アルゴリズムでの表示解像度及びフレームレートに対して一定のままだからである。従って、図2a−bに示すシステムには、今日見られるハードウェア制限及び互換性の問題が生じない。 As games and application software become more complex and more photorealistic, they require high performance CPUs, GPUs, more RAM, and larger and faster disk drives, and hosting services 210's While computing power continues to upgrade, end users are not required to update the client platform 205 for home or office. This is because the processing requirements remain constant for the display resolution and frame rate for a given video decompression algorithm. Thus, the system shown in FIGS. 2a-b does not suffer from the hardware limitations and compatibility issues found today.
更に、ゲーム及びアプリケーションソフトウェアは、ホスティングサービス210のサーバーでのみ実行されるので、ゲーム又はアプリケーションソフトウェアのコピー(光学的メディアの形態又はダウンロードされたソフトウェアとして)がユーザの家庭又はオフィスに存在することはない(ここで使用する「オフィス」とは、特に指示のない限り、例えば、学校の教室を含めて、非住居設定を含むものとする)。これは、ゲーム又はアプリケーションソフトウェアが不法にコピーされる(海賊版作成される)おそれを著しく軽減すると共に、海賊版作成されるゲーム又はアプリケーションにより貴重なデータベースが使用されるおそれを軽減する。実際に、家庭又はオフィスでの使用に実際的でないゲーム又はアプリケーションソフトウェアをプレイするために特殊なサーバーが要求される(例えば、非常に高価で、大きく又はノイズを発生する装置が要求される)場合には、ゲーム又はアプリケーションソフトウェアの海賊版コピーが得られたとしても、家庭又はオフィスで動作することはできない。 In addition, since the game and application software runs only on the server of the hosting service 210, a copy of the game or application software (in the form of optical media or downloaded software) is not present in the user's home or office. None (“office” as used herein includes non-residential settings, including, for example, school classrooms unless otherwise indicated). This significantly reduces the risk of illegally copying (pirated) games or application software, as well as the risk of using valuable databases by pirated games or applications. In fact, special servers are required to play games or application software that are impractical for home or office use (eg, very expensive, large or noisy devices are required) Even if a pirated copy of the game or application software is obtained, it cannot operate at home or in the office.
一実施形態では、ホスティングサービス210は、ソフトウェア開発ツールをゲーム又はアプリケーションソフトウェア開発者(一般的に、ソフトウェア開発会社、ゲーム又は映画スタジオ、或いはゲーム又はアプリケーションソフトウェア発行者を指す)220に与え、この開発者は、ホスティングサービス210において実行できるゲームを設計するようにビデオゲームを設計する。そのようなツールは、スタンドアローンPC又はビデオゲームコンソールでは通常利用できないホスティングサービスの特徴を開発者が利用できるようにする(例えば、複雑な幾何学形状の非常に大きなデータベースへの高速アクセス(「幾何学形状」とは、特に指示のない限り、ここでは、多角形、テクスチャ、リギング、照明、挙動、並びに3Dデータベースを定義する他のコンポーネント及びパラメータを指すものとする))。 In one embodiment, the hosting service 210 provides software development tools to a game or application software developer 220 (generally referring to a software development company, a game or movie studio, or a game or application software publisher) 220 for this development. A person designs a video game to design a game that can be run on the hosting service 210. Such tools allow developers to take advantage of hosting service features not normally available on stand-alone PCs or video game consoles (eg, fast access to very large databases of complex geometries (“geometry "Study shape" here refers to polygons, textures, rigging, lighting, behavior, and other components and parameters that define a 3D database unless otherwise indicated)).
このアーキテクチャーのもとでは、異なるビジネスモデルが考えられる。1つのモデルのもとで、ホスティングサービス210は、図2aに示すように、エンドユーザから契約料金を収集し、そして開発者220にロイヤリティを支払う。図2bに示す別の具現化においては、開発者220がユーザから契約料金を直接収集し、そしてゲーム又はアプリケーションコンテンツをホストするためにホスティングサービス210に支払をする。これらの基礎的な原理は、オンラインゲーム又はアプリケーションホスティングを提供するための特定のビジネスモデルに限定されない。 Under this architecture, different business models are possible. Under one model, the hosting service 210 collects contract fees from end users and pays royalties to the developer 220 as shown in FIG. 2a. In another implementation shown in FIG. 2b, developer 220 collects subscription fees directly from the user and pays hosting service 210 to host the game or application content. These basic principles are not limited to a specific business model for providing online gaming or application hosting.
圧縮ビデオ特性
上述したように、ビデオゲームサービス又はアプリケーションソフトウェアサービスをオンラインで提供することに伴う1つの顕著な問題は、待ち時間である。(ユーザにより入力装置が操作される点から、ディスプレイ装置に応答が表示される点までの)70から80msの待ち時間が、高速応答時間を要求するゲーム及びアプリケーションの上限である。しかしながら、図2a及び2bに示すアーキテクチャーの環境では多数の実際的及び物理的な制約があるために、これを達成することが非常に困難である。
Compressed Video Characteristics As noted above, one significant problem with providing video game services or application software services online is latency. A waiting time of 70 to 80 ms (from the point where the input device is operated by the user to the point where the response is displayed on the display device) is the upper limit of games and applications that require a fast response time. However, this is very difficult to achieve due to the numerous practical and physical constraints in the architectural environment shown in FIGS. 2a and 2b.
図3に示すように、ユーザがインターネットサービスに契約するときに、その接続は、典型的に、ユーザの家庭又はオフィスへの公称最大データレート301によって定格付けされる。プロバイダーのポリシー及びルーティング装置の能力に基づいて、その最大データレートは、若干厳格に施行できるが、典型的に、実際に得られるデータレートは、多数の異なる理由の1つで、低いものとなる。例えば、DSL中央オフィス又はローカルケーブルモデムループに非常に多くのネットワークトラフィックがあるか、又はケーブルにノイズが生じてパケットをドロップさせるか、或いはプロバイダーが最大ビット数/月/ユーザを確立することがある。現在、ケーブル及びDSLサービスに対する最大ダウンストリームデータレートは、典型的に、数百キロビット/秒(Kbps)から30Mbpsの範囲である。セルラーサービスは、典型的に、数百Kbpsのダウンストリームデータに制限される。しかしながら、ブロードバンドサービスの速度及びブロードバンドサービスに契約するユーザの数は、時間と共に急激に増加する。現在、ある分析では、米国のブロードバンド加入者の33%が2Mbps以上のダウンストリームデータレートを有することが推定される。例えば、ある分析では、2010年までに、米国のブロードバンド加入者の85%以上が2Mbps以上のデータレートを有することが推定される。 As shown in FIG. 3, when a user subscribes to Internet services, the connection is typically rated by the nominal maximum data rate 301 to the user's home or office. Based on the provider's policy and the capabilities of the routing device, its maximum data rate can be enforced slightly more strictly, but typically the actual data rate will be low for one of many different reasons. . For example, there may be a lot of network traffic in the DSL central office or local cable modem loop, or there may be noise on the cable causing the packets to be dropped, or the provider establishing the maximum number of bits / month / user . Currently, maximum downstream data rates for cable and DSL services typically range from several hundred kilobits per second (Kbps) to 30 Mbps. Cellular services are typically limited to hundreds of Kbps downstream data. However, the speed of broadband services and the number of users subscribing to broadband services increase rapidly with time. Currently, one analysis estimates that 33% of US broadband subscribers have downstream data rates of 2 Mbps or higher. For example, one analysis estimates that by 2010, over 85% of US broadband subscribers will have a data rate of 2 Mbps or higher.
図3に示すように、実際に利用可能な最大データレート302は、時間と共に変動し得る。従って、短い待ち時間のオンラインゲーム又はアプリケーションソフトウェアコンテクストでは、時々、特定のビデオストリームに対する実際に利用できるデータレートを予想することが困難である。所与の数値のフレーム/秒(fps)における所与のレベルのクオリティをある量のシーンの複雑さに対し所与の解像度(例えば、640x480@60fps)において維持するためにデータレート303が要求され、そして(図3にピークで示されるように)実際に利用できる最大データレート302より上に動きが上昇する場合には、多数の問題が発生し得る。例えば、あるインターネットサービスは、単にパケットをドロップし、ユーザのビデオスクリーンにデータロス及び映像歪/ロスを招くことになる。他のサービスは、付加的なパケットを一時的にバッファし(即ち、キューイングし)、そして利用可能なデータレートでクライアントへパケットを与えて、待ち時間の増加、即ち多数のビデオゲーム及びアプリケーションにとって受け容れられない結果を招くことになる。最終的に、あるインターネットサービスプロバイダーは、データレートの増加を、悪意のある攻撃、例えば、サービス拒否攻撃(ネットワーク接続を無能化するためにハッカーにより使用される良く知られた技術)とみなし、そしてユーザのインターネット接続を指定期間中切断する。従って、ここに述べる実施形態は、ビデオゲームに要求されるデータレートが、利用可能な最大データレートを越えないことを保証するステップをとる。 As shown in FIG. 3, the maximum data rate 302 actually available can vary over time. Thus, in low latency online games or application software contexts, it is sometimes difficult to predict the actual available data rate for a particular video stream. A data rate 303 is required to maintain a given level of quality in a given number of frames per second (fps) at a given resolution (eg, 640 × 480 @ 60 fps) for a certain amount of scene complexity. A number of problems can arise if the movement increases above the maximum data rate 302 that is actually available (as shown by the peaks in FIG. 3). For example, some Internet services will simply drop packets, causing data loss and video distortion / loss on the user's video screen. Other services temporarily buffer (ie queue) additional packets and provide packets to clients at available data rates, increasing latency, ie for many video games and applications. It will lead to unacceptable results. Eventually, some internet service providers see the increase in data rate as a malicious attack, eg, a denial of service attack (a well-known technique used by hackers to disable network connectivity), and Disconnect the user's Internet connection for a specified period. Accordingly, the embodiments described herein take steps to ensure that the data rate required for a video game does not exceed the maximum available data rate.
ホスティングサービスアーキテクチャー
図4aは、一実施形態によるホスティングサービス210のアーキテクチャーを示す。ホスティングサービス210は、単一サーバーセンターに配置することもできるし、又は複数のサーバーセンターにわたり分散することもできる(あるサーバーセンターへの経路が他のサーバーセンターより短い待ち時間となる短待ち時間接続をユーザに与え、ユーザ間に負荷バランスを与え、そして1つ以上のサーバーセンターがフェイルする場合に冗長性を与えるために)。ホスティングサービス210は、最終的に、数百又は数千或いは数百万のサーバー402を含み、非常に大きなユーザベースにサービスすることができる。ホスティングサービスコントロールシステム401は、ホスティングサービス210に対する全体的なコントロールを与え、ルーター、サーバー、ビデオ圧縮システム、ビリング及びアカウンティングシステム、等に指令する。一実施形態では、ホスティングサービスコントロールシステム401は、ユーザ情報、サーバー情報及びシステム統計情報のためのデータベースを記憶するのに使用されるRAIDアレイに結合された分散処理Linuxベースシステムにおいて具現化される。以上の説明では、ホスティングサービス210により具現化される種々のアクションは、他の特定システムに起因しない限り、ホスティングサービスコントロールシステム401により開始されコントロールされる。
Hosting Service Architecture FIG. 4a illustrates the architecture of the hosting service 210 according to one embodiment. The hosting service 210 can be located in a single server center or can be distributed across multiple server centers (a low latency connection where the path to one server center has a lower latency than other server centers). To users, load balance among users, and provide redundancy when one or more server centers fail). The hosting service 210 ultimately includes hundreds, thousands, or millions of servers 402 that can serve a very large user base. The hosting service control system 401 provides overall control over the hosting service 210 and commands routers, servers, video compression systems, billing and accounting systems, and the like. In one embodiment, the hosting service control system 401 is embodied in a distributed processing Linux-based system coupled to a RAID array that is used to store a database for user information, server information, and system statistics information. In the above description, the various actions embodied by the hosting service 210 are initiated and controlled by the hosting service control system 401 unless it is due to another specific system.
ホスティングサービス210は、インテル、IBM、ヒューレットパッカード、等から現在入手できるもののような多数のサーバー402を含む。或いは又、サーバー402は、コンポーネントのカスタム構成でアッセンブルすることもできるし、又は全サーバーが単一チップとして具現化されるように最終的に一体化することもできる。この図は、図示明瞭化のために、少数のサーバー402しか示していないが、実際の展開では、1つ程度のサーバー402があってもよいし、又は数百万以上のサーバー402があってもよい。サーバー402は、全てが同様に構成されてもよいし(幾つかの構成パラメータの例として、同じCPU形式及び性能で、GPUをもったりもたなかったりして、そしてGPUをもつ場合には、同じGPU形式及び性能で、又、同じ数のCPU及びGPUで、又、同じ量及び形式/速度のRAMで、並びに同じRAM構成で)、又はサーバー402の種々のサブセットが同じ構成を有してもよいし(例えば、サーバーの25%をある仕方で構成することができ、50%を異なる仕方で構成することができ、そして25%を更に別の仕方で構成することができ)、或いは各サーバー402が異なるものでもよい。 Hosting service 210 includes a number of servers 402 such as those currently available from Intel, IBM, Hewlett-Packard, and the like. Alternatively, server 402 can be assembled with a custom configuration of components, or ultimately integrated so that all servers are embodied as a single chip. This figure shows only a few servers 402 for clarity of illustration, but in an actual deployment there may be as few as one server 402 or there may be millions of servers 402 or more. Also good. Server 402 may all be configured similarly (as an example of some configuration parameters, with the same CPU type and performance, with or without a GPU, and with a GPU, With the same GPU type and performance, with the same number of CPUs and GPUs, and with the same amount and type / speed of RAM, and with the same RAM configuration), or various subsets of servers 402 have the same configuration (For example, 25% of the servers can be configured in one way, 50% can be configured in a different way, and 25% can be configured in another way) or each The server 402 may be different.
一実施形態では、サーバー402は、ディスクレスであり、即ちそれ自身のローカル大量記憶装置(光学又は磁気記憶装置、或いは半導体ベースの記憶装置、例えば、フラッシュメモリ又は同様の機能を果たす他の大量記憶手段)を有するのではなく、各サーバーは、高速バックプレーン又はネットワーク接続を通して共有大量記憶装置にアクセスする。一実施形態では、この高速接続は、一連の独立ディスク冗長アレイ(RAID)405に接続された記憶エリアネットワーク(SAN)403であり、装置間の接続がギガビットイーサネット(登録商標)を使用して具現化される。当業者に明らかなように、SAN403は、多数のRAIDアレイ405を一緒に合成して、最終的に広い帯域巾を生じさせ、即ち現在のゲームコンソール及びPCに使用されるRAMから得られる帯域巾に接近するか又はそれを潜在的に越えるのに使用される。そして、磁気メディアのような回転メディアをベースとするRAIDアレイは、著しいシーク時間アクセス待ち時間をしばしば有するが、半導体記憶装置をベースとするRAIDアレイは、相当に短いアクセス待ち時間で具現化することができる。別の構成では、サーバー402の幾つか又は全部が、それら自身の大量記憶装置の幾つか又は全部をローカルで与える。例えば、サーバー402は、そのオペレーティングシステムのような頻繁にアクセスされる情報、及びビデオゲーム又はアプリケーションのコピーを短待ち時間のローカルフラッシュベースの記憶装置に記憶するが、幾何学形状又はゲーム状態情報の大きなデータベースに時々アクセスするには、SANを使用して、回転メディアをベースとするRAIDアレイ405に大きなシーク待ち時間でアクセスする。 In one embodiment, the server 402 is diskless, i.e. its own local mass storage (optical or magnetic storage, or semiconductor-based storage, e.g. flash memory or other mass storage means performing a similar function. Each server accesses a shared mass storage device through a high speed backplane or network connection. In one embodiment, this high-speed connection is a storage area network (SAN) 403 connected to a series of independent disk redundant arrays (RAID) 405, and the connection between the devices is implemented using Gigabit Ethernet. It becomes. As will be apparent to those skilled in the art, SAN 403 synthesizes multiple RAID arrays 405 together to ultimately produce a wide bandwidth, ie, the bandwidth available from the RAM used for current game consoles and PCs. Used to approach or potentially exceed it. RAID arrays based on rotating media such as magnetic media often have significant seek time access latencies, but RAID arrays based on semiconductor storage devices should be implemented with fairly short access latencies. Can do. In another configuration, some or all of the servers 402 locally provide some or all of their own mass storage. For example, the server 402 stores frequently accessed information, such as its operating system, and a copy of the video game or application in a low-latency local flash-based storage device, but with geometric or game state information. To access a large database from time to time, a SAN is used to access a rotating media based RAID array 405 with high seek latency.
更に、一実施形態では、ホスティングサービス210は、以下に詳細に説明する短待ち時間のビデオ圧縮ロジック404を使用する。このビデオ圧縮ロジック404は、ソフトウェア、ハードウェア又はその組合せで具現化することができる(その幾つかの実施形態を以下に説明する)。ビデオ圧縮ロジック404は、オーディオ及びビジュアル資料を圧縮するためのロジックを含む。 Further, in one embodiment, the hosting service 210 uses the low latency video compression logic 404 described in detail below. The video compression logic 404 can be implemented in software, hardware, or a combination thereof (some embodiments of which are described below). Video compression logic 404 includes logic for compressing audio and visual material.
動作に際し、ユーザの家屋211において、キーボード、マウス、ゲームコントローラ又は他の入力装置421を経てビデオゲームをプレイするか又はアプリケーションを使用する間に、クライアント415のコントロール信号ロジック413は、ユーザにより作動されたボタン押圧(及び他の形式のユーザ入力)を表す(典型的にUDPパケットの形態の)コントロール信号406a−bを送信する。所与のユーザからのコントロール信号は、適当なサーバー(又は複数のサーバーがユーザの入力装置に応答する場合には複数のサーバー)402へルーティングされる。図4aに示すように、コントロール信号406aは、SANを経てサーバー402へルーティングされる。それとは別に又はそれに加えて、コントロール信号406bは、ホスティングサービスネットワーク(例えば、イーサネットベースのローカルエリアネットワーク)を経てサーバー402へ直接ルーティングされる。それらがどのように送信されるかに関わらず、サーバー(1つ又は複数)は、コントロール信号406a−bに応答してゲーム又はアプリケーションソフトウェアを実行する。図4aに示されていないが、ファイアウオール(1つ又は複数)及び/又はゲートウェイ(1つ又は複数)のような種々のネットワークコンポーネントは、ホスティングサービス210の縁(例えば、ホスティングサービス210とインターネット410との間)において、及び/又はインターネット410と家庭又はオフィスクライアント415との間のユーザの家屋211の縁において到来するトラフィック及び出て行くトラフィックを処理することができる。実行されたゲーム又はアプリケーションソフトウェアのグラフィック及びオーディオ出力、即ちビデオ映像の新たなシーケンスは、短待ち時間のビデオ圧縮ロジック404へ供給され、このロジックは、ここに述べるような短待ち時間のビデオ圧縮技術に基づいてビデオ映像のシーケンスを圧縮し、そして圧縮されたビデオストリームを、典型的に、圧縮された又は非圧縮のオーディオと共に、インターネット410を経て(又は、以下に述べるように、一般的なインターネットをバイパスする最適な高速ネットワークサービスを経て)クライアント415へ返送する。クライアント415における短待ち時間のビデオ解凍ロジック412は、次いで、ビデオ及びオーディオストリームを解凍し、その解凍されたビデオストリームをレンダリングし、そして典型的に、その解凍されたオーディオストリームをディスプレイ装置422においてプレイする。或いは又、オーディオは、ディスプレイ装置422とは個別のスピーカで再生してもよいし、そうでなくてもよい。入力装置421及びディスプレイ装置422は、図2a及び2bでは独立した装置として示されているが、ポータブルコンピュータ又は移動装置のようなクライアント装置内に一体化されてもよいことに注意されたい。 In operation, the control signal logic 413 of the client 415 is activated by the user while playing a video game or using an application in the user's home 211 via a keyboard, mouse, game controller or other input device 421. Send control signals 406a-b (typically in the form of UDP packets) representing button presses (and other forms of user input). Control signals from a given user are routed to the appropriate server 402 (or multiple servers if multiple servers respond to the user's input device). As shown in FIG. 4a, the control signal 406a is routed to the server 402 via the SAN. Alternatively or additionally, the control signal 406b is routed directly to the server 402 via a hosting service network (eg, an Ethernet-based local area network). Regardless of how they are transmitted, the server (s) execute the game or application software in response to the control signals 406a-b. Although not shown in FIG. 4a, various network components such as firewall (s) and / or gateway (s) may be connected to the edge of hosting service 210 (eg, hosting service 210 and Internet 410). And / or traffic at the edge of the user's home 211 between the Internet 410 and the home or office client 415 can be processed. The graphics and audio output of the executed game or application software, i.e., a new sequence of video images, is fed to the low latency video compression logic 404, which is a low latency video compression technique as described herein. And compressing the compressed video stream, typically with compressed or uncompressed audio, over the Internet 410 (or as described below, the general Internet To the client 415 (via an optimal high-speed network service that bypasses). The low latency video decompression logic 412 at the client 415 then decompresses the video and audio streams, renders the decompressed video stream, and typically plays the decompressed audio stream on the display device 422. To do. Alternatively, the audio may or may not be played on a separate speaker from the display device 422. Note that the input device 421 and the display device 422 are shown as separate devices in FIGS. 2a and 2b, but may be integrated into a client device such as a portable computer or mobile device.
家庭又はオフィスクライアント415(図2a及び2bにおいて家庭又はオフィスクライアント205として既に述べた)は、非常に安価で且つ低電力の装置で、計算又はグラフィック性能が非常に限定されていると共に、ローカルの大量記憶装置が非常に限定されたものであるか又はそれを全く有していない。対照的に、SAN403及び複数のRAID405に結合された各サーバー402は、非常に高い性能のコンピューティングシステムであり、そして実際に、複数のサーバーが並列処理構成で協働的に使用される場合は、保持することのできる計算及びグラフィック処理パワーの量にほぼ制限がなくなる。そして、ユーザにとって知覚的に短待ち時間のビデオ圧縮404及び短待ち時間のビデオ圧縮412のために、サーバー402の計算パワーがユーザに与えられる。ユーザが入力装置421のボタンを押すと、ディスプレイ422上の映像は、ゲーム又はアプリケーションソフトウェアがローカルで実行されるかのように、知覚的に意義のある遅延を伴わずに、ボタンの押圧に応答して更新される。従って、短待ち時間のビデオ解凍及びコントロール信号ロジック413を具現化する非常に低性能のコンピュータ又は安価なチップである家庭又はオフィスクライアント415では、ローカルで利用できると思われるリモート位置から効果的な任意の計算パワーがユーザに与えられる。これは、最も進歩したプロセッサ集中の(典型的に新規な)ビデオゲーム及び最高性能のアプリケーションをプレイするパワーをユーザに与える。 The home or office client 415 (previously described as the home or office client 205 in FIGS. 2a and 2b) is a very inexpensive and low power device with very limited computational or graphic performance and local mass. The storage device is very limited or not at all. In contrast, each server 402 coupled to the SAN 403 and multiple RAIDs 405 is a very high performance computing system, and in fact when multiple servers are used cooperatively in a parallel processing configuration. There is almost no limit to the amount of computation and graphics processing power that can be retained. Then, the computing power of server 402 is given to the user because of the low latency video compression 404 and the short latency video compression 412 perceptible to the user. When the user presses a button on the input device 421, the video on the display 422 responds to the button press with no perceptually significant delay as if the game or application software is running locally. And updated. Thus, a home or office client 415, which is a very low performance computer or inexpensive chip that embodies the low latency video decompression and control signal logic 413, can be any effective from a remote location that may be available locally. Is given to the user. This gives the user the power to play the most advanced processor intensive (typically new) video games and highest performance applications.
図4cは、非常に基本的で且つ安価な家庭又はオフィスクライアント装置465を示す。この装置は、図4a及び4bからの家庭又はオフィスクライアント415の実施形態である。これは約2インチの長さである。これは、パワーオーバーイーサネット(PoE)でイーサネットケーブルとインターフェイスするイーサネットジャック462を有し、そこから、インターネットへの電力及び接続が得られる。ネットワークアドレストランスレーション(NAT)をサポートするネットワーク内でNATを実行することができる。オフィス環境では、多数の新規なイーサネットスイッチは、PoEを有し、そしてPoEをオフィスのイーサネットジャックへ直接持って行く。このような状況では、壁ジャックからクライアント465へのイーサネットケーブルが要求されるだけである。利用できるイーサネット接続が(例えば、DSL又はケーブルモデムをもつが、PoEはもたない家庭において)電力を搬送しない場合には、非給電イーサネットケーブル及びPoE付き出力イーサネットを受け容れる安価な壁「ブリック」(即ち電源)が利用できる。 FIG. 4 c shows a very basic and inexpensive home or office client device 465. This device is an embodiment of a home or office client 415 from FIGS. 4a and 4b. This is about 2 inches long. It has an Ethernet jack 462 that interfaces with an Ethernet cable over Power over Ethernet (PoE), from which power and connection to the Internet is obtained. NAT can be performed in a network that supports network address translation (NAT). In an office environment, many new Ethernet switches have PoE and take PoE directly to the office Ethernet jack. In such situations, only an Ethernet cable from the wall jack to the client 465 is required. If the available Ethernet connection does not carry power (eg in a home with DSL or cable modem but no PoE), an inexpensive wall “brick” that accepts an unpowered Ethernet cable and an output Ethernet with PoE. (Ie power supply) can be used.
クライアント465は、キーボード、マウス、ゲームコントローラ及び/又はマイクロホン及び/又はヘッドセットのようなブルーツース入力装置479とインターフェイスするブルーツースワイヤレスインターフェイスに結合された(図4aの)コントロール信号ロジック413を含む。又、クライアント465の一実施形態は、120fpsビデオをサポートできるディスプレイ装置468に結合されるビデオを120fpsで出力し、そしてシャッター付き眼鏡466に信号を送って(典型的に赤外線により)、各次々のフレームで片方の目に、次いで、他方の目に交互にシャッター作動することができる。ユーザが認知する効果は、ディスプレイスクリーンを「跳び出す」ステレオ3D映像である。このようなオペレーションをサポートする1つのこのようなディスプレイ装置468は、Samsung HL−T5076Sである。各目のビデオストリームは個別であるから、一実施形態では、独立した2つのビデオストリームがホスティングサービス210により圧縮され、フレームは、時間的にインターリーブされ、そしてフレームは、クライアント465内の独立した2つの解凍プロセスとして解凍される。 Client 465 includes control signal logic 413 (FIG. 4a) coupled to a Bluetooth wireless interface that interfaces with a Bluetooth input device 479 such as a keyboard, mouse, game controller and / or microphone and / or headset. One embodiment of client 465 also outputs video coupled to display device 468 capable of supporting 120 fps video at 120 fps and sends a signal to shuttered glasses 466 (typically via infrared) for each successive one. The shutter can be alternately actuated on one eye and then the other eye on the frame. The effect perceived by the user is a stereo 3D image that “jumps” the display screen. One such display device 468 that supports such operations is the Samsung HL-T5076S. Since each eye's video stream is separate, in one embodiment, two independent video streams are compressed by the hosting service 210, the frames are interleaved in time, and the frames are independent 2 in the client 465. Defrosted as one thawing process.
又、クライアント465は、到来するビデオ及びオーディオを解凍してHDMI(高鮮明度マルチメディアインターフェイス)を通して出力する短待ち時間のビデオ解凍ロジック412と、SDTV(標準鮮明度テレビジョン)又はHDTV(高鮮明度テレビジョン)468に差し込まれてTVにビデオ及びオーディオを与えるか又はHDMIをサポートするモニタ468に差し込まれるコネクタ463とを含む。ユーザのモニタ468がHDMIをサポートしない場合には、HDMI対DVI(デジタルビジュアルインターフェイス)を使用することができるが、オーディオが失われる。HDMI規格のもとでは、ディスプレイの能力(例えば、サポートされる解像度、フレームレート)464がディスプレイ装置468から通信され、この情報は、次いで、インターネット接続462を通してホスティングサービス210へ返送され、従って、ディスプレイ装置に適したフォーマットで圧縮ビデオをストリーミングすることができる。 Client 465 also has a low latency video decompression logic 412 that decompresses incoming video and audio and outputs it via HDMI (High Definition Multimedia Interface), and SDTV (Standard Definition Television) or HDTV (High Definition Sharpness). TV) 468 to provide video and audio to the TV or plug 463 to a monitor 468 that supports HDMI. If the user's monitor 468 does not support HDMI, HDMI to DVI (Digital Visual Interface) can be used, but audio is lost. Under the HDMI standard, display capabilities (eg, supported resolution, frame rate) 464 are communicated from the display device 468, and this information is then sent back to the hosting service 210 over the Internet connection 462, and thus the display The compressed video can be streamed in a format suitable for the device.
図4dは、より多くの外部インターフェイスを有する以外は図4cに示す家庭又はオフィスクライアント装置465と同じである家庭又はオフィスクライアント装置475を示す。又、クライアント475は、電力に対してPoEを受け容れることもできるし、又は壁に差し込まれる外部電源アダプタ(図示せず)から延びることもできる。クライアント475のUSB入力を使用すると、ビデオカメラ477は、圧縮されたビデオをクライアント475へ供給し、これは、クライアント475によってホスティングサービス210へアップロードされ、以下に述べるように使用される。カメラ477に内蔵されるのは、以下に述べる圧縮技術を使用した短待ち時間のコンプレッサである。 FIG. 4d shows a home or office client device 475 that is the same as the home or office client device 465 shown in FIG. 4c except that it has more external interfaces. Client 475 can also accept PoE for power or can extend from an external power adapter (not shown) that plugs into the wall. Using the client 475's USB input, the video camera 477 provides the compressed video to the client 475, which is uploaded by the client 475 to the hosting service 210 and used as described below. Built in the camera 477 is a short-latency compressor using a compression technique described below.
インターネット接続としてイーサネットコネクタを有するのに加えて、クライアント475は、インターネットへの802.11gワイヤレスインターフェイスも有する。両インターフェイスは、NATをサポートするネットワーク内でNATを使用することができる。 In addition to having an Ethernet connector as an Internet connection, the client 475 also has an 802.11g wireless interface to the Internet. Both interfaces can use NAT in a network that supports NAT.
又、ビデオ及びオーディオを出力するためにHDMIコネクタを有するのに加えて、クライアント475は、アナログ出力を含む(且つ標準アダプタケーブルでVGA出力を与える)デュアルリンクDVI−Iコネクタも有する。又、これは、複合ビデオ及びS−ビデオのためのアナログ出力も有する。 In addition to having an HDMI connector for outputting video and audio, the client 475 also has a dual link DVI-I connector that includes an analog output (and provides a VGA output with a standard adapter cable). It also has an analog output for composite video and S-video.
オーディオに対して、クライアント475は、左右のアナログステレオRCAジャックを、そしてデジタルオーディオ出力に対して、TOSLINK出力を有する。 For audio, the client 475 has left and right analog stereo RCA jacks and a TOSLINK output for digital audio output.
又、入力装置479へのブルーツースワイヤレスインターフェイスに加えて、入力装置にインターフェイスするためのUSBジャックも有する。 In addition to the Bluetooth wireless interface to the input device 479, it also has a USB jack for interfacing with the input device.
図4eは、クライアント465の内部アーキテクチャーの一実施形態を示す。図示された装置の全部又は幾つかを、フィールドプログラマブルロジックアレー、カスタムASIC、或いはカスタム設計又は既製の多数の個別装置で具現化することができる。 FIG. 4 e illustrates one embodiment of the internal architecture of client 465. All or some of the illustrated devices can be embodied in a field programmable logic array, custom ASIC, or a number of custom designed or off-the-shelf devices.
PoEを伴うイーサネット497がイーサネットインターフェイス481に取り付けられる。PoEを伴うイーサネット497から電力499が導出され、クライアント465内の残りの装置に接続される。バス480は、装置間の通信のための共通バスである。 An Ethernet 497 with PoE is attached to the Ethernet interface 481. Power 499 is derived from Ethernet 497 with PoE and connected to the remaining devices in client 465. The bus 480 is a common bus for communication between devices.
フラッシュ476からの小さなクライアントコントロールアプリケーションを実行するコントロールCPU483(ほとんどの場合に、RAMが埋設された100MHzのMIPS R4000シリーズCPUのような小型のCPUで充分である)は、ネットワーク(即ち、イーサネットインターフェイス)のためのプロトコルスタックを具現化し、又、ホスティングサービス210と通信し、そしてクライアント465内の全ての装置を構成する。又、これは、入力装置469とのインターフェイスを取り扱い、そして必要に応じて、「順方向エラー修正」で保護して、パケットをユーザコントローラデータと共にホスティングサービス210へ返送する。又、コントロールCPU483は、パケットトラフィックを監視する(例えば、パケットが失われるか遅延された場合、それらの到着にタイムスタンプも押す)。この情報は、ホスティングサービス210へ返送され、従って、ネットワーク接続を常時監視し、それに応じて何を送信するか調整することができる。フラッシュメモリ476は、最初に、製造時に、コントロールCPU483のコントロールプログラムがロードされると共に、特定のクライアント465ユニットにとって独特のシリアル番号もロードされる。このシリアル番号は、ホスティングサービス210がクライアント465ユニットを独特に識別できるようにする。 A control CPU 483 that runs a small client control application from flash 476 (in most cases a small CPU such as a 100 MHz MIPS R4000 series CPU with embedded RAM) is sufficient for the network (ie Ethernet interface). Implements the protocol stack for, and communicates with the hosting service 210 and configures all devices within the client 465. It also handles the interface with the input device 469 and, if necessary, protects with “forward error correction” and sends the packet back to the hosting service 210 with the user controller data. Control CPU 483 also monitors packet traffic (eg, if packets are lost or delayed, also stamps their arrival). This information is returned to the hosting service 210 so that it can constantly monitor the network connection and adjust what is sent accordingly. The flash memory 476 is initially loaded with the control program of the control CPU 483 at the time of manufacture, as well as a serial number unique to a particular client 465 unit. This serial number allows the hosting service 210 to uniquely identify the client 465 unit.
ブルーツースインターフェイス484は、クライアント465の内部にあるそのアンテナを通して入力装置469へワイヤレス通信する。 The Bluetooth interface 484 communicates wirelessly to the input device 469 through its antenna internal to the client 465.
ビデオデコンプレッサ486は、ここに述べるビデオ解凍を具現化するように構成された短待ち時間のビデオデコンプレッサである。非常に多数のビデオ解凍装置が、既製品として、又はFPGA又はカスタムASICへ一体化できる知的プロパティ(IP)設計として、存在する。H.264デコーダのためのIPを提供する1つの会社は、NSWオーストラリアのオーシャンロジックオブマンリー(Ocean Logic of Manly)である。IPを使用する効果は、ここで使用する圧縮技術が圧縮規格に従わないことである。ある標準的なデコンプレッサは、ここに述べる圧縮技術を受け容れるように構成されるに充分なほど融通性があるが、あるものはそうではない。しかし、IPでは、デコンプレッサを必要に応じて設計し直す上で完全な融通性がある。 Video decompressor 486 is a low latency video decompressor configured to implement the video decompression described herein. A large number of video decompressors exist as off-the-shelf or intelligent property (IP) designs that can be integrated into FPGAs or custom ASICs. H. One company that provides IP for H.264 decoders is Ocean Logic of Manly of NSW Australia. The effect of using IP is that the compression technique used here does not follow the compression standard. Some standard decompressors are flexible enough to be configured to accept the compression techniques described herein, while others are not. However, IP offers complete flexibility in redesigning decompressors as needed.
ビデオデコンプレッサの出力は、ビデオ出力サブシステム487に結合され、これは、ビデオをHDMIインターフェイス490のビデオ出力に結合する。 The output of the video decompressor is coupled to the video output subsystem 487, which couples the video to the video output of the HDMI interface 490.
オーディオ解凍サブシステム488は、入手可能な標準的オーディオデコンプレッサを使用して具現化されるか、又はIPとして具現化することもでき、或いはオーディオの解凍は、例えば、Vorbisオーディオデコンプレッサを具現化できるコントロールプロセッサ483内で具現化することもできる。 Audio decompression subsystem 488 can be implemented using standard audio decompressors available or can be implemented as IP, or audio decompression can implement, for example, a Vorbis audio decompressor. It can also be embodied in a control processor 483 that can.
オーディオの解凍を具現化する装置は、オーディオ出力サブシステム489へ結合され、これは、オーディオをHDMIインターフェイス490のオーディオ出力へ結合する。 An apparatus that implements audio decompression is coupled to an audio output subsystem 489 that couples audio to the audio output of the HDMI interface 490.
図4fは、クライアント475の内部アーキテクチャーの一実施形態を示す。明らかなように、このアーキテクチャーは、付加的なインターフェイスと、壁に差し込む電源アダプタからの任意の外部DC電力を除き、クライアント465と同じであり、その外部DC電力は、そのように使用される場合、イーサネットPoE497から到来する電力に取って代わる。クライアント465と共通の機能は、以下に説明を繰り返さず、付加的な機能を以下に説明する。 FIG. 4 f illustrates one embodiment of the internal architecture of client 475. As will be apparent, this architecture is the same as the client 465 except for the additional interface and any external DC power from the wall power adapter, which external DC power is used as such. The power coming from the Ethernet PoE 497 is replaced. Functions common to the client 465 will not be described below, and additional functions will be described below.
CPU483は、付加的な装置と通信し、それを構成する。 The CPU 483 communicates with and configures additional devices.
WiFiサブシステム482は、そのアンテナを通してイーサネット497への代替物としてワイヤレスインターネットアクセスを与える。WiFiサブシステムは、カリフォルニア州サンタクララのアセロスコミュニケーションズ(Atheros Communications)を含めて幅広い製造者から入手できる。 WiFi subsystem 482 provides wireless Internet access as an alternative to Ethernet 497 through its antenna. The WiFi subsystem is available from a wide range of manufacturers, including Atheros Communications of Santa Clara, California.
USBサブシステム485は、ワイヤードUSB入力装置479に対してブルーツース通信の代替物を与える。USBサブシステムは、極めて標準的で、FPGA及びASICについて入手容易であり、且つビデオ解凍と同様に、他の機能を遂行する既製装置にしばしば内蔵される。 USB subsystem 485 provides an alternative to Bluetooth communication for wired USB input device 479. USB subsystem, a fairly standard, readily available for FPGA and ASIC, as with and video decompression, often built in performing off-the-shelf devices other functions.
ビデオ出力サブシステム487は、クライアント465内よりも広範囲なビデオ出力を発生する。これは、HDMI490ビデオ出力を与えるのに加えて、DVI−I491、S−ビデオ492及び複合ビデオ493を与える。又、DVI−I491インターフェイスがデジタルビデオに対して使用されるときには、ディスプレイ能力464がディスプレイ装置からコントロールCPU483へ返送され、ディスプレイ装置478の能力をホスティングサービス210に通知できるようにする。ビデオ出力サブシステム487により与えられる全てのインターフェイスは、極めて標準的なインターフェイスであり、多数の形態で入手容易である。 Video output subsystem 487 generates a wider range of video output than in client 465. This provides DVI-I 491, S-video 492 and composite video 493 in addition to providing HDMI 490 video output. Also, when the DVI-I 491 interface is used for digital video, the display capability 464 is returned from the display device to the control CPU 483 so that the hosting service 210 can be notified of the capabilities of the display device 478. All the interfaces provided by the video output subsystem 487 are very standard interfaces and are readily available in numerous forms.
オーディオ出力サブシステム489は、デジタルインターフェイス494(S/PDIF及び/又はToslink)を通してオーディオをデジタルで出力すると共に、ステレオアナログインターフェイス495を通してオーディオをアナログ形態で出力する。 Audio output subsystem 489 outputs audio digitally through digital interface 494 (S / PDIF and / or Toslink) and outputs audio in analog form through stereo analog interface 495.
往復待ち時間の分析
もちろん、以上の段落を理解するために、入力装置421を使用したユーザのアクションと、そのアクションの結果をディスプレイ装置420で見るときとの間の往復待ち時間は、70−80ms以下でなければならない。この待ち時間は、ユーザの家屋211内の入力装置421からホスティングサービス210へそしてユーザの家屋211へ戻って、ディスプレイ装置422へ至る経路における全てのファクタを考慮しなければならない。図4bは、信号が進行しなければならない種々のコンポーネント及びネットワークを示し、これらコンポーネント及びネットワークの上には、実際の具現化で予想できる待ち時間を列挙した時間線がある。図4bは、重要な経路ルーティングだけを示すように簡略化されていることに注意されたい。システムの他の特徴のために使用されるデータの他のルーティングは、以下で説明する。双頭矢印(例えば、矢印453)は、往復待ち時間を表し、単頭矢印(例えば、矢印457)は、片道待ち時間を表し、そして「〜」は、近似尺度を示す。列挙した待ち時間を達成できない実世界の状況があるが、米国内における多くのケースでは、ユーザの家屋211へのDSL及びケーブルモデム接続を使用し、次の段落で述べる環境においてこれら待ち時間を達成できることを指摘しなければならない。又、インターネットへのセルラーワイヤレス接続は、図示されたシステムにおいて確実に機能するが、ほとんどの現在のUSセルラーデータシステム(EVDOのような)は、非常に長い待ち時間を被り、図4bに示す待ち時間を達成できないことにも注意されたい。しかしながら、これらの基礎的な原理は、このレベルの待ち時間を具現化できる将来のセルラー技術において具現化することができよう。
Round Trip Latency Analysis Of course, to understand the above paragraph, the round trip latency between the user's action using the input device 421 and viewing the result of that action on the display device 420 is 70-80 ms. Must be: This waiting time must consider all factors in the path from the input device 421 in the user's house 211 to the hosting service 210 and back to the user's house 211 to the display device 422. FIG. 4b shows the various components and networks through which the signal must travel, and above these components and networks are timelines that list the latency that can be expected in an actual implementation. Note that FIG. 4b has been simplified to show only important path routing. Other routing of data used for other features of the system is described below. Double-headed arrows (eg, arrow 453) represent round trip latency, single-headed arrows (eg, arrow 457) represent one-way latency, and “˜” represents an approximate measure. There are real-world situations where the listed latency cannot be achieved, but in many cases in the United States, DSL and cable modem connections to the user's home 211 are used to achieve these latency in the environment described in the next paragraph. I must point out what I can do. Also, cellular wireless connections to the Internet will work reliably in the system shown, but most current US cellular data systems (such as EVDO) suffer from very long latencies and the wait shown in FIG. 4b. Note also that time cannot be achieved. However, these basic principles could be implemented in future cellular technologies that can implement this level of latency.
ユーザの家屋211における入力装置421からスタートして、ユーザが入力装置421を操作すると、ユーザコントロール信号がクライアント415へ送信され(これは、セットトップボックスのようなスタンドアローン装置でもよいし、或いはPC又は移動装置のような別の装置で実行されるソフトウェア又はハードウェアでもよい)、そして(一実施形態ではUDPフォーマットで)パケット化され、そのパケットには、ホスティングサービス210に到着するための行先アドレスが与えられる。又、パケットは、コントロール信号がどのユーザから到来するか指示する情報も含む。次いで、コントロール信号のパケット(1つ又は複数)は、ファイアウオール/ルーター/NAT(ネットワークアドレストランスレーション)装置443を通してWANインターフェイス442へ転送される。WANインターフェイス442は、ユーザのISP(インターネットサービスプロバイダー)によりユーザの家屋211に与えられるインターフェイス装置である。WANインターフェイス442は、ケーブル又はDSLモデム、WiMaxトランシーバー、ファイバートランシーバー、セルラーデータインターフェイス、インターネットプロトコル・オーバー・パワーラインインターフェイス、又はインターネットへの多数のインターフェイスの他のものでよい。更に、ファイアウオール/ルーター/NAT装置443(及び潜在的にWANインターフェイス442)は、クライアント415に一体化されてもよい。その一例は、家庭又はオフィスクライアント415の機能を具現化するためのソフトウェアと、ある規格(例えば、802.11g)によりインターネットへワイヤレスでルーティング及び接続する手段とを含む移動電話である。 Starting from the input device 421 in the user's house 211, when the user operates the input device 421, a user control signal is transmitted to the client 415 (this may be a stand-alone device such as a set-top box or a PC Or may be software or hardware running on another device, such as a mobile device), and packetized (in one embodiment in UDP format) with the destination address for arriving at the hosting service 210 Is given. The packet also includes information indicating from which user the control signal comes. The control signal packet (s) are then forwarded through the firewall / router / NAT (Network Address Translation) device 443 to the WAN interface 442. The WAN interface 442 is an interface device provided to the user's house 211 by the user's ISP (Internet Service Provider). The WAN interface 442 may be a cable or DSL modem, WiMax transceiver, fiber transceiver, cellular data interface, internet protocol over power line interface, or others of multiple interfaces to the internet. Further, the firewall / router / NAT device 443 (and potentially the WAN interface 442) may be integrated into the client 415. One example is a mobile phone that includes software for implementing the functionality of a home or office client 415 and means for wirelessly routing and connecting to the Internet according to a standard (eg, 802.11g).
WANインターフェイス442は、次いで、コントロール信号をユーザのインターネットサービスプロバイダー(ISP)のための「存在点(point of presence)」441と称されるものへルーティングし、これは、ユーザの家屋211に接続されたWANトランスポートと、一般的インターネット又はプライベートネットワークとの間のインターフェイスをなすファシリティである。存在点の特性は、提供されるインターネットサービスの性質に基づいて変化する。DSLの場合、これは、典型的に、DSLAMが配置される電話会社の中央オフィスとなる。ケーブルモデムの場合、これは、典型的に、ケーブルマルチシステムオペレータ(MSO)ヘッドエンドとなる。セルラーシステムの場合、これは、典型的に、セルラータワーに関連したコントロールルームとなる。しかし、存在点の性質が何であれ、これは、コントロール信号パケット(1つ又は複数)を一般的インターネット410へルーティングする。コントロール信号パケット(1つ又は複数)は、次いで、最も多くはファイバトランシーバーインターフェイスであるものを通して、ホスティングサービス210へのWANインターフェイス441へルーティングされる。WAN441は、次いで、コントロール信号パケットをルーティングロジック409(これは、イーサネットスイッチ及びルーティングサーバーを含めて、多数の異なる仕方で具現化される)へルーティングし、これは、ユーザのアドレスを評価し、そしてコントロール信号を所与のユーザに対する正しいサーバー402へルーティングする。 The WAN interface 442 then routes the control signal to what is referred to as a “point of presence” 441 for the user's Internet service provider (ISP), which is connected to the user's home 211. A facility that provides an interface between a WAN transport and a general Internet or private network. The nature of the existence point varies based on the nature of the Internet service provided. In the case of DSL, this will typically be the central office of the telephone company where the DSLAM is located. In the case of a cable modem, this is typically a cable multisystem operator (MSO) headend. In the case of a cellular system, this will typically be the control room associated with the cellular tower. However, whatever the nature of the point of presence, this routes the control signal packet (s) to the general Internet 410. The control signal packet (s) is then routed to the WAN interface 441 to the hosting service 210 through what is most often a fiber transceiver interface. WAN 441 then routes the control signal packet to routing logic 409 (which is implemented in a number of different ways, including Ethernet switches and routing servers), which evaluates the user's address, and Route control signals to the correct server 402 for a given user.
サーバー402は、次いで、コントロール信号を、サーバー402で実行されるゲーム又はアプリケーションソフトウェアに対する入力として取り上げ、そしてそのコントロール信号を使用して、ゲーム又はアプリケーションの次のフレームを処理する。次のフレームが発生されると、サーバー402からビデオコンプレッサ404へビデオ及びオーディオが出力される。ビデオ及びオーディオは、サーバー402から種々の手段を経てコンプレッサ404へ出力される。先ず、コンプレッサ404は、サーバー402に組み込むことができ、従って、圧縮をサーバー402内でローカルに具現化することができる。又は、ビデオ及び/又はオーディオは、パケット化形態で、イーサネット接続のようなネットワーク接続を経て、サーバー402とビデオコンプレッサ404との間のプライベートネットワークであるネットワークへ、又はSAN403のような共有ネットワークを通して、出力することができる。或いは、ビデオは、サーバー402から、DVI又はVGAコネクタのようなビデオ出力コネクタを通して出力され、次いで、ビデオコンプレッサ404により捕獲されてもよい。又、オーディオは、サーバー402からデジタルオーディオとして(例えば、TOSLINK又はS/PDIFコネクタを経て)出力されるか又はアナログオーディオとして出力されてもよく、アナログオーディオは、ビデオコンプレッサ404内のオーディオ圧縮ロジックによりデジタル化されエンコードされる。 Server 402 then takes the control signal as input to the game or application software running on server 402 and uses that control signal to process the next frame of the game or application. When the next frame is generated, video and audio are output from the server 402 to the video compressor 404. Video and audio are output from the server 402 to the compressor 404 via various means. First, the compressor 404 can be incorporated into the server 402, and thus compression can be implemented locally within the server 402. Alternatively, video and / or audio is in packetized form, via a network connection such as an Ethernet connection, to a network that is a private network between the server 402 and the video compressor 404, or through a shared network such as the SAN 403. Can be output. Alternatively, the video may be output from server 402 through a video output connector, such as a DVI or VGA connector, and then captured by video compressor 404. Audio may also be output from the server 402 as digital audio (eg, via a TOSLINK or S / PDIF connector) or as analog audio, and the analog audio may be output by audio compression logic within the video compressor 404. Digitized and encoded.
ビデオコンプレッサ404は、ビデオフレーム、及びサーバー402からのそのフレーム時間中に発生されたオーディオを捕獲すると、以下に述べる技術を使用してビデオ及びオーディオを圧縮する。ビデオ及びオーディオが圧縮されると、アドレスと共にパケット化されて、ユーザのクライアント415へ返送され、WANインターフェイス441へルーティングされ、このWANインターフェイスは、ビデオ及びオーディオパケットを一般的なインターネット410を経てルーティングし、このインターネットは、ビデオ及びオーディオパケットをユーザのISP存在点441へルーティングし、この存在点は、ビデオ及びオーディオパケットをユーザの家屋のWANインターフェイス442へルーティングし、このインターフェイスは、ビデオ及びオーディオパケットをファイアウオール/ルーター/NAT装置443へルーティングし、次いで、この装置は、ビデオ及びオーディオパケットをクライアント415へルーティングする。 When video compressor 404 captures a video frame and the audio generated during that frame time from server 402, it compresses the video and audio using the techniques described below. Once video and audio are compressed, they are packetized with an address, sent back to the user's client 415 and routed to the WAN interface 441, which routes video and audio packets over the general Internet 410. The Internet routes video and audio packets to the user's ISP presence point 441, which routes the video and audio packets to the user's home WAN interface 442, which interface the video and audio packets. Route to firewall / router / NAT device 443, which then routes video and audio packets to client 415
クライアント415は、ビデオ及びオーディオを解凍し、次いで、ビデオをディスプレイ装置422(又はクライアントの内蔵ディスプレイ装置)に表示すると共に、オーディオをディスプレイ装置422又は個別の増幅器/スピーカへ或いはクライアントに内蔵された増幅器/スピーカへ送信する。 The client 415 decompresses the video and audio, then displays the video on the display device 422 (or the client's built-in display device) and the audio to the display device 422 or a separate amplifier / speaker or an amplifier built into the client. / Send to speaker.
上述した全プロセスに知覚的に遅れがないことをユーザが認知するためには、往復遅延が70又は80ms未満である必要がある。前記往復経路における待ち時間遅延のあるものは、ホスティングサービス210及び/又はユーザのコントロールのもとにあり、他のものは、そうではない。それでも、非常に多数の実世界のシナリオの分析及びテストに基づき、おおよその測定値は次のようになる。 In order for the user to recognize that there is no perceptual delay in the entire process described above, the round trip delay needs to be less than 70 or 80 ms. Some of the latency delays in the round trip path are under the control of the hosting service 210 and / or the user, others are not. Nevertheless, based on the analysis and testing of a large number of real-world scenarios, the approximate measurements are:
コントロール信号451を送信するための片道送信時間は、典型的に、1ms未満であり、ユーザの家屋452を通る往復ルーティングは、典型的に、イーサネット上に入手容易な消費者グレードのファイアウオール/ルーター/NATスイッチを使用して約1msで達成される。ユーザISPは、その往復遅延453が広く変化するが、DSL及びケーブルモデムプロバイダーでは、典型的に、10ないし25msである。一般的なインターネット410における往復待ち時間は、トラフィックがどのようにルーティングされるか及びルートに欠陥があるかどうか(これらの問題は以下で述べる)に基づいて大きく変化するが、典型的に、一般的なインターネットは、非常に最適なルートを与え、そして待ち時間は、行先までの距離が与えられると、主として光ファイバを通る光の速度によって決定される。以下に更に述べるように、ユーザの家屋211から離れてホスティングサービス210を発することが予想される最も遠いおおよその距離として1000マイルを確立した。1000マイル(往復2000マイル)では、インターネットを通る信号の実際の通過時間は、約22msである。ホスティングサービス210へのWANインターフェイス441は、典型的に、待ち時間を無視できる商業的グレードファイバの高速インターフェイスである。従って、一般的インターネットの待ち時間454は、典型的に、1ないし10msである。ホスティングサービス210を通る片道ルーティング455の待ち時間は、1ms未満である。サーバー402は、典型的に、ゲーム又はアプリケーションのための新たなフレームを1フレーム時間(60fpsでは16.7msである)未満で計算し、従って、使用するために合理的な最大片道待ち時間は、16msである。ここに述べるビデオ圧縮及びオーディオ圧縮アルゴリズムの最適なハードウェア具現化では、圧縮457を1msで完了することができる。あまり最適でない形態では、圧縮に6ms程度を要する(もちろん、もっと最適でない形態は、更に長い時間を要するが、このような具現化は、往復の全待ち時間に影響を及ぼし、70−80msの待ち時間目標を維持するには他の待ち時間を短縮する必要がある(例えば、一般的なインターネットを通る許容距離を短縮することができる))。インターネット454、ユーザISP453及びユーザ家屋ルーティング452の往復待ち時間は、既に考慮されており、従って、残りは、ビデオ解凍458の待ち時間であり、これは、ビデオ解凍458が専用のハードウェアで具現化されるか、又は(PC又は移動装置のような)クライアント装置415においてソフトウェアで具現化されるかに基づいて、又、ディスプレイのサイズ及び解凍CPUの性能に基づいて、変化する。典型的に、解凍458は、1ないし8msを要する。 The one-way transmission time for transmitting the control signal 451 is typically less than 1 ms, and round trip routing through the user's house 452 is typically consumer grade firewall / router / accessible over Ethernet. This is achieved in about 1 ms using a NAT switch. User ISPs vary widely in their round trip delay 453, but for DSL and cable modem providers it is typically 10-25 ms. The round trip latency in the general Internet 410 varies greatly based on how traffic is routed and whether the route is flawed (these issues are discussed below), but typically The typical Internet provides a very optimal route, and latency is determined primarily by the speed of light through the optical fiber given the distance to the destination. As further described below, we have established 1000 miles as the furthest approximate distance that is expected to leave the hosting service 210 away from the user's home 211. At 1000 miles (2000 miles round trip), the actual transit time of signals through the Internet is about 22 ms. The WAN interface 441 to the hosting service 210 is typically a commercial grade fiber high speed interface with negligible latency. Thus, typical Internet latency 454 is typically 1 to 10 ms. The latency of the one-way routing 455 through the hosting service 210 is less than 1 ms. Server 402 typically calculates a new frame for a game or application in less than one frame time (16.7 ms at 60 fps), so the maximum one-way latency that is reasonable to use is 16 ms. With the optimal hardware implementation of the video and audio compression algorithms described herein, compression 457 can be completed in 1 ms. The less optimal form takes about 6 ms to compress (of course, the less optimal form takes longer, but such an implementation affects the overall round trip latency and waits for 70-80 ms. Other latency needs to be reduced to maintain the time goal (e.g., an acceptable distance through the general Internet can be reduced). The round trip latency of the Internet 454, user ISP 453, and user house routing 452 has already been taken into account, so the rest is the latency of video decompression 458, which is implemented by dedicated hardware for video decompression 458. Depending on whether it is implemented in software on a client device 415 (such as a PC or mobile device) and based on the size of the display and the performance of the decompression CPU. Typically, decompression 458 takes 1 to 8 ms.
従って、実際上見られる最悪のケースの待ち時間を全部加算することにより、図4aに示すシステムのユーザにより経験されると予想できる最悪のケースの往復待ち時間を決定することができる。それらは、1+1+25+22+1+16+6+8=80msである。そして、正に、実際に(以下に述べる注意と共に)、これは、図4aに示すシステムのプロートタイプバージョンを使用し、既製品のWindows PCをクライアント装置として及び米国内の家庭用DSL及びケーブルモデム接続を使用して分かったおおよその往復待ち時間である。もちろん、最悪のケースより良好のシナリオでは、非常に短い待ち時間が得られるが、それは、広く使用される商業的サービスの開発に依存することができない。 Therefore, by adding all the worst case latency actually seen, the worst case round trip latency that can be expected to be experienced by the user of the system shown in FIG. 4a can be determined. They are 1 + 1 + 25 + 22 + 1 + 16 + 6 + 8 = 80 ms. And indeed (with the note below), this uses a prototype type version of the system shown in FIG. 4a, with an off-the-shelf Windows PC as a client device and a domestic DSL and cable modem in the United States. The approximate round trip latency found using the connection. Of course, in a scenario better than the worst case, a very short latency is obtained, but it cannot depend on the development of widely used commercial services.
一般的なインターネットを経て図4bに列挙する待ち時間を得るには、図4aのビデオコンプレッサ404及びクライアント415のビデオデコンプレッサ412が、非常に特定の特性をもつパケットストリームを発生し、ホスティングサービス210からディスプレイ装置422までの全経路を経て発生されるパケットシーケンスが、遅延や過剰なパケットロスを受けず、且つ特に、WANインターフェイス442及びファイアウオール/ルーター/NAT443を通るユーザのインターネット接続を経てユーザに利用できる帯域巾の制約内に一貫して入るようにする必要がある。更に、ビデオコンプレッサは、通常のインターネット及びネットワーク送信において生じる不可避なパケットロス及びパケット並べ替えを許容できるに充分なほど頑丈なパケットストリームを生成しなければならない。 To obtain the latency listed in FIG. 4b over the general Internet, the video compressor 404 of FIG. 4a and the video decompressor 412 of the client 415 generate a packet stream with very specific characteristics and the hosting service 210 Packet sequence generated over the entire path from the device to the display device 422 is not subject to delay or excessive packet loss and is used by the user via the user's Internet connection through the WAN interface 442 and the firewall / router / NAT 443 in particular. It must be consistently within the bandwidth constraints that it can. In addition, the video compressor must generate a packet stream that is robust enough to allow the inevitable packet loss and packet reordering that occurs in normal Internet and network transmissions.
短待ち時間のビデオ圧縮
前記目標を達成するために、一実施形態は、待ち時間を減少し且つビデオを送信するためのピーク帯域巾要件を緩和するというビデオ圧縮の新規な解決策をとる。これらの実施形態を説明する前に、図5及び図6a−bを参照して、現在のビデオ圧縮技術の分析を行う。もちろん、これらの技術は、これらの技術で要求されるデータレートを取り扱うに充分な帯域巾がユーザに与えられる場合には、基礎的な原理に基づいて使用することができる。オーディオの圧縮は、ビデオの圧縮と同時に且つ同期して具現化されることを述べる以外、ここでは扱わないことに注意されたい。このシステムの要件を満足する従来のオーディオ圧縮技術が存在する。
Low Latency Video Compression To achieve the goal, one embodiment takes a novel video compression solution that reduces latency and relaxes peak bandwidth requirements for transmitting video. Before describing these embodiments, an analysis of current video compression techniques is performed with reference to FIGS. 5 and 6a-b. Of course, these techniques can be used on a basic basis if the user is given sufficient bandwidth to handle the data rates required by these techniques. Note that audio compression is not addressed here other than that it is implemented simultaneously and synchronously with video compression. There are conventional audio compression techniques that meet the requirements of this system.
図5は、ビデオを圧縮するための1つの特定の従来技術であって、特定の圧縮アルゴリズムを使用する圧縮ロジック520により各個々のビデオフレーム501−503を圧縮して、一連の圧縮されたフレーム511−513を発生する従来技術を示している。この技術の一実施形態は、「モーションJPEG」であり、各フレームが、離散的コサイン変換(DCT)に基づき、ジョイント・ピクチャー・エクスパート・グループ(JPEG)圧縮アルゴリズムに従って圧縮されるというものである。種々の異なる形式の圧縮アルゴリズムを使用してもよいが、これらの基礎的な原理(例えば、JPEG−2000のようなウェーブレットベースの圧縮アルゴリズム)に依然適合させるようにする。 FIG. 5 is one specific prior art for compressing video, where each individual video frame 501-503 is compressed by compression logic 520 using a specific compression algorithm to produce a series of compressed frames. 2 illustrates the prior art for generating 511-513. One embodiment of this technique is “motion JPEG”, where each frame is compressed according to a joint picture expert group (JPEG) compression algorithm, based on a discrete cosine transform (DCT). . A variety of different types of compression algorithms may be used, but remain adapted to these basic principles (eg, wavelet-based compression algorithms such as JPEG-2000).
この形式の圧縮の1つの問題は、各フレームのデータレートを下げるが、連続フレーム間の類似性を利用してビデオストリーム全体のデータレートを下げるものでないことである。例えば、図5に示すように、映像の所与のクオリティに対し、640x480x24ビット/ピクセル=640*480*24/8/1024=900キロバイト/フレーム(KB/フレーム)のフレームレートを仮定すれば、モーションJPEGは、10のファクタでストリームを圧縮するだけであり、90KB/フレームのデータストリームを生じさせる。60フレーム/秒では、これは、90KB*8ビット*60フレーム/秒=42.2Mbpsのチャンネル帯域巾を要求し、これは、今日の米国内のほぼ全ての家庭用インターネット接続に対して遥かに広い帯域巾となり、且つ多数のオフィス用インターネット接続に対しても非常に広い帯域巾となる。実際に、このような広い帯域巾で一定のデータストリームを要求し、且つオフィスLAN環境においても1人のユーザにしか役立たないとすれば、100MbpsのイーサネットLAN帯域巾の大きな割合を消費し、LANをサポートするイーサネットスイッチに大きな負担を掛けることになる。従って、動画ビデオに対する圧縮は、(以下に述べるような)他の圧縮技術と比べたときに、非効率的である。更に、ロッシー圧縮アルゴリズムを使用するJPEG及びJPEG−2000のような単一フレーム圧縮アルゴリズムは、静止映像では気付かない圧縮欠陥(例えば、シーンにおける密集した葉の中の欠陥は、その密集した葉がどのように見えるべきか目にとって厳密に分からないので、欠陥として見えないことがある)を生じる。しかし、シーンが動くと、欠陥が静止映像では気付かないシーンのエリアにあるにも関わらず、欠陥がフレームごとに変化することが目で検出されるので、欠陥が目立つようになる。その結果、余白的アナログTV受信中に見える「スノー」ノイズに見掛けが類似した「バックグランドノイズ」がフレームのシーケンスにおいて知覚される。もちろん、この形式の圧縮は、ここに述べる幾つかの実施形態で依然使用できるが、一般的に述べると、シーンにおけるバックグランドノイズを回避するため、所与の知覚上のクオリティに対して高いデータレート(即ち、低い圧縮比)が要求される。 One problem with this type of compression is that it reduces the data rate of each frame, but does not use the similarity between successive frames to reduce the data rate of the entire video stream. For example, assuming a frame rate of 640 * 480 * 24 bits / pixel = 640 * 480 * 24/8/1024 = 900 kilobytes / frame (KB / frame) for a given quality of video, as shown in FIG. Motion JPEG only compresses the stream by a factor of 10 and produces a 90 KB / frame data stream. At 60 frames / second, this requires a channel bandwidth of 90 KB * 8 bits * 60 frames / second = 42.2 Mbps, which is much more for almost all home Internet connections in the United States today It has a wide bandwidth and a very wide bandwidth for a large number of office Internet connections. In fact, if a constant data stream is required with such a wide bandwidth and only one user is useful in an office LAN environment, a large percentage of the 100 Mbps Ethernet LAN bandwidth is consumed. This puts a heavy burden on Ethernet switches that support. Therefore, compression for moving video is inefficient when compared to other compression techniques (as described below). In addition, single-frame compression algorithms such as JPEG and JPEG-2000 that use the lossy compression algorithm can cause compression flaws that are not noticeable in still images (eg, flaws in dense leaves in a scene are It may not be visible as a defect because it is not exactly known to the eye what it should look like. However, when the scene moves, the defect becomes noticeable because it is detected by the eye that the defect changes from frame to frame, even though the defect is in the area of the scene that is not noticed by still images. As a result, “background noise” that is similar in appearance to “snow” noise seen during marginal analog TV reception is perceived in the sequence of frames. Of course, this form of compression can still be used in some of the embodiments described herein, but generally speaking, high data for a given perceptual quality to avoid background noise in the scene. A rate (ie, a low compression ratio) is required.
H.264、又はWindows MediaVC9、MPEG2及びMPEG4のような他の形式の圧縮は、全て、連続するフレーム間の類似性を利用しているので、ビデオストリームの圧縮がより効率的である。これらの技術は、全て、ビデオを圧縮するための同じ一般的技術に依存している。従って、H.264規格について述べるが、他の種々の圧縮アルゴリズムにも同じ一般的原理が適用される。圧縮H.264のためのx264オープンソースソフトウェアライブラリー、及び解凍H.264のためのFFmpegオープンソースソフトウェアライブラリーを含めて、非常に多数のH.264コンプレッサ及びデコンプレッサを利用することができる。 H. H.264, or other types of compression, such as Windows Media VC9, MPEG2 and MPEG4, all take advantage of the similarity between successive frames, so the compression of the video stream is more efficient. All of these techniques rely on the same general technique for compressing video. Therefore, H.I. Although the H.264 standard is described, the same general principles apply to various other compression algorithms. Compression H. X264 open source software library for H.264 and decompression H.264 A large number of H.264 including the FFmpeg open source software library for H.264 H.264 compressors and decompressors can be used.
図6a及び6bは、従来の圧縮技術を例示するもので、一連の非圧縮のビデオフレーム501−503、559−561が、圧縮ロジック620により、一連の「Iフレーム」611、671、「Pフレーム」612−613、及び「Bフレーム」670へと圧縮される。図6aの縦軸は、一般的に、エンコードされて得られる各フレームのサイズを表す(が、フレームは適切なスケールで描かれていない)。上述したように、Iフレーム、Bフレーム及びPフレームを使用するビデオコーディングは、当業者に良く知られている。簡単に述べると、Iフレーム611は、完全非圧縮のフレーム501のDCTベース圧縮である(上述した圧縮されたJPEG映像と同様)。Pフレーム612−613は、一般的に、Iフレーム611よりサイズが著しく小さい。というのは、手前のIフレーム又はPフレームのデータの利点を取り入れるからであり、即ち手前のIフレーム又はPフレーム間の変化を示すデータを含むからである。Bフレーム670は、Pフレームと同様であるが、Bフレームは、後続する基準フレームにおけるフレームと、先行する基準フレームにおける潜在的なフレームとを使用する。 FIGS. 6a and 6b illustrate a conventional compression technique in which a series of uncompressed video frames 501-503, 559-561 are converted by a compression logic 620 into a series of “I frames” 611, 671, “P frames. "612-613" and "B frame" 670. The vertical axis in FIG. 6a generally represents the size of each frame that is obtained by encoding (but the frame is not drawn to an appropriate scale). As mentioned above, video coding using I-frames, B-frames and P-frames is well known to those skilled in the art. Briefly, I frame 611 is DCT-based compression of fully uncompressed frame 501 (similar to the compressed JPEG video described above). The P frame 612-613 is generally significantly smaller in size than the I frame 611. This is because the advantage of the data of the previous I frame or P frame is taken in, that is, the data indicating the change between the previous I frame or P frame is included. B frame 670 is similar to P frame, but B frame uses a frame in a subsequent reference frame and a potential frame in a preceding reference frame.
以下の説明では、望ましいフレームレートが60フレーム/秒であり、各Iフレームが約160Kbであり、平均Pフレーム及びBフレームが16Kbであり、そして毎秒新たなIフレームが発生されると仮定する。この1組のパラメータで、平均データレートは、160Kb+16Kb*59=1.1Mbpsとなる。このデータレートは、家庭及びオフィスへの多くの現在のブロードバンドインターネット接続に対する最大データレート内に充分入る。又、この技術は、イントラフレーム専用のエンコーディングからバックグランドノイズの問題を回避する傾向がある。というのは、P及びBフレームは、フレーム間の差を追跡し、圧縮欠陥がフレームごとに現れたり消えたりする傾向がなく、前記バックグランドノイズの問題を緩和するからである。 In the following description, it is assumed that the desired frame rate is 60 frames / second, each I frame is about 160 Kb, the average P and B frames are 16 Kb, and a new I frame is generated every second. With this set of parameters, the average data rate is 160 Kb + 16 Kb * 59 = 1.1 Mbps. This data rate is well within the maximum data rate for many current broadband Internet connections to homes and offices. This technique also tends to avoid the background noise problem from intraframe dedicated encoding. This is because P and B frames track the difference between frames and compression defects do not tend to appear or disappear from frame to frame, alleviating the background noise problem.
前記形式の圧縮に伴う1つの問題は、平均データレートが比較的低い(例えば、1.1Mbps)が、単一のIフレームが送信に多数のフレーム分の時間を要することである。例えば、従来技術を使用すると、60フレームごとに160KbpsのIフレームの状態で1.1Mbpsでビデオをストリーミングするのに、典型的に、2.2Mbpsのネットワーク接続(例えば、図3aから2.2Mbpsピークの利用可能な最大データレート302をもつDSL又はケーブルモデム)で充分である。これは、ビデオを解凍するまで解凍キューに1秒のビデオを入れておくことにより達成される。1秒で、1.1Mbのデータが送信され、これは、利用可能なデータレートが周期的に50%程度下がると仮定しても、2.2Mbpsの利用可能な最大データレートによって容易に受け容れられる。不都合なことに、この従来の解決策は、1秒のビデオバッファが受信器にあるので、ビデオについて1秒の待ち時間を生じさせる。このような遅延は、多数の従来の用途(例えば、リニアビデオの再生)では充分であるが、70−80msを越える待ち時間を許容できない高速アクションのビデオゲームに対しては遥かに長い待ち時間である。 One problem with this type of compression is that the average data rate is relatively low (eg, 1.1 Mbps), but a single I-frame takes many frames to transmit. For example, using the prior art, to stream video at 1.1 Mbps with 160 Kbps I frames every 60 frames, typically a 2.2 Mbps network connection (eg, 2.2 Mbps peak from FIG. 3a). DSL or cable modem) with a maximum available data rate 302 is sufficient. This is accomplished by keeping the 1 second video in the decompression queue until the video is decompressed. In 1 second, 1.1 Mb of data is transmitted, which is easily accepted by the maximum available data rate of 2.2 Mbps, even assuming that the available data rate drops periodically by about 50%. It is done. Unfortunately, this conventional solution results in a 1 second latency for the video because there is a 1 second video buffer at the receiver. Such a delay is sufficient for many conventional applications (eg, linear video playback), but with much longer latency for fast action video games that cannot tolerate a latency greater than 70-80 ms. is there.
1秒のビデオバッファを排除する試みがなされたが、高速アクションビデオゲームのための充分な待ち時間短縮が得られていない。一例として、上述したBフレームの使用は、Iフレームに先行する全てのBフレーム及びIフレームの受信を必要とする。PフレームとBフレームとの間で59個の非Iフレームがおおよそ分割されると仮定すれば、少なくとも29個のBフレームがあり、そしてBフレームを表示できるまでにIフレームが受信される。従って、チャンネルの利用可能な帯域巾に関わらず、各々1/60秒巾の29+1=30フレームの遅延、即ち500msの待ち時間が必要になる。明らかに、これは、遥かに長過ぎる。 Attempts have been made to eliminate the 1 second video buffer, but not enough latency reduction for fast action video games. As an example, the use of the B frame described above requires reception of all B and I frames preceding the I frame. Assuming that 59 non-I frames are roughly divided between P and B frames, there are at least 29 B frames, and I frames are received before the B frames can be displayed. Therefore, regardless of the available bandwidth of the channel, a delay of 29 + 1 = 30 frames, each 1/60 second wide, ie a waiting time of 500 ms is required. Obviously this is far too long.
従って、別の解決策は、Bフレームを排除し、そしてI及びPフレームだけを使用することである。(その1つの結果として、所与のクオリティレベルに対してデータレートが増加することになるが、この例における一貫性のために、各Iフレームが160Kbであり、平均Pフレームが16Kbのサイズであり、従って、データレートが依然1.1Mbpsであると仮定し続ける。)この解決策は、Bフレームにより導入される不可避な待ち時間を排除する。というのは、各Pフレームのデコーディングが、以前に受信したフレームに依存するだけだからである。この解決策に伴う問題は、Iフレームが平均Pフレームより非常に大きいために、ほとんどの家庭及び多くのオフィスにおいて典型的である狭帯域巾チャンネルでは、Iフレームの送信が実質的な待ち時間を増大することである。これが図6bに示されている。Iフレームに要求されるピークデータレート623が、利用可能な最大データレート622を(及び定格最大データレート621も)遥かに越えるIフレームを除いて、ビデオストリームのデータレート624は、利用可能な最大データレート621より低い。Pフレームにより要求されるデータレートは、利用可能な最大データレート未満である。2.2Mbpsの利用可能な最大データレートのピークがその2.2Mbpsのピークレートに着実に保たれるとしても、Iフレームを送信するのに160Kb/2.2Mb=71msを要し、利用可能な最大データレート622が50%(1.1Mbps)下がった場合には、Iフレームを送信するのに142msを要する。従って、Iフレームを送信する際の待ち時間は、71から142msのどこかに入る。この待ち時間は、図4bに示された待ち時間に加算され、最悪の場合、これが70msに加算され、従って、これは、ユーザが入力装置421を操作する時点から、ディスプレイ装置422に映像が現れるまで、141ないし222msの合計往復待ち時間を生じ、遥かに高いものとなる。そして、利用可能な最大データレートが2.2Mbpsより下がる場合には、待ち時間は更に増大する。 Therefore, another solution is to eliminate B frames and use only I and P frames. (One result is an increase in data rate for a given quality level, but for consistency in this example, each I frame is 160 Kb and the average P frame is 16 Kb in size. Yes, and therefore continue to assume that the data rate is still 1.1 Mbps.) This solution eliminates the inevitable latency introduced by B-frames. This is because the decoding of each P frame only depends on the previously received frame. The problem with this solution is that because I frames are much larger than average P frames, transmission of I frames has substantial latency in narrow bandwidth channels that are typical in most homes and many offices. It is to increase. This is shown in FIG. 6b. Except for I frames where the peak data rate 623 required for an I frame far exceeds the maximum available data rate 622 (and also the rated maximum data rate 621), the data rate 624 of the video stream is the maximum available. Lower than data rate 621. The data rate required by the P frame is less than the maximum available data rate. Even if the peak of the maximum available data rate of 2.2 Mbps is kept steadily at the peak rate of 2.2 Mbps, it takes 160 Kb / 2.2 Mb = 71 ms to transmit an I-frame and can be used If the maximum data rate 622 drops by 50% (1.1 Mbps), 142 ms is required to transmit the I frame. Therefore, the waiting time for transmitting an I frame is somewhere between 71 and 142 ms. This waiting time is added to the waiting time shown in FIG. 4b, and in the worst case this is added to 70 ms, so that it appears on the display device 422 from the moment the user operates the input device 421. Up to 141 to 222 ms total round trip latency, which is much higher. And when the maximum available data rate falls below 2.2 Mbps, the latency increases further.
又、一般的に、ピークデータレート623でISPを「ジャミング」させて、利用可能なデータレート622を遥かに越える厳しい結果が生じることにも注意されたい。異なるISPの装置は、異なる挙動をするが、利用可能なデータレート622より非常に高いデータレートでパケットを受け取るときには、次の挙動がDSL及びケーブルモデムISPの間で極めて一般的となる。(a)パケットをキューイングすることでパケットを遅延させ(待ち時間を導入し)、(b)パケットの幾つか又は全部をドロップさせ、(c)ある期間接続をディスエイブルする(おそらく、ISPに関するものであるから、「サービス拒絶」攻撃のような悪意のある攻撃である)。従って、図6bに示すような特性で全データレートにおいてパケットストリームを送信することは、実現可能な選択肢ではない。ピーク623は、ホスティングサービス210においてキューイングされ、そして利用可能な最大データレートより低いデータレートで送信され、上述した許容できない待ち時間を導入することがある。 Note also that generally “jamming” the ISP at the peak data rate 623 will produce severe results that far exceed the available data rate 622. Different ISP devices behave differently, but when receiving packets at a data rate much higher than the available data rate 622, the following behavior is quite common between DSL and cable modem ISPs. (A) delay the packet by queuing the packet (introducing latency), (b) drop some or all of the packet, and (c) disable the connection for a period of time (probably related to the ISP It is a malicious attack such as a “denial of service” attack). Therefore, transmitting a packet stream at all data rates with the characteristics shown in FIG. 6b is not a feasible option. Peak 623 may be queued at hosting service 210 and transmitted at a data rate lower than the maximum available data rate, introducing the unacceptable latency described above.
更に、図6bに示すビデオストリームデータレートシーケンス624は、非常に「従順な」ビデオストリームデータレートシーケンスであり、そして著しく変化せず且つほとんど動きのないビデオシーケンスからビデオを圧縮することにより生じると予想される種類のデータレートシーケンスである(例えば、カメラが固定位置にあってほとんど動かず、そしてシーン内のオブジェクト、例えば、椅子に座って話している人がほとんど動きを示さないビデオ遠隔会議において一般的であるように)。 Furthermore, the video stream data rate sequence 624 shown in FIG. 6b is a very “compliant” video stream data rate sequence and is expected to result from compressing video from a video sequence that does not change significantly and has little motion. Data rate sequences of the type (e.g. common in video teleconferencing where the camera is in a fixed position and hardly moves, and objects in the scene, for example a person sitting in a chair and showing little movement) To be appropriate).
図6cに示すビデオストリームデータレートシーケンス634は、動画又はビデオゲーム或いはあるアプリケーションソフトウェアにおいて発生されるような、遥かに多いアクションを伴うビデオから見えると予想されるものに対して典型的なシーケンスである。Iフレームピーク633に加えて、極めて大きく且つ多くの場合に利用可能な最大データレートを越える635及び636のようなPフレームピークもあることに注意されたい。これらのPフレームピークは、Iフレームピークと同程度に大きいことはあまりないが、全データレートでチャンネルにより搬送されるには遥かに大き過ぎるもので、又、Iフレームピークと同様に、Pフレームピークは、ゆっくり送信されねばならない(従って、待ち時間が増大する)。 The video stream data rate sequence 634 shown in FIG. 6c is a typical sequence for what would be expected to be seen from a video with much more action, such as generated in a video or video game or some application software. . Note that in addition to the I frame peak 633, there are also P frame peaks such as 635 and 636 that are very large and often exceed the maximum available data rate. These P frame peaks are not as large as I frame peaks, but are much too large to be carried by the channel at all data rates, and, like I frame peaks, P frames The peak must be transmitted slowly (thus increasing latency).
広帯域巾チャンネル(例えば、100MbpsのLAN、又は広帯域巾100Mbpsのプライベート接続))において、ネットワークは、Iフレームピーク633又はPフレームピーク636のような大きなピークを許容することができ、そして原理的に、短い待ち時間を維持することができる。しかし、このようなネットワークは、多くの場合、大勢のユーザ間に共有され(例えば、オフィス環境において)、そしてこのような「ピーク」データは、特に、ネットワークトラフィックがプライベート共有接続へルーティングされた場合に(例えば、リモートデータセンターからオフィスへ)、LANの性能に影響を及ぼす。先ず、この例は、60fpsにおいて640x480ピクセルの比較的低解像度のビデオストリームであることを銘記されたい。60fpsにおいて1920x1080のHDTVストリームは、近代的なコンピュータ及びディスプレイによって容易に取り扱われ、そして60fpsにおいて2560x1440解像度のディスプレイが益々入手可能になってきている(例えば、アップル社の30”ディスプレイ)。又、60fpsにおいて1920x1080の高アクションビデオシーケンスは、適度なクオリティレベルに対してH.264圧縮を使用して4.5Mbpsを必要とする。公称データレートの10倍のIフレームピークを仮定すれば、それは45Mbps以下のピークを生じるが、まだかなりのPフレームピークがある。大勢のユーザが同じ100Mbpsのネットワーク(例えば、オフィスとデータセンターとの間のプライベートなネットワーク接続)を経てビデオストリームを受信する場合、大勢のユーザのビデオストリームからのピークがどのように整列して、ネットワークの帯域巾を圧倒し、そしてネットワーク上のユーザをサポートするスイッチのバックプレーンの帯域巾を潜在的に圧倒するか容易に見ることができる。ギガビットのイーサネットネットワークの場合でも、充分なユーザが充分なピークを一度に整列させる場合は、ネットワーク又はネットワークスイッチを圧倒することができる。そして、2560x1440解像度のビデオがより平凡なものになると、平均ビデオストリームデータレートが9.5Mbpsとなり、おそらく、95Mbpsのピークデータレートを生じさせる。言うまでもなく、データセンターとオフィスとの間の100Mbpsの接続(これは、今日、非常に高速な接続である)は、単一ユーザからのピークトラフィックによって完全に沈没される。従って、LAN及びプライベートネットワーク接続が、ピークストリーミングビデオを更に許容できるとしても、高いピークを伴うストリーミングビデオは、望ましいものではなく、オフィスのIT部門による特殊なプランニング及び適応を要求する。 In a high bandwidth channel (eg, a 100 Mbps LAN, or a wide bandwidth 100 Mbps private connection), the network can tolerate large peaks, such as I frame peak 633 or P frame peak 636, and in principle: A short waiting time can be maintained. However, such networks are often shared among a large number of users (eg, in an office environment), and such “peak” data is especially relevant when network traffic is routed to a private shared connection. (E.g., from a remote data center to an office), affecting LAN performance. First, it should be noted that this example is a relatively low resolution video stream of 640 × 480 pixels at 60 fps. 1920 x 1080 HDTV streams at 60 fps are easily handled by modern computers and displays, and 2560 x 1440 resolution displays are becoming increasingly available at 60 fps (eg, Apple's 30 "display) and 60 fps. A 1920x1080 high-action video sequence requires 4.5 Mbps using H.264 compression for a reasonable quality level, assuming an I-frame peak of 10 times the nominal data rate, which is 45 Mbps or less Although there are still significant P frame peaks, many users have the same 100 Mbps network (eg, private network connection between office and data center) When receiving a video stream via a network, how the peaks from the video stream of a large number of users align, overwhelm the network bandwidth, and reduce the bandwidth of the switch backplane that supports users on the network. It's easy to see if it's potentially overwhelming, even with Gigabit Ethernet networks, if enough users align enough peaks at once, they can overwhelm the network or network switch, and 2560x1440. As resolution video becomes more commonplace, the average video stream data rate will be 9.5 Mbps, possibly resulting in a peak data rate of 95 Mbps, of course, a 100 Mbps connection between the data center and the office (this is Today, which is a very fast connection) is completely sunk by peak traffic from a single user, so streaming with high peaks even though LAN and private network connections can tolerate more peak streaming video. Video is undesirable and requires special planning and adaptation by the office IT department.
もちろん、標準的なリニアビデオアプリケーションの場合、これらの事柄は、問題ではない。というのは、データレートが送信点において「平滑化」され、各フレームのデータが利用可能な最大データレート622より低く、そしてクライアントのバッファが、I、P及びBフレームのシーケンスを、それらが解凍されるまで記憶するからである。従って、ネットワークにわたるデータレートは、ビデオストリームの平均データレートの近くに保たれる。不都合なことに、これは、Bフレームが使用されない場合でも待ち時間を導入し、即ち高速応答時間を要求するビデオゲーム及びアプリケーションのような短待ち時間アプリケーションについては受け容れられない。 Of course, for standard linear video applications, these matters are not a problem. This is because the data rate is “smoothed” at the transmission point, the data for each frame is below the maximum available data rate 622, and the client's buffer decompresses the sequence of I, P and B frames. It is because it memorizes until it is done. Thus, the data rate across the network is kept close to the average data rate of the video stream. Unfortunately, this introduces latency even when B-frames are not used, ie it is unacceptable for short latency applications such as video games and applications that require fast response time.
高いピークを有するビデオストリームを軽減する1つの従来の解決策は、「コンスタントビットレート」(CBR)エンコーディングとしばしば称される技術を使用することである。CBRという語は、全てのフレームが同じビットレート(即ち、サイズ)を有するように圧縮されることを意味すると思われるが、それが通常指すのは、ある数のフレーム(ここでは、1フレーム)にわたり最大ビットレートが許されるという圧縮パラダイムである。例えば、図6cのケースでは、ビットレートを、定格最大データレート621の例えば70%に制限するエンコーディングにCBR制約が適用される場合に、圧縮アルゴリズムは、定格最大データレート621の70%以上を使用して通常圧縮されるフレームが少ないビットで圧縮されるように、各フレームの圧縮を制限する。その結果、所与のクオリティレベルを維持するために通常より多くのビットを要求するフレームがビットの「欠乏」となり、これらフレームの映像クオリティは、定格最大データレート621の70%以上のビットを要求しない他のフレームの場合より悪くなる。この解決策は、(a)予想される動き又はシーンの変化があまりなく、且つ(b)ユーザが周期的なクオリティ低下を受け容れできるようなある形式の圧縮ビデオに対して、受け容れられる結果を生じさせることができる。CBRに適したアプリケーションの良い例は、ビデオ遠隔会議である。というのは、ピークが僅かしかなく、且つクオリティが短時間低下した場合に(例えば、カメラがパンして、著しいシーンの動き及び大きなピークを生じ、そのパン中に、高クオリティ映像圧縮に充分なビットがなく、映像クオリティの低下を招く場合に)、ほとんどのユーザにそれが受け容れられるからである。不都合なことに、CBRは、非常に複雑な又は多くの動きのあるシーンを有し、及び/又は適度な一定レベルのクオリティが要求される他の多数のアプリケーションにはあまり適していない。 One conventional solution to mitigate video streams with high peaks is to use a technique often referred to as “constant bit rate” (CBR) encoding. The term CBR seems to mean that all frames are compressed to have the same bit rate (ie size), but it usually refers to a certain number of frames (here one frame) This is a compression paradigm where the maximum bit rate is allowed. For example, in the case of FIG. 6c, the compression algorithm uses 70% or more of the rated maximum data rate 621 when the CBR constraint is applied to an encoding that limits the bit rate to, for example, 70% of the rated maximum data rate 621. Thus, the compression of each frame is limited so that the frames that are normally compressed are compressed with a small number of bits. As a result, frames that require more bits than usual to maintain a given quality level result in a bit “deficiency” and the video quality of these frames requires more than 70% of the rated maximum data rate 621. Not worse than for other frames. This solution results in acceptable results for some types of compressed video where (a) there is little expected motion or scene change and (b) the user can accept periodic quality degradation. Can be generated. A good example of an application suitable for CBR is video teleconferencing. This means that if there are only a few peaks and the quality drops for a short time (eg, the camera pans to produce significant scene movement and large peaks, during which it is sufficient for high quality video compression. This is because most users will accept it if there is no bit and the video quality is degraded. Unfortunately, CBR is not well suited for many other applications that have very complex or many moving scenes and / or where a moderate level of quality is required.
一実施形態に使用される短待ち時間の圧縮ロジック404は、高いクオリティを維持しながら短待ち時間の圧縮ビデオをストリーミングすることに伴うある範囲の問題に対処するために多数の異なる技術を使用する。第1に、短待ち時間の圧縮ロジック404は、Iフレーム及びPフレームしか発生せず、各Bフレームをデコードするために多数のフレーム分の時間を待機する必要性を緩和する。更に、図7aに示すように、一実施形態では、短待ち時間の圧縮ロジック404は、各非圧縮フレーム701−760を一連の「タイル」へと細分化し、そして各タイルをIフレーム又はPフレームのいずれかとして個々にエンコードする。圧縮されたIフレーム及びPフレームのグループは、ここでは、「Rフレーム」711−770と称される。図7aに示す特定例では、各非圧縮フレームが、16タイルの4x4マトリクスへと細分化される。しかしながら、これらの基礎的な原理は、特定の細分化スキムに限定されない。 The low latency compression logic 404 used in one embodiment uses a number of different techniques to address a range of problems associated with streaming low latency compressed video while maintaining high quality. . First, the low latency compression logic 404 only generates I and P frames, alleviating the need to wait multiple frames of time to decode each B frame. Further, as shown in FIG. 7a, in one embodiment, the low latency compression logic 404 subdivides each uncompressed frame 701-760 into a series of “tiles” and each tile is an I or P frame. Encode individually as either. The group of compressed I and P frames is referred to herein as “R frames” 711-770. In the particular example shown in FIG. 7a, each uncompressed frame is subdivided into a 16 tile 4 × 4 matrix. However, these basic principles are not limited to specific subdivision schemes.
一実施形態では、短待ち時間の圧縮ロジック404は、ビデオフレームを多数のタイルに分割し、そして各フレームからの1つのタイルをIフレームとしてエンコード(即ち、圧縮)し(即ち、タイルは、フル映像サイズの1/16の個別ビデオフレームであるかのように圧縮され、この「ミニ」フレームに使用される圧縮は、Iフレーム圧縮である)、そして残りのタイルをPフレームとしてエンコード(即ち、圧縮)する(即ち、1/16の各「ミニ」フレームに使用される圧縮は、Pフレーム圧縮である)。Iフレーム及びPフレームとして圧縮されるタイルは、各々、「Iタイル」及び「Pタイル」と称される。各連続するビデオフレームでは、Iタイルとしてエンコードされるべきタイルが変化される。従って、所与のフレーム時間では、ビデオフレーム内のタイルのうちの1つのタイルだけがIタイルであり、そして残りのタイルがPタイルである。例えば、図7aでは、非圧縮フレーム701のタイル0がIタイルI0としてエンコードされ、そして残りの1−15タイルがPタイルP1−P15としてエンコードされ、Rフレーム711を形成する。次の非圧縮ビデオフレーム702では、非圧縮フレーム701のタイル1がIタイルI1としてエンコードされ、そして残りのタイル0及び2から15がPタイルP0及びP2からP15としてエンコードされ、Rフレーム712を形成する。従って、タイルとしてIタイル及びPタイルは、連続するフレームにわたり時間的に次々にインターリーブされる。このプロセスは、マトリクス内の最後のタイルがIタイル(即ち、I15)としてエンコードされてRタイル770が発生されるまで続く。次いで、このプロセスが再開されて、フレーム711のような別のRフレームを発生する(即ち、タイル0に対してIタイルをエンコードし、等々)。図7aには示されていないが、一実施形態では、Rフレームのビデオシーケンスのうちの第1のRフレームがIタイルしか含まない(即ち、その後のPフレームが、動きを計算するための基準映像データを有するように)。或いは又、一実施形態では、スタートアップシーケンスが、通常と同じIタイルパターンを使用するが、Iタイルでまだエンコードされていないタイルに対してPタイルを含まない。換言すれば、あるタイルは、第1のIタイルが到着するまでデータでエンコードされず、従って、以下に詳細に述べる図9aのビデオストリームデータレート934におけるスタートアップピークを回避する。更に、以下に述べるように、これらの基礎的な原理に依然適合しつつ、タイルに対して種々の異なるサイズ及び形状を使用することができる。 In one embodiment, the low latency compression logic 404 divides the video frame into a number of tiles and encodes (ie, compresses) one tile from each frame as an I frame (ie, the tile is full). Compressed as if it were 1/16 individual video frames of video size, the compression used for this “mini” frame is I frame compression), and the remaining tiles are encoded as P frames (ie, (Ie, the compression used for each 1/16 “mini” frame is P-frame compression). The tiles compressed as I and P frames are referred to as “I tile” and “P tile”, respectively. In each successive video frame, the tile to be encoded as an I tile is changed. Thus, for a given frame time, only one of the tiles in the video frame is an I tile and the remaining tiles are P tiles. For example, in FIG. 7 a, tile 0 of uncompressed frame 701 is encoded as I tile I 0 and the remaining 1-15 tiles are encoded as P tiles P 1 -P 15 to form R frame 711. In the next uncompressed video frame 702, tile 1 of uncompressed frame 701 is encoded as I tile I 1 and the remaining tiles 0 and 2 to 15 are encoded as P tiles P 0 and P 2 to P 15 , R A frame 712 is formed. Accordingly, the tiles I and P tiles are interleaved one after another over successive frames. This process continues until the last tile in the matrix is encoded as an I tile (ie, I 15 ) and an R tile 770 is generated. The process is then resumed to generate another R frame, such as frame 711 (ie, encoding an I tile for tile 0, etc.). Although not shown in FIG. 7a, in one embodiment, the first R frame of a video sequence of R frames contains only I tiles (ie, subsequent P frames are the basis for calculating motion). To have video data). Alternatively, in one embodiment, the startup sequence uses the same I tile pattern as normal, but does not include P tiles for tiles that are not yet encoded with I tiles. In other words, some tiles are not encoded with data until the first I tile arrives, thus avoiding the startup peak at the video stream data rate 934 of FIG. 9a, described in detail below. Further, as described below, a variety of different sizes and shapes can be used for the tiles while still conforming to these basic principles.
クライアント415で実行されるビデオ解凍ロジック412は、各タイルを、小さなI及びPフレームの個別のビデオシーケンスであるかのように解凍し、次いで、各タイルをフレームバッファドライブディスプレイ装置422へレンダリングする。例えば、Rフレーム711ないし770からのI0及びP0を使用して、ビデオ映像のタイル0を解凍し、レンダリングする。同様に、Rフレーム711ないし770からのI1及びP1を使用して、タイル1を再構成し、等々となる。上述したように、Iフレーム及びPフレームの解凍は、良く知られた技術であり、Iタイル及びPタイルの解凍は、クライアント415で実行されるビデオ解凍の複数のインスタンスを得ることにより遂行することができる。乗算プロセスは、クライアント415の計算負担を増大すると思われるが、実際には、そうではない。というのは、タイルそれ自体は、付加的なプロセスの数に対し比例的に小さく、従って、表示されるピクセルの数は、1つのプロセスがあって従来のフルサイズのI及びPフレームを使用する場合と同じだからである。 Video decompression logic 412 executed at client 415 decompresses each tile as if it were a separate video sequence of small I and P frames, and then renders each tile to frame buffer drive display device 422. For example, I 0 and P 0 from R frames 711 to 770 are used to decompress and render tile 0 of the video footage. Similarly, tile 1 is reconstructed using I 1 and P 1 from R frames 711-770, and so on. As described above, I-frame and P-frame decompression is a well-known technique, and I-tile and P-tile decompression is accomplished by obtaining multiple instances of video decompression performed by client 415. Can do. Although the multiplication process appears to increase the computational burden on the client 415, in practice it is not. This is because the tile itself is proportionally smaller with respect to the number of additional processes, so the number of pixels displayed is one process and uses conventional full size I and P frames. Because it is the same as the case.
このRフレーム技術は、図6b及び6cに示したIフレームに典型的に関連した帯域巾ピークを著しく軽減する。というのは、所与のフレームが、大抵は、Iフレームより典型的に小さなPフレームで作られるからである。例えば、典型的なIフレームが160Kbであると再び仮定すれば、図7aに示す各フレームのIタイルは、この量のほぼ1/16即ち10Kbとなる。同様に、典型的なPフレームが16Kbであると仮定すれば、図7aに示す各タイルのPフレームは、ほぼ1Kbとなる。最終の結果として、ほぼ10Kb+15*1Kb=25KbのRフレームとなる。従って、各60フレームシーケンスは、25Kb*60=1.5Mbpsとなる。従って、60フレーム/秒では、これは、1.5Mbpsの帯域巾を維持することのできるチャンネルを要求するが、Iタイルのために相当に低いピークが60フレームインターバル全体にわたって分布される。 This R frame technique significantly reduces the bandwidth peaks typically associated with the I frames shown in FIGS. 6b and 6c. This is because a given frame is usually made up of P frames that are typically smaller than I frames. For example, assuming again that a typical I frame is 160 Kb, the I tile of each frame shown in FIG. 7 a will be approximately 1/16 of this amount, or 10 Kb. Similarly, assuming that a typical P frame is 16 Kb, the P frame of each tile shown in FIG. 7 a is approximately 1 Kb. The final result is an R frame of approximately 10 Kb + 15 * 1 Kb = 25 Kb. Therefore, each 60 frame sequence is 25 Kb * 60 = 1.5 Mbps. Thus, at 60 frames / second, this requires a channel that can maintain a bandwidth of 1.5 Mbps, but fairly low peaks for I tiles are distributed throughout the 60 frame interval.
Iフレーム及びPフレームに対して同じデータレートを仮定した先の例では、平均データレートが1.1Mbpsであったことに注意されたい。これは、先の例では、新たなIフレームが60フレームの時間ごとに一度しか導入されず、一方、この例では、16フレームの時間、ひいては、Iフレームに等しい時間でIフレームサイクルを作り上げる16個のタイルが16フレームの時間ごとに導入され、著しく高い平均データレートとなるからである。実際に、より頻繁にIフレームを導入しても、データレートを直線的に高めることはない。これは、Pフレーム(又はPタイル)が主として手前のフレームから次のフレームへの相違をエンコードするという事実のためである。従って、手前のフレームが次のフレームにかなり類似している場合には、Pフレームが非常に小さくなり、一方、手前のフレームが次のフレームとかなり相違がある場合には、Pフレームが非常に大きくなる。しかし、Pフレームは、主として、実際のフレームではなく、手前のフレームから導出されるので、それにより生じるエンコードされたフレームは、充分なビット数でIフレームより大きなエラー(例えば、視覚欠陥)を含むことができる。そして、1つのPフレームに別のPフレームが続くときには、エラーの蓄積が生じ、長いシーケンスのPフレームがあるときには悪化する。ここで、精巧なビデオコンプレッサは、一連のPフレームの後に映像のクオリティが低下することを検出し、必要に応じて、より多くのビットをその後続Pフレームに割り当てて、クオリティを上げるか、又はそれが最も効率的なアクションのコースである場合には、PフレームをIフレームに置き換える。従って、長いシーケンスのPフレーム(例えば、上述した例のように59個のPフレーム)が使用されるとき、特に、シーンが多大な複雑さ及び/又は動きを有するときには、典型的に、PフレームがIフレームから更に離れるにつれて、より多くのビットがPフレームに必要とされる。 Note that in the previous example assuming the same data rate for I and P frames, the average data rate was 1.1 Mbps. This is because, in the previous example, a new I frame is introduced only once every 60 frames of time, whereas in this example, an I frame cycle is created in a time of 16 frames and thus a time equal to the I frame. This is because tiles are introduced every 16 frames, resulting in a significantly higher average data rate. In fact, even more frequently introducing I frames does not increase the data rate linearly. This is due to the fact that the P frame (or P tile) encodes the difference from the previous frame to the next frame. Thus, if the previous frame is quite similar to the next frame, the P frame will be very small, while if the previous frame is quite different from the next frame, the P frame will be very growing. However, since the P frame is derived primarily from the previous frame, not the actual frame, the resulting encoded frame contains a larger number of bits (eg, visual defects) than the I frame. be able to. Error accumulation occurs when one P frame is followed by another P frame, and worsens when there is a long sequence of P frames. Here, an elaborate video compressor detects that the video quality is degraded after a series of P frames and allocates more bits to its subsequent P frames as needed to increase the quality, or If it is the most efficient course of action, replace the P frame with an I frame. Thus, when a long sequence of P-frames is used (eg, 59 P-frames as in the example above), typically when the scene has a great deal of complexity and / or motion, As is further away from the I frame, more bits are needed in the P frame.
或いは、Pフレームを逆の視点から見ると、Iフレームに接近して続くPフレームは、Iフレームから更に離れたPフレームよりビットを必要としない傾向がある。従って、図7aに示す例では、先行するIフレームから15フレーム以上離れたPフレームはなく、一方、先の例では、Pフレームは、Iフレームから59フレーム離れることができる。従って、より頻繁にIフレームがあると、Pフレームは、より小さくなる。もちろん、厳密な相対的サイズは、ビデオストリームの性質に基づいて変化するが、図7aの例では、Iタイルが10Kbである場合、Pタイルは、平均で、0.75Kbのみのサイズとなり、10Kb+15*0.75Kb=21.25Kbとなるか、又は60フレーム/秒では、データレートは、21.25Kb*60=1.3Mbpsとなり、又はIフレームの後に59個のPフレームが続く1.1Mbpsのストリームより約16%高いデータレートとなる。この場合も、ビデオ圧縮に対するこれら2つの解決策間の相対的な結果は、ビデオシーケンスに基づいて変化するが、典型的に、Rフレームを使用すると、I/Pフレームシーケンスを使用する場合より、所与のクオリティレベルに対して約20%多くのビットを要求することが実験で分かった。しかし、当然、Rフレームは、ピークを劇的に減少させ、I/Pフレームシーケンスより遥かに短い待ち時間でビデオシーケンスを使用可能にする。 Alternatively, when viewing the P frame from the opposite perspective, the P frame that follows the I frame tends to require fewer bits than the P frame that is further away from the I frame. Accordingly, in the example shown in FIG. 7a, there is no P frame that is 15 frames or more away from the preceding I frame, while in the previous example, the P frame can be 59 frames away from the I frame. Therefore, the more frequently there are I frames, the smaller the P frames. Of course, the exact relative size will vary based on the nature of the video stream, but in the example of FIG. 7a, if the I tile is 10Kb, the P tile will average only 0.75Kb in size and 10Kb + 15 * 0.75Kb = 21.25Kb, or at 60 frames / second, the data rate is 21.25Kb * 60 = 1.3Mbps, or 1.1Mbps with 59 P frames followed by I frames The data rate is about 16% higher than the stream. Again, the relative results between these two solutions for video compression will vary based on the video sequence, but typically using R frames is more than using I / P frame sequences. Experiments have shown that it requires about 20% more bits for a given quality level. However, of course, R frames dramatically reduce peaks and enable video sequences with much lower latency than I / P frame sequences.
Rフレームは、ビデオシーケンスの性質、チャンネルの信頼性、及び利用できるデータレートに基づいて、種々の異なる仕方で構成することができる。別の実施形態では、4x4構成の16とは異なる数のタイルが使用される。例えば、2枚のタイルを2x1又は1x2構成で使用することができ、4枚のタイルを2x2、4x1又は1x4構成で使用することができ、6枚のタイルを3x2、2x3、6x1又は1x6構成で使用することができ、或いは8枚のタイルを4x2(図7bに示すような)、2x4、8x1又は1x8構成で使用することができる。タイルは、方形である必要がなく、又、ビデオフレームも、方形又は長方形である必要がないことに注意されたい。タイルは、使用するビデオフレーム及びアプリケーションに最も適した形状に分割することができる。 R frames can be configured in a variety of different ways, depending on the nature of the video sequence, channel reliability, and available data rates. In another embodiment, a different number of tiles than 16 in a 4x4 configuration is used. For example, 2 tiles can be used in a 2x1 or 1x2 configuration, 4 tiles can be used in a 2x2, 4x1 or 1x4 configuration, and 6 tiles can be used in a 3x2, 2x3, 6x1 or 1x6 configuration. Eight tiles can be used in a 4x2 (as shown in Fig. 7b), 2x4, 8x1 or 1x8 configuration. Note that the tiles do not need to be square and the video frames need not be square or rectangular. The tiles can be divided into shapes that are most suitable for the video frame and application to be used.
別の実施形態では、I及びPタイルのサイクルがタイルの数に固定されない。例えば、8タイルの4x2構成では、図7bに示すように16サイクルシーケンスを依然使用することができる。順次の非圧縮フレーム721、722、723は、各々、8枚のタイル、0−7に分割され、各タイルが個々に圧縮される。Rフレーム731から、タイル0だけがIタイルとして圧縮され、残りのタイルは、Pタイルとして圧縮される。その後のRフレーム732については、8枚のタイル全部がPタイルとして圧縮され、次いで、その後のRフレーム733については、タイル1がIタイルとして圧縮され、そして他のタイル全部がPタイルとして圧縮される。従って、16個のフレームについてシーケンスが続き、Iタイルは、1つおきのフレームのみに発生され、最後のIタイルは、15番目のフレーム時間中にタイル7について発生され(図7bには示さず)、そして第16番目のフレーム時間中に、全Pタイルを使用してRフレーム780が圧縮される。次いで、タイル0がIタイルとして圧縮されそして他のタイルがPタイルとして圧縮されるようにしてシーケンスが再開される。先の実施形態と同様に、全ビデオシーケンスの各第1フレームは、典型的に、全てIタイルであり、その点から前方へのPタイルの基準を与える。Iタイル及びPタイルのサイクルは、タイルの数の偶数倍である必要がない。例えば、8枚のタイルでは、Iタイルをもつ各フレームの後に、全てPタイルをもつ2つのフレームが続き、その後に、別のIタイルが使用される。更に別の実施形態では、あるタイルは、例えば、スクリーンのあるエリアがより多くの動きを有し頻繁なIタイルを要求すると分かっているが、他のエリアはより静的であって(例えば、ゲームのスコアを示す)頻繁なIタイルをほとんど要求しない場合に、Iタイルが他のタイルより頻繁にある状態でシーケンスされる。更に、各フレームは、図7a−bにおいて単一のIタイルと共に示されているが、(送信チャンネルの帯域巾に基づいて)単一のフレーム内で複数のIタイルをエンコードすることもできる。逆に、あるフレーム又はフレームシーケンスを、Iタイルなしで(即ち、Pタイルのみで)送信することもできる。 In another embodiment, the cycle of I and P tiles is not fixed to the number of tiles. For example, in an 8 tile 4x2 configuration, a 16 cycle sequence can still be used as shown in Figure 7b. The sequential uncompressed frames 721, 722, 723 are each divided into 8 tiles, 0-7, and each tile is individually compressed. From R frame 731, only tile 0 is compressed as an I tile, and the remaining tiles are compressed as P tiles. For subsequent R frame 732, all 8 tiles are compressed as P tiles, then for subsequent R frame 733, tile 1 is compressed as an I tile and all other tiles are compressed as P tiles. The Thus, the sequence continues for 16 frames, and I tiles are generated only for every other frame, and the last I tile is generated for tile 7 during the 15th frame time (not shown in FIG. 7b). ), And during the 16th frame time, the R frame 780 is compressed using all P tiles. The sequence is then resumed, with tile 0 being compressed as an I tile and the other tiles being compressed as P tiles. Similar to the previous embodiment, each first frame of the entire video sequence is typically all I tiles, giving a reference of P tiles forward from that point. The cycle of I and P tiles need not be an even multiple of the number of tiles. For example, with eight tiles, each frame with an I tile is followed by two frames, all with P tiles, followed by another I tile. In yet another embodiment, some tiles have been found to have more movement and require more frequent I tiles, for example, while other areas are more static (e.g., If few frequent I tiles are required (indicating game scores), the I tile is sequenced more frequently than the other tiles. Further, although each frame is shown with a single I tile in FIGS. 7a-b, multiple I tiles may be encoded within a single frame (based on the transmission channel bandwidth). Conversely, a frame or frame sequence can be transmitted without I tiles (ie, only with P tiles).
先の段落で述べた解決策が良く機能する理由は、各単一フレームにわたってIタイルを分布させないことで、大きなピークを生じると思われるが、システムの挙動は、そのように単純ではないことである。各タイルは、他のタイルとは個別に圧縮されるので、タイルが小さくなるほど、各タイルのエンコーディングは、効率的でなくなる。というのは、所与のタイルのコンプレッサが、他のタイルからの類似映像特徴及び類似の動きを利用できないためである。従って、スクリーンを16枚のタイルに分割すると、一般的に、スクリーンを8枚のタイルに分割する場合よりエンコーディングの効率が低下する。しかし、スクリーンが8枚のタイルに分割され、そして全Iフレームのデータを、16フレームごとではなく8フレームごとに導入させる場合には、全体的に非常に高いデータレートとなる。従って、8フレームごとではなく16フレームごとに全Iフレームを導入することにより、全体的なデータレートが減少される。又、16枚の小さなタイルではなく8枚の大きなタイルを使用することにより、全データレートが減少され、大きなタイルにより生じるデータピークをある程度軽減させる。 The reason why the solution described in the previous paragraph works well is that the distribution of I tiles over each single frame seems to cause a big peak, but the behavior of the system is not that simple. is there. Each tile is compressed separately from the other tiles, so the smaller the tile, the less efficient the encoding of each tile. This is because the compressor for a given tile cannot take advantage of similar video features and similar motion from other tiles. Therefore, dividing the screen into 16 tiles generally results in lower encoding efficiency than dividing the screen into 8 tiles. However, if the screen is divided into 8 tiles and all I-frame data is introduced every 8 frames instead of every 16 frames, the overall data rate is very high. Thus, by introducing all I frames every 16 frames instead of every 8 frames, the overall data rate is reduced. Also, by using 8 large tiles instead of 16 small tiles, the overall data rate is reduced, reducing the data peaks caused by the large tiles to some extent.
別の実施形態では、図7a及び7bの短待ち時間のビデオ圧縮ロジック404は、Rフレームにおける種々のタイルへのビットの割り当てを、圧縮されるべきビデオシーケンスの既知の特性に基づく設定で予め構成することにより、或いは各タイルにおける映像クオリティの進行中の分析に基づいて自動的に、コントロールする。例えば、ある競争ビデオゲームでは、(シーンにおいて比較的動きの少ない)プレーヤの車の前部が、シーンの下半分の大部分を占有し、一方、シーンの上半分が、ほぼ常に動いている接近する道路、ビル及び風景で完全に埋められる。圧縮ロジック404が各タイルに等しい数のビットを割り当てる場合には、図7bの非圧縮フレーム721のスクリーンの下半分のタイル(タイル4−7)が、一般的に、図7bの非圧縮フレーム721のスクリーンの上半分のタイル(タイル0−3)より高いクオリティで圧縮される。この特定のゲーム又はゲームのこの特定のシーンがこのような特性を有すると分かっている場合には、ホスティングサービス210のオペレータは、スクリーンの下部のタイルよりスクリーンの上部のタイルにより多くのビットを割り当てるように圧縮ロジック404を構成することができる。或いは、圧縮ロジック404は、フレームが圧縮された後に(ピーク信号対雑音比(PSNR)のような多数の圧縮クオリティメトリックの1つ以上を使用して)タイルの圧縮のクオリティを評価することができ、そしてある時間ウインドウにわたり、あるタイルが高いクオリティの結果を一貫して生じると決定する場合に、種々のタイルが同様のクオリティレベルに達するまで、低いクオリティの結果を生じるタイルにより多くのビットを徐々に割り当てる。別の実施形態では、圧縮ロジック404は、特定のタイル又はタイルのグループに高いクオリティを得るようにビットを割り当てる。例えば、スクリーンの縁より中心部のクオリティを高くするように全体的に良好な知覚上の見掛けを与えることができる。 In another embodiment, the low latency video compression logic 404 of FIGS. 7a and 7b preconfigures the allocation of bits to various tiles in an R frame with settings based on known characteristics of the video sequence to be compressed. Or automatically based on ongoing analysis of video quality in each tile. For example, in a competitive video game, the front of the player's car (which has relatively little movement in the scene) occupies most of the lower half of the scene, while the upper half of the scene is almost always moving. Completely filled with roads, buildings and landscapes. If compression logic 404 assigns an equal number of bits to each tile, the lower half tile (tile 4-7) of the uncompressed frame 721 screen of FIG. 7b is typically the uncompressed frame 721 of FIG. The screen is compressed with higher quality than the upper half tiles (tiles 0-3). If this particular game or this particular scene of the game is known to have such characteristics, the hosting service 210 operator allocates more bits to the top tile of the screen than to the bottom tile of the screen. The compression logic 404 can be configured as follows. Alternatively, the compression logic 404 can evaluate the quality of tile compression after the frame is compressed (using one or more of a number of compression quality metrics such as peak signal-to-noise ratio (PSNR)). And gradually determine that a tile will consistently produce a high quality result over a time window until the various tiles reach a similar quality level and gradually give more bits to the tile that produces a lower quality result. Assign to. In another embodiment, compression logic 404 assigns bits to obtain a high quality for a particular tile or group of tiles. For example, an overall good perceptual appearance can be given so that the quality of the central part is higher than the edge of the screen.
一実施形態では、ビデオストリームのある領域の解像度を改善するために、ビデオ圧縮ロジック404は、シーンの複雑さ及び/又は動きが比較的大きいビデオスクリーンのエリアを、シーンの複雑さ及び/又は動きが比較的小さいビデオスクリーンのエリアより小さいタイルを使用してエンコードする。例えば、図8に示すように、1つのRフレーム811の1つのエリア内の動くキャラクタ805の周りに小さなタイルが使用される(潜在的に、その後に、同じタイルサイズをもつ一連のRフレーム(図示せず)が続く)。次いで、キャラクタ805が映像の新たなエリアへ移動すると、図示されたように、別のRフレーム812内のこの新たなエリアの周りに小さなタイルが使用される。上述したように、これらの基礎的な原理に依然合致しながら、種々の異なるサイズ及び形状を「タイル」として使用することができる。 In one embodiment, to improve the resolution of certain areas of the video stream, video compression logic 404 may use areas of the video screen with relatively large scene complexity and / or motion as scene complexity and / or motion. Encode using tiles that are smaller than a relatively small video screen area. For example, as shown in FIG. 8, small tiles are used around a moving character 805 in one area of one R frame 811 (potentially a series of R frames with the same tile size ( (Not shown))). Then, when the character 805 moves to a new area of the video, small tiles are used around this new area in another R frame 812 as shown. As mentioned above, a variety of different sizes and shapes can be used as “tiles” while still meeting these basic principles.
上述した循環するI/Pタイルは、ビデオストリームのデータレートのピークを実質的に減少するが、特に、動画、ビデオゲーム及びあるアプリケーションソフトウェアで発生する急速に変化する又は非常に複雑なビデオ映像の場合には、ピークを完全に排除することができない。例えば、突然のシーンの移行中に、複雑なフレームの後に、完全に異なる別の複雑なフレームが続くことがある。多数のIタイルが若干のフレームの時間だけシーンの移行に先行することがあっても、それらは、この状態において助けとならない。というのは、新たなフレーム資料が手前のIタイルと関係がないからである。このような状態(及び何もかもが変化しなくても、多くの映像が変化する他の状態)では、ビデオコンプレッサ404は、Pタイルの全部でなくてもその多くがIタイルとしてより効率的にコード化され、その結果、そのフレームに対するデータレートに非常に大きなピークが生じると決定する。 The cyclic I / P tiles described above substantially reduce the peak data rate of the video stream, but especially for rapidly changing or very complex video footage that occurs in video, video games and certain application software. In some cases, the peaks cannot be completely eliminated. For example, during a sudden scene transition, a complex frame may be followed by another completely different complex frame. Even if a large number of I tiles may precede the scene transition by some frame time, they do not help in this situation. This is because the new frame material is not related to the previous I tile. In this state (and other states where many videos change even if everything has changed), video compressor 404 can code more efficiently as I tiles, if not all of the P tiles. As a result, it is determined that a very large peak occurs in the data rate for the frame.
上述したように、ほとんどの消費者グレードのインターネット接続(及び多くのオフィス接続)では、図6cに622として示す利用可能な最大データレートを越えるデータを定格最大データレート621と共に「ジャム(jam)」することが単純に実行できないケースがある。定格最大データレート621(例えば、“6Mbps DSL”)は、インターネット接続の購入を考えるユーザにとって本質的にマーケッティングナンバーであるが、一般的に、性能のレベルを保証するものではない。本発明の説明上、これは、無関係である。というのは、ビデオが接続を通してストリーミングされるときには、利用可能な最大データレート622だけが問題だからである。その結果、図9a及び9cにおいて、ピークの問題に対する解決策を説明するときに、定格最大データレートがグラフから削除され、利用可能な最大データレート922だけが示される。ビデオストリームデータレートは、利用可能な最大データレート922を越えてはならない。 As noted above, for most consumer grade Internet connections (and many office connections), data exceeding the maximum available data rate shown as 622 in FIG. 6c is “jam” along with the rated maximum data rate 621. There are cases where it is simply not feasible. The rated maximum data rate 621 (eg, “6 Mbps DSL”) is essentially a marketing number for users considering purchasing an Internet connection, but generally does not guarantee a level of performance. For the purposes of the present invention this is irrelevant. This is because only the maximum available data rate 622 is a problem when video is streamed through a connection. As a result, in FIGS. 9a and 9c, when describing a solution to the peak problem, the rated maximum data rate is removed from the graph and only the maximum data rate 922 available is shown. The video stream data rate should not exceed the maximum available data rate 922.
これに対処するために、ビデオコンプレッサ404が第1に実行すべきことは、チャンネルが着実に取り扱うことのできるデータレートであるピークデータレート941を決定することである。このレートは、多数の技術によって決定することができる。1つのこのような技術は、図4a及び4bにおいて、ホスティングサービス210からクライアント415へ次第に高いデータレートテストストリームを徐々に送信し、そしてクライアントがパケットロス及び待ち時間のレベルに関してホスティングサービスへフィードバックを与えるようにさせるものである。パケットロス及び/又は待ち時間が鋭い増加を示し始めるときには、それは、利用可能な最大データレート922に到達しつつあるという指示である。その後、ホスティングサービス210は、適度な期間中受け容れられるパケットロスレベルでテストストリームが受信され且つ待ち時間がほぼ最小であることをクライアント415が報告するまで、テストストリームのデータレートを徐々に減少することができる。これは、ピーク最大データレート941を確立し、これは、次いで、ストリーミングビデオのためのピークデータレートとして使用される。時間と共に、ピークデータレート941が変動し(例えば、家の別のユーザがインターネット接続を激しく使用し始める場合に)、そしてクライアント415は、それを常時監視して、パケットロス又は待ち時間が増大するかどうか調べる必要があり、利用可能な最大データレート922が以前に確立されたピークデータレート941より降下することを指示し、そしてもしそうであれば、ピークデータレート941を指示する。同様に、時間と共に、クライアント415は、パケットロス及び待ち時間が最適なレベルに保たれることを見つけた場合には、ビデオコンプレッサがデータレートをゆっくり増加して利用可能な最大データレートが増加したかどうか調べることを要求でき(例えば、家の別のユーザがインターネット接続の激しい使用を止めた場合に)、そして利用可能な最大データレート922を越えたことをパケットロス及び/又は長い待ち時間が指示し、ピークデータレート941に対して低いレベルを再び見つけることができるが、それがおそらく増加データレートのテストの前のレベルより高いものとなるまで、再び待機する。従って、この技術(及びそれに類似した他の技術)を使用することにより、ピークデータレート941を見つけて、必要に応じて、周期的に調整することができる。ピークデータレート941は、ユーザへビデオをストリーミングするためにビデオコンプレッサにより使用できる最大データレートを確立する。ピークデータレートを決定するためのロジックは、ユーザの家屋211及び/又はホスティングサービス210において具現化することができる。ユーザの家屋211において、クライアント装置415は、計算を行ってピークデータレートを決定し、そしてその情報をホスティングサービス210へ返送し、ホスティングサービス210において、ホスティングサービスのサーバー402は、クライアント415から受け取った統計情報(例えば、パケットロス、待ち時間、最大データレート、等)に基づいて、計算を行ってピークデータレートを決定する。 To address this, the first thing the video compressor 404 should do is determine a peak data rate 941, which is the data rate that the channel can handle steadily. This rate can be determined by a number of techniques. One such technique, in FIGS. 4a and 4b, gradually sends a progressively higher data rate test stream from the hosting service 210 to the client 415, and the client provides feedback to the hosting service regarding packet loss and latency levels. It is what makes you When packet loss and / or latency begins to show a sharp increase, it is an indication that the maximum available data rate 922 is being reached. Thereafter, the hosting service 210 gradually reduces the data rate of the test stream until the client 415 reports that the test stream is received at a packet loss level that is acceptable for a reasonable period of time and the latency is approximately minimal. be able to. This establishes a peak maximum data rate 941, which is then used as the peak data rate for streaming video. Over time, the peak data rate 941 fluctuates (eg, when another user in the home begins to use the Internet connection heavily) and the client 415 constantly monitors it, increasing packet loss or latency. Indicates that the maximum available data rate 922 falls below the previously established peak data rate 941, and if so, indicates the peak data rate 941. Similarly, over time, if client 415 finds that packet loss and latency are kept at an optimal level, the video compressor will slowly increase the data rate to increase the maximum available data rate. Packet loss and / or long latency that the maximum available data rate 922 has been exceeded (for example, if another user at home stops heavy use of the Internet connection) You can again find a low level for the peak data rate 941, but wait again until it is probably higher than the previous level of the increased data rate test. Thus, by using this technique (and other techniques similar to it), the peak data rate 941 can be found and adjusted periodically as needed. The peak data rate 941 establishes the maximum data rate that can be used by the video compressor to stream video to the user. The logic for determining the peak data rate can be embodied in the user's home 211 and / or hosting service 210. In the user's home 211, the client device 415 performs calculations to determine the peak data rate and returns that information to the hosting service 210, where the hosting service server 402 received from the client 415. Based on statistical information (eg, packet loss, latency, maximum data rate, etc.), calculations are performed to determine the peak data rate.
図9aは、図7a、7b及び図8に示されて上述した循環I/Pタイル圧縮技術を使用して発生された実質的なシーンの複雑さ及び/又は動きを有するビデオストリームデータレート934を例示する。ビデオコンプレッサ404は、ピークデータレート941より低い平均データレートで圧縮ビデオを出力するように構成され、ほとんどの時間、ビデオストリームデータレートは、ピークデータレート941より低く保たれることに注意されたい。I/P/B又はI/Pフレームを使用して生成された図6cに示すビデオストリームデータレート634とデータレート934との比較は、循環I/Pタイル圧縮が非常に滑らかなデータレートを発生することを示している。更に、フレーム2xピーク952(これは2xピークデータレート942に接近する)及びフレーム4xピーク954(これは4xピークデータレート944に接近する)において、データレートは、ピークデータレート941を越え、受け容れられない。実際に、迅速に変化するビデオゲームからの高アクションビデオでも、ピークデータレート941を越えるピークがフレームの2%未満で発生し、2xピークデータレート942を越えるピークがまれに発生し、そして3xピークデータレート943を越えるピークはほとんど発生しない。しかし、それらが(例えば、シーンの移行中に)発生するときには、それらによって要求されるデータレートは、良好なクオリティのビデオ映像を発生するのに必要なものである。 FIG. 9a illustrates a video stream data rate 934 having substantial scene complexity and / or motion generated using the cyclic I / P tile compression technique shown in FIGS. 7a, 7b and 8 and described above. Illustrate. Note that the video compressor 404 is configured to output compressed video at an average data rate that is lower than the peak data rate 941, and most of the time, the video stream data rate is kept below the peak data rate 941. Comparison of video stream data rate 634 and data rate 934 shown in FIG. 6c generated using I / P / B or I / P frames shows that cyclic I / P tile compression produces a very smooth data rate It shows that Further, at frame 2x peak 952 (which approaches 2x peak data rate 942) and frame 4x peak 954 (which approaches 4x peak data rate 944), the data rate exceeds peak data rate 941 and is acceptable. I can't. In fact, even high action video from rapidly changing video games, peaks above peak data rate 941 occur in less than 2% of the frame, peaks in excess of 2x peak data rate 942 occur infrequently, and 3x peak A peak exceeding the data rate 943 hardly occurs. However, when they occur (e.g., during scene transitions), the data rate required by them is necessary to produce a good quality video image.
この問題を解決する1つの方法は、最大データレート出力がピークデータレート941となるようにビデオコンプレッサ404を単に構成することである。不都合なことに、それによりピークフレーム中に生じるビデオ出力のクオリティは、圧縮アルゴリズムがビットについて「欠乏」しているので、不充分である。その結果、突然の移行又は高速な動きがあるときに圧縮欠陥が現れ、やがて、ユーザは、突然の変化又は急速な動きがあるときに常に欠陥が現れ、それが極めて迷惑であることを悟る。 One way to solve this problem is to simply configure the video compressor 404 such that the maximum data rate output is the peak data rate 941. Unfortunately, the quality of the video output that results during the peak frame is insufficient because the compression algorithm is “deficient” in bits. As a result, a compression defect appears when there is a sudden transition or fast movement, and eventually the user realizes that a defect always appears when there is a sudden change or rapid movement, which is extremely annoying.
人間の視覚系は、突然の変化又は急速な動きの間に現れる視覚上の欠陥には極めて敏感であるが、このような状態におけるフレームレートの減少の検出にはあまり敏感でない。実際に、このような突然の変化が生じたときに、人間の視覚系は、変化を追跡することに心を奪われ、フレームレートが短時間で60fpsから30fpsへ降下し、次いで、即座に60fpsへ復帰することに気付かないと思われる。そして、突然のシーンの切り換えのような非常に急激な移行の場合には、人間の視覚系は、フレームレートが20fps又は15fpsへ降下し、次いで、即座に60fpsへ戻ることに気付かない。観察する人間にとってフレームレートの減少が時々生じるだけである限り、ビデオは、60fpsで連続的に動作したかのように見える。 The human visual system is very sensitive to visual defects that appear during sudden changes or rapid movements, but is less sensitive to detection of frame rate reduction in such conditions. In fact, when such a sudden change occurs, the human visual system is fascinated by tracking the change, the frame rate drops from 60 fps to 30 fps in a short time, and then instantly 60 fps. It seems that he / she does not notice to return to. And in the case of a very rapid transition, such as a sudden scene change, the human visual system is unaware that the frame rate drops to 20 fps or 15 fps and then immediately returns to 60 fps. As long as the frame rate decrease only occasionally occurs for the observing person, the video will appear as if it has run continuously at 60 fps.
人間の視覚系のこの特性は、図9bに示す技術により利用される。サーバー402(図4a及び4bからの)は、一定のフレームレート(一実施形態では60fps)の非圧縮ビデオ出力ストリームを発生する。時間線は、各フレーム961−970を各々1/60秒で示している。各非圧縮ビデオフレームは、フレーム961でスタートして、短待ち時間のビデオコンプレッサ404へ出力され、これは、フレームを1フレーム時間未満で圧縮し、第1フレームとして圧縮フレーム1 981を発生する。圧縮フレーム1 981に対して発生されるデータは、上述したように、多数のファクタに基づいて大きくてもよいし小さくてもよい。データが、フレーム時間(1/60秒)内又はピークデータレート941未満でクライアント415へ送信できるに充分なほど小さい場合には、それが送信時間(xmit時間)991中に送信される(矢印の長さは、送信時間の巾を示す)。次のフレーム時間において、サーバー402は、非圧縮フレーム2 962を発生し、これは、圧縮フレーム2 982へと圧縮され、そしてピークデータレート941においてフレーム時間未満である送信時間992中にクライアント415へ送信される。 This property of the human visual system is exploited by the technique shown in FIG. 9b. Server 402 (from FIGS. 4a and 4b) generates an uncompressed video output stream at a constant frame rate (60 fps in one embodiment). The time line shows each frame 961-970 in 1/60 second each. Each uncompressed video frame starts at frame 961 and is output to the low latency video compressor 404, which compresses the frame in less than one frame time and generates compressed frame 1 981 as the first frame. The data generated for compressed frame 1 981 may be large or small based on a number of factors, as described above. If the data is small enough to be transmitted to the client 415 within a frame time (1/60 second) or less than the peak data rate 941, it is transmitted during the transmission time (xmit time) 991 (arrowed) The length indicates the width of the transmission time). At the next frame time, server 402 generates uncompressed frame 2 962, which is compressed into compressed frame 2 982, and to client 415 during transmission time 992, which is less than the frame time at peak data rate 941. Sent.
次いで、次のフレーム時間に、サーバー402は、非圧縮フレーム3 963を発生する。これがビデオコンプレッサ404により圧縮されると、それにより生じる圧縮フレーム3 983は、1フレーム時間にピークデータレート941で送信できる以上のデータとなる。従って、それは、全フレーム時間と次のフレーム時間の一部分とを取り上げた送信時間(2xピーク)993中に送信される。ここで、次のフレーム時間中に、サーバー402は、別の非圧縮フレーム4 964を発生し、それをビデオコンプレッサ404へ出力するが、データは、無視され、974で示されている。これは、ビデオコンプレッサ404が、手前の圧縮フレームをまだ送信している間に到着する更に別の非圧縮ビデオフレームを無視するように構成されているからである。もちろん、クライアント415のビデオデコンプレッサは、フレーム4を受信せず、2フレームの時間中、フレーム3をディスプレイ装置422に単に表示し続ける(即ち、フレームレートを60fpsから30fpsへ簡単に減少する)。 Then, at the next frame time, server 402 generates uncompressed frame 3 963. When this is compressed by the video compressor 404, the resulting compressed frame 3 983 is more data than can be transmitted at the peak data rate 941 per frame time. Therefore, it is transmitted during a transmission time (2x peak) 993 taking up the entire frame time and a portion of the next frame time. Here, during the next frame time, server 402 generates another uncompressed frame 4 964 and outputs it to video compressor 404, but the data is ignored and is shown at 974. This is because the video compressor 404 is configured to ignore further uncompressed video frames that arrive while still transmitting the previous compressed frame. Of course, the video decompressor of client 415 does not receive frame 4 and simply continues to display frame 3 on display device 422 for a duration of 2 frames (ie, the frame rate is simply reduced from 60 fps to 30 fps).
次のフレーム5に対して、サーバー402は、非圧縮フレーム5 965を出力し、これは、圧縮フレーム5 985へと圧縮され、そして送信時間995中の1フレーム以内に送信される。クライアント415のビデオデコンプレッサは、フレーム5を解凍し、ディスプレイ装置422に表示する。次いで、サーバー402は、非圧縮フレーム6 966を出力し、ビデオコンプレッサ404は、それを圧縮フレーム6 986へと圧縮するが、このときには、得られるデータが非常に長い。圧縮フレームは、送信時間(4xピーク)996中にピークデータレート941で送信されるが、フレームを送信するのに、ほぼ4フレームの時間を要する。次の3フレームの時間中に、ビデオコンプレッサ404は、サーバー402からの3フレームを無視し、そしてクライアント415のデコンプレッサは、フレーム6を4フレームの時間中にディスプレイ装置422に着実に保持する(即ち、フレームレートを60fpsから15fpsへ簡単に減少する)。次いで、最終的に、サーバー402は、フレーム10 970を出力し、ビデオコンプレッサ404は、それを圧縮フレーム10 987へ圧縮し、これは、送信時間997中に送信され、そしてクライアント415のデコンプレッサは、フレーム10を解凍してディスプレイ装置422に表示し、そしてもう一度ビデオが60fpsで再開する。 For the next frame 5, server 402 outputs uncompressed frame 5 965, which is compressed into compressed frame 5 985 and transmitted within one frame during transmission time 995. The video decompressor of the client 415 decompresses the frame 5 and displays it on the display device 422. Server 402 then outputs uncompressed frame 6 966 and video compressor 404 compresses it to compressed frame 6 986, where the resulting data is very long. The compressed frame is transmitted at the peak data rate 941 during the transmission time (4 × peak) 996, but it takes approximately 4 frames to transmit the frame. During the next 3 frame times, video compressor 404 ignores 3 frames from server 402 and client 415 decompressor holds frame 6 steadily on display device 422 during the 4 frame time period ( That is, the frame rate is simply reduced from 60 fps to 15 fps). Finally, server 402 then outputs frame 10 970, video compressor 404 compresses it to compressed frame 10 987, which is transmitted during transmission time 997, and the decompressor of client 415 is The frame 10 is decompressed and displayed on the display device 422, and the video resumes again at 60 fps.
ビデオコンプレッサ404は、サーバー402により発生されたビデオストリームからビデオフレームをドロップするが、オーディオがどんな形態で到来するかに関わらずオーディオデータはドロップせず、ビデオフレームがドロップされるときにオーディオデータを圧縮し続けて、それらをクライアント415へ送信し、クライアントは、オーディオデータを解凍し続け、そしてオーディオを、ユーザにより使用される装置へ供給し、オーディオを再生することに注意されたい。従って、オーディオは、フレームがドロップされる期間中は非減衰状態を続ける。圧縮オーディオは、圧縮ビデオに比して、帯域巾の比較的僅かな割合を消費するだけであり、その結果、全体的なデータレートに大きな影響は及ぼさない。いずれのデータレート図にも示されていないが、ピークデータレート941内で圧縮オーディオストリームに対して常にデータレート容量が予約されている。 Video compressor 404 drops video frames from the video stream generated by server 402, but does not drop audio data regardless of how the audio arrives, and does not drop audio data when the video frame is dropped. Note that it continues to compress and send them to the client 415, which continues to decompress the audio data and feeds the audio to the device used by the user and plays the audio. Thus, the audio continues to be unattenuated during the period when the frame is dropped. Compressed audio consumes a relatively small percentage of bandwidth compared to compressed video and as a result does not significantly affect the overall data rate. Although not shown in any data rate diagram, a data rate capacity is always reserved for the compressed audio stream within the peak data rate 941.
図9bについて上述した例は、データレートピーク中にフレームレートがいかに降下するか示すために選択されたものであるが、先に述べた循環I/Pタイル技術が使用されるときに、そのようなデータレートピーク及びそれによりドロップされるフレームは、ビデオゲーム、動画及びあるアプリケーションソフトウェアにおいて生じるような高いシーン複雑さ/高いアクションのシーケンス中でもまれであることは、示されていない。従って、フレームレートの減少は、時々で且つ短時間であり、人間の視覚系は、それを検知しない。 The example described above with respect to FIG. 9b was chosen to show how the frame rate drops during the data rate peak, but when the cyclic I / P tile technique described above is used. It has not been shown that high data rate peaks and frames dropped thereby are rare even in high scene complexity / high action sequences such as occur in video games, movies and some application software. Thus, the decrease in frame rate is occasional and short, and the human visual system does not detect it.
上述したフレームレート減少メカニズムが、図9aに示すビデオストリームデータレートに適用される場合に、それにより生じるビデオストリームデータレートが図9cに示されている。この例では、2xピーク952が平坦な2xピーク953へ減少され、4xピーク955が平坦な4xピーク955へ減少され、そして全ビデオストリームデータレート934がピークデータレート941以下に保たれる。 When the frame rate reduction mechanism described above is applied to the video stream data rate shown in FIG. 9a, the resulting video stream data rate is shown in FIG. 9c. In this example, 2x peak 952 is reduced to flat 2x peak 953, 4x peak 955 is reduced to flat 4x peak 955, and the total video stream data rate 934 is kept below peak data rate 941.
従って、上述した技術を使用して、高アクションビデオストリームを、一般的なインターネット及び消費者グレードのインターネット接続を通して短い待ち時間で送信することができる。更に、LAN(例えば、100Mbsイーサネット又は802.11gワイヤレス)、或いはプライベートネットワーク(例えば、データセンターとオフィスとの間の100Mbps接続)におけるオフィス環境では、高アクションビデオストリームをピークなしに送信することができ、大勢のユーザ(例えば、4.5Mbpsにおいて60fpsで1920x1080を送信する)が、ネットワーク又はネットワークスイッチバックプレーンを圧倒する重畳ピークをもたずに、LAN又は共有プライベートデータ接続を使用できるようにする。 Thus, using the techniques described above, high-action video streams can be transmitted with low latency over common Internet and consumer grade Internet connections. In addition, in an office environment in a LAN (eg, 100 Mbps Ethernet or 802.11g wireless) or a private network (eg, a 100 Mbps connection between a data center and an office), high action video streams can be transmitted without peaks. , Allowing a large number of users (eg, sending 1920 × 1080 at 60 fps at 4.5 Mbps) to use a LAN or shared private data connection without having a superimposed peak overwhelming the network or network switch backplane.
データレートの調整
一実施形態では、ホスティングサービス210は、最初、利用可能な最大データレート622及びチャンネルの待ち時間にアクセスして、ビデオストリームのための適当なデータレートを決定し、次いで、それに応答してデータレートを動的に調整する。データレートを調整するために、ホスティングサービス210は、例えば、映像の解像度、及び/又はクライアント415へ送信されるビデオストリームのフレーム数/秒を変更することができる。又、ホスティングサービスは、圧縮ビデオのクオリティレベルを調整することもできる。ビデオストリームの解像度を、例えば、1280x720解像度から640x360へ変更するときに、クライアント415のビデオ解凍ロジック412は、ディスプレイスクリーン上に同じ映像サイズを維持するように映像をスケールアップすることができる。
Data Rate Adjustment In one embodiment, the hosting service 210 first accesses the maximum available data rate 622 and channel latency to determine an appropriate data rate for the video stream and then responds thereto. To dynamically adjust the data rate. In order to adjust the data rate, the hosting service 210 can change, for example, the video resolution and / or the number of frames / second of the video stream sent to the client 415. The hosting service can also adjust the quality level of the compressed video. When changing the resolution of the video stream, for example, from 1280x720 resolution to 640x360, the video decompression logic 412 of the client 415 can scale up the video to maintain the same video size on the display screen.
一実施形態では、チャンネルが完全にドロップアウトする状況において、ホスティングサービス210は、ゲームを休止する。マルチプレーヤゲームの場合には、ホスティングサービスは、ユーザがゲームからドロップアウトしたことを他のユーザに報告し、及び/又は他のユーザに対してゲームを休止する。 In one embodiment, in a situation where the channel is completely dropped out, the hosting service 210 pauses the game. In the case of a multiplayer game, the hosting service reports to the other user that the user has dropped out of the game and / or pauses the game to the other user.
ドロップ又は遅延したパケット
一実施形態において、図4a又は4bにおけるビデオコンプレッサ404とクライアント415との間のパケットロスのために、或いはパケットが順序ずれして受け取られて、解凍するには遅過ぎ且つ解凍フレームの待ち時間要件を満足するには遅過ぎる到着であるために、データが失われる場合に、ビデオ解凍ロジック412は、視覚上の欠陥を軽減することができる。ストリーミングI/Pフレーム具現化において、失われ/遅延したパケットがある場合には、スクリーン全体に影響が及び、潜在的に、ある期間中スクリーンを完全に凍結させるか、又は他のスクリーン巾の視覚上の欠陥を表示させる。例えば、失われ/遅延したパケットがIフレームの損失を生じさせる場合には、デコンプレッサは、それに続く全てのPフレームに対する基準を、新たなIフレームが受け取られるまで欠くことになる。Pフレームが失われた場合には、それに続く全スクリーンのためのPフレームに影響を及ぼすことになる。Iフレームが現れるまでどれほど長いかに基づき、これは、長い又は短い視覚上の影響となる。図7a及び7bに示すインターリーブされたI/Pタイルを使用すると、失われ/遅延したパケットは、スクリーン全体に影響を及ぼすおそれが非常に僅かになる。というのは、影響を受けるパケットに含まれたタイルにしか影響しないからである。各タイルのデータが個々のパケット内で送信される場合には、パケットが失われた場合に、それが1つのタイルにしか影響しない。もちろん、視覚上の欠陥の巾は、Iタイルパケットが失われるかどうか、及びPタイルが失われた場合には、Iタイルが現れるまでにどれほど多くのフレームを要するか、に依存する。しかし、スクリーン上の異なるタイルがIフレームで頻繁に(潜在的にフレームごとに)更新されるとすれば、スクリーン上の1つのタイルが影響を受ける場合でも、他のタイルは、そうではない。更に、ある事象が一度に多数のパケットのロスを生じさせる場合には(例えば、DSLラインに続く電力のスパイクでデータ流を短時間中断するもの)、あるタイルが、他のタイル以上に影響を受けるが、あるタイルは、新たなIタイルで素早く更新されるので、短時間影響を受けるだけである。又、ストリーミングI/Pフレーム具現化では、Iフレームが最も重要なフレームであるだけでなく、非常に大きなフレームでもあり、従って、ドロップされ/遅延されたパケットを生じさせる事象がある場合には、Iフレームが影響を受ける確率が、非常に小さなIタイルより高くなる(即ち、Iフレームが一部分でも失われた場合には、Iフレームを解凍できる見込みが全くなくなる)。これら全ての理由で、I/Pタイルを使用すると、パケットがドロップされ/遅延されるときに、視覚上の欠陥は、I/Pフレームの場合より遥かに少なくなる。
Dropped or delayed packets In one embodiment, due to packet loss between video compressor 404 and client 415 in FIG. 4a or 4b, or packets are received out of order and too slow to decompress The video decompression logic 412 can mitigate visual defects when data is lost due to arrivals that are too late to meet the frame latency requirements. In streaming I / P frame implementations, if there are lost / delayed packets, the entire screen is affected, potentially freezing the screen completely for a period of time, or viewing other screen widths Display the top defect. For example, if a lost / delayed packet causes an I frame loss, the decompressor will lack a reference for all subsequent P frames until a new I frame is received. If a P frame is lost, it will affect the P frame for all subsequent screens. Based on how long it takes for an I frame to appear, this can be a long or short visual effect. Using the interleaved I / P tiles shown in FIGS. 7a and 7b, lost / delayed packets are very unlikely to affect the entire screen. This is because it only affects the tiles contained in the affected packet. If the data for each tile is transmitted in an individual packet, it affects only one tile if the packet is lost. Of course, the width of the visual defect depends on whether the I tile packet is lost and how many frames it takes to see the I tile if the P tile is lost. However, if different tiles on the screen are updated frequently (potentially every frame) in an I-frame, even if one tile on the screen is affected, the other tiles are not. In addition, if an event causes the loss of a large number of packets at once (for example, interrupting the data flow for a short time with a power spike following the DSL line), one tile can affect more than other tiles. However, certain tiles are only affected for a short time because they are quickly updated with new I tiles. Also, in streaming I / P frame implementation, if the I frame is not only the most important frame, but also a very large frame, and therefore there are events that cause dropped / delayed packets, The probability that an I-frame will be affected is higher than a very small I-tile (ie, if any part of the I-frame is lost, there is no chance of decompressing the I-frame). For all these reasons, using I / P tiles results in much fewer visual defects when packets are dropped / delayed than with I / P frames.
一実施形態では、圧縮されたタイルをTCP(送信コントロールプロトコル)パケット又はUDP(ユーザデータグラムプロトコル)パケット内にインテリジェントにパッケージすることにより失われたパケットの作用を減少することが試みられる。例えば、一実施形態では、タイルが、可能であれば、パケット境界に整列される。図10aは、この特徴を具現化せずに、タイルを一連のパケット1001−1005内にどのようにパックするか示す。より詳細には、図10aにおいて、単一パケットのロスが複数のフレームのロスを生じるように、タイルがパケット境界に交差し、非効率的にパックされる。例えば、パケット1003または1004が失われる場合に、3つのタイルが失われ、視覚上の欠陥を招く。 In one embodiment, an attempt is made to reduce the effects of lost packets by intelligently packaging compressed tiles into TCP (Transmission Control Protocol) or UDP (User Datagram Protocol) packets. For example, in one embodiment, tiles are aligned to packet boundaries if possible. FIG. 10a shows how tiles are packed into a series of packets 1001-1005 without embodying this feature. More specifically, in FIG. 10a, tiles cross packet boundaries and are packed inefficiently such that single packet loss results in multiple frame losses. For example, if the packet 1003 or 1004 is lost, three tiles are lost, resulting in a visual defect.
対称的に、図10bは、パケットロスの作用を減少するためにパケット内にタイルをインテリジェントにパッキングするためのタイルパッキングロジック1010を示す。第1に、タイルパッキングロジック1010は、タイルをパケット境界に整列させる。従って、タイルT1、T3、T4、T7及びT2は、各々、パケット1001−1005の境界に整列される。又、タイルパッキングロジックは、パケット境界に交差せずに、考えられる最も効率的な仕方で、パケット内にタイルを嵌合させることも試みる。各タイルのサイズに基づいて、タイルT1及びT6は、1つのパケット1001内で合成され、T3及びT5は、1つのパケット1002内で合成され、タイルT4及びT8は、1つのパケット1003内で合成され、タイルT8は、パケット1004に追加され、そしてタイルT2は、パケット1005に追加される。従って、このスキムのもとでは、単一パケットのロスは、(図10aに示す3つのタイルではなく)2つ以下のタイルのロスを招くことになる。 In contrast, FIG. 10b shows tile packing logic 1010 for intelligently packing tiles into packets to reduce the effects of packet loss. First, tile packing logic 1010 aligns tiles to packet boundaries. Thus, tiles T1, T3, T4, T7, and T2 are each aligned with the boundaries of packets 1001-1005. Tile packing logic also attempts to fit tiles within a packet in the most efficient way possible without crossing packet boundaries. Based on the size of each tile, tiles T1 and T6 are combined in one packet 1001, T3 and T5 are combined in one packet 1002, and tiles T4 and T8 are combined in one packet 1003. Tile T8 is added to packet 1004 and tile T2 is added to packet 1005. Thus, under this skim, the loss of a single packet will result in the loss of two or fewer tiles (rather than the three tiles shown in FIG. 10a).
図10bに示す実施形態に対する1つの付加的な利益は、タイルが、映像内に表示されるのとは異なる順序で送信されることである。このように、隣接パケットが送信を妨げる同じ事象から失われた場合に、スクリーン上の互いに近隣でないエリアに影響を及ぼし、ディスプレイ上の欠陥をあまり目立たなくする。 One additional benefit over the embodiment shown in FIG. 10b is that tiles are transmitted in a different order than they are displayed in the video. In this way, if adjacent packets are lost from the same event that prevents transmission, they affect areas that are not adjacent to each other on the screen, making defects on the display less noticeable.
一実施形態では、順方向エラー修正(FEC)技術を使用して、ビデオストリームの幾つかの部分をチャンネルエラーから保護する。この技術で知られているように、リードソロモン及びビタビのようなFEC技術は、エラー修正データ情報を発生して、通信チャンネルを経て送信されるデータに添付させる。基礎的なデータ(例えば、Iフレーム)にエラーが発生した場合には、FECを使用して、エラーを修正することができる。 In one embodiment, forward error correction (FEC) techniques are used to protect some portions of the video stream from channel errors. As known in the art, FEC techniques such as Reed-Solomon and Viterbi generate error correction data information and attach it to data transmitted over the communication channel. If an error occurs in the underlying data (eg, an I frame), the error can be corrected using FEC.
FECコードは、送信のデータレートを高め、従って、理想的には、それらが最も必要とされるところに使用されるだけである。非常に目立つ視覚上の欠陥を生じないデータが送信される場合には、データを保護するためにFECコードを使用しないのが好ましい。例えば、失われるIタイルの直前のPタイルは、スクリーン上に1/60秒だけ視覚上の欠陥を生じさせる(即ち、スクリーン上のタイルは更新されない)。このような視覚上の欠陥は、人間の目でかろうじて検知できる。PタイルがIタイルから更に後方にある場合には、Pタイルを失うと、益々目立つことになる。例えば、タイルサイクルパターンが、Iタイルの後に15個のPタイルが続き、その後、Iタイルが再び得られるというものである場合、Iタイルの直後のPタイルが失われると、そのタイルは、15フレームの時間中誤った映像を示すことになる(60fpsでは、それは、250msである)。人間の目は、250ms間のストリームの中断は容易に検知する。従って、Pタイルが新たなIタイルから更に後方にあるほど(即ち、Pタイルがより接近してIタイルに続くほど)、欠陥がより目立ったものになる。上述したように、一般的に、Pタイルがより接近してIタイルに続くほど、そのPタイルに対するデータがより小さくなる。従って、Iタイルに続くPタイルは、失われないよう保護するのがより重要であるだけでなく、サイズが小さいことも重要である。そして、一般的に、保護される必要のあるデータが小さいほど、それを保護するために必要なFECコードも小さくなる。 FEC codes increase the data rate of transmission and therefore ideally are only used where they are most needed. If data is transmitted that does not cause very noticeable visual defects, it is preferable not to use FEC codes to protect the data. For example, a P tile immediately before a lost I tile causes a visual defect on the screen by 1/60 second (ie, the tile on the screen is not updated). Such visual defects can be barely detected by the human eye. If the P tile is further back from the I tile, losing the P tile will become more noticeable. For example, if the tile cycle pattern is that an I tile is followed by 15 P tiles, and then the I tile is obtained again, if the P tile immediately following the I tile is lost, the tile is 15 It will show the wrong video for the duration of the frame (at 60 fps it is 250 ms). The human eye easily detects a break in the stream for 250 ms. Thus, the further the P tile is behind the new I tile (ie, the closer the P tile is to the I tile), the more pronounced the defect. As mentioned above, in general, the closer the P tile is to the I tile, the smaller the data for that P tile. Therefore, not only is it important to protect the P tile following the I tile from being lost, but it is also important that the size is small. In general, the smaller the data that needs to be protected, the smaller the FEC code required to protect it.
従って、図11aに示すように、一実施形態では、ビデオストリームにおけるIタイルの重要性のために、IタイルだけにFECコードが与えられる。従って、FEC1101は、Iタイル1100に対するエラー修正コードを含み、そしてFEC1104は、Iタイル1103に対するエラー修正コードを含む。この実施形態では、Pタイルに対してFECは発生されない。 Thus, as shown in FIG. 11a, in one embodiment, only the I tile is given an FEC code due to the importance of the I tile in the video stream. Accordingly, FEC 1101 includes error correction code for I tile 1100 and FEC 1104 includes error correction code for I tile 1103. In this embodiment, no FEC is generated for P tiles.
図11bに示す一実施形態では、失われた場合に視覚上の欠陥を生じさせるおそれが最もあるPタイルについてもFECコードが発生される。この実施形態では、FEC1105は、最初の3つのPタイルに対してエラー修正コードを与えるが、それに続くPタイルについては与えない。別の実施形態では、データサイズが最も小さいPタイルについてFECコードが発生される(Iタイルの後に最も早く発生して、保護することが最も重要なPタイルを自己選択する傾向がある)。 In one embodiment shown in FIG. 11b, FEC codes are also generated for P tiles that are most likely to cause visual defects if lost. In this embodiment, FEC 1105 provides error correction code for the first three P tiles, but not for subsequent P tiles. In another embodiment, an FEC code is generated for the P tile with the smallest data size (which tends to occur earliest after the I tile and self-select the P tile that is most important to protect).
別の実施形態では、FECコードをタイルと共に送信するのではなく、タイルが2回、そのたびに異なるパケットで、送信される。1つのパケットが失われ/遅延された場合には、他のパケットが使用される。 In another embodiment, rather than sending the FEC code with the tile, the tile is sent twice, each time with a different packet. If one packet is lost / delayed, the other packet is used.
図11cに示す一実施形態では、FECコード1111及び1113は、ビデオと同時にホスティングサービスから送信されるオーディオパケット1110及び1112に対して各々発生される。ビデオストリームにおいてオーディオの完全性を維持することが特に重要である。というのは、歪んだオーディオ(例えば、カチカチ音又はスー音)は、特に望ましからぬユーザの経験を招くからである。FECコードは、オーディオコンテンツがクライアントコンピュータ415において歪なくレンダリングされることを保証する上で助けとなる。 In one embodiment shown in FIG. 11c, FEC codes 1111 and 1113 are generated for audio packets 1110 and 1112 transmitted from the hosting service simultaneously with the video, respectively. It is particularly important to maintain audio integrity in the video stream. This is because distorted audio (e.g., ticks or soots) leads to a particularly unwanted user experience. The FEC code helps to ensure that the audio content is rendered at the client computer 415 without distortion.
別の実施形態では、FECコードをオーディオデータと共に送信するのではなく、オーディオデータが2回、そのたびに異なるパケットで、送信される。1つのパケットが失われ/遅延された場合には、他のパケットが使用される。 In another embodiment, rather than sending the FEC code with the audio data, the audio data is sent twice, each time in a different packet. If one packet is lost / delayed, the other packet is used.
更に、図11dに示す一実施形態では、クライアント415からホスティングサービス210へと上流に送信されるユーザ入力コマンド1120及び1122(例えば、ボタン押圧)に対してFECコード1121及び1123が各々使用される。これは重要である。というのは、ビデオゲーム又はアプリケーションにおいてボタン押圧又はマウス移動が欠落すると、望ましからぬユーザ経験を招くからである。 Further, in one embodiment shown in FIG. 11d, FEC codes 1121 and 1123 are used for user input commands 1120 and 1122 (eg, button presses) sent upstream from client 415 to hosting service 210, respectively. This is important. This is because the lack of button presses or mouse movements in a video game or application leads to an undesirable user experience.
別の実施形態では、FECコードをユーザ入力コマンドデータと共に送信するのではなく、ユーザ入力コマンドデータが2回、そのたびに異なるパケットで、送信される。1つのパケットが失われ/遅延された場合には、他のパケットが使用される。 In another embodiment, rather than sending the FEC code with the user input command data, the user input command data is sent twice, each time in a different packet. If one packet is lost / delayed, the other packet is used.
一実施形態では、ホスティングサービス210がクライアント415との通信チャンネルのクオリティを評価して、FECを使用すべきかどうか決定し、もしそうであれば、ビデオ、オーディオ及びユーザコマンドのどの部分にFECを適用すべきか決定する。チャンネルの「クオリティ」を評価することは、上述したように、パケットロス、待ち時間、等を評価するようなファンクションを含む。チャンネルに特に信頼性がない場合には、ホスティングサービス210は、Iタイル、Pタイル、オーディオ及びユーザコマンドの全てにFECを適用することができる。対照的に、チャンネルに信頼性がある場合には、ホスティングサービス210は、オーディオ及びユーザコマンドのみにFECを適用するか、又はオーディオ又はビデオにFECを適用するか、或いはFECを全く使用しない。これら基礎的な原理に依然合致しながら、FECの適用の種々の他の順列を使用することができる。一実施形態では、ホスティングサービス210は、チャンネルの状態を常時監視し、それに応じてFECポリシーを変更する。 In one embodiment, the hosting service 210 evaluates the quality of the communication channel with the client 415 to determine whether FEC should be used, and if so, applies the FEC to any part of the video, audio and user commands. Decide what to do. Evaluating the “quality” of the channel includes functions such as evaluating packet loss, latency, etc., as described above. If the channel is not particularly reliable, the hosting service 210 can apply FEC to all of the I tiles, P tiles, audio, and user commands. In contrast, if the channel is reliable, the hosting service 210 applies FEC to audio and user commands only, or applies FEC to audio or video, or does not use FEC at all. While still meeting these basic principles, various other permutations of FEC applications can be used. In one embodiment, the hosting service 210 constantly monitors the channel status and changes the FEC policy accordingly.
別の実施形態では、図4a及び4bを参照すれば、パケットが失われ/遅延されてタイルデータを失うことになるか、又はおそらく特に悪いパケット損失のために、FECが、失われたタイルデータを修正できない場合には、クライアント415は、新たなIタイルが受け取られる前にどれほど多くのフレームが残っているか評価し、それをクライアント415からホスティングサービス210への往復待ち時間と比較する。その往復待ち時間が、新たなIタイルが当然到着するまでのフレームの数より少ない場合には、クライアント415は、新たなIタイルを要求するメッセージをホスティングサービス210へ送信する。このメッセージは、ビデオコンプレッサ404へルーティングされ、このコンプレッサは、データが失われたところのタイルに対してPタイルを発生するのではなく、Iタイルを発生する。図4a及び4bに示すシステムが、典型的に80ms未満の往復待ち時間を与えるように設計されているとすれば、それにより、タイルが80ms以内に修正される(60fpsにおいて、フレームは、16.67msの巾であり、従って、全フレームの時間において、80msの待ち時間で、5フレームの時間である83.33ms以内にタイルが修正され、即ち、これは、目立った中断であるが、例えば、15フレームに対する250msの中断よりは遥かに目立たないものである)。コンプレッサ404がその通常の循環順序からIタイルを発生するときに、Iタイルによりそのフレームの帯域巾が利用可能な帯域巾を越える場合は、コンプレッサ404は、他のタイルのサイクルを遅延させて、他のタイルがそのフレーム時間中にPタイルを受け取るようにし(1つのタイルが通常そのフレーム中に当然Iタイルであるべき場合でも)、次いで、次のフレームでスタートして、通常の循環が続き、そして通常はその手前のフレームでIタイルを受信するタイルが、Iタイルを受信するようにする。このアクションは、Rフレーム循環の位相を短時間遅延するが、通常は、視覚上、目立つものではない。 In another embodiment, referring to FIGS. 4a and 4b, a packet is lost / delayed and the tile data is lost, or perhaps because of a particularly bad packet loss, the FEC may have lost tile data. Can not be modified, the client 415 evaluates how many frames remain before a new I tile is received and compares it to the round trip latency from the client 415 to the hosting service 210. If the round-trip latency is less than the number of frames until the new I tile naturally arrives, the client 415 sends a message requesting the new I tile to the hosting service 210. This message is routed to the video compressor 404, which generates an I tile rather than a P tile for the tile where the data is lost. If the system shown in FIGS. 4a and 4b is designed to give a round trip latency of typically less than 80 ms, then the tile is modified within 80 ms (at 60 fps, the frame is 16. It is 67ms wide, so in the time of all frames, the tile is modified within 83.33ms, which is the time of 5 frames, with a latency of 80ms, ie this is a noticeable interruption, It is much less noticeable than the 250ms break for 15 frames). When compressor 404 generates an I tile from its normal cyclic order, if the bandwidth of the frame exceeds the available bandwidth by the I tile, compressor 404 delays the cycle of the other tiles, Make the other tiles receive P tiles during that frame time (even if one tile should normally be an I tile during that frame), then start with the next frame and continue with normal cycling , And usually the tile receiving the I tile in the previous frame will receive the I tile. This action delays the phase of the R frame cycle for a short time, but is usually not visually noticeable.
ビデオ及びオーディオコンプレッサ/デコンプレッサ具現化
図12は、マルチコア及び/又はマルチプロセッサ1200を使用して8枚のタイルを並列に圧縮する1つの特定の実施形態を示す。一実施形態では、2.66GHz以上で動作するデュアルプロセッサ・クオドコアXeon CPUコンピュータシステムが使用され、各コアは、オープンソースx264 H.264コンプレッサを独立プロセスとして具現化する。しかしながら、これら基礎的な原理に依然合致しながら、種々の他のハードウェア/ソフトウェアコンフィギュレーションが使用されてもよい。例えば、CPUコアの各々を、FPGAで具現化されるH.264コンプレッサに置き換えることができる。図12に示す例では、コア1201−1208を使用して、Iタイル及びPタイルを8個の独立したスレッドとして同時に処理する。この技術で良く知られているように、現在のマルチコア及びマルチプロセッサコンピュータシステムは、本来、Microsoft Windows XPプロフェッショナルエディション(64ビット又は32ビットエディション)及びLinuxのようなマルチスレッドオペレーティングシステムと一体化されたときにマルチスレッディング可能である。
Video and Audio Compressor / Decompressor Implementation FIG. 12 illustrates one particular embodiment of compressing 8 tiles in parallel using a multi-core and / or multi-processor 1200. In one embodiment, a dual processor quad-core Xeon CPU computer system operating at 2.66 GHz or higher is used, each core being an open source x264 H.264. H.264 compressor is implemented as an independent process. However, various other hardware / software configurations may be used while still meeting these basic principles. For example, each of the CPU cores is implemented by FPGA. H.264 compressor. In the example shown in FIG. 12, cores 1201-1208 are used to simultaneously process I tiles and P tiles as eight independent threads. As is well known in the art, current multi-core and multi-processor computer systems were originally integrated with multi-threaded operating systems such as Microsoft Windows XP Professional Edition (64-bit or 32-bit edition) and Linux. Sometimes multithreading is possible.
図12に示す実施形態では、8個のコアの各々は、1つのタイルについてのみ役立つので、x264の個別インスタンス生成を各々実行する他のコアとは主として独立して動作する。PCI Express x1ベースのDVI捕獲カード、例えば、オランダ、オーステルハウトのマイクロトロニクスからのセンデロ・ビデオ・イメージングIPデベロープメント・ボードを使用して、640x480、800x600、又は1280x720解像度で非圧縮ビデオを捕獲し、そしてこのカードのFPGAは、直接メモリアクセス(DMA)を使用して、DVIバスを経て捕獲されたビデオをシステムRAMへと転送する。タイルは、4x2配列1205に配列される(それらは、方形タイルとして示されているが、この実施形態では、160x240解像度である)。x264の各インスタンス化は、8個の168x240タイルの1つを圧縮するように構成され、そしてそれらは、最初のIタイル圧縮の後に、各コアがサイクルに入り、各1つのフレームが他のフレームと位相ずれし、1つのIタイル、その後、7つのPタイルを圧縮するように、図12に示すように、同期される。 In the embodiment shown in FIG. 12, each of the eight cores works only for one tile, so it operates primarily independently of the other cores that each perform x264 individual instantiations. Capturing uncompressed video at 640x480, 800x600, or 1280x720 resolution using a PCI Express x1-based DVI capture card, such as the Sendero Video Imaging IP Development Board from Microtronics, Oosterhout, The Netherlands The card's FPGA then uses direct memory access (DMA) to transfer the captured video over the DVI bus to the system RAM. The tiles are arranged in a 4x2 array 1205 (they are shown as square tiles, but in this embodiment are 160x240 resolution). Each instantiation of x264 is configured to compress one of eight 168x240 tiles, and after the first I tile compression, each core enters a cycle and each one frame is another frame Are synchronized, as shown in FIG. 12, to phase out and compress one I tile and then seven P tiles.
フレーム時間ごとに、得られた圧縮されたタイルが、上述した技術を使用して、パケットストリームへと合成され、次いで、その圧縮されたタイルが、行先クライアント415へ送信される。 At each frame time, the resulting compressed tiles are combined into a packet stream using the techniques described above, and then the compressed tiles are sent to the destination client 415.
図12には示されていないが、合成される8枚のタイルのデータレートが特定のピークデータレート941を越える場合には、その合成される8枚のタイルのデータが送信されてしまうまで必要に応じて多数のフレームの時間中、全部で8x264のプロセスが保留される。 Although not shown in FIG. 12, if the data rate of the 8 tiles to be combined exceeds a specific peak data rate 941, it is necessary until the data of the 8 tiles to be combined has been transmitted. Accordingly, a total of 8x264 processes are suspended during multiple frame times.
一実施形態では、クライアント415は、FFmpegの8個のインスタンスを実行するPCにおいてソフトウェアとして具現化される。受信プロセスは、8枚のタイルを受信し、そして各タイルは、FFmpegへルーティングされ、これは、タイルを解凍して、ディスプレイ装置422上の適当なタイル位置にレンダリングする。 In one embodiment, the client 415 is implemented as software on a PC running eight instances of FFmpeg. The receive process receives 8 tiles and each tile is routed to FFmpeg, which decompresses the tile and renders it at the appropriate tile location on the display device 422.
クライアント415は、PCの入力装置ドライバからキーボード、マウス、又はゲームコントローラ入力を受け取り、そしてそれをサーバー402へ送信する。サーバー402は、次いで、その受け取った入力装置データを、サーバー402で実行されるゲーム又はアプリケーションに適用し、サーバー402は、Intel 2.16GHzCore Duo CPUを使用してWindowsを実行するPCである。次いで、サーバー402は、新たなフレームを発生し、そしてそのDVI出力を通して、マザーボードベースのグラフィックシステムから、或いはNVIDIA8800GTX PCIエクスプレスカードのDVI出力を通して、それを出力する。 The client 415 receives keyboard, mouse, or game controller input from the PC input device driver and sends it to the server 402. The server 402 then applies the received input device data to a game or application executed on the server 402, which is a PC that runs Windows using an Intel 2.16 GHz Core Duo CPU. Server 402 then generates a new frame and outputs it through its DVI output, either from the motherboard-based graphics system, or through the NVIDIA 8800GTX PCI Express card DVI output.
同時に、サーバー402は、ゲーム又はアプリケーションにより形成されたオーディオを、そのデジタルオーディオ出力(例えば、S/PDIF)を通して出力し、これは、ビデオ圧縮を具現化するデュアルクオドコアXeonベースPCのデジタルオーディオ入力に結合される。Vorbisオープンソースオーディオコンプレッサは、プロセススレッドに対して利用可能なコアを使用して、オーディオをビデオと同時に圧縮するように使用される。一実施形態では、タイルの圧縮を完了するコアが、オーディオ圧縮を最初に実行する。圧縮されたオーディオは、次いで、圧縮されたビデオと共に送信され、そしてクライアント415においてVorbisオーディオデコンプレッサを使用して解凍される。 At the same time, server 402 outputs the audio formed by the game or application through its digital audio output (eg, S / PDIF), which is the digital audio input of a dual quad-core Xeon-based PC that embodies video compression. Combined with The Vorbis open source audio compressor is used to compress audio simultaneously with video, using the core available for process threads. In one embodiment, the core that completes tile compression performs audio compression first. The compressed audio is then transmitted with the compressed video and decompressed at the client 415 using a Vorbis audio decompressor.
ホスティングサービスサーバーセンター配布
光ファイバのようなガラスを通る光は、真空中の光の速度の一部分で進行し、従って、光ファイバにおける光の厳密な伝播速度を決定することができる。しかし、実際には、ルーティング遅延の時間、送信の非効率さ、及び他のオーバーヘッドを考慮すると、インターネット上の最適な待ち時間は、光速のほぼ50%の送信速度を反映することが観察される。従って、最適な1000マイル往復待ち時間は、約22msであり、そして最適な3000マイル往復待ち時間は、約64msである。従って、米国の一方の海岸にある単一のサーバーは、(3000マイル程度離れた)他方の海岸にあるクライアントに望ましい待ち時間でサービスするには離れ過ぎている。しかしながら、図13aに示すように、ホスティングサービス210のサーバーセンター1300が、米国の中央部(例えば、カンザス、ネブラスカ、等)に位置されて、米国大陸の任意の点までの距離が約1500マイル以下となる場合には、往復インターネット待ち時間を32ms程度に小さくすることができる。図4bを参照すれば、ユーザISP453に許された最悪のケースの待ち時間は、典型的に、25msであるが、DSL及びケーブルモデムシステムでは、10から15msに近い待ち時間が観察されていることに注意されたい。又、図4bは、ユーザの家屋211からホスティングセンター210までの最大距離が1000マイルであると仮定している。従って、15msの典型的なユーザISP往復待ち時間が使用され、32msの往復待ち時間に対して1500マイルの最大インターネット距離では、ユーザが入力装置421を操作しそしてディスプレイ装置422上に応答を見る点からの合計往復待ち時間は、1+1+15+32+1+16+6+8=80msとなる。従って、80msの応答時間が、典型的に、1500マイルのインターネット距離にわたって得られる。これは、米国大陸において充分短いユーザISP待ち時間453をもつユーザの家屋が、中央部に位置する単一のサーバーにアクセスできるようにする。
Light passing through a glass, such as a hosting service server center distribution optical fiber, travels at a fraction of the speed of light in a vacuum, and therefore the exact propagation speed of light in the optical fiber can be determined. In practice, however, the optimal latency on the Internet is observed to reflect a transmission rate of nearly 50% of the speed of light, considering routing delay times, transmission inefficiencies, and other overhead. . Thus, the optimal 1000 mile round trip latency is about 22 ms and the optimal 3000 mile round trip latency is about 64 ms. Thus, a single server on one coast of the United States is too far away to service clients on the other coast (as far as 3000 miles away) with the desired latency. However, as shown in FIG. 13a, the server center 1300 of the hosting service 210 is located in the central part of the United States (eg, Kansas, Nebraska, etc.), and the distance to any point on the US continent is about 1500 miles or less. In this case, the round-trip Internet waiting time can be reduced to about 32 ms. Referring to FIG. 4b, the worst-case latency allowed for user ISP 453 is typically 25 ms, but latency close to 10 to 15 ms has been observed in DSL and cable modem systems. Please be careful. FIG. 4b also assumes that the maximum distance from the user's house 211 to the hosting center 210 is 1000 miles. Thus, a typical user ISP round trip latency of 15 ms is used, and at a maximum internet distance of 1500 miles for a round trip latency of 32 ms, the user operates the input device 421 and sees a response on the display device 422. The total round-trip waiting time from is 1 + 1 + 15 + 32 + 1 + 16 + 6 + 8 = 80 ms. Thus, a response time of 80 ms is typically obtained over an internet distance of 1500 miles. This allows a user's home with a sufficiently short user ISP latency 453 in the US continent to access a single server located in the center.
図13bに示した別の実施形態では、ホスティングサービス210のサーバーセンターHS−1ないしHS6が、米国(又は他の地理的領域)に戦略的に配置され、ある大きなホスティングサービスサーバーセンター(例えば、HS2及びHS5)は、人口の多いセンターの付近に配置される。一実施形態では、サーバーセンターHS1ないしHS6は、インターネット又はプライベートネットワーク或いはその両方の組合せであるネットワーク1301を経て情報を交換する。複数のサーバーセンターがある状態では、長いユーザISP待ち時間453をもつユーザに対して短い待ち時間でサービスを提供することができる。 In another embodiment shown in FIG. 13b, the server centers HS-1 through HS6 of the hosting service 210 are strategically located in the United States (or other geographic region) and some large hosting service server center (eg, HS2 And HS5) are located in the vicinity of a population center. In one embodiment, the server centers HS1 to HS6 exchange information over a network 1301, which is the Internet or a private network or a combination of both. In a state where there are a plurality of server centers, it is possible to provide a service with a short waiting time to a user having a long user ISP waiting time 453.
インターネット上の距離は、確実に、インターネットを通しての往復待ち時間に貢献するファクタであるが、時々、待ち時間にあまり関係のない他のファクタが影響するようになる。時々、パケットストリームがインターネットを通して離れた位置へルーティングされそして再び戻り、長いループから待ち時間を招く。時々、適切に動作しないルーティング装置が経路上にあり、送信遅延を招く。時々、経路に過負荷となるトラフィックがあって、遅延を導入する。そして、時々、ユーザのISPが所与の行先へルーティングされるのを全く阻止する故障が生じる。従って、一般的なインターネットは、通常、距離により主として決定される非常に信頼性のある最適なルート及び待ち時間で(特に、ユーザのローカルエリアの外部へのルートを生じさせる長距離接続で)、ある点から別の点への接続を与えるが、このような信頼性及び待ち時間は、保証されるものではなく、多くの場合、ユーザの家屋から一般的なインターネット上の所与の行先まで得ることができない。 The distance on the Internet is certainly a factor that contributes to round trip latency through the Internet, but sometimes other factors that are less related to latency will come into play. Sometimes the packet stream is routed to a remote location through the Internet and back again, incurring latency from long loops. Sometimes routing devices that do not work properly are on the path, causing transmission delays. Sometimes there is overloaded traffic on the path and introduces delay. And sometimes a failure occurs that completely prevents the user's ISP from being routed to a given destination. Thus, the general Internet usually has very reliable optimal routes and latencies that are largely determined by distance (especially with long-distance connections that cause routes out of the user's local area), Gives a connection from one point to another, but such reliability and latency are not guaranteed and often get from a user's home to a given destination on the general Internet I can't.
一実施形態では、ユーザクライアント415が、最初にホスティングサービス210に接続して、ビデオゲームをプレイするか又はアプリケーションを使用するときに、クライアントは、始動時に利用可能なホスティングサービスサーバーセンターHS1ないしHS6の各々と通信する(例えば、上述した技術を使用して)。特定の接続に対して待ち時間が充分短い場合には、その接続が使用される。一実施形態では、クライアントは、最短待ち時間接続をもつものが選択されたところのホスティングサービスサーバーセンターの全部又はサブセットと通信する。クライアントが最短待ち時間接続をもつサービスセンターを選択してもよいし、又はサービスセンターが最短的時間接続をもつものを識別しそしてこの情報を(例えば、インターネットアドレスの形態で)クライアントに与えてもよい。 In one embodiment, when a user client 415 first connects to the hosting service 210 to play a video game or use an application, the client can connect to the hosting service server centers HS1 to HS6 available at startup. Communicate with each (eg, using the techniques described above). If the latency is sufficiently short for a particular connection, that connection is used. In one embodiment, the client communicates with all or a subset of the hosting service server center from which the one with the lowest latency connection has been selected. The client may select a service center with the shortest latency connection, or identify what the service center has the shortest time connection and provide this information to the client (eg, in the form of an Internet address) Good.
特定のホスティングサービスサーバーセンターが過負荷状態になり及び/又はユーザのゲーム又はアプリケーションが、別の負荷の少ないホスティングサービスサーバーセンターへの待ち時間を許容できる場合には、クライアント415は、他のホスティングサービスサーバーセンターに向け直される。このような状況では、ユーザが実行しているゲーム又はアプリケーションは、ユーザの過負荷状態にサーバーセンターにおけるサーバー402上で休止され、そしてゲーム又はアプリケーションの状態データは、別のホスティングサービスサーバーセンターにおけるサーバー402へ転送される。次いで、ゲーム又はアプリケーションが再開される。一実施形態では、ホスティングサービス210は、ゲーム又はアプリケーションが自然の休止点(例えば、ゲームにおけるレベル間、又はユーザがアプリケーションにおいて「セーブ」オペレーションを開始した後)に到達して転送を行うまで、待機する。更に別の実施形態では、ホスティングサービス210は、ユーザのアクティビティが特定の期間中(例えば1分間)休止するまで待機し、次いで、その時点で転送を開始する。 If a particular hosting service server center is overloaded and / or the user's game or application can tolerate latency to another lightly loaded hosting service server center, the client 415 may have other hosting services. Redirected to the server center. In such a situation, the game or application that the user is running is paused on the server 402 at the server center in the user's overload condition, and the game or application state data is stored on a server at another hosting service server center. 402. The game or application is then resumed. In one embodiment, the hosting service 210 waits until the game or application reaches a natural pause (eg, between levels in the game, or after the user initiates a “save” operation on the application) and transfers. To do. In yet another embodiment, the hosting service 210 waits for user activity to pause for a specified period of time (eg, 1 minute), and then initiates a transfer at that point.
上述したように、一実施形態では、ホスティングサービス210は、そのクライアントに保証された待ち時間を与えるよう試みるために、図14のインターネットバイパスサービス440に契約する。ここで使用されるインターネットバイパスサービスとは、保証された特性(例えば、待ち時間、データレート、等)をもつインターネットにおいてある点から別の点へのプライベートネットワークルートを与えるサービスである。例えば、ホスティングサービス210が、AT&Tのサンフランシスコベースの中央オフィスへのルーティングではなく、サンフランシスコで提供されるAT&TのDSLサービスを利用してユーザから大量のトラフィックを受信した場合に、ホスティングサービス210は、サンフランシスコベースの中央オフィスと、ホスティングサービス210のための1つ以上のサービスセンターとの間のサービスプロバイダー(おそらくAT&Tそれ自体又は別のプロバイダー)から大容量のプライベートデータ接続をリースすることができる。次いで、全てのホスティングサービスサーバーセンターHS1ないしHS6から一般的なインターネットを経てAT&TのDSLを使用するサンフランシスコのユーザへのルートが非常に長い待ち時間を生じる場合には、それに代わって、プライベートデータ接続を使用することができる。プライベートデータ接続は、一般的に、一般的なインターネットを通るルートより費用が高いが、それがユーザへのホスティングサービス210接続の僅かな割合に保たれる限り、全コストへの影響は低く、ユーザは、より一貫したサービスを経験することになる。 As described above, in one embodiment, hosting service 210 subscribes to Internet bypass service 440 of FIG. 14 to attempt to provide guaranteed latency to its clients. As used herein, an Internet bypass service is a service that provides a private network route from one point to another in the Internet with guaranteed characteristics (eg, latency, data rate, etc.). For example, if hosting service 210 receives a large amount of traffic from a user using AT & T's DSL service provided in San Francisco rather than routing to AT & T's San Francisco-based central office, hosting service 210 may Large private data connections can be leased from a service provider (possibly AT & T itself or another provider) between the base central office and one or more service centers for hosting service 210. If the route from all hosting service server centers HS1 to HS6 to San Francisco users using AT & T's DSL via the general Internet then causes a very long latency, a private data connection will be used instead. Can be used. A private data connection is generally more expensive than a route through the general Internet, but as long as it remains a small percentage of the hosting service 210 connection to the user, the impact on the total cost is low and the user Will experience a more consistent service.
サービスセンターは、多くの場合、停電時に2層のバックアップ電源を有する。第1の層は、典型的に、バッテリから(又は発電機に取り付けられてランニング状態に保たれるフライホイールのような別の直ちに利用できるエネルギー源から)のバックアップ電源であって、主電源が停電したときに直ちに電力を供給して、サーバーセンターをランニング状態に保持する。停電が短時間で、主電源が素早く(例えば、1分以内に)回復する場合には、バッテリは、全て、サーバーセンターをランニング状態に保持するために必要とされる。しかし、停電が長期間である場合には、典型的に、発電機(例えば、ジーゼル付勢)が始動され、バッテリを引き継いで、燃料がある限り運転することができる。このような発電機は、サーバーセンターが通常主電源から得るのと同程度の電力を発生できねばならないので、非常に高価である。 Service centers often have two layers of backup power sources during a power outage. The first layer is typically a backup power source from the battery (or from another readily available energy source such as a flywheel that is attached to the generator and kept running), where the main power source is Supply power immediately in the event of a power failure to keep the server center running. If the power failure is short and the main power recovers quickly (eg, within 1 minute), all of the battery is needed to keep the server center running. However, if the power outage is for a long time, typically a generator (eg, diesel energization) is started and can take over the battery and run as long as there is fuel. Such a generator is very expensive because it must be able to generate as much power as the server center normally obtains from the main power source.
一実施形態では、ホスティングサービスHS1ないしHS5の各々は、互いにユーザデータを共有し、1つのサーバーセンターが停電した場合に、進行中のゲーム及びアプリケーションを休止し、次いで、ゲーム又はアプリケーションの状態データを各サーバー402から他のサーバーセンターのサーバー402へ転送し、そして各ユーザのクライアント415に通知して、新たなサーバー402と通信するように指令する。このような状態が頻繁に生じないとすれば、最適な待ち時間を与えることのできないホスティングサービスサーバーセンターへのユーザの転送を受け容れることができ(即ち、ユーザは、単に停電期間中に長い待ち時間を許容するだけでよく)、これは、ユーザを転送するための非常に広範囲のオプションを許す。例えば、米国を横切る時間ゾーン差が与えられると、東海岸のユーザは、PM11時30分には就寝するが、PM8時30分の西海岸のユーザは、ビデオゲームの使用がピークになり始めている。その時間に西海岸のホスティングサービスサーバーセンターに停電が生じた場合に、他のホスティングサービスサーバーセンターには、全てのユーザを取り扱うに充分な西海岸サーバー402が存在しないことがある。このような状況では、利用できるサーバー402を有する東海岸のホスティングサービスサーバーセンターへあるユーザを転送することができ、それらユーザに対してのみ長い待ち時間となる。ユーザが、停電したサーバーセンターから転送されると、サーバーセンターは、次いで、そのサーバー及び装置の整然とした遮断を開始し、バッテリ(又は他の即座の電源バックアップ)が尽きるまでに全ての装置を遮断することができる。このように、サーバーセンター用の発電機のコストを回避することができる。 In one embodiment, each of the hosting services HS1 to HS5 shares user data with each other, suspends ongoing games and applications in the event of a power outage at one server center, and then stores game or application status data. Transfer from each server 402 to another server center server 402 and notify each user's client 415 to instruct it to communicate with the new server 402. If such a situation does not occur frequently, it can accept the user's transfer to a hosting service server center that cannot provide optimal latency (ie, the user simply waits long during a power outage period). This only allows time), which allows a very wide range of options for transferring users. For example, given a time zone difference across the United States, East Coast users go to bed at 11:30 PM, while West Coast users at 8:30 PM begin to peak in video game usage. If a power outage occurs at the west coast hosting service server center at that time, there may not be enough west coast servers 402 at other hosting service server centers to handle all users. In such a situation, users can be transferred to the east coast hosting service server center with available servers 402, resulting in long latency only for those users. When a user is transferred from a failed server center, the server center then initiates an orderly shutdown of the server and equipment, shutting down all equipment until the battery (or other immediate power backup) is exhausted. can do. In this way, the cost of the generator for the server center can be avoided.
一実施形態では、ホスティングサービス210の激しい負荷の時間中に(ピークユーザ負荷によるか、又は1つ以上のサーバーセンターが停電したために)、ユーザは、彼等が使用しているゲーム又はアプリケーションの待ち時間要件に基づいて他のサーバーセンターへ転送される。従って、短待ち時間を要求するゲーム又はアプリケーションを使用しているユーザは、電源に制限があるときに、利用可能な短待ち時間サーバー接続への優先権が与えられる。 In one embodiment, during periods of heavy load on hosting service 210 (due to peak user load or because one or more server centers have lost power), users wait for the games or applications they are using. Forwarded to another server center based on time requirements. Thus, users using games or applications that require low latency are given priority to available low latency server connections when power is limited.
ホスティングサービスの特徴
図15は、以下の特徴説明に使用されるホスティングサービス210のためのサーバーセンターのコンポーネントの実施形態を示す。図2aに示されたホスティングサービス210と同様に、サーバーセンターのコンポーネントは、特に指示のない限り、ホスティングサービス210の制御システム401により制御され整合される。
Hosting Service Features FIG. 15 illustrates an embodiment of a server center component for the hosting service 210 used in the following feature description. Similar to the hosting service 210 shown in FIG. 2a, server center components are controlled and coordinated by the control system 401 of the hosting service 210 unless otherwise indicated.
ユーザクライアント415からのインバウンドインターネットトラフィック1501は、インバウンドルーティング1502に向けられる。典型的に、インバウンドインターネットトラフィック1501は、インターネットへの高速光ファイバ接続を経てサーバーセンターに入るが、適当な帯域巾、信頼性及び短待ち時間のネットワーク接続手段で充分である。インバウンドルーティング1502は、ネットワーク(ネットワークは、イーサネットネットワーク、ファイバチャンネルネットワークとして、或いは他の搬送手段を経て具現化できる)スイッチ、及びスイッチをサポートするルーティングサーバーのシステムであり、これは、到着するパケットを取り上げ、そして各パケットを適当なアプリケーション/ゲーム(app/game)サーバー1521−1525へルーティングする。一実施形態では、特定のapp/gameサーバーに配送されるパケットは、クライアントから受信されたデータのサブセットを表し、及び/又はデータセンター内の他のコンポーネント(例えば、ゲートウェイ及びルーターのようなネットワークコンポーネント)によって変換/変更されてもよい。あるケースでは、例えば、ゲーム又はアプリケーションが複数のサーバー上で並列に一度実行される場合に、パケットが一度に2つ以上のサーバー1521−1525へルーティングされる。RAIDアレイ1511−1512は、インバウンドルーティングネットワーク1502へ接続され、app/gameサーバー1521−1525がそれらRAIDアレイ1511−1512の読み取り及び書き込みを行えるようにする。更に、RAIDアレイ1515(複数のRAIDアレイとして具現化できる)も、インバウンドルーティング1502に接続され、RAIDアレイ1515からのデータは、app/gameサーバー1521−1525から読み出すことができる。インバウンドルーティング1502は、インバウンドインターネットトラフィック1501を根にもつスイッチのツリー構造、全ての種々の装置を相互接続するメッシュ構造、或いは相互通信装置間の集中トラフィックが他の装置間の集中トラフィックから分離されるようにして相互接続された一連のサブネットを含めて、広範囲な従来のネットワークアーキテクチャーで具現化することができる。ネットワークコンフィギュレーションの一形式は、SANであり、これは、典型的に記憶装置として使用されるが、装置間の一般的な高速データ転送に使用することもできる。又、app/gameサーバー1521−1525は、各々、インバウンドルーティング1502への複数のネットワーク接続を有する。例えば、サーバー1521−1525は、RAIDアレイ1511−1512に取り付けられたサブネットへのネットワーク接続と、他の装置に取り付けられたサブネットへの別のネットワーク接続とを有することができる。 Inbound internet traffic 1501 from user client 415 is directed to inbound routing 1502. Typically, inbound Internet traffic 1501 enters the server center via a high speed fiber optic connection to the Internet, but network connections with adequate bandwidth, reliability and low latency are sufficient. Inbound routing 1502 is a network switch (a network can be embodied as an Ethernet network, a fiber channel network, or via other transport means) and a system of routing servers that support the switch. Pick up and route each packet to the appropriate application / game (app / game) server 1521-1525. In one embodiment, packets delivered to a particular app / game server represent a subset of data received from a client and / or other components in the data center (eg, network components such as gateways and routers). ) May be converted / changed. In some cases, for example, if a game or application is executed once in parallel on multiple servers, the packet is routed to more than one server 1521-1525 at a time. The RAID arrays 1511-1512 are connected to the inbound routing network 1502 and allow the app / game servers 1521-1525 to read and write to the RAID arrays 1511-1512. Further, a RAID array 1515 (which can be implemented as a plurality of RAID arrays) is also connected to the inbound routing 1502, and data from the RAID array 1515 can be read from the app / game servers 1521-1525. Inbound routing 1502 is a tree structure of switches rooted in inbound Internet traffic 1501, a mesh structure that interconnects all the various devices, or concentrated traffic between intercommunication devices is separated from concentrated traffic between other devices. It can be implemented in a wide range of conventional network architectures, including a series of interconnected subnets. One form of network configuration is SAN, which is typically used as a storage device, but can also be used for general high-speed data transfer between devices. The app / game servers 1521-1525 each have a plurality of network connections to the inbound routing 1502. For example, the servers 1521-1525 can have a network connection to a subnet attached to the RAID array 1511-1512 and another network connection to a subnet attached to another device.
app/gameサーバー1521−1525は、図4aに示す実施形態におけるサーバー402に関して上述したように、全部が同じに、幾つかが異なるように、又は全部が異なるように構成されてもよい。一実施形態では、各ユーザは、ホスティングサービスを利用するときに、典型的に、少なくとも1つのapp/gameサーバー1521−1525を使用する。説明を簡略化するため、所与のユーザがapp/gameサーバー1521を使用すると仮定するが、1人のユーザが複数のサーバーを使用することができると共に、複数のユーザが単一のapp/gameサーバー1521−1525を共有することができる。上述したようにクライアント415から送られるユーザ制御入力は、インバウンドインターネットトラフィック1501として受け取られ、そしてインバウンドルーティング1502を通してapp/gameサーバー1521へルーティングされる。app/gameサーバー1521は、ユーザの制御入力を、サーバー上で実行されるゲーム又はアプリケーションへの制御入力として使用し、そしてビデオ及びそれに関連したオーディオの次のフレームを計算する。次いで、app/gameサーバー1521は、非圧縮のビデオ/オーディオ1529を共有ビデオ圧縮1530へ出力する。app/gameサーバーは、非圧縮のビデオを、1ギガビット以上のイーサネット接続を含む手段を経て出力できるが、一実施形態では、ビデオがDVI接続を経て出力され、そしてオーディオ及び他の圧縮並びに通信チャンネル状態情報は、ユニバーサルシリアルバス(USB)接続を経て出力される。 The app / game servers 1521-1525 may be configured to be all the same, some different, or all different, as described above with respect to server 402 in the embodiment shown in FIG. 4a. In one embodiment, each user typically uses at least one app / game server 1521-1525 when utilizing a hosting service. For simplicity, assume that a given user uses an app / game server 1521, but one user can use multiple servers and multiple users can use a single app / game. Servers 1521-1525 can be shared. User control input sent from client 415 as described above is received as inbound internet traffic 1501 and routed to app / game server 1521 through inbound routing 1502. The app / game server 1521 uses the user's control input as a control input to a game or application running on the server, and calculates the next frame of video and associated audio. The app / game server 1521 then outputs the uncompressed video / audio 1529 to the shared video compression 1530. The app / game server can output uncompressed video via means including a 1 gigabit or higher Ethernet connection, but in one embodiment, the video is output via a DVI connection, and audio and other compression and communication channels. The status information is output via a universal serial bus (USB) connection.
共有ビデオ圧縮1530は、app/gameサーバー1521ないし1525からの非圧縮ビデオ及びオーディオを圧縮する。圧縮は、完全にハードウェアで具現化されてもよいし、又はハードウェア実行ソフトウェアで具現化されてもよい。各app/gameサーバー1521ないし1525に対する専用コンプレッサがあってもよいし、又はコンプレッサが充分高速である場合には、所与のコンプレッサを使用して、2つ以上のapp/gameサーバー1521ないし1525からのビデオ/オーディオを圧縮することができる。例えば、60fpsでは、ビデオフレーム時間は、16.67msである。コンプレッサがフレームを1msで圧縮できる場合には、そのコンプレッサを使用して、16個程度のapp/gameサーバー1521ないし1525からのビデオ/オーディオを圧縮することができ、これは、あるサーバーからの入力を別のサーバーの後に取り上げ、コンプレッサが各ビデオ/オーディオ圧縮プロセスの状態をセーブし、そしてコンテクストを、それがサーバーからのビデオ/オーディオストリーム間で循環するときにスイッチすることにより行われる。その結果、圧縮ハードウェアにおいて実質的なコスト節約が得られる。異なるサーバーが異なる時間にフレームを完了するので、一実施形態では、コンプレッサリソースが、各圧縮プロセスの状態を記憶するための共有記憶手段(例えば、RAM、フラッシュ)と共に共有プール1530にあり、サーバー1521−1525のフレームが完了して圧縮の準備ができると、制御手段は、どの圧縮リソースがそのとき利用できるか決定し、圧縮リソースに、サーバーの圧縮プロセスの状態と、圧縮すべき非圧縮ビデオ/オーディオのフレームとを与える。 Shared video compression 1530 compresses uncompressed video and audio from app / game servers 1521-1525. The compression may be implemented entirely in hardware or may be implemented in hardware executing software. There may be a dedicated compressor for each app / game server 1521-1525, or, if the compressor is fast enough, use a given compressor to move from more than one app / game server 1521-1525. Video / audio can be compressed. For example, at 60 fps, the video frame time is 16.67 ms. If the compressor can compress a frame in 1 ms, it can be used to compress video / audio from as many as 16 app / game servers 1521-1525, which is the input from one server. Is taken after another server, the compressor saves the state of each video / audio compression process, and the context is switched as it cycles between the video / audio streams from the server. As a result, substantial cost savings are obtained in the compression hardware. Since different servers complete frames at different times, in one embodiment, compressor resources are in shared pool 1530 with shared storage means (eg, RAM, flash) for storing the state of each compression process, and server 1521 When the 1525 frame is complete and ready for compression, the control means determines which compression resources are available at that time, including the compression process status of the server and the uncompressed video / Give with audio frames.
各サーバーの圧縮プロセスの状態の一部分は、圧縮それ自体に関する情報、例えば、Pタイルの基準として使用できる以前のフレームの解凍フレームバッファデータ、ビデオ出力の解像度;圧縮のクオリティ;タイル構造;タイル当たりのビットの割り当て;圧縮のクオリティ、オーディオフォーマット(例えば、ステレオ、サラウンドサウンド、Dolby(登録商標)、AC−3)を含むことに注意されたい。しかし、圧縮プロセスの状態は、ピークデータレート941に関する通信チャンネル状態情報、以前のフレーム(図9bに示す)が現在出力されるかどうか(その結果、現在フレームを無視すべきかどうか)、そして潜在的に、圧縮に考慮すべきチャンネル特性、例えば、圧縮の判断に影響する過剰なパケットロス(例えば、Iタイルの頻度、等に関して)があるかどうか、も含む。クライアント415から送られるデータを監視する各ユーザをサポートするapp/gameサーバー1521−1525により決定されるように、ピークデータレート941又は他のチャンネル特性が時間と共に変化するときに、app/gameサーバー1521−1525は、共有ハードウェア圧縮1530へ関連情報を送信する。 Part of the state of each server's compression process is information about the compression itself, eg decompressed frame buffer data of previous frames that can be used as a reference for P tiles, video output resolution; compression quality; tile structure; Note that bit allocation; quality of compression, audio format (eg, stereo, surround sound, Dolby®, AC-3). However, the state of the compression process depends on the communication channel state information regarding the peak data rate 941, whether the previous frame (shown in FIG. 9b) is currently output (thus whether the current frame should be ignored) and potential Also includes channel characteristics to be considered for compression, for example, whether there are excessive packet losses (eg, with respect to I tile frequency, etc.) that affect compression decisions. The app / game server 1521 when the peak data rate 941 or other channel characteristics change over time as determined by the app / game server 1521-1525 that supports each user monitoring the data sent from the client 415. -1525 sends the relevant information to the shared hardware compression 1530.
又、共有ハードウェア圧縮1530は、上述したような手段を使用して、圧縮されたビデオ/オーディオをパケット化し、そしてもし適当であれば、FECコードを適用し、あるデータを複写し、又は他のステップを行って、ビデオ/オーディオデータストリームをクライアント415により受信しそしてできるだけ高いクオリティ及び信頼性で解凍するという能力を充分に確保するようにする。 Shared hardware compression 1530 may also use the means described above to packetize the compressed video / audio and, if appropriate, apply the FEC code, copy some data, or otherwise To ensure that the video / audio data stream is received by the client 415 and decompressed with the highest possible quality and reliability.
以下に述べるような幾つかのアプリケーションでは、所与のapp/gameサーバー1521−1525のビデオ/オーディオ出力を同時に複数の解像度で(又は他の複数のフォーマットで)得られることが要求される。従って、app/gameサーバー1521−1525が共有ハードウェア圧縮1530のリソースを通知する場合には、そのapp/gameサーバー1521−1525の非圧縮ビデオ/オーディオ1529が、異なるフォーマット、異なるリソース、及び/又は異なるパケット/エラー修正構造で同時に圧縮される。あるケースでは、幾つかの圧縮リソースを、同じビデオ/オーディオを圧縮する複数の圧縮プロセス間で共有することができる(例えば、多くの圧縮アルゴリズムには、圧縮を適用する前に映像を複数のサイズにスケーリングするステップがある。異なるサイズの映像を出力することが要求される場合に、このステップを使用して、一度に多数の圧縮プロセスに応じることができる)。他のケースでは、フォーマットごとに個別の圧縮リソースが要求される。いずれにせよ、所与のapp/gameサーバー1521−1525に要求される全ての種々の解像度及びフォーマットの圧縮されたビデオ/オーディオ1539は、(1つであっても多数であっても)アウトバウンドルーティング1540へ一度に出力される。一実施形態では、圧縮されたビデオ/オーディオ1539の出力はUDPフォーマットであり、従って、パケットの位置方向性ストリームである。 Some applications, such as those described below, require that the video / audio output of a given app / game server 1521-1525 be obtained simultaneously in multiple resolutions (or in other formats). Thus, if the app / game server 1521-1525 notifies the resource of the shared hardware compression 1530, the uncompressed video / audio 1529 of that app / game server 1521-1525 may have a different format, different resource, and / or Compressed simultaneously with different packet / error correction structures. In some cases, some compression resources can be shared between multiple compression processes that compress the same video / audio (eg, many compression algorithms require multiple sizes of video before applying compression). There is a scaling step that can be used to accommodate multiple compression processes at once if it is required to output video of different sizes). In other cases, a separate compression resource is required for each format. In any case, all the various resolutions and formats of compressed video / audio 1539 required for a given app / game server 1521-1525 are outbound routing (whether one or many). Output to 1540 at a time. In one embodiment, the output of the compressed video / audio 1539 is in UDP format and is therefore a position-oriented stream of packets.
アウトバウンドルーティングネットワーク1540は、圧縮された各ビデオ/オーディオストリームを、アウトバウンドインターネットトラフィック1599インターフェイス(これは、典型的に、インターネットへのファイバインターフェイスに接続される)を通して意図されたユーザ(1人又は複数)又は他の行先へ向け、及び/又は遅延バッファ1515へ戻し、及び/又はインバウンドルーティング1502へ戻し、及び/又はビデオ配布のためにプライベートネットワーク(図示せず)を通して向ける一連のルーティングサーバー及びスイッチを備えている。(以下に述べるように)アウトバウンドルーティング1540は、所与のビデオ/オーディオストリームを一度に複数の行先へ出力できることに注意されたい。一実施形態では、これは、一度に複数の行先へストリーミングされることが意図された所与のUDPストリームをブロードキャストし、そしてこのブロードキャストをアウトバウンドルーティング1540内のルーティングサーバー及びスイッチにより繰り返すようなインターネットプロトコル(IP)マルチキャストを使用して具現化される。ブロードキャストの複数の行先は、インターネットを経て複数のユーザのクライアント415、インバウンドルーティング1502を経て複数のapp/gameサーバー1521−1525、及び/又は1つ以上の遅延バッファ1515である。従って、所与のサーバー1521−1522の出力は、1つ又は複数のフォーマットへ圧縮され、そして各圧縮されたストリームは、1つ又は複数の行先へ向けられる。 The outbound routing network 1540 routes each compressed video / audio stream to the intended user (s) through an outbound internet traffic 1599 interface (which is typically connected to a fiber interface to the internet). Or a series of routing servers and switches directed to other destinations and / or back to delay buffer 1515 and / or back to inbound routing 1502 and / or directed through a private network (not shown) for video distribution. ing. Note that outbound routing 1540 (as described below) can output a given video / audio stream to multiple destinations at once. In one embodiment, this is an Internet protocol that broadcasts a given UDP stream intended to be streamed to multiple destinations at a time and repeats this broadcast by routing servers and switches in the outbound routing 1540. It is implemented using (IP) multicast. The multiple broadcast destinations are multiple user clients 415 via the Internet, multiple inbound routing 1502, multiple app / game servers 1521-1525, and / or one or more delay buffers 1515. Thus, the output of a given server 1521-1522 is compressed into one or more formats, and each compressed stream is directed to one or more destinations.
更に、別の実施形態では、複数のapp/gameサーバー1521−1525が1人のユーザにより同時に使用され(例えば、複雑なシーンの3D出力を生成するために並列処理構成で)そして各サーバーが出来上がる映像の一部分を発生する場合には、複数のサーバー1521−1525のビデオ出力を共有ハードウェア圧縮1530により合成フレームへと合成することができ、そしてその点以降は、それが単一のapp/gameサーバー1521−1525から到来したかのように、上述したように取り扱われる。 Furthermore, in another embodiment, multiple app / game servers 1521-1525 are used simultaneously by a single user (eg, in a parallel processing configuration to generate 3D output of complex scenes) and each server is completed. When generating a portion of the video, the video output of multiple servers 1521-1525 can be combined into a composite frame by shared hardware compression 1530, and from that point on, it is a single app / game. It is handled as described above as if it had arrived from the server 1521-1525.
一実施形態では、app/gameサーバー1521−1525により発生される全ビデオのコピー(少なくともユーザが見るビデオの解像度又はそれ以上)が、少なくとも数分(一実施形態では、15分)、遅延バッファ1515に記録されることに注意されたい。これは、各ユーザが、以前の働き又は成績(ゲームの場合)を再検討するために各セッションからビデオを「巻き戻し」できるようにする。従って、一実施形態では、ユーザクライアント415へルーティングされる圧縮された各ビデオ/オーディオ出力1539のストリームは、遅延バッファ1515へもマルチキャストされる。ビデオ/オーディオが遅延バッファ1515に記憶されるときには、遅延バッファ1515のディレクトリが、遅延されたビデオ/オーディオのソースであるapp/gameサーバー1521−1525のネットワークアドレスと、遅延されたビデオ/オーディオを見つけることのできる遅延バッファ1515上の位置との間の相互参照を与える。 In one embodiment, a copy of the entire video generated by the app / game server 1521-1525 (at least the resolution of the video viewed by the user or higher) is at least a few minutes (in one embodiment, 15 minutes), the delay buffer 1515 Note that it is recorded in This allows each user to “rewind” the video from each session to review previous work or performance (in the case of games). Thus, in one embodiment, each compressed stream of video / audio output 1539 routed to user client 415 is also multicast to delay buffer 1515. When video / audio is stored in the delay buffer 1515, the directory of the delay buffer 1515 finds the network address of the app / game server 1521-1525 that is the source of the delayed video / audio and the delayed video / audio. Provides a cross-reference between possible locations on the delay buffer 1515.
生の、瞬時に見られる、瞬時にプレイ可能なゲーム
app/gameサーバー1521−1525は、ユーザのための所与のアプリケーション又はビデオゲームを実行するのに使用できるだけでなく、ホスティングサービス210によるナビゲーション及び他の特徴をサポートするホスティングサービス210のためのユーザインターフェイスアプリケーションを生成するのにも使用できる。1つのこのようなユーザインターフェイスアプリケーションのスクリーンショットが図16に示されており、即ち「ゲームファインダー」スクリーンである。この特定のユーザインターフェイススクリーンは、ユーザが、他のユーザにより生で(又は遅延されて)プレイされている15のゲームを見ることができるようにする。1600のような「サムネール」ビデオウインドウの各々は、動きのある生のビデオウインドウで、1人のユーザのゲームから1つのビデオを示している。サムネールに示される視野は、ユーザが見ている同じ視野でもよいし、遅延された視野でもよい(例えば、ユーザがコンバットゲームをプレイする場合、ユーザは、自分がどこに隠れているか他のユーザから見えるのを望まず、又、ゲームプレイの視野を、ある期間、例えば、10分遅らせることを選択してもよい)。又、視野は、ユーザの視野とは異なるゲームのカメラ視野でもよい。メニュー選択肢(この図には示さず)を通して、ユーザは、種々の基準に基づいて、一度に見るゲームの選択を選ぶことができる。例示的選択の小さな例として、ユーザは、(図16に示すような)ゲームのランダムな選択、(異なるプレーヤにより全てプレイされる)一種類の全てのゲーム、ゲームのトップランクプレーヤのみ、ゲームの所与のレベルのプレーヤ、低いランクのプレーヤ(例えば、プレーヤが基礎を学習している場合)、「相棒」(又はライバル)であるプレーヤ、視聴者の最も多いゲーム、等を選ぶことができる。
The live, instantly viewed, instantly playable game app / game server 1521-1525 can be used to run a given application or video game for the user, as well as navigation by the hosting service 210 and It can also be used to create user interface applications for hosting service 210 that support other features. A screen shot of one such user interface application is shown in FIG. 16, ie a “game finder” screen. This particular user interface screen allows the user to view 15 games that are being played live (or delayed) by other users. Each of the “thumbnail” video windows, such as 1600, is a live video window with motion, showing one video from one user's game. The field of view shown in the thumbnail may be the same field of view that the user is viewing or may be a delayed field of view (e.g., if the user plays a combat game, the user will see where others are hiding) And may choose to delay the view of the game play for a period of time, eg, 10 minutes). The field of view may be a camera field of view of a game different from the user's field of view. Through menu choices (not shown in this figure), the user can select a selection of games to watch at a time based on various criteria. As a small example of an exemplary selection, the user may select a random selection of games (as shown in FIG. 16), all games of one type (all played by different players), only the top ranked players of the game, A player at a given level, a low-ranking player (eg, if the player is learning the basics), a player who is a “friend” (or rival), a game with the most viewers, etc. can be selected.
一般的に、各ユーザは、自分のゲーム又はアプリケーションからのビデオが他人に見られるかどうか判断し、もしそうであれば、どんな他人、いつ他人に見られるか、遅れて見られるだけかどうか、判断することに注意されたい。 In general, each user will determine if the video from their game or application will be seen by others, and if so, what others, when others will see them, only if they will be seen late, Note the judgment.
図16に示すユーザインターフェイススクリーンを発生するapp/gameサーバー1521−1525は、ゲームが要求される各ユーザについてapp/gameサーバー1521−1525へメッセージを送信することにより15個のビデオ/オーディオフィードを取得する。このメッセージは、インバウンドルーティング1502又は別のネットワークを通して送信される。このメッセージは、要求されたビデオ/オーディオのサイズ及びフォーマットを含み、ユーザインターフェイススクリーンを見ているユーザを識別する。所与のユーザは、「プライバシー」モードを選択し、他のユーザが彼のゲームのビデオ/オーディオを(彼の視点又は別の視点から)見るのを許さないことを選ぶか、或いは前記段落で述べたように、ユーザは、彼のゲームからのビデオ/オーディオを見るのを許すが、見るビデオ/オーディオを遅らせることを選んでもよい。ビデオ/オーディオを見ることを許すための要求を受け取って受け容れるユーザapp/gameサーバー1521−1525は、要求側サーバーに確認を送り、共有ハードウェア圧縮1530に、要求されたフォーマット又はスクリーンサイズで付加的な圧縮されたビデオストリームを発生する要求も通知し(フォーマット及びスクリーンサイズが、既に発生されたものとは異なると仮定すれば)、そしてその圧縮されたビデオの行先(即ち、要求側サーバー)も指示する。要求されたビデオ/オーディオが遅延されるだけである場合には、要求側app/gameサーバー1521−1525は、そのように通知され、そして遅延バッファ1515のディレクトリにおけるビデオ/オーディオの位置と、遅延されたビデオ/オーディオのソースであるapp/gameサーバー1521−1525のネットワークアドレスとをルックアップすることにより、遅延バッファ1515から遅延されたビデオ/オーディオを取得する。これらの要求が全て発生されて処理されると、15までの生のサムネールサイズのビデオストリームが、アウトバウンドルーティング1540から、app/gameサーバー1521−1525へのインバウンドルーティング1502へルーティングされて、ユーザインターフェイススクリーンを発生し、そしてサーバーにより解凍されて表示される。遅延されたビデオ/オーディオストリームは、スクリーンサイズが大き過ぎることがあり、もしそうであれば、app/gameサーバー1521−1525は、ストリームを解凍して、ビデオストリームをサムネールサイズへスケールダウンする。一実施形態では、オーディオ/ビデオのための要求が、図4aのホスティングサービス制御システムと同様の中央「管理」サービス(図15には示さず)へ送られ(及びそれにより管理され)、これは、次いで、その要求を適当なapp/gameサーバー1521−1525へ向け直す。更に、一実施形態では、サムネールが、それを許すユーザのクライアントへ「プッシュ」されるので、要求が発せられないこともある。 The app / game server 1521-1525 that generates the user interface screen shown in FIG. 16 obtains 15 video / audio feeds by sending a message to the app / game server 1521-1525 for each user for whom a game is requested. To do. This message is sent through inbound routing 1502 or another network. This message includes the requested video / audio size and format and identifies the user viewing the user interface screen. A given user chooses the “privacy” mode and chooses not to allow other users to watch his game's video / audio (from his point of view or another point of view) or in the paragraph above As stated, the user is allowed to watch video / audio from his game, but may choose to delay viewing video / audio. User app / game server 1521-1525 that receives and accepts the request to allow viewing video / audio sends confirmation to requesting server and appends to shared hardware compression 1530 in the requested format or screen size Also notify the request to generate a typical compressed video stream (assuming the format and screen size are different from those already generated) and the destination of the compressed video (ie requesting server) Also instruct. If the requested video / audio is only delayed, the requesting app / game server 1521-1525 is so notified and delayed with the location of the video / audio in the directory of the delay buffer 1515. The delayed video / audio is obtained from the delay buffer 1515 by looking up the network address of the app / game server 1521-1525 which is the source of the video / audio. Once all these requests have been generated and processed, up to 15 raw thumbnail-sized video streams are routed from outbound routing 1540 to inbound routing 1502 to app / game servers 1521-1525 to the user interface screen. And is decompressed and displayed by the server. The delayed video / audio stream may have a screen size that is too large, and if so, the app / game server 1521-1525 decompresses the stream and scales the video stream down to the thumbnail size. In one embodiment, the request for audio / video is sent (and managed by) a central “management” service (not shown in FIG. 15) similar to the hosting service control system of FIG. Then redirect the request to the appropriate app / game server 1521-1525. Further, in one embodiment, the request may not be issued because the thumbnail is “pushed” to the user's client that allows it.
全て同時に混合される15個のゲームからのオーディオは、不快な音を発することがある。ユーザは、このように全ての音を一緒に混合することを選んでもよいし(おそらく、見ている全てのアクションにより生じる騒音の感覚を単に得るために)、又はユーザは、一度に1つのゲームからのオーディオのみを聞くことを選んでもよい。単一ゲームの選択は、黄色の選択ボックス1601を所与のゲームへ移動することにより達成される(黄色のボックスの移動は、キーボード上の矢印キーを使用するか、マウスを移動するか、ジョイスティックを動かすか、又は移動電話のような別の装置の方向ボタンを押すことにより達成できる)。単一のゲームが選択されると、そのゲームからのオーディオだけが再生される。又、ゲーム情報1602も示される。このゲームの場合には、例えば、発行者ロゴ(“EA”)及びゲームロゴ“Need for Speed Carbon”、及びオレンジの水平バーは、その特定の瞬間にゲームをプレイするか又は見ている人々の数を相対的な表現で指示する(この場合は、多数、従って、ゲームは、「ホット」)。更に、「スタッツ(Stats)」も設けられ、これは、145人のプレーヤがNeed for Speed Gameの80個の異なるインスタンス化を能動的にプレイしており(即ち、個人プレーヤゲーム又はマルチプレーヤゲームのいずれかによりプレイできる)、そして680人の視聴者がいる(このユーザは、そのうちの1人である)ことを示している。これらの統計値(及び他の統計値)は、ホスティングサービス210のオペレーションのログを保持すると共に、ユーザに適宜請求し、又、コンテンツを提供する発行者に支払するために、ホスティングサービス制御システム401により収集され、そしてRAIDアレイ1511−1512に記憶される。統計値のあるものは、サービス制御システム401によりアクションによって記録され、そしてあるものは、個々のapp/gameサーバー1521−1525によりサービス制御システム401へ報告される。例えば、この「ゲームファインダー」アプリケーションを実行するapp/gameサーバー1521−1525は、ゲームを見ているとき(及びゲームを見終えたとき)ホスティングサービス制御システム401へメッセージを送信し、どれほど多くのゲームが見られているかの統計値を更新できるようにする。統計値のあるものは、この「ゲームファインダー」アプリケーションのようなユーザインターフェイスアプリケーションに利用される。 Audio from fifteen games all mixed at the same time can make an unpleasant sound. The user may choose to mix all sounds together in this way (perhaps just to get a sensation of noise caused by all the actions they are seeing), or the user can play one game at a time. You may choose to listen only to audio from. Single game selection is accomplished by moving the yellow selection box 1601 to the given game (moving the yellow box using the arrow keys on the keyboard, moving the mouse, joystick Or by pressing the direction button of another device, such as a mobile phone). When a single game is selected, only the audio from that game is played. Game information 1602 is also shown. In the case of this game, for example, the issuer logo (“EA”) and the game logo “Need for Speed Carbon” and the orange horizontal bar indicate the people who are playing or watching the game at that particular moment. Numbers are indicated in relative terms (in this case many, and thus the game is “hot”). In addition, “Stats” is also provided, which means that 145 players are actively playing 80 different instantiations of Need for Speed Game (ie, individual player games or multiplayer games). And 680 viewers (this user is one of them). These statistics (and other statistics) maintain a log of the hosting service 210 operations and are billed to the user as appropriate and paid to the publisher that provides the content. And stored in RAID arrays 1511-1512. Some statistics are recorded by actions by the service control system 401, and some are reported to the service control system 401 by individual app / game servers 1521-1525. For example, the app / game server 1521-1525 executing this “game finder” application sends a message to the hosting service control system 401 when watching the game (and finishing watching the game), and how many games Allows updating of statistics on whether or not Some of the statistics are used in user interface applications such as this “game finder” application.
ユーザは、入力装置のアクチベーションボタンをクリックした場合に、フルスクリーンサイズへの生の状態を保ちながら黄色のボックス内のサムネールビデオをズームアップして見ることができる。この効果が図17のプロセスに示されている。ビデオウインドウ1700は、サイズが増大していることに注意されたい。この効果を具現化するために、app/gameサーバー1521−1525は、選択されたゲームを実行しているapp/gameサーバー1521−1525から、そこにルーティングされたゲームのフルスクリーンサイズのビデオストリームのコピーを取ることを要求する(ユーザのディスプレイ装置422の解像度で)。ゲームを実行しているapp/gameサーバー1521−1525は、共有ハードウェアコンプレッサ1530に、ゲームのサムネールサイズのコピーがもはや必要ない(別のapp/gameサーバー1521−1525がそのようなサムネールを要求しない限り)ことを通知し、次いで、ビデオのフルスクリーンサイズコピーを、ビデオをズームしているapp/gameサーバー1521−1525へ送信することを指令する。ゲームをプレイしているユーザは、ゲームをズームアップしているユーザと同じ解像度のディスプレイ装置422を有していても、いなくてもよい。更に、ゲームを見る他の者も、ゲームをズームアップしているユーザと同じ解像度のディスプレイ装置422を有していても、いなくてもよい(且つ異なるオーディオ再生手段、例えば、ステレオ又はサラウンドサウンドを有してもよい)。従って、共有ハードウェアコンプレッサ1530は、ビデオ/オーディオストリームを要求しているユーザの要件を満足する適当に圧縮されたビデオ/オーディオストリームが既に発生されたかどうか決定し、もしそれが存在する場合には、ビデオをズームしているapp/gameサーバー1521−1525へストリームのコピーをルーティングするようにアウトバウンドルーティング1540に通知し、又、もしそうでなければ、そのユーザに適したビデオの別のコピーを圧縮して、ビデオをズームしているapp/gameサーバー1521−1525及びインバウンドルーティング1502へストリームを返送するようにアウトバウンドルーティングに命令する。選択されたビデオのフルスクリーンバージョンを現在受信しているこのサーバーは、それを解凍し、フルサイズまで徐々にスケールアップする。 When the user clicks the activation button on the input device, the user can zoom in on the thumbnail video in the yellow box while keeping the raw state to full screen size. This effect is illustrated in the process of FIG. Note that the video window 1700 has increased in size. In order to embody this effect, the app / game server 1521-1525 receives the full screen size video stream of the game routed to it from the app / game server 1521-1525 running the selected game. Request to make a copy (at the resolution of the user's display device 422). The app / game server 1521-1525 running the game no longer needs a copy of the game thumbnail size from the shared hardware compressor 1530 (another app / game server 1521-1525 does not require such a thumbnail) Limit) and then command a full screen size copy of the video to be sent to the app / game server 1521-1525 that is zooming the video. The user who is playing the game may or may not have the display device 422 having the same resolution as the user who is zooming up the game. In addition, others viewing the game may or may not have the same resolution display device 422 as the user zooming in on the game (and different audio playback means such as stereo or surround sound). May be included). Thus, the shared hardware compressor 1530 determines whether a properly compressed video / audio stream has already been generated that satisfies the requirements of the user requesting the video / audio stream, and if it exists. Notify outbound routing 1540 to route a copy of the stream to the app / game server 1521-1525 zooming the video, and if not, compress another copy of the video appropriate for that user To instruct the outbound routing to send the stream back to the app / game server 1521-1525 and the inbound routing 1502 that are zooming the video. The server currently receiving a full screen version of the selected video will decompress it and gradually scale up to full size.
図18は、ゲームがフルスクリーンへ完全にズームアップされた後にスクリーンがどのように見えるか示しており、ゲームは、矢印1800で指された映像により示すように、ユーザのディスプレイ装置422の全解像度で示されている。ゲームファインダーアプリケーションを実行しているapp/gameサーバー1521−1525は、もはや必要でないサムネールを発生した他のapp/gameサーバー1521−1525へメッセージを送信すると共に、他のゲームがもはや見られていないホスティングサービス制御サーバー401へメッセージを送信する。この点において、発生される表示は、スクリーンの頂部にあって、情報及びメニュー制御をユーザに与えるオーバーレイ1801である。このゲームが進行するにつれて、観衆は、2503人の視聴者まで増加したことに注意されたい。このように大勢の視聴者では、同じ又はほぼ同じ解像度をもつディスプレイ装置422に大勢の視聴者が結び付けられる(各app/gameサーバー1521−1525は、適合性を調整するためにビデオをスケーリングする能力を有する)。 FIG. 18 shows what the screen will look like after the game is fully zoomed up to full screen, and the game is displayed at the full resolution of the user's display device 422 as shown by the video pointed to by arrow 1800. It is shown in The app / game server 1521-1525 running the game finder application sends a message to the other app / game server 1521-1525 that has generated a thumbnail that is no longer needed, and no other games are seen. A message is transmitted to the service control server 401. In this regard, the generated display is an overlay 1801 that is at the top of the screen and provides information and menu control to the user. Note that as the game progressed, the audience increased to 2503 viewers. Thus, with a large number of viewers, a large number of viewers are tied to a display device 422 that has the same or nearly the same resolution (each app / game server 1521-1525 is capable of scaling the video to adjust the fit). Have).
図示されたゲームは、マルチプレーヤゲームであるから、ユーザは、ある点でゲームに加わることを決定できる。ホスティングサービス210は、種々の理由で、ユーザがゲームに加わるのを許しても許さなくてもよい。例えば、ユーザは、ゲームをプレイするために支払しなければならず、又、プレイしないことを選んでもよく、ユーザは、その特定のゲームに加わるに充分なランキングを有していないことがあり(例えば、他のプレーヤとの競争に耐えない)、或いはユーザのインターネット接続は、ユーザがプレイするのに充分な短い待ち時間を有していないことがある(例えば、ゲームを見るための待ち時間制約がなく、従って、遠くで(実際上、別の大陸で)プレイされるゲームを、待ち時間の問題なしに見ることはできるが、プレイするゲームについては、待ち時間は、(a)ゲームを楽しむために、及び(b)短い待ち時間接続を有する他のプレーヤと平等の立場であるために、ユーザにとって充分短いものでなければならない)。ユーザがプレイを許された場合には、ユーザに対して「ゲームファインダー」ユーザインターフェイスを与えたapp/gameサーバー1521−1525は、ホスティングサービス制御サーバー401が、特定のゲームをプレイするために適当に構成されたapp/gameサーバー1521−1525を始動して(即ち、探索し始動して)、RAIDアレイ1511−1512からゲームをロードし、次いで、ホスティングサービス制御サーバー401が、ゲームを現在ホストしているapp/gameゲームサーバーへユーザから制御信号を転送するようにインバウンドルーティング1502に命令すると共に、「ゲームファインダー」アプリケーションをホストしたapp/gameサーバーからのビデオ/オーディオを圧縮することから、ゲームを現在ホストしているapp/gameサーバーからのビデオ/オーディオを圧縮することへスイッチするように共有ハードウェアコンプレッサ1530に命令することを要求する。「ゲームファインダー」app/gameサービス、及びゲームをホストしている新たなapp/gameサーバーの垂直同期は、同期されず、その結果、2つの同期間におそらく時間差が生じる。共有ビデオ圧縮ハードウェア1530は、app/gameサーバー1521−1525がビデオフレームを完成したときにビデオの圧縮を開始するので、新たなサーバーからの第1のフレームは、古いサーバーのフルフレーム時間より早期に完成され、これは、その手前の圧縮されたフレームがその送信を完了する前である(例えば、図9bの送信時間992を考えると、非圧縮フレーム3 963がフレーム時間の半分早期に完成された場合に、送信時間992に影響を及ぼす)。このような状況では、共有ビデオ圧縮ハードウェア1530は、新たなサーバーからの第1のフレームを無視し(例えば、フレーム4 964が無視される(974)のと同様に)、クライアント415は、古いサーバーからの最後のフレームを特別のフレーム時間中保持し、そして共有ビデオ圧縮ハードウェア1530は、ゲームをホストする新たなapp/gameサーバーからの次のフレーム時間ビデオの圧縮を開始する。視覚上、あるapp/gameサーバーから他のapp/gameサーバーへの移行は、シームレスである。ホスティングサービス制御サーバー401は、次いで、「ゲームファインダー」をホストしていたapp/gameゲームサーバー1521−1525に、それが再び必要になるまでアイドル状態にスイッチするように通知する。 Since the game shown is a multiplayer game, the user can decide to join the game at some point. The hosting service 210 may or may not allow the user to join the game for various reasons. For example, a user may have to pay to play a game, or may choose not to play, and the user may not have enough ranking to participate in that particular game ( For example, the user's Internet connection may not have a short enough waiting time for the user to play (eg, a latency constraint for watching the game). Thus, a game played at a distance (effectively on another continent) can be viewed without latency issues, but for games to play, latency is (a) enjoying the game And (b) it must be short enough for the user to be on an equal footing with other players with short latency connections). If the user is allowed to play, the app / game server 1521-1525 that provided the user with a “game finder” user interface is suitable for the hosting service control server 401 to play a particular game. Start the configured app / game server 1521-1525 (ie, search and start) to load the game from the RAID array 1511-1512, and then the hosting service control server 401 is now hosting the game Instructs inbound routing 1502 to transfer control signals from the user to the current app / game game server, and compresses video / audio from the app / game server hosting the “Game Finder” application From, to request that the instruction to the shared hardware compressor 1530 to switch to it to compress the video / audio from the app / game server game currently host. The “game finder” app / game service and the vertical sync of the new app / game server hosting the game are not synchronized, resulting in a likely time difference between the two syncs. The shared video compression hardware 1530 starts compressing the video when the app / game server 1521-1525 completes the video frame, so the first frame from the new server is earlier than the full frame time of the old server. This is before the previous compressed frame completes its transmission (eg, considering transmission time 992 in FIG. 9b, uncompressed frame 3 963 is completed half an early frame time. The transmission time 992 is affected. In such a situation, the shared video compression hardware 1530 ignores the first frame from the new server (eg, as frame 4 964 is ignored (974)), and the client 415 The last frame from the server is held for a special frame time, and the shared video compression hardware 1530 begins to compress the next frame time video from the new app / game server hosting the game. Visually, the transition from one app / game server to another app / game server is seamless. The hosting service control server 401 then informs the app / game game server 1521-1525 hosting the “game finder” to switch to the idle state until it is needed again.
次いで、ユーザは、ゲームをプレイすることができる。そして、何が優れているかと言えば、ゲームは、知覚上即座にプレイされ(ギガビット/秒の速度でRaidアレイ1511−1512からapp/gameゲームサーバー1521−1525にロードされるので)、そしてゲームは、理想的なドライバ、レジストリ構成(Windowsの場合)をもち、且つゲームのオペレーションと競合し得るサーバーで実行される他のアプリケーションをもたずに、ゲームに対して厳密に構成されたオペレーティングシステムと一緒にゲームに厳密に適したサーバーにロードされる。 The user can then play the game. And what is better is that the game is played perceptually immediately (since it is loaded from the Raid array 1511-1512 to the app / game game server 1521-1525 at gigabit / second speed) and the game A strictly configured operating system for the game with ideal drivers, registry configuration (for Windows), and no other applications running on the server that can compete with the game's operation Along with a server that is strictly suitable for the game.
又、ユーザがゲームを通して進行するにつれて、ゲームの各セグメントが、RAIDアレイ1511−1512からギガビット/秒の速度でサーバーへロードされ(即ち、1ギガバイトの負荷が8秒で)、そしてRAIDアレイ1511−1512の膨大な記憶容量のために(これは多数のユーザ間の共有リソースであるから、非常に大きく、又、コスト効率がよい)、幾何学的な設定又は他のゲームセグメント設定を予め計算して、RAIDアレイ1511−1512に記憶し、そして非常に迅速にロードすることができる。更に、各app/gameサーバー1521−1525のハードウェア構成及び計算能力が既知であるから、ピクセル及び頂点シェーダーを予め計算することができる。 Also, as the user progresses through the game, each segment of the game is loaded from the RAID array 1511-1512 to the server at a gigabit / second rate (ie, 1 gigabyte load is 8 seconds) and the RAID array 1511- Because of the massive storage capacity of 1512 (which is a very large and cost effective because it is a shared resource between many users), geometric settings or other game segment settings are pre-calculated Can be stored in RAID arrays 1511-1512 and loaded very quickly. Furthermore, since the hardware configuration and calculation capability of each app / game server 1521-1525 are known, the pixel and vertex shaders can be pre-calculated.
従って、ゲームは、ほぼ瞬間的に始動し、理想的な環境で実行され、そしてその後のセグメントがほぼ瞬間的にロードされる。 Thus, the game starts almost instantaneously, runs in an ideal environment, and subsequent segments are loaded almost instantaneously.
しかし、これらの効果を越えて、ユーザは、ゲームをプレイする他人を見ることができ(上述した「ゲームファインダー」及び他の手段を経て)、そしてゲームに関心があるかどうか判断し、もしそうであれば、他人を見ることから秘訣を学習することができる。そして、ユーザは、大きなダウンロード及び/又はインストールを待機する必要なく、ゲームを瞬時にデモすることができ、又、ユーザは、おそらく、僅かな費用の試行ベースで、又は長期間ベースで、ゲームを瞬時にプレイすることができる。そして、ユーザは、ゲームを、ウインドウズPC、マッキントッシュ、家のTV受像機で、又、旅行中も、移動電話で、充分短い待ち時間のワイヤレス接続によりプレイすることができる。又、これは、全て、ゲームのコピーを物理的に所持せずに行うことができる。 However, beyond these effects, the user can see others playing the game (via the “game finder” and other means described above) and determine if he is interested in the game, and if so If so, you can learn secrets from seeing others. The user can then instantly demo the game without having to wait for large downloads and / or installations, and the user can probably play the game on a low cost trial basis or on a long term basis. You can play instantly. The user can then play the game on a Windows PC, Macintosh, home TV receiver, or even on a mobile phone with a wireless connection with a sufficiently short waiting time. Also, all this can be done without physically having a copy of the game.
上述したように、ユーザは、自分のゲームプレイを他人に見られることを許さないか、自分のゲームを遅延の後に見られるのを許すか、自分のゲームを選択されたユーザにより見られるのを許すか、又は自分のゲームを全てのユーザにより見られるのを許すかを判断することができる。それにも関わらず、ビデオ/オーディオは、一実施形態では、15分間、遅延バッファ1515に記憶され、そしてユーザは、デジタルビデオレコーダ(DVR)でTVを見ていたときに行うことができたのと同様に、自分の以前のゲームプレイを「巻き戻して」見ることができ、又、休止し、スローで再生し、早送りし、等々を行うことができる。この例では、ユーザは、ゲームをプレイするが、ユーザがアプリケーションを使用する場合には、同じ“DVR”能力を利用することができる。これは、以前の行動を再検討すること及び以下に述べる他のアプリケーションでも有用である。更に、カメラの視野を変更できる、等のように、ゲーム状態情報の利用に基づいて巻き戻することができるようにゲームが設計されている場合は、この“3D DVR”能力もサポートされるが、それをサポートするようにゲームを設計することが要求される。遅延バッファ1515を使用する“DVR”能力は、もちろん、ゲーム又はアプリケーションが使用されたときに発生するビデオに限定して、ゲーム又はアプリケーションと共に機能するが、3D DVR能力をもつゲームの場合には、ユーザは、以前にプレイしたセグメントの3Dにおける「フライスルー(fly through)」を制御することができ、そしてそれにより得られるビデオを遅延バッファ1515で記録させ、ゲームセグメントのゲーム状態を記録させることができる。従って、特定の「フライスルー」が、圧縮されたビデオとして記録されるが、ゲーム状態も記録されるので、後日、ゲームの同じセグメントについて異なるフライスルーが考えられることになる。 As mentioned above, users may not allow others to see their gameplay, allow their games to be viewed after a delay, or allow their users to see their games. You can decide whether to allow or allow your game to be viewed by all users. Nevertheless, video / audio is stored in the delay buffer 1515 for 15 minutes in one embodiment, and the user could have done when watching TV on a digital video recorder (DVR). Similarly, you can "rewind" to see your previous gameplay, pause, play in slow, fast forward, etc. In this example, the user plays a game, but can use the same “DVR” capability when the user uses an application. This is also useful for reviewing previous behavior and other applications described below. Furthermore, this “3D DVR” capability is also supported if the game is designed so that it can be rewound based on the use of game state information, such as changing the field of view of the camera. It is required to design the game to support it. The “DVR” capability using the delay buffer 1515 is of course limited to video that occurs when the game or application is used, but works with the game or application, but for games with 3D DVR capability, The user can control the “fly through” in 3D of a previously played segment and have the resulting video recorded in the delay buffer 1515 to record the game state of the game segment. it can. Thus, a particular “fly-through” is recorded as a compressed video, but the game state is also recorded, so at a later date, different fly-throughs will be considered for the same segment of the game.
以下に述べるように、ホスティングサービス210におけるユーザは、各々、彼等に関する情報及び他のデータを掲示することのできる「ユーザページ」を有する。ユーザが掲示することのできるものの中には、彼等がセーブしたゲームプレイからのビデオセグメントがある。例えば、ユーザがゲームにおいて特に困難な挑戦を克服した場合には、ユーザは、ゲームにおいて偉大な成果をなし得た点の直前まで「巻き戻し」、次いで、他のユーザが見るために、ある時間巾(例えば、30秒)のビデオセグメントをユーザの「ユーザページ」にセーブするようにホスティングサービス210に命令することができる。これを達成するには、ユーザが、遅延バッファ1515に記憶されたビデオをRAIDアレイ1511−1512へ再生してユーザの「ユーザページ」においてそのビデオセグメントをインデックスするように使用するという、単なるapp/gameサーバー1521−1525の問題である。 As described below, each user at the hosting service 210 has a “user page” on which information about them and other data can be posted. Among the things that users can post are video segments from gameplay that they saved. For example, if a user overcomes a particularly difficult challenge in the game, the user “rewinds” to just before the point where great achievements could have been made in the game, and then some time for other users to see. The hosting service 210 can be instructed to save a video segment of width (eg, 30 seconds) to the user's “user page”. To accomplish this, the user simply plays the video stored in the delay buffer 1515 into the RAID array 1511-1512 and uses it to index that video segment in the user's “user page”. This is a problem of the game server 1521-1525.
ゲームが、上述した3D DVRの能力を有する場合には、3D DVRに要求されるゲーム状態情報もユーザによって記録して、ユーザの「ユーザページ」に利用することができる。 When the game has the 3D DVR capability described above, the game state information required for the 3D DVR can also be recorded by the user and used for the user's “user page”.
能動的なプレーヤに加えて「観客」(即ち3Dの世界を進んで、アクションに関与せずにそれを観察できるユーザ)をもつようにゲームが設計されている場合には、「ゲームファインダー」アプリケーションは、ユーザが観客及びプレーヤとしてゲームに加わることができるようにする。具現化の視点から、ユーザが能動的なプレーヤではなく観客である場合も、ホスティングシステム210に対して差はない。ゲームは、app/gameサーバー1521−1525にロードされ、そしてユーザは、ゲームを制御する(例えば、世界を見るバーチャルカメラを制御する)。唯一の相違は、ユーザのゲーム経験である。 If the game is designed to have an “audience” (ie, a user who can navigate the 3D world and observe it without being involved in an action) in addition to an active player, a “game finder” application Allows users to participate in the game as spectators and players. From a realization point of view, there is no difference to the hosting system 210 even if the user is a spectator rather than an active player. The game is loaded into the app / game server 1521-1525, and the user controls the game (eg, controls a virtual camera that sees the world). The only difference is the user's gaming experience.
複数ユーザの協力
ホスティングサービス210の別の特徴は、複数のユーザが、大きく異なる視聴装置を使用していても、生のビデオを見ながら協力する能力である。これは、ゲームをプレイするとき及びアプリケーションを使用するときの両方に有用である。
Another feature of multi-user collaborative hosting service 210 is the ability for multiple users to collaborate while watching live video, even if they use very different viewing devices. This is useful both when playing games and when using applications.
多くのPC及び移動電話は、ビデオカメラを装備しており、且つ特に、映像が小さいときには、リアルタイム映像圧縮を行う能力を有している。又、テレビに取り付けることのできる小型カメラも入手でき、リアルタイム圧縮を、ソフトウェアで具現化するか、又はビデオを圧縮するための多数のハードウェア圧縮装置の1つを使用して具現化するのは、困難なことではない。又、多数のPC及び全ての移動電話は、マイクロホンを有し、又、マイクロホンと共にヘッドセットが利用できる。 Many PCs and mobile phones are equipped with video cameras and have the ability to perform real-time video compression, especially when the video is small. Small cameras that can be attached to televisions are also available, and real-time compression can be implemented in software or using one of a number of hardware compression devices for compressing video. It ’s not difficult. Also, many PCs and all mobile phones have a microphone, and a headset can be used with the microphone.
このようなカメラ及び/又はマイクロホンは、ローカルのビデオ/オーディオ圧縮能力(特に、ここに述べる短待ち時間のビデオ圧縮技術を使用する)と合成されると、ユーザが、ユーザの家屋211からのビデオ及び/又はオーディオを入力装置の制御データと共にホスティングサービス210へ送信できるようにする。このような技術が使用されるときには、図19に示す能力を達成でき、即ちユーザは、自分のビデオ及びオーディオ1900を別のユーザのゲーム又はアプリケーション内のスクリーンに出現させることができる。この例は、カーレースにおいてチームメートが協力するマルチプレーヤゲームである。ユーザのビデオ/オーディオは、チームメートだけにより選択的に見る/聞くことができる。そして、実質上、待ち時間がないので、上述した技術を使用すると、プレーヤは、気付くほどの遅延を伴うことなく、互いにリアルタイムで話したり動いたりすることができる。 When such a camera and / or microphone is combined with local video / audio compression capabilities (especially using the low latency video compression techniques described herein), the user can view video from the user's home 211. And / or enable audio to be sent to the hosting service 210 along with the control data of the input device. When such a technique is used, the capability shown in FIG. 19 can be achieved, i.e., the user can have his video and audio 1900 appear on a screen in another user's game or application. This example is a multiplayer game in which teammates cooperate in a car race. The user's video / audio can be selectively viewed / listened only by teammates. And since there is virtually no waiting time, using the techniques described above, players can speak and move in real time with each other without noticeable delay.
このビデオ/オーディオの一体化は、ユーザのカメラ/マイクロホンからの圧縮されたビデオ及び/又はオーディオをインバウンドインターネットトラフィック1501として到着させることにより達成される。次いで、インバウンドルーティング1502が、ビデオ及び/又はオーディオを、それを見る/聞くことが許されたapp/gameゲームサーバー1521−1525へルーティングする。次いで、ビデオ及び/又はオーディオを使用することを選択する各app/gameゲームサーバー1521−1525のユーザは、それを解凍し、そして1900で示されたように、必要に応じて、ゲーム又はアプリケーション内に現れるように一体化する。 This video / audio integration is accomplished by arriving the compressed video and / or audio from the user's camera / microphone as inbound internet traffic 1501. Inbound routing 1502 then routes the video and / or audio to the app / game game server 1521-1525 that is allowed to view / listen to it. Each app / game game server 1521-1525 user who chooses to use video and / or audio will then decompress it and, as indicated at 1900, in the game or application as needed. Integrate to appear in
図19の例は、このような協力がゲームにおいてどのように利用されるか示しているが、このような協力は、アプリケーションにとって非常にパワフルなツールである。ニューヨーク市ではニューヨークに本拠地を置く不動産開発業者のためにシカゴの建築家により大きなビルが設計されているが、その判断には、旅行中でマイアミの空港にたまたまいる金融投資家が含まれ、そして投資家と不動産開発業者の両方を満足させるために、周囲のビルにどのように調和させるかに関してそのビルの幾つかの設計要素について判断をする必要がある状況を考える。建設会社は、シカゴにおいてカメラがPCに取り付けられた高解像度モニタを有し、不動産開発業者は、ニューヨークにおいてカメラ付きのラップトップを有し、そして投資家は、マイアミにおいてカメラ付きの移動電話を有している。建設会社は、ホスティングサービス210を使用して、非常に現実的な3Dレンダリングを行うことのできるパワフルな建設設計アプリケーションをホストすることができ、ニューヨーク市内のビルの大きなデータベース及び設計中のビルのデータベースを使用することができる。建設設計アプリケーションは、app/gameサーバー1521−1525の1つで実行され、又は多大な計算パワーを要求する場合には、その幾つかにおいて実行される。異なる位置にいる3人のユーザの各々は、ホスティングサービス210に接続され、そしてその各々は、建設設計アプリケーションのビデオ出力の同時ビューを有するが、これは、各ユーザが有する所与の装置及びネットワーク接続特性に対して共有ハードウェア圧縮1530により適当なサイズにされる(例えば、建設会社は、20Mbpsの商業的インターネット接続を通して2560x1440の60fpsディスプレイを見ることができ、ニューヨークの不動産開発業者は、自分のラップトップの6MbpsのDSL接続を経て1280x720の60fps映像を見ることができ、そして投資家は、自分の移動電話の250Kbpsのセルラーデータ接続を経て320x180の60fps映像を見ることができる。各当事者は、他の当事者の音声を聞き(会議コールは、app/gameサーバー1521−1525において広く利用できる多数の会議コールソフトウェアパッケージのいずれかにより取り扱われ)、そしてユーザ入力装置上のボタンの操作を通して、ユーザは、ローカルカメラを使用してそれら自身のビデオ出演をすることができる。ミーティングが進むにつれて、建築家は、そのビルを回転し且つそのエリアの他のビルの近くを飛行したときにそのビルがどのように見えるか、非常にホトリアルな3Dレンダリングで示すことができ、そして同じビデオを、各当事者のディスプレイ装置の解像度で全ての当事者が見ることができる。当事者により使用されるローカル装置が、どれも、このようなリアリズムで3Dアニメーションを取り扱いできないことは問題ではないが、ニューヨーク市の周囲のビルをレンダリングするために要求される膨大なデータベースをダウンロードするか又は記憶することは言うまでもない。各ユーザの視点から、距離が離れているにも関わらず、又、異なるローカル装置であるにも関わらず、ユーザは、単純に、信じられないほどのリアリズムで繋ぎ目のない経験をする。そして、1人の当事者が顔を見えるようにして感情を良く伝えたいときには、そのようにすることができる。更に、不動産開発業者又は投資家のいずれかが建設プログラムの制御を手に入れてそれら自身の入力装置(キーボード、マウス、キーパッド又はタッチスクリーン)を使用したい場合には、知覚上待ち時間なしに応答でき、又、応答することになる(それらのネットワーク接続が不合理な待ち時間をもたないと仮定して)。例えば、移動電話の場合には、その移動電話が空港のWiFiネットワークに接続された場合には、待ち時間が非常に短くなる。しかし、米国で今日利用できるセルラーデータネットワークを使用する場合には、おそらく、顕著な遅れで悩まされることになる。更に、投資家が見ているミーティングのほとんどの目的では、建築家がビルの接近飛行を制御し、又はビデオ遠隔会議で話をするためには、セルラー待ち時間でも許容できねばならない。 The example of FIG. 19 shows how such cooperation is used in the game, but such cooperation is a very powerful tool for the application. In New York City, Chicago architects have designed larger buildings for New York-based real estate developers, but that decision includes a financial investor who travels and hangs at an airport in Miami, and To satisfy both investors and property developers, consider a situation in which some design elements of a building need to be judged on how to harmonize with the surrounding building. The construction company has a high-resolution monitor with a camera attached to a PC in Chicago, the property developer has a laptop with a camera in New York, and the investor has a mobile phone with a camera in Miami. is doing. The construction company can use the hosting service 210 to host a powerful construction design application that can do very realistic 3D rendering, including a large database of buildings in New York City and A database can be used. The construction design application is executed on one of the app / game servers 1521-1525, or on some of them if it requires significant computing power. Each of the three users at different locations is connected to the hosting service 210, and each has a simultaneous view of the video output of the construction design application, which is a given device and network each user has. Appropriately sized with shared hardware compression 1530 for connection characteristics (eg, a construction company can view a 2560x1440 60 fps display through a 20 Mbps commercial Internet connection, and a New York real estate developer can A 1280x720 60fps video can be viewed via a 6Mbps DSL connection on a laptop, and an investor can view a 320x180 60fps video via a 250Kbps cellular data connection on his mobile phone. (Conference calls are handled by any of a number of conference call software packages widely available in the app / game server 1521-1525), and through the operation of buttons on the user input device, the user can You can make your own video appearances using a local camera, and as the meeting progresses, architects can see how the building rotates when it rotates and flies near other buildings in the area Or can be shown in very photorealistic 3D rendering, and the same video can be viewed by all parties at the resolution of each party's display device. Can't handle 3D animation with realism like this That's not a problem, but it goes without saying that you download or remember the huge database required to render buildings around New York City, even though they are far from each user's point of view. In spite of being a different local device, the user simply has a seamless experience with incredible realism, and one person can see his face and express his emotions. If you want to communicate well, you can do so, and either the property developer or investor gets control of the construction program and has their own input device (keyboard, mouse, keypad or touch screen). If you want to use it, you can and will respond with no perceptual latency (and their network connection is (Assuming no reasonable waiting time). For example, in the case of a mobile phone, if the mobile phone is connected to the WiFi network at the airport, the waiting time is very short. But if you use cellular data networks available in the US today, you will probably suffer from a noticeable delay. Furthermore, for most purposes of meetings that investors are looking at, cellular latencies must be acceptable in order for an architect to control the approaching flight of a building or speak in a video teleconference.
最終的に、協力会議コールの終わりに、不動産開発業者及び投資家は、ホスティングサービスから彼等のコメントを発し且つ署名し、建設会社は、遅延バッファ1515に記録された会議のビデオを「巻き戻し」、そしてコメント、顔の表情、及び/又はミーティング中に作られたビルの3Dモデルに加えられたアクションを再検討することができる。セーブしたい特定のセグメントがある場合は、ビデオ/オーディオのそれらセグメントを、記録保管及び後で再生するために遅延バッファ1515からRAIDアレイ1511−1512へ移動することができる。 Finally, at the end of the collaborative conference call, property developers and investors make and comment their comments from the hosting service, and the construction company “rewinds” the conference video recorded in the delay buffer 1515. And comments, facial expressions, and / or actions added to the 3D model of the building created during the meeting can be reviewed. If there are specific segments that you want to save, those segments of video / audio can be moved from the delay buffer 1515 to the RAID arrays 1511-1512 for recording storage and later playback.
又、コストの観点から、建築家が計算パワー及びニューヨーク市の大きなデータベースを15分の会議コールにしか使用する必要がない場合には、ハイパワーのワークステーションを所有し且つ大きなデータベースの高価なコピーを購入するのではなく、リソースを使用した時間について支払するだけでよい。 Also, in terms of cost, if an architect needs to use computational power and a large New York City database only for a 15 minute conference call, he has a high power workstation and an expensive copy of the large database. Instead of purchasing a resource, you only have to pay for the time spent using the resource.
ビデオリッチなコミュニティサービス
ホスティングサービス210は、インターネットにビデオリッチなコミュニティサービスを確立するための空前の機会を可能にする。図20は、ホスティングサービス210におけるゲームプレーヤのための規範的「ユーザページ」を示す。「ゲームファインダー」アプリケーションと同様に、「ユーザページ」は、app/gameサーバー1521−1525の1つにおいて実行されるアプリケーションである。このページにおけるサムネール及びビデオウインドウは、全て、絶えず動くビデオ(セグメントが短い場合は、ループになる)を示す。
Video rich community service hosting service 210 enables an unprecedented opportunity to establish video rich community services on the Internet. FIG. 20 shows an exemplary “user page” for a game player in hosting service 210. Similar to the “game finder” application, the “user page” is an application that is executed on one of the app / game servers 1521-1525. The thumbnails and video windows on this page all show a constantly moving video (or a loop if the segment is short).
ビデオカメラを使用するか、又はビデオをアップロードすることにより、ユーザ(ユーザ名は“KILLHAZARD”である)は、自分自身のビデオ2000を掲示することができ、他のユーザがこれを見ることができる。このビデオは、RAIDアレイ1511−1512に記憶される。又、他のユーザがKILLHAZARDの「ユーザページ」に到来するときに、KILLHAZARDがそのときホスティングサービス210を使用していれば、(ユーザが彼を見るために彼の「ユーザページ」を見ることを許すと仮定すれば)彼が何を行おうとその生のビデオ2001が示される。これは、サーバー制御システム401から要求される「ユーザページ」アプリケーションをホストするapp/gameサーバー1521−1525により達成され、KILLHAZARDがアクティブであるかどうか、そしてもしそうであれば、彼が使用するapp/gameサーバー1521−1525により達成される。次いで、「ゲームファインダー」アプリケーションにより使用される同じ方法を使用して、適当な解像度及びフォーマットの圧縮されたビデオストリームが、「ユーザページ」アプリケーションを実行するapp/gameサーバー1521−1525へ送信され、そして表示される。ユーザがKILLHAZARDの生のゲームプレイでウインドウを選択し、次いで、その入力装置を適当にクリックする場合は、ウインドウがズームアップされ(この場合も「ゲームファインダー」アプリケーションと同じ方法を使用して)、そして生のビデオが、見ているユーザのインターネット接続の特性に適した、見ているユーザのディスプレイ装置422の解像度でスクリーンを埋める。 By using a video camera or uploading a video, the user (whose username is “KILLHAZARD”) can post his own video 2000 and other users can see it. . This video is stored in a RAID array 1511-1512. Also, when another user arrives at KILLHAZARD's “user page”, if KILLHAZARD is currently using hosting service 210 (the user will see his “user page” to see him). The live video 2001 is shown no matter what he does (assuming forgiveness). This is achieved by the app / game server 1521-1525 hosting the “user page” application requested by the server control system 401, and whether KILLHAZARD is active and if so, the app he uses. / Game server 1521-1525. Then, using the same method used by the “Game Finder” application, a compressed video stream of the appropriate resolution and format is sent to the app / game server 1521-1525 running the “User Page” application, And displayed. If the user selects a window in KILLHAZARD's live gameplay and then clicks on the input device appropriately, the window is zoomed up (again, using the same method as the “Game Finder” application) The live video then fills the screen with the resolution of the viewing user's display device 422 that is appropriate for the characteristics of the viewing user's Internet connection.
従来に勝るこの解決策の重要な効果は、「ユーザページ」を見ているユーザが、自分が所有していないゲームの生のプレイを見ることができ、且つ非常に良いことに、ゲームをプレイできるローカルコンピュータ又はゲームコンソールをもたなくてよいことである。これは、ゲームをプレイする「アクション中」である「ユーザページ」に示されたユーザをユーザが見る良い機会を与えると共に、見ているユーザが試してみたい又は上手くなりたいゲームに関して学習する機会でもある。 An important advantage of this solution over the past is that the user viewing the “user page” can see the live play of games that he does not own and, very well, play the game There is no need to have a local computer or game console that can. This gives a good opportunity for the user to see the user shown on the “user page”, which is “in action” to play the game, as well as an opportunity for the viewing user to learn about the game they want to try or improve.
KILLHAZARDの相棒2002からのカメラ記録又はアップロードされたビデオクリップも「ユーザページ」に示され、そして各ビデオクリップの下には、相棒がオンラインでゲームをプレイしているかどうか示すテキストがある(例えば、six_shotは、ゲーム“Eragon”をプレイしており、MrSnuggles99は、オフラインであり、等)。メニューアイテム(図示せず)をクリップすることにより、相棒のビデオクリップは、記録又はアップロードされたビデオを示すものから、ホスティングサービス210上で現在ゲームをプレイしている相棒がそのときゲームにおいて何をしているかの生のビデオへとスイッチする。従って、これは、相棒のためのゲームファインダーグループとなる。相棒のゲームが選択されそしてユーザがそれをクリックする場合には、全スクリーンをズームアップし、そしてユーザは、全スクリーンでプレイされるゲームを生で見ることができる。 Camera recordings or uploaded video clips from KILLHAZARD's companion 2002 are also shown on the “user page” and below each video clip is text indicating whether the companion is playing the game online (eg, (six_shot is playing the game “Eragon”, MrSnggles99 is offline, etc.). By clipping a menu item (not shown), the partner's video clip shows what was recorded or uploaded, and what the partner currently playing the game on the hosting service 210 then does in the game. Switch to a live video of what you are doing. This is therefore a game finder group for a companion. If a buddy game is selected and the user clicks on it, the entire screen is zoomed in and the user can see the game played full screen live.
この場合も、相棒のゲームを見ているユーザは、ゲームのコピーも、ゲームをプレイするためのローカルコンピューティング/ゲームコンソールリソースも、所有していない。ゲームを見るのは、実際上、瞬間的である。 Again, the user watching the companion game does not have a copy of the game or a local computing / game console resource to play the game. Watching the game is practically instantaneous.
上述したように、ユーザがホスティングサービス210においてゲームをプレイするときには、ユーザは、ゲームを「巻き戻し」、セーブしたいビデオセグメントを見出し、次いで、ビデオセグメントを自分の「ユーザページ」へセーブする。これらは、「自慢のクリップ(Brag Clips)」と称される。ビデオセグメント2003は、全て、プレイした以前のゲームからKILLHAZARDによりセーブされた「自慢のクリップ」2003である。番号2004は、「自慢のクリップ」が何回見られたかを示し、そして「自慢のクリップ」が見られるときに、ユーザは、それを格付けする機会を得、オレンジのキー穴形状のアイコン2005の数は、どれほど高い格付けであるかを示す。「自慢のクリップ」2003は、ユーザが「ユーザページ」を見るとき、そのページにおけるビデオの残りと共に絶えずループする。ユーザが「自慢のクリップ」2003の1つを選択してクリックする場合には、それがズームアップし、「自慢のクリップ」2003を、クリップの再生、休止、巻き戻し、早送り、ステップスルー、等を行えるようにするDVRコントロールと共に提示する。 As described above, when a user plays a game on the hosting service 210, the user "rewinds" the game, finds the video segment that he wants to save, and then saves the video segment to his "user page". These are called “Brag Clips”. The video segments 2003 are all “proud clips” 2003 saved by KILLHAZARD from previous games played. The number 2004 indicates how many times the “proud clip” has been viewed, and when the “proud clip” is viewed, the user has the opportunity to rate it and the orange keyhole shaped icon 2005 The number indicates how high the rating is. “Proud clip” 2003 continuously loops with the rest of the video on the page when the user views the “user page”. If the user selects and clicks on one of the “Proud Clips” 2003, it zooms in and plays the “Proud Clip” 2003 to play, pause, rewind, fast forward, step through, etc. Presented with DVR controls that allow
「自慢のクリップ」2003の再生は、ユーザが「自慢のクリップ」を記録し、それを解凍して再生するときに、RAIDアレイ1511−1512に記憶された圧縮ビデオセグメントをapp/gameサーバー1521−1525がロードすることにより具現化される。 The playback of “proud clip” 2003 is performed when the user records the “proud clip” and decompresses and plays back the compressed video segment stored in the RAID array 1511-1512 in the app / game server 1521-. 1525 is implemented by loading.
又、「自慢のクリップ」2003は、“3D DVR”ビデオセグメント(即ち、再生でき且つユーザがカメラの視点を変更するのを許すゲームからのゲーム状態シーケンス)でもあり、これは、そのような能力をサポートするゲームからのものである。この場合、ゲームセグメントが記録されたときにユーザが作った特定の「フライスルー」の圧縮ビデオ記録に加えて、ゲーム状態情報が記憶される。「ユーザページ」が見られ、そして全てのサムネール及びビデオウインドウが絶えずループ化するときには、3D DVR「自慢のクリップ」2003は、ユーザがゲームセグメントの「フライスルー」を記録したときに圧縮ビデオとして記録された「自慢のクリップ」2003を絶えずループ化する。しかし、ユーザが3D DVR「自慢のクリップ」2003を選択してそれをクリップするときには、圧縮ビデオの「自慢のクリップ」を再生できるようにするDVRコントロールに加えて、ユーザは、ゲームセグメントに対する3D DVR能力を与えるボタンをクリックすることができる。それらは、彼等自身でゲームセグメント中にカメラの「フライスルー」を制御することができ、そしてそれらが望む(及びユーザページを所有するユーザがそれを許す)場合に、別の「自慢のクリップ」の「フライスルー」を圧縮ビデオ形態で記録することができ、これは、次いで、ユーザページの他の視聴者に利用可能となる(直ちに、又はユーザページの所有者が「自慢のクリップ」を再検討する機会をもった後に)。 “Proud clip” 2003 is also a “3D DVR” video segment (ie, a game state sequence from a game that can be played and allows the user to change the camera's viewpoint), which is such a capability. Is from games that support. In this case, game state information is stored in addition to the specific “fly-through” compressed video recording created by the user when the game segment was recorded. When a “user page” is seen and all thumbnails and video windows are constantly looping, 3D DVR “Proud Clip” 2003 records as compressed video when the user records a “fly-through” of the game segment The “Proud Clip” 2003 is continuously looped. However, when the user selects a 3D DVR “Proud Clip” 2003 and clips it, in addition to the DVR control that allows the “Proud Clip” of the compressed video to be played, the user can use the 3D DVR for the game segment. You can click a button that gives you the ability. They can control their camera “fly-through” during the game segment themselves, and if they want (and the user who owns the user page allows it) another “proud clip” "Fly-through" can be recorded in compressed video form, which is then made available to other viewers of the user page (immediately or by the owner of the user page "proud clip" After having the opportunity to review).
この3D DVR「自慢のクリップ」2003の能力は、記録されたゲーム状態情報を別のapp/gameサーバー1521−1525において再生しようとしているゲームを作動することによりイネーブルされる。ゲームは、ほぼ瞬間的に作動できるので(上述したように)、「自慢のクリップ」により記録されたゲーム状態にプレイを限定してゲームを作動し、次いで、ユーザが、圧縮ビデオを遅延バッファ1515に記録しながらカメラで「フライスルー」を実行できるようにするのは、困難ではない。ユーザが「フライスルー」の実行を完了すると、ゲームが不作動にされる。 This 3D DVR “Proud Clip” 2003 capability is enabled by running a game about to play the recorded game state information on another app / game server 1521-1525. Since the game can be run almost instantaneously (as described above), play is limited to the game state recorded by the “proud clip” and the user then plays the compressed video in the delay buffer 1515. It is not difficult to be able to perform “fly-through” with the camera while recording to the camera. When the user completes the “fly-through”, the game is deactivated.
ユーザの視点から、3D DVRの「自慢のクリップ」2003で「フライスルー」を作動することは、リニアな「自慢のクリップ」2003のDVRコントロールを制御することより努力が要らない。それらは、ゲームについて又はゲームをどのようにプレイするかについて何も知らなくてよい。それらは、別の者により記録されるゲームセグメント中に3D世界を凝視するバーチャルカメラオペレータに過ぎない。 From the user's point of view, activating “fly-through” with the 3D DVR “Proud Clip” 2003 requires less effort than controlling the linear “Proud Clip” 2003 DVR control. They may not know anything about the game or how to play the game. They are just virtual camera operators staring at the 3D world during a game segment recorded by another person.
又、ユーザは、それら自身のオーディオを、マイクロホンから記録されるか又はアップロードされる「自慢のクリップ」にオーバーダビングすることもできる。このようにして、「自慢のクリップ」は、ゲームからのキャラクタ及びアクションを使用して、カスタムアニメーションを生成するのに使用できる。このアニメーション技術は、「マシニマ(machinima)」として一般に知られている。 Users can also overdub their own audio into “proud clips” that are recorded or uploaded from a microphone. In this way, "Proud Clips" can be used to generate custom animations using characters and actions from the game. This animation technique is commonly known as “machinima”.
ユーザがゲームを進めるにつれて、異なるスキルレベルを達成する。プレイしたゲームは、達成度をサービスコントロールシステム401へ報告し、それらのスキルレベルが「ユーザページ」に示される。 As the user progresses through the game, different skill levels are achieved. The played game reports the achievement level to the service control system 401, and their skill level is shown in the “user page”.
双方向アニメ化広告
オンライン広告は、テキストから、静止映像へ、ビデオへ、そして今や、Adobe Flashのようなアニメーションシンクライアントを使用して典型的に具現化される双方向セグメントへと推移してきた。アニメーションシンクライアントを使用する理由は、ユーザが、典型的に、製品やサービスが彼等に推薦される特典に対する遅れが耐え難いからである。又、シンクライアントは、非常に低性能のPCで実行され、従って、広告主は、双方向アドが適切に機能するという高い信頼度をもつことができる。不都合なことに、Adobe Flashのようなアニメーションシンクライアントは、双方向性の度合い及び経験の巾が制限される(ダウンロード時間を軽減するために)。
Interactive animated advertising Online advertising has transitioned from text to still video to video and now to interactive segments that are typically embodied using animation thin clients such as Adobe Flash. The reason for using animation thin clients is that users typically cannot tolerate delays in the benefits that products and services are recommended to them. Thin clients also run on very low performance PCs, so advertisers can have a high degree of confidence that interactive ads will function properly. Unfortunately, animation thin clients such as Adobe Flash are limited in their degree of interactivity and breadth of experience (to reduce download time).
図21は、ショールーム内で車を回転させ、車がどのように見えるかリアルタイムレイトレーシングで示しながら、ユーザが車の外部及び内部の色を選択する双方向広告を示している。ユーザは、車を運転するアバターを選択し、次いで、ユーザは、レーストラック上、又はモナコのようなエキゾチックな場所でドライブするように車を取り出すことができる。ユーザは、より大きなエンジン又はより優れたタイヤを選択することができ、次いで、その変更した構成が車の加速性能又は路面の食い付きにどのように影響するか見ることができる。 FIG. 21 shows an interactive advertisement where the user selects the exterior and interior colors of the car while rotating the car in the showroom and showing in real time ray tracing how the car will look. The user can select an avatar to drive the car, and then the user can remove the car to drive on a race track or in an exotic location such as Monaco. The user can select a larger engine or a better tire and then see how the modified configuration affects the acceleration performance of the car or the road biting.
もちろん、広告は、実際上、精巧な3Dビデオゲームである。しかし、PC又はビデオゲームコンソール上に再生できる広告については、おそらく、100MBダウンロードを要求し、そしてPCの場合には、特殊なドライバのインストールを要求すると共に、PCが充分なCPU又はGPU計算能力に欠ける場合には全く実行されないことがある。従って、このような広告は、従来の構成では不可能である。 Of course, advertising is actually a sophisticated 3D video game. However, for advertisements that can be played on a PC or video game console, you will probably require a 100MB download, and in the case of a PC, you will need to install a special driver and the PC will have enough CPU or GPU computing power. If it is missing, it may not be executed at all. Therefore, such an advertisement is not possible with the conventional configuration.
ホスティングサービス210では、このような広告は、ほぼ瞬時に起動し、そしてユーザのクライアント415の能力がどんなものであっても、完全に実行される。従って、それらは、シンクライアント双方向アドより素早く起動し、著しく経験に富み、且つ非常に信頼性が高い。 In the hosting service 210, such advertisements are launched almost instantaneously and are fully executed regardless of the capabilities of the user's client 415. Thus, they start faster than thin-client bi-directional ads, are significantly more experienced, and are very reliable.
リアルタイムアニメーション中のストリーミング幾何学形状
RAIDアレイ1511−1512及びインバウンドルーティング1502は、リアルタイムアニメーション(例えば、複雑なデータベースを伴うフライスルー)中にゲームプレイ又はアプリケーションの中間において幾何学形状をオンザフライで確実に配信するためにRAIDアレイ1511−1512及びインバウンドルーティング1502に依存するビデオゲーム及びアプリケーションを設計できるように高速で且つ短待ち時間のデータレートを与えることができる。
Streaming geometry RAID arrays 1511-1512 and inbound routing 1502 during real-time animation ensure delivery of geometry on-the-fly during game play or application during real-time animation (eg, fly-through with complex databases) In order to design video games and applications that rely on RAID arrays 1511-1512 and inbound routing 1502 to provide high speed and low latency data rates.
図1に示すビデオゲームシステムのような従来のシステムでは、特に実際の家庭用装置に使用できる大量記憶装置は、要求される幾何学形状をある程度予想できる状況を除き、ゲームプレイ中に幾何学形状をストリームするには遥かに低速である。例えば、特定の道路が存在するドライブゲームにおいて、視野に入って来るビルの幾何学形状は、合理的に充分なほど予想でき、そして大量記憶装置は、近づきつつある幾何学形状が位置している場所を前もって探すことができる。 In a conventional system such as the video game system shown in FIG. 1, a mass storage device that can be used for an actual home device, in particular, has a geometric shape during game play, except in situations where the required geometric shape can be predicted to some extent. Is much slower to stream. For example, in a drive game where certain roads exist, the geometric shape of the building entering the field of view can be reasonably well predicted, and the mass storage device is located nearing the geometric shape You can search for places in advance.
しかし、予想できない変化を伴う複雑なシーンにおいて(例えば、あたり一面に複雑なキャラクタが存在する戦闘のシーンにおいて)、PC又はビデオゲームシステムのRAMが、現在視野にある物体に対する幾何学形状で完全に埋められており、次いで、ユーザが突然それらのキャラクタを、それらキャラクタの背後の視野へ方向転換する場合に、幾何学形状がRAMに予めロードされていなければ、それを表示できるまでに遅延が生じることになる。 However, in complex scenes with unpredictable changes (for example, in battle scenes where there are complex characters all around), the PC or video game system's RAM is completely in the geometry for the object currently in view. If it is filled and then the user suddenly redirects them to the field of view behind them, there will be a delay before the geometry can be displayed if it is not preloaded in RAM It will be.
ホスティングサービス210において、RAIDアレイ1511−1512は、ギガビットイーサネット速度以上でデータをストリームすることができ、そしてSANネットワークでは、10ギガビットのイーサネット又は他のネットワークに勝る10ギガビット/秒の速度を達成することができる。10ギガビット/秒は、ギガバイトのデータを1秒未満でロードする。60fpsのフレーム時間(16.67ms)では、ほぼ170メガビット(21MB)のデータをロードすることができる。当然、RAID構成にある回転するメディアは、1フレーム時間より大きな待ち時間を依然被るが、フラッシュベースのRAID記憶装置は、結局、回転するメディアRAIDアレイと同程度の大きさであり、そのような長い待ち時間は被らない。一実施形態では、大量RAMライトスルーキャッシングを使用して、非常に短い待ち時間のアクセスを与える。 In hosting service 210, RAID arrays 1511-1512 can stream data at gigabit Ethernet speeds and higher, and in SAN networks, achieve 10 gigabits per second over 10 gigabit Ethernet or other networks. Can do. 10 gigabits / second loads gigabytes of data in less than 1 second. With a frame time of 60 fps (16.67 ms), almost 170 megabits (21 MB) of data can be loaded. Of course, rotating media in a RAID configuration still suffers a latency greater than one frame time, but flash-based RAID storage is eventually as large as a rotating media RAID array, such as There is no long waiting time. In one embodiment, mass RAM write-through caching is used to provide very low latency access.
従って、充分に高いネットワーク速度及び充分に短い待ち時間の大量記憶では、CPU及び/又はGPUが3Dデータを処理できるのと同程度の速さでapp/gameゲームサーバー1521−1525へ幾何学形状をストリームすることができる。従って、ユーザがそのキャラクタを突然方向転換しそして後を見る上述した例では、後方の全てのキャラクタに対する幾何学形状を、キャラクタが回転を完了する前にロードすることができ、従って、ユーザにとって、生のアクションと同程度にリアルなホトリアルな世界にいるかのように思える。 Thus, with high enough network speed and large storage with sufficiently low latency, geometry can be transferred to the app / game game server 1521-1525 as fast as the CPU and / or GPU can process 3D data. Can be streamed. Thus, in the above example where the user suddenly turns the character and looks back, the geometry for all the characters behind can be loaded before the character completes the rotation, so for the user It seems as if you are in a real world that is as real as a live action.
上述したように、ホトリアルなコンピュータアニメーションにおける最後の未開拓の1つは、人間の顔であり、不完全さに対して人間の目が敏感であるために、ホトリアルな顔からの若干のエラーが視聴者から否定的なリアクションを招くことがある。図22は、ContourTM「リアリティキャプチャーテクノロジー」(本CIP出願の譲受人に各々譲渡された同時係争中の特許出願、即ち2004年9月15日に出願された第10/942,609号“Apparatus and method for capturing the motion of a performer”、2004年9月15日に出願された第10/942,413号“Apparatus and method for capturing the expression of a performer”、2005年2月25日に出願された第11/066,954号“Apparatus and method for improving marker identification within a motion capture system”、2005年3月10日に出願された第11/077,628号“Apparatus and method for performing motion capture using shutter synchronization”、2005年10月20日に出願された第11/255,854号“Apparatus and method for performing motion capture using a random pattern on capture surfaces”、2006年6月7日に出願された第11/449,131号“System and method for performing motion capture using phosphor application techniques”、2006年6月7日に出願された第11/449,043号“System and method for performing motion capture by strobing a fluorescent lamp”、2006年6月7日に出願された第11/449,127号“System and method for three dimensional capture of stop-motion animated characters”の要旨)を使用して捕獲される生の演技が、非常に滑らかな捕獲表面を、次いで、高多角形数追跡表面(即ち、多角形の動きが顔の動きに正確に追従する)をどのように生じるか示している。最終的に、生の演技のビデオが追跡表面にマップされて、テクスチャ処理表面を形成するときに、ホトリアルな結果が得られる。 As mentioned above, one of the last pioneers in photoreal computer animation is the human face, which is sensitive to imperfections, so there are some errors from the photoreal face. Negative reaction may be invited from the viewer. FIG. 22 shows Contour ™ “Reality Capture Technology” (a co-pending patent application each assigned to the assignee of this CIP application, ie, 10 / 942,609 filed on September 15, 2004, “Apparatus”. and method for capturing the motion of a performer ", No. 10 / 942,413 filed on September 15, 2004," Apparatus and method for capturing the expression of a performer ", filed February 25, 2005. No. 11 / 066,954 “Apparatus and method for improving marker identification within a motion capture system”, No. 11 / 077,628 “Apparatus and method for performing motion capture using shutter” filed on Mar. 10, 2005. synchronization ", No. 11 / 255,854," Apparatus and method for performing motion capture usi "filed on October 20, 2005 ng a random pattern on capture surfaces ", No. 11 / 449,131" System and method for performing motion capture using phosphor application techniques "filed June 7, 2006, filed June 7, 2006. No. 11 / 449,043 “System and method for performing motion capture by strobing a fluorescent lamp”, No. 11 / 449,127 “System and method for three dimensional capture of stop-” filed on June 7, 2006 The live performance captured using “motion animated characters” follows a very smooth capture surface, followed by a high polygon number tracking surface (ie, the polygonal motion accurately follows the facial motion). Shows how this occurs. Finally, photorealistic results are obtained when a video of a live performance is mapped to a tracking surface to form a textured surface.
現在のGPU技術は、追跡表面における多角形の数及びテクスチャをレンダリングしそして表面をリアルタイムで照明することができるが、多角形及びテクスチャがフレーム時間ごとに変化する(これは、最もホトリアルな結果を生じる)場合には、近代的PC又はビデオゲームコンソールの利用可能な全てのRAMを急速に消費してしまう。 Current GPU technology can render the number and texture of polygons on the tracking surface and illuminate the surface in real time, but the polygons and texture change from frame time to frame time (this is the most photorealistic result). If so, it will quickly consume all available RAM on a modern PC or video game console.
上述したストリーミング幾何学形状技術を使用すると、app/gameゲームサーバー1521−1525へ幾何学形状を連続的に供給して、ホトリアルな顔を連続的にアニメ化し、生の動きの顔とほとんど見分けがつかない顔をもつビデオゲームを作成できるようにするが実際的である。 Using the streaming geometry technology described above, the geometry is continuously supplied to the app / game game server 1521-1525, and the photoreal faces are continuously animated, making them almost indistinguishable from the faces of live motion. It's practical to be able to create a video game with a frightening face.
リニアなコンテンツと双方向特徴との一体化
動画、テレビ番組及びオーディオ資料(集合的に「リニアコンテンツ」)は、家庭及びオフィスのユーザに多数の形態で広く利用することができる。リニアコンテンツは、CD、DVD、HD−DVD及びBlu−rayメディアのような物理的なメディアにおいて取得することができる。又、これは、衛星及びケーブルTV放送からDVRにより記録することもできる。そして、衛星及びケーブルTVを通してペイパービュー(PPV)コンテンツとして、及びケーブルTVのビデオオンデマンド(VOD)として利用することもできる。
Integrated video, television programs and audio material (collectively “linear content”) of linear content and interactive features can be widely used in many forms by home and office users. Linear content can be obtained on physical media such as CD, DVD, HD-DVD and Blu-ray media. It can also be recorded by DVR from satellite and cable TV broadcasts. It can also be used as pay-per-view (PPV) content through satellite and cable TV and as video-on-demand (VOD) in cable TV.
益々多くのリニアコンテンツが、インターネットを通して、ダウンロードされたコンテンツとして及びストリーミングコンテンツとして利用できるようになった。今日、リニアメディアに関連した全ての特徴を経験するための場所は、実際に1つではない。例えば、DVD及び他のビデオ光学メディアは、典型的に、演出家の解説、「メーキングオブ(making of)」特徴、等のように、他の場所では利用できない双方向特徴を有する。オンライン音楽サイトは、一般的にCDでは入手できないカバー技術及び歌情報を有するが、全てのCDをオンラインで入手できるのではない。又、テレビ番組に関連したウェブサイトは、しばしば、特別な特徴、ブログ、及びときには、俳優又は創作スタッフからのコメントを有する。 More and more linear content is available as downloaded content and streaming content over the Internet. Today, there is not really one place to experience all the features associated with linear media. For example, DVDs and other video optical media typically have interactive features that are not available elsewhere, such as director commentary, “making of” features, and the like. Online music sites have cover technology and song information that is not generally available on CDs, but not all CDs are available online. Also, websites related to television programs often have special features, blogs, and sometimes comments from actors or creative staff.
更に、多くの動画又はスポーツの出来事では、(動画の場合)しばしばリニアメディアと一緒に発売されるか、或いは(スポーツの場合)実世界の出来事(例えば、プレーヤのトレード)に密接に結びついたビデオゲームがしばしばある。 In addition, many videos or sports events are often released with linear media (for videos) or closely tied to real-world events (for example, player trades). There are often games.
ホスティングサービス210は、異なる形態の関連コンテンツと一緒にリンクしてリニアコンテンツを配布するのに良く適している。確かに、動画の配信は、もはや、高度な双方向性のビデオゲームを配信する挑戦ではなく、ホスティングサービス210は、リニアコンテンツを家庭又はオフィスの広範な装置或いは移動装置へ配信することができる。図23は、リニアコンテンツの選択を示すホスティングサービス210の規範的なユーザインターフェイスページを示している。 Hosting service 210 is well suited for distributing linear content linked with different forms of related content. Indeed, video distribution is no longer a challenge to delivering highly interactive video games, and hosting service 210 can deliver linear content to a wide range of home or office devices or mobile devices. FIG. 23 shows an example user interface page for hosting service 210 showing the selection of linear content.
しかし、ほとんどのリニアコンテンツ配信システムとは異なり、ホスティングサービス210は、関連する双方向コンポーネント(例えば、DVDにおけるメニュー及び特徴、HD−DVDにおける双方向オーバーレイ、及びウェブサイトにおけるAdobe Flashアニメーション(以下に述べる))を配信することもできる。従って、クライアント装置415の制限は、どの特徴が利用できるかについて、もはや制限を導入しない。 However, unlike most linear content delivery systems, the hosting service 210 has associated interactive components (eg, menus and features on DVDs, interactive overlays on HD-DVDs, and Adobe Flash animations on websites (described below)). )) Can also be distributed. Thus, the client device 415 restrictions no longer introduce restrictions on which features are available.
更に、ホスティングサービス210は、リニアコンテンツをビデオゲームコンテンツと動的に且つリアルタイムでリンクすることができる。例えば、ユーザがハリーポッターの映画においてクィディッチの試合を見て、クィディッチのプレイにトライしたい場合に、ボタンをクリックするだけで、映画を休止し、直ちに、ハリーポッタービデオゲームのクィディッチセグメントへ移ることができる。クィディッチの試合をプレイした後に、ボタンの別のクリックで、即座に映画が再開する。 Further, the hosting service 210 can link linear content with video game content dynamically and in real time. For example, if a user watches a Quidditch game in a Harry Potter movie and wants to try playing Quidditch, the user can click the button to pause the movie and immediately go to the Quidditch segment of the Harry Potter video game. it can. After playing the Quidditch game, another click on the button will immediately resume the movie.
写真的に捕獲されたビデオが生の動きのキャラクタと見分けがつかないようなホトリアルなグラフィック及び制作技術では、ユーザが、生の動きの映画におけるクィディッチゲームから、ここに述べるホスティングサービスにおけるビデオゲームのクィディッチゲームへ移行するときに、2つのシーンは、実質上、見分けがつかない。これは、2つの世界の間の線が見分けられないのでリニアコンテンツ及び双方向(例えば、ビデオゲーム)コンテンツの両方の演出家にとって全く新しい創作オプションを与える。 In photorealistic graphics and production techniques where photo-captured video is indistinguishable from live-motion characters, users can use video games in the hosting services described here, from quiditch games in live-motion movies. When transitioning to a Quidditch game, the two scenes are virtually indistinguishable. This provides a whole new creation option for directors of both linear and interactive (eg video game) content since the line between the two worlds is indistinguishable.
図14に示すホスティングサービスアーキテクチャーを使用して、3D映画のバーチャルカメラの制御権を視聴者に与えることができる。例えば、列車の車両内で生じるシーンでは、視聴者がバーチャルカメラを制御して、ストーリーが進行する間に車両の周囲を見ることができる。これは、車両内の全ての3Dオブジェクト(アセット)が利用できると共に、シーンをリアルタイムでレンダリングできる充分なレベルの計算パワー、及びオリジナルの映画を仮定している。 Using the hosting service architecture shown in FIG. 14, the viewer can be given control of the 3D movie virtual camera. For example, in a scene that occurs in a train car, the viewer can control the virtual camera to see the surroundings of the vehicle as the story progresses. This assumes that all 3D objects (assets) in the vehicle are available and that the original movie has a sufficient level of computational power to render the scene in real time.
そして、非コンピュータ発生娯楽であっても、非常にエキサイティングな双方向特徴を提供することができる。例えば、2005動画“高慢と偏見(Pride and Prejudice)”は、華麗な古い英国風大邸宅における多くのシーンを有している。大邸宅の幾つかのシーンに対し、ユーザは、ビデオを休止し、次いで、カメラを制御して、大邸宅の塔、又はおそらく、周囲のエリアを撮影することができる。これを具現化するために、従来のアップル社のQuickTime VRが具現化されたのと同様に、位置を見失わないように魚眼レンズをつけて大邸宅を通してカメラを搬送することができる。次いで、種々のフレームが変換され、従って、映像は歪むことなく、映画と共にRAIDアレイ1511−1512に記憶され、そしてユーザがバーチャルの塔に行くことを選択したときに再生することができる。 And even non-computer generated entertainment can provide very exciting interactive features. For example, the 2005 movie “Pride and Prejudice” has many scenes in a brilliant old English mansion. For some scenes of the mansion, the user can pause the video and then control the camera to film the mansion tower, or perhaps the surrounding area. To realize this, the camera can be transported through the mansion with a fish-eye lens so as not to lose sight of the position, as in the case of the conventional Apple QuickTime VR. The various frames are then converted, so that the video is stored in the RAID array 1511-1512 with the movie without distortion and can be played back when the user chooses to go to the virtual tower.
スポーツ行事では、バスケットボールゲームのような生のスポーツ行事を、ユーザが普通のTVで見るために、ホスティングサービス210を通してストリーミングすることができる。ユーザが特定のプレイを見た後に、ゲームのビデオゲーム(最終的には実際のプレーヤと同程度ホトリアルに見えるバスケットプレーヤを伴う)を、プレーヤが同じ位置でスタートして始めることができ、そしてユーザ(おそらく各々1人のプレーヤの制御権を得ている)がプレイをやり直して、プレーヤよりうまくいくかどうか確かめることができる。 In sports events, live sports events, such as basketball games, can be streamed through the hosting service 210 for the user to watch on a normal TV. After the user sees a particular play, the video game of the game (eventually with a basket player that looks as photoreal as the real player) can be started with the player starting at the same location, and the user (Probably each with control of one player) can redo the play and see if it is better than the player.
ここに述べるホスティングサービス210は、この未来派的な世界をサポートするのに非常に良く適している。というのは、家庭又はほとんどのオフィス設定でインストールするのが不可能である計算パワー及び大量記憶リソースを保持することができ、又、家庭用設定では常に古い世代のPC及びビデオゲームをもつものとなるが、その計算リソースは、入手可能な最新の計算ハードウェアで、常に、最新のものだからである。そして、ホスティングサービス210では、この計算の複雑さが全てユーザから隠され、従って、非常に精巧なシステムを使用しても、ユーザの観点から、テレビのチャンネルを切り換えるように簡単である。更に、ユーザは、全ての計算パワーにアクセスし、そして計算パワーがクライアント415から得られるところの経験にアクセスすることができる。 The hosting service 210 described here is very well suited to support this futuristic world. Because it can retain computing power and mass storage resources that are impossible to install in a home or most office setting, and the home setting always has an older generation of PCs and video games. However, the computational resources are the latest computational hardware available and always up-to-date. And in the hosting service 210, all of this computational complexity is hidden from the user, so it is as simple as switching TV channels from the user's point of view, even using a very sophisticated system. In addition, the user has access to all computing power and access to experience where computing power is obtained from the client 415.
マルチプレーヤゲーム
ゲームがマルチプレーヤゲームであるという点で、インバウンドルーティング1502のネットワークを通してapp/gameゲームサーバー1521−1525と通信できると共に、インターネット(図示せず)へのネットワークブリッジで、ホスティングサービス210において実行されないサーバー又はゲームマシンと通信することができる。一般的なインターネットにおけるコンピュータでマルチプレーヤゲームをプレイするときには、app/gameゲームサーバー1521−1525は、インターネットへのアクセスが非常に速い(ゲームが家庭のサーバーで実行された場合に比して)という利点を有するが、低速な接続でゲームをプレイする他のコンピュータの能力により制限を受けると共に、インターネット上のゲームサーバーが、比較的低速の消費者用インターネット接続上の家庭用コンピュータである最小公分母を受け容れるように設計されたことによっても潜在的に制限を受ける。
The multiplayer game can be communicated with the app / game game server 1521-1525 through the network of inbound routing 1502 in that the multiplayer game is a multiplayer game, and executed in the hosting service 210 with a network bridge to the Internet (not shown). Can communicate with servers or gaming machines that are not. When playing a multiplayer game on a computer on the general Internet, the app / game game server 1521-1525 is said to have very fast access to the Internet (compared to when the game is run on a home server). The lowest common denominator, which has advantages but is limited by the ability of other computers to play games over a slow connection, and the game server on the Internet is a home computer on a relatively slow consumer Internet connection It is also potentially limited by being designed to accept.
しかし、マルチプレーヤゲームが完全にホスティングサービス210のサーバーセンター内でプレイされるときには、差の世界を達成することができる。ユーザのためのゲームをホストする各app/gameゲームサーバー1521−1525は、他のapp/gameゲームサーバー1521−1525と、非常に高速で非常に短待ち時間の接続及び膨大な非常に高速の記憶アレイをもつマルチプレーヤゲームのための集中制御をホストするサーバーとに相互接続される。例えば、インバウンドルーティング1502のネットワークにギガビットのイーサネットが使用される場合には、app/gameゲームサーバー1521−1525は、ギガビット/秒の速度において潜在的に1ms以下の待ち時間で、互いに通信すると共に、マルチプレーヤゲームのための集中制御をホストするサーバーとも通信する。更に、RAIDアレイ1511−1512は、非常に迅速に応答し、そしてギガビット/秒の速度でデータを転送することができる。例えば、家庭においてPC又はゲームコンソールで実行されるゲームクライアントに制限された従来のシステムで、キャラクタが大量の幾何学形状及びそのキャラクタ独特の挙動を有するように、容貌及び服装に関してユーザがキャラクタをカスタマイズする場合に、そのキャラクタが別のユーザの視野に入ってきた場合には、ユーザは、長くて低速のダウンロードが完了して全ての幾何学形状及び挙動データがコンピュータにロードされるまで、待機しなければならなくなる。ホスティングサービス210内では、その同じダウンロードを、RAIDアレイ1511−1512から対応されるギガビットのイーサネットを経てギガビット/秒の速度で行うことができる。家庭のユーザが8Mbpsのインターネット接続(これは、今日の規格では非常に高速である)を有する場合でも、ギガビットイーサネットは、100倍も高速である。従って、高速インターネット接続で1分かかるものが、ギガビットイーサネットでは1秒未満である。 However, when a multiplayer game is played entirely within the server center of the hosting service 210, a world of difference can be achieved. Each app / game game server 1521-1525 hosting games for the user is very fast, very low latency connections and a huge amount of very fast memory with other app / game game servers 1521-1525. Interconnected with a server that hosts centralized control for multiplayer games with arrays. For example, if gigabit Ethernet is used for the inbound routing 1502 network, the app / game game servers 1521-1525 communicate with each other at a gigabit / second rate, potentially with a latency of 1 ms or less, It also communicates with a server that hosts centralized control for a multiplayer game. In addition, RAID arrays 1511-1512 can respond very quickly and transfer data at gigabit / second rates. For example, in a traditional system limited to game clients running on PCs or game consoles at home, the user customizes the character with respect to appearance and clothing so that the character has a large amount of geometry and unique behavior If the character enters another user's field of view, the user waits until the long and slow download is complete and all geometry and behavior data is loaded into the computer. Will have to. Within the hosting service 210, the same download can be done at a rate of gigabits per second over the corresponding gigabit Ethernet from the RAID arrays 1511-1512. Even if home users have an Internet connection of 8 Mbps (which is very fast with today's standards), Gigabit Ethernet is 100 times faster. Therefore, what takes 1 minute for a high-speed Internet connection is less than 1 second for Gigabit Ethernet.
トッププレーヤグループ及びトーナメント
ホスティングサービス210は、トーナメントに非常に良く適している。ローカルクライアントではゲームが実行されないので、ユーザがチートする機会がない。又、出力ルーティング1540がUDPストリームをマルチキャストできるので、ホスティングサービス210は、メジャートーナメントを観衆の中の数千の人々に一度にブロードキャストすることができる。
Top player group and tournament hosting service 210 is very well suited for tournaments. Since the game is not run on the local client, there is no opportunity for the user to cheat. Also, because output routing 1540 can multicast UDP streams, hosting service 210 can broadcast major tournaments to thousands of people in the audience at once.
実際に、数千のユーザが同じストリーム(例えば、メジャートーナメントのビューを示す)を受信するように普及した幾つかのビデオストリームがあるときは、多くのクライアント装置415へ大量配布するためにAkamai又はLimelightのような「コンテンツデリバリーネットワーク」(CDN)へビデオストリームを送信するのがより効率的である。 In fact, when there are several video streams that are popular to allow thousands of users to receive the same stream (eg, showing a view of a major tournament), Akamai or It is more efficient to send the video stream to a “content delivery network” (CDN) such as Timelight.
CDNを使用してトッププレーヤグループの「ゲームファインダー」ページを示すときには、同様の効率レベルを得ることができる。 Similar efficiency levels can be obtained when using the CDN to indicate the “game finder” page of the top player group.
メジャートーナメントの場合、生の有名アナウンサを使用して、ある試合中に実況放送することができる。メジャートーナメントを見ているのは大勢のユーザであるが、トーナメントでプレイするのは比較的少数である。有名アナウンサからの音声は、トーナメントでプレイしているユーザをホストすると共にトーナメントにおけるゲームの観客モードコピーをホストするapp/gameゲームサーバー1521−1525へルーティングすることができ、そしてその音声は、ゲーム音声の上にオーバーダビングすることができる。有名アナウンサの映像も、ゲームにオーバーレイし、おそらくは、観客のビューにオーバーレイすることができる。 In the case of major tournaments, live broadcasters can be broadcast during a game using famous live announcers. Many users watch major tournaments, but relatively few play in tournaments. The audio from the famous announcer can be routed to the app / game game server 1521-1525 hosting the user playing in the tournament and hosting a spectator mode copy of the game in the tournament, and the audio is game audio Can be overdubbed on top. Famous announcer footage can also be overlaid on the game and possibly on the audience's view.
ウェブページロードの加速
ワールドワイドウェブ、その一次トランスポートプロトコルであるハイパーテキストトランスファープロトコル(HTTP)は、ビジネスだけが高速インターネット接続をもちそしてオンラインにいる消費者がダイヤルアップモデム又はISDNを使用していた時代に考えられ定義されたものである。そのとき、高速接続用の「黄金律(gold standard)」は、1.5Mbpsのデータレートを対称的に(即ち、両方向に等しいデータレートで)与えるT1ラインであった。
Web page load acceleration World Wide Web, its primary transport protocol, Hypertext Transfer Protocol (HTTP), was the only business with a high-speed Internet connection and online consumers using dial-up modems or ISDN It was thought and defined in the times. At that time, the “gold standard” for high speed connections was a T1 line that provided a data rate of 1.5 Mbps symmetrically (ie, with an equal data rate in both directions).
今日、状況は、完全に異なる。開発された世界の多くにおいてDSL又はケーブルモデム接続を通る平均的な家庭用接続の速度は、T1ラインより遥かに高いダウンストリームデータレートを有している。実際に、世界の幾つかの部分では、ファイバー・ツー・ザ・カーブ(fiber-to-the-curb)が、50ないし100Mbps程度の高さのデータレートを家庭へ運ぶ。 Today, the situation is completely different. In many of the developed worlds, the average home connection speed through a DSL or cable modem connection has a much higher downstream data rate than the T1 line. In fact, in some parts of the world, fiber-to-the-curb carries data rates as high as 50-100 Mbps to the home.
不都合なことに、HTTPは、これらの急激な速度改善の利点を効果的に取り入れるように構成されてこなかった(又、具現化もされなかった)。ウェブサイトは、リモートサーバーにおけるファイルの集合である。非常に簡単に言えば、HTTPは、第1のファイルを要求し、そのファイルがダウンロードされるのを待機し、次いで、第2のファイルを要求し、そのファイルがダウンロードされるのを待機し、等々である。実際に、HTTPは、2つ以上の「オープン接続」を許し、即ち一度に2つ以上のファイルを要求できるようにするが、合意された規格(及びウェブサーバーが過負荷にならないよう防止する要望)があるために、非常に僅かなオープン接続しか許されない。更に、ウェブページが構成される方法のために、ブラウザは、多くの場合、直ちにダウンロードに利用できる複数の同時のページに気付かない(即ち、ページをパーズした後にのみ、映像と同様に、新たなファイルをダウンロードする必要があることが明らかとなる)。従って、ウェブサイトのファイルは、本質的に1つ1つロードされる。そして、HTTPによって使用される要求及び応答プロトコルのために、ロードされる各ファイルに関連して(米国で典型的なウェブサーバーにアクセスすると)おおよそ100msの待ち時間がある。 Unfortunately, HTTP has not been configured (and not implemented) to effectively take advantage of these rapid speed improvements. A website is a collection of files on a remote server. Very simply, HTTP requests a first file, waits for the file to be downloaded, then requests a second file, waits for the file to be downloaded, And so on. In fact, HTTP allows more than one "open connection", i.e. allows more than one file to be requested at a time, but the agreed standard (and the desire to prevent overloading the web server). ), Very few open connections are allowed. In addition, because of the way web pages are constructed, browsers often do not notice multiple simultaneous pages that are immediately available for download (ie, only after parsing the page, new videos, as well as video). It becomes clear that you need to download the file). Thus, the website files are essentially loaded one by one. And because of the request and response protocol used by HTTP, there is approximately 100 ms latency associated with each file loaded (when accessing a typical web server in the United States).
比較的低速の接続では、これにより大きな問題が導入されることはない。というのは、ファイルそれ自体のダウンロード時間がウェブページの待ち時間を支配するからである。しかし、接続速度が上がるにつれて、特に、複雑なウェブページでは、問題が起き始める。 For relatively low speed connections, this does not introduce major problems. This is because the download time of the file itself dominates the latency of the web page. But as the connection speed increases, problems begin to arise, especially with complex web pages.
図24に示す例では、典型的な商業的ウェブサイトが示されている(この特定のウェブサイトは、一流運動選手用の靴のブランドからのものである)。このウェブサイトには、54のファイルがある。これらファイルは、HTML、CSS、JPEG、PHP、Java(登録商標)Script、及びFlashファイルを含むと共に、ビデオコンテンツを含む。ページが生になる(即ち、ユーザがそれをクリックして、それを使用し始める)前に、合計1.5Mバイトをロードしなければならない。多数のファイルには、多くの理由がある。1つのこととして、複雑で且つ精巧なウェブページであり、そして別のこととして、ページにアクセスするユーザに関する情報(例えば、ユーザの母国、言語、以前に購入したかどうか、等)に動的に基づいてアッセンブルされるウェブページであり、そしてこれら全てのファクタに基づいて、異なるファイルがダウンロードされる。依然、これは、非常に典型的な商業用ウェブページである。 In the example shown in FIG. 24, a typical commercial website is shown (this particular website is from a brand of first-class athlete shoes). There are 54 files on this website. These files include HTML, CSS, JPEG, PHP, Java (registered trademark) Script, and Flash files as well as video content. A total of 1.5 Mbytes must be loaded before the page is live (ie, the user clicks on it and starts using it). There are many reasons for many files. One is a complex and sophisticated web page, and another is dynamically based on information about the user accessing the page (eg, the user's home country, language, whether it was previously purchased, etc.) A web page that is assembled based on, and different files are downloaded based on all these factors. This is still a very typical commercial web page.
図24は、接続速度が上がるにつれてウェブページが生になるまでに経過する時間量を示している。1.5Mbpsの接続速度2401では、従来のウェブブラウザを伴う従来のウェブサーバーを使用すると、ウェブページが生になるまでに13.5秒を要する。12Mbpsの接続速度2402では、ロード時間は、6.5秒に短縮され、即ち約2倍の速さになる。しかし、96Mbpsの接続速度2403では、ロード時間は、約5.5秒までしか短縮されない。その理由として、このように高いダウンロード速度では、ファイルそれ自体をダウンロードするための時間は最小であるが、ファイル当たりの待ち時間、各々約100msが依然あって、その結果、54ファイル*100ms=5.4秒の待ち時間となる。従って、家庭への接続がどれほど速くても、このウェブサイトは、常に、それが生となるまでに少なくとも少なくとも5.4秒を要する。別のファクタは、サーバー側のキューイングであり、即ち各HTTP要求がキューの後部に追加され、従って、ビジーのサーバーでは、これが大きな影響を及ぼす。というのは、ウェブサーバーから小さなアイテムを得るたびに、HTTP要求がその方向転換を待機する必要があるためである。 FIG. 24 shows the amount of time that elapses before a web page becomes live as the connection speed increases. At a 1.5Mbps connection speed 2401, using a conventional web server with a conventional web browser, it takes 13.5 seconds for the web page to be live. With a 12 Mbps connection speed 2402, the load time is reduced to 6.5 seconds, or about twice as fast. However, at a 96 Mbps connection speed 2403, the load time can only be reduced to about 5.5 seconds. The reason for this is that at this high download speed, the time to download the file itself is minimal, but there is still about 100 ms of latency per file, resulting in 54 files * 100 ms = 5. The waiting time is 4 seconds. Thus, no matter how fast the connection to the home is, this website always takes at least 5.4 seconds to live. Another factor is server-side queuing, i.e. each HTTP request is added to the back of the queue, so this has a big impact on busy servers. This is because every time a small item is obtained from the web server, the HTTP request needs to wait for its turn.
これらの問題を解決する1つの仕方は、HTTPを破棄するか又は再定義することである。或いは、おそらく、ウェブサイト所有者がそのファイルを単一のファイル(例えば、Adobe Flashフォーマットの)へうまく合併することである。しかし、実際的な問題として、この会社及び多くの他の者は、そのウェブサイトアーキテクチャー多大な投資をしている。更に、ある家庭は、12−100Mbpsの接続を有するが、大多数の家庭は、依然、ゆっくりした速度であり、HTTPも、低速度で機能する。 One way to solve these problems is to discard or redefine HTTP. Or perhaps the website owner has successfully merged the file into a single file (eg, in Adobe Flash format). But as a practical matter, this company and many others are investing heavily in its website architecture. In addition, some homes have 12-100 Mbps connections, but the majority of homes are still at slow speeds and HTTP also works at low speeds.
1つの別の仕方は、app/gameサーバー1521−1525のウェブブラウザをホストすると共に、RAIDアレイ1511−1512のウェブサーバーに対するファイルをホストすることである(或いは潜在的にウェブブラウザをホストするapp/gameサーバー1521−1525のRAM又はローカル記憶装置において)。インバウンドルーティング1502を通して(又はローカル記憶装置への)非常に高速の相互接続があるために、HTTPを使用してファイル当たり100msの待ち時間となるのではなく、HTTPを使用してファイル当たり最小の待ち時間となる。従って、家にいるユーザがHTTPを通してウェブページにアクセスするのではなく、ユーザは、クライアント415を通してウェブページにアクセスすることができる。次いで、1.5Mbpsの接続では(このウェブページがそのビデオに対して著しい帯域巾を要求しないので)、ウェブページは、線2400当たり1秒未満で生となる。本質的に、app/gameサーバー1521−1525で実行されるウェブブラウザが生のページを表示するまでは待ち時間がなく、そしてクライアント415がウェブブラウザからのビデオ出力を表示するまでは検出可能な待ち時間がない。ユーザがウェブページ上でマウス操作し及び/又はタイプするときに、ユーザの入力情報がapp/gameサーバー1521−1525で実行されるウェブブラウザへ送信され、そしてウェブブラウザが適宜に応答する。 One alternative is to host the web browser for the app / game server 1521-1525 and host the files for the web server of the RAID array 1511-1512 (or the app / potentially hosting the web browser). in the RAM or local storage of the game server 1521-1525). Because there is a very fast interconnect through inbound routing 1502 (or to local storage), there is a minimum latency per file using HTTP, rather than a 100 ms latency per file using HTTP. It will be time. Thus, instead of a user at home accessing the web page through HTTP, the user can access the web page through client 415. Then, with a 1.5 Mbps connection (since this web page does not require significant bandwidth for the video), the web page will be live in less than 1 second per line 2400. In essence, there is no waiting time for the web browser running on the app / game server 1521-1525 to display the raw page, and a detectable wait until the client 415 displays the video output from the web browser. no time. As the user manipulates and / or types on the web page, the user's input information is sent to the web browser running on the app / game server 1521-1525, and the web browser responds accordingly.
この解決策の1つの欠点は、コンプレッサがビデオデータを常時送信する場合に、ウェブページが静的なものとなっても、帯域巾が使用されることである。これは、ウェブページが変化するときだけ(及びその場合にのみ)データを送信し、次いで、変化したページの部分にのみデータを送信するようにコンプレッサを構成することにより、改善することができる。常時変化するフラッシングバナー、等をもつ幾つかのウェブページがあるが、このようなウェブページは、うっとうしい傾向となり、通常、ウェブページは、何かが動く(例えば、ビデオクリップ)理由がない限り静的なものとなる。このようなウェブページの場合、おそらく、従来のウェブサーバーよりも少ないデータがホスティングサービス210を使用して送信される。というのは、実際に表示される映像だけが送信され、シンクライアント実行コードも、決して見ることのない大きなオブジェクト、例えば、ロールオーバー映像も、送信されないからである。 One drawback of this solution is that bandwidth is used even if the web page is static when the compressor always sends video data. This can be improved by configuring the compressor to send data only when (and only when) the web page changes, and then send data only to the portion of the page that has changed. There are some web pages with constantly changing flashing banners, etc., but such web pages tend to be annoying and usually web pages are quiet unless there is a reason for something to move (eg, a video clip). It will be something like that. For such a web page, perhaps less data is transmitted using the hosting service 210 than a conventional web server. This is because only the video that is actually displayed is transmitted, and neither the thin client execution code nor large objects that are never seen, such as rollover video, are transmitted.
従って、ホスティングサービス210を使用して、レガシーウェブページをホストすると、ウェブページのロード時間は、ウェブページをオープンすることがテレビのチャンネルを切り換えることと同じである点まで短縮することができ、即ちウェブページは、実際上瞬時に生となる。 Thus, using the hosting service 210 to host a legacy web page, the load time of the web page can be reduced to the point that opening a web page is the same as switching a television channel, ie Web pages are actually live instantly.
ゲーム及びアプリケーションのデバッグの容易化
上述したように、リアルタイムグラフィックを伴うビデオゲーム及びアプリケーションは、非常に複雑なアプリケーションであり、典型的に、市場に発売されるときに、バグを含むことがある。ソフトウェア開発者は、バグに関してユーザからフィードバックを得、そしてクラッシュ後にマシン状態を還元するための何らかの手段を有するが、ゲーム又はリアルタイムアプリケーションに何が起きてクラッシュさせ又は不適切に機能させたか厳密に識別することは非常に困難である。
Ease of Debugging Games and Applications As mentioned above, video games and applications with real-time graphics are very complex applications and typically include bugs when released to the market. Software developers have some means to get user feedback on bugs and reduce machine state after a crash, but strictly identify what happened to the game or real-time application that caused it to crash or function improperly It is very difficult to do.
ゲーム又はアプリケーションがホスティングサービス210で実行されるときに、ゲーム又はアプリケーションのビデオ/オーディオ出力は、遅延バッファ1515に常時記録される。更に、ウオッチドッグプロセスが、各app/gameサーバー1521−1525を動作させ、app/gameサーバー1521−1525が円滑に動作することをホスティングサービスコントロールシステム401に規則的に報告する。ウオッチドッグプロセスが報告を怠った場合には、サーバーコントロールシステム401は、app/gameサーバー1521−1525と通信するように試み、それが成功すれば、どんなマシン状態が得られてもそれを収集する。どんな情報が得られてもそれが、遅延バッファ1515に記録されたビデオ/オーディオと共に、ソフトウェア開発者へ送信される。 When a game or application is executed on the hosting service 210, the video / audio output of the game or application is constantly recorded in the delay buffer 1515. In addition, the watchdog process operates each app / game server 1521-1525 and regularly reports to the hosting service control system 401 that the app / game server 1521-1525 operates smoothly. If the watchdog process fails to report, the server control system 401 attempts to communicate with the app / game server 1521-1525 and collects whatever machine state is available if it succeeds. . Whatever information is obtained, it is sent to the software developer along with the video / audio recorded in the delay buffer 1515.
従って、ゲーム又はアプリケーションソフトウェアの開発者が、ホスティングサービス210からクラッシュの通知を得ると、何がクラッシュを招いたかのフレームごとの記録を得る。この情報は、バグを追跡して修理する上で非常に価値がある。 Thus, when a game or application software developer gets a crash notification from the hosting service 210, he gets a frame-by-frame record of what caused the crash. This information is very valuable for tracking and fixing bugs.
又、app/gameサーバー1521−1525がクラッシュすると、サーバーは、最も最近の再スタート可能な点において再スタートされ、そして技術的な困難さについて謝罪するメッセージがユーザに与えられる。 Also, if the app / game server 1521-1525 crashes, the server is restarted at the most recent restartable point and a message is given to the user apologizing for technical difficulties.
リソースの共有及びコストの節約
図4a及び4bに示されたシステムは、エンドユーザとゲーム及びアプリケーションの開発者の両方に種々の利益を与える。例えば、典型的に、家庭及びオフィスのクライアントシステム(例えば、PC又はゲームコンソール)は、一週間に僅かな時間しか使用されない。ニールセンエンターテイメント“Active Gamer Benchmark Study”(http://www.prnewswire.com/cgibin/stories.pl?ACCT=104&STORY=/www/story/10-05-2006/0004446115&EDATE=)による2006年10月5日プレスリリースによれば、積極的なゲーマーは、一週間に平均14時間を費やしてビデオゲームコンソールをプレイし、そして一週間に約17時間をハンドヘルド状態にしている。又、このレポートは、(コンソール、ハンドヘルド及びPCゲームプレイを含む)全てのゲームプレイ活動に対し、積極的なゲーマーは、一週間に平均13時間を費やすと述べている。コンソールビデオゲームのプレイ時間が高い数値であることを考慮すれば、一週間は、24*7=168時間であり、これは、積極的なゲーマーの家では、ビデオゲームコンソールが一週間の時間のうち17/168=10%しか使用されないことを意味する。即ち、90%の時間は、ビデオゲームコンソールがアイドル状態である。高いコストのビデオゲームコンソールであり、そして製造者がこのような装置に助成しているとすれば、高価なリソースの非常に非効率的な使い方である。会社の中のPCも、典型的に、一週間のうち僅かな時間しか使用されず、特に、Autodesk Mayaのようなハイエンドアプリケーションにしばしば要求される非ポータブルのデスクトップPCがそうである。ある会社は、全ての時間及び休日も営業し、そしてあるPC(例えば、夜家で仕事をするために持ち運ばれるポータブル)は、全ての時間及び休日も使用されるが、会社のほとんどの活動は、月曜日から金曜日まで所定の営業時間ゾーンのほぼAM9時からPM5時までを中心とする傾向があり、休日や休息時間(昼食時のような)にはほとんど行われず、又、ほとんどのPC使用は、ユーザがPCに積極的に関わる間に生じるので、デスクトップPCの使用は、これらの営業時間に従う傾向となる。PCが、週5日間、AM9時からPM5時まで恒常的に使用されると仮定すれば、PCが週の時間の40/168=24%使用されることを意味する。高性能デスクトップPCは、会社にとって非常個高価な投資であり、これは、非常に低い利用レベルを反映している。デスクトップコンピュータで授業する学校は、週のより小さな時間巾でもコンピュータを使用し、授業時間に基づいて変化するが、ほとんどの授業は、月曜日から金曜日までの昼間の時間中に行われる。従って、一般的に、PC及びビデオゲームコンソールは、週の時間の僅かな部分でしか利用されない。
Resource Sharing and Cost Savings The system shown in FIGS. 4a and 4b provides various benefits to both end users and game and application developers. For example, home and office client systems (eg, PCs or game consoles) are typically used only a small amount of time per week. October 5, 2006 by Nielsen Entertainment “Active Gamer Benchmark Study” (http://www.prnewswire.com/cgibin/stories.pl?ACCT=104&STORY=/www/story/10-05-2006/0004446115&EDATE=) According to the press release, aggressive gamers spend an average of 14 hours a week playing video game consoles and handheld about 17 hours a week. The report also states that active gamers spend an average of 13 hours per week for all gameplay activities (including console, handheld and PC gameplay). Considering that console video game play time is a high number, a week is 24 * 7 = 168 hours, which means that in an aggressive gamer's house, the video game console is It means that only 17/168 = 10% is used. That is, the video game console is idle for 90% of the time. If it is a high-cost video game console and the manufacturer subsidizes such a device, it is a very inefficient use of expensive resources. PCs in the company are also typically used for a fraction of the week, especially non-portable desktop PCs that are often required for high-end applications such as Autodesk Maya. Some companies also operate all hours and holidays, and some PCs (eg portables carried to work at home at night) are used for all hours and holidays, but most activities of the company Tends to be centered around Mondays to Fridays at approximately 9am to 5pm in the designated business hours, rarely on holidays and rest times (like lunch), and most PC use Occurs while a user is actively engaged with a PC, so the use of a desktop PC tends to follow these business hours. Assuming that the PC is permanently used for 5 days a week from 9:00 AM to 5:00 PM, this means that the PC is used 40/168 = 24% of the time of the week. High performance desktop PCs are a very expensive investment for a company, reflecting a very low usage level. Schools that teach with desktop computers use computers with less time of the week and vary based on class hours, but most classes take place during the daytime from Monday to Friday. Thus, in general, PCs and video game consoles are only utilized for a small portion of the time of the week.
特に、多くの人々は、平日月曜日から金曜日の昼間の時間中は会社や学校にいるので、これらの人々は、一般的に、これらの時間中はビデオゲームをプレイせず、従って、ビデオゲームをプレイするのは、一般的に、夜や週末や休日のような他の時間中である。 In particular, many people are at work or school during the weekday Monday-Friday daytime, so these people generally do not play video games during these hours, and therefore do not play video games. Playing is typically during other times such as nights, weekends or holidays.
図4aに示すホスティングサービスの構成が与えられると、上述した2つの段落で述べた使用パターンは、リソースの非常に効率的な利用を生じる。明らかなように、特に、ユーザが、精巧な3Dビデオゲームのような複雑なアプリケーションに対してリアルタイム応答を要求する場合には、所与の時間にホスティングサービス210によってサービスを受けることのできるユーザの数に限度がある。しかし、典型的にほとんどの時間アイドル状態にある家庭のビデオゲームコンソールや会社で使用されるPCとは異なり、サーバー402は、異なる時間に異なるユーザにより再利用することができる。例えば、高性能のデュアルCPU及びデュアルGPUと大容量のRAMとを伴う高性能サーバー402は、平日のAM9時からPM5時まで会社及び学校により利用することができるが、夜、週末及び休日には精巧なビデオゲームをプレイするゲーマーにより利用することができる。同様に、低性能のアプリケーションは、Celeron CPUをもち、GPUをもたず(又は非常にローエンドのGPUをもち)且つ制限されたRAMをもつ低性能サーバー402において会社の時間中に会社及び学校によって利用することができ、そして低性能ゲームは、会社の時間中でないときに低性能サーバー402を利用することができる。 Given the configuration of the hosting service shown in FIG. 4a, the usage patterns described in the two paragraphs above result in a very efficient use of resources. As will be apparent, the user who can be serviced by the hosting service 210 at a given time, especially if the user requests a real-time response to a complex application such as a sophisticated 3D video game. There is a limit to the number. However, unlike home video game consoles or office PCs that are typically idle most of the time, the server 402 can be reused by different users at different times. For example, a high-performance server 402 with a high-performance dual CPU and dual GPU and large-capacity RAM can be used by companies and schools from 9 am to 5 pm on weekdays, but at night, weekends and holidays It can be used by gamers who play sophisticated video games. Similarly, low-performance applications may have a Celeron CPU, no GPU (or very low-end GPU), and low-performance servers 402 with limited RAM by companies and schools during the company's time. A low performance game can be utilized and the low performance server 402 can be utilized when it is not during company time.
更に、ここに述べるホスティングサービス構成では、数百万でなくても数千のユーザ間でリソースが効率的に共用される。一般的に、オンラインサービスは、所与の時間にサービスを利用する全ユーザベースの僅かな割合しかもたない。上述したニールセンのビデオゲーム使用統計値を考えると、なぜそうなるか調べることは容易である。積極的なゲーマーがコンソールゲームを一週間に17時間しかプレイしない場合に、ゲームのピーク使用時間が、夜(5−AM12、7*5日=35時間/週)及び週末(AM8−AM12、16*2=32時間/週)の典型的な非仕事非会社時間中であると仮定すると、17時間のゲームプレイに対して一週間に35+32=65ピーク時間ある。システムに対する厳密なピークユーザ負荷は、多くの理由で推定が困難であり、即ちあるユーザは、オフピーク時間中にプレイし、ある日中の時間にユーザの集団ピークがあり、ピーク時間は、プレイするゲームの形式により影響され(例えば、子供のゲームは、おそらく、夜の早い時間にプレイされ)、等々である。しかし、ゲーマーがプレイする平均時間数が、ゲーマーがおそらくゲームをプレイする日の時間数より遥かに少ないとすれば、所与の時間にホスティングサービス210のユーザ数の一部分がそれを使用するだけである。この分析のためには、ピーク負荷が12.5%であると仮定しなければならない。従って、計算、圧縮及び帯域巾リソースの12.5%が所与の時間に使用されるだけであり、その結果、リソースの再使用により所与の性能レベルのゲームをプレイするように所与のユーザをサポートするのにハードウェアコストの12.5%だけとなる。 Furthermore, the hosting service configuration described herein efficiently shares resources among thousands of users, even if not millions. In general, online services have only a small percentage of the total user base that uses the services at a given time. Given the above Nielsen video game usage statistics, it's easy to see why. If an aggressive gamer plays a console game for only 17 hours per week, the peak usage time of the game is at night (5-AM12, 7 * 5 days = 35 hours / week) and weekends (AM8-AM12, 16 * 2 = 32 hours / week) Assuming typical non-working non-business hours, there are 35 + 32 = 65 peak hours per week for 17 hours of game play. The exact peak user load on the system is difficult to estimate for a number of reasons: some users play during off-peak hours, users have collective peaks at certain times of the day, and peak times play Influenced by the type of game (eg, children's games are probably played early in the night), and so on. However, if the average number of hours a gamer plays is much less than the number of hours a day the gamer probably plays the game, only a fraction of the number of users of the hosting service 210 will use it at any given time. is there. For this analysis, it must be assumed that the peak load is 12.5%. Thus, 12.5% of the computational, compression and bandwidth resources are only used at a given time, so that a given performance level is played by reusing resources to play a given performance level game. Supporting users is only 12.5% of the hardware cost.
更に、あるゲーム及びアプリケーションが他のものより多くの計算パワーを要求するとすれば、ユーザによってプレイされるゲーム又は実行されるアプリケーションに基づいてリソースを動的に割り当てることができる。従って、低性能ゲーム又はアプリケーションを選択するユーザには、低性能(低廉な)サーバー402が割り当てられ、そして高性能ゲーム又はアプリケーションを選択するユーザには、高性能(より高価な)サーバー402が割り当てられる。実際に、所与のゲーム又はアプリケーションは、ゲーム又はアプリケーションの低性能区分及び高性能区分を有し、そしてユーザは、ゲーム又はアプリケーションのニーズを満足する最低コストのサーバー402でのユーザの動作を保持するように、ゲーム又はアプリケーションの区分間で、あるサーバー402から別のサーバー402へスイッチすることができる。単一のディスクより遥かに高速のRAIDアレイ405が、低性能のサーバー402でも使用でき、高速ディスク転送レートの利益を得る。従って、プレイされるゲーム又は使用されるアプリケーションの全部にわたるサーバー402当たりの平均コストは、最高性能のゲーム又はアプリケーションをプレイする最も高価なサーバー402のコストよりかなり低く、更に、低性能サーバー402は、RAIDアレイ405からディスク性能の利益を導出する。 In addition, given that certain games and applications require more computing power than others, resources can be dynamically allocated based on the game played by the user or the application being executed. Thus, a user selecting a low performance game or application is assigned a low performance (cheap) server 402 and a user selecting a high performance game or application is assigned a high performance (more expensive) server 402. It is done. In fact, a given game or application has a low-performance segment and a high-performance segment of the game or application, and the user retains the user's behavior on the lowest cost server 402 that satisfies the game or application needs. As such, it is possible to switch from one server 402 to another between game or application segments. A RAID array 405 that is much faster than a single disk can also be used with a low performance server 402 to benefit from high disk transfer rates. Thus, the average cost per server 402 across all games played or applications used is significantly lower than the cost of the most expensive server 402 playing the highest performance game or application, and the low performance server 402 The disk performance benefits are derived from the RAID array 405.
更に、ホスティングサービス210のサーバー402は、ネットワークインターフェイス以外のディスク又は周辺インターフェイスをもたないPCマザーボード以上のものではなく、やがて、SAN403への高速ネットワークインターフェイスのみをもつ単一チップへと一体化される。又、RAIDアレイ405は、おそらく、ディスクより遥かに多数のユーザ間で共用され、従って、活動的なユーザ当たりのディスクコストは、1つのディスクドライブより遥かに低い。この装置は、全て、おそらく、環境的に制御されたサーバールーム環境においてラック内に存在する。サーバー402がフェイルした場合に、ホスティングサービス210において容易に修理又は交換することができる。対照的に、家庭又はオフィスにおけるPC又はゲームコンソールは、叩かれたり落とされたりすることによる適度な摩耗及び引き裂きに生き残ることができねばならず、ハウジングを要求し、少なくとも1つのディスクドライブを有し、悪い環境条件(例えば、他のギアでオーバーヘッドAVキャビネットへ詰め込まれる)に生き残らねばならず、サービス保証を要求し、パッケージされて出荷されねばならず、且つおそらく小売利ざやを徴収する小売店により販売される頑強なスタンドアローン機器でなければならない。更に、PC又はゲームコンソールは、ほとんどの時間に低性能ゲーム又はアプリケーション(或いはゲーム又はアプリケーションの区分)がプレイされても、将来のある時点で使用される最も計算上強いと予想されるゲーム又はアプリケーションのピーク性能を満足するように構成されねばならない。そして、PC又はコンソールがフェイルした場合に、それを修理するのは、高価で且つ時間のかかるプロセス(製造者、ユーザ及びソフトウェア開発者に悪影響が及ぶ)である。 Furthermore, the server 402 of the hosting service 210 is not more than a PC motherboard with no disk or peripheral interface other than the network interface, but will eventually be integrated into a single chip with only a high-speed network interface to the SAN 403. . Also, the RAID array 405 is probably shared among many more users than disks, so the disk cost per active user is much lower than a single disk drive. All of this equipment is probably in a rack in an environmentally controlled server room environment. If the server 402 fails, the hosting service 210 can easily repair or replace it. In contrast, a PC or game console in a home or office must be able to survive moderate wear and tear by being struck or dropped, requires a housing and has at least one disk drive. Sold by retailers that must survive bad environmental conditions (eg, packed into overhead AV cabinets with other gear), require service guarantees, must be packaged and shipped, and possibly collect retail margins Must be stubborn stand-alone equipment. In addition, a PC or game console is expected to be the most computationally strong game or application used at some point in the future, even if a low performance game or application (or game or application segment) is played most of the time. Must be configured to satisfy the peak performance of And when a PC or console fails, repairing it is an expensive and time consuming process that adversely affects manufacturers, users, and software developers.
従って、図4aに示すシステムがローカル計算リソースに匹敵する経験をユーザに与えるとすれば、家庭、オフィス又は学校のユーザが所与のレベルの計算能力を経験するために、図4aに示すアーキテクチャーを通してその計算能力を与えるのにかなり低廉なものとなる。 Thus, if the system shown in FIG. 4a gives the user an experience comparable to local computing resources, the architecture shown in FIG. 4a is required for a home, office or school user to experience a given level of computing power. It is quite inexpensive to give its computing power through.
アップグレードの必要性の排除
更に、ユーザは、新たなゲームをプレイし又はより高い性能の新たなアプリケーションを取り扱うためにPC及び/又はコンソールをアップグレードすることに関して心配する必要はもはやない。ホスティングサービス210におけるゲーム又はアプリケーションは、そのゲーム又はアプリケーションのためにどんな形式のサーバー402が要求されるかに関わらず、ユーザに利用することができ、全てのゲーム及びアプリケーションは、ほぼ即座に(即ち、サーバー402上のRAIDアレイ405又はローカル記憶装置から素早くロードされて)且つ最新の更新及びバグ修理で適切に実行される(即ち、ソフトウェア開発者は、所与のゲーム又はアプリケーションを実行するサーバー402にとって理想的なサーバー構成を選択し、次いで、最適なドライバを伴うサーバー402を構成することができ、そして時間の経過と共に、開発者は、ホスティングサービス210におけるゲーム又はアプリケーションの全てのコピーに更新、バグ修理、等を一度に与えることができる)。実際に、ユーザがホスティングサービス210の使用を開始した後に、ユーザは、おそらく、(例えば、更新及び/又はバグ修理を通じて)優れた経験を与え続けるゲーム及びアプリケーションを見出し、そしてユーザは、1年前に存在しなかったコンピューティング技術(例えば、高性能GPU)を使用するサービス210に新たなゲーム又はアプリケーションを利用できることを1年後に発見し、ひいては、1年後にゲームをプレイし又はアプリケーションを実行する技術を1年前に買うことがユーザにとって不可能であったことを発見することになろう。ゲームをプレイし又はアプリケーションを実行する計算リソースは、ユーザには見えないから(即ち、ユーザの観点から、ユーザは、テレビのチャンネルを切り換えるのと同様に、ほぼ瞬時に実行を開始するゲーム又はアプリケーションを単に選択するだけであるから)、ユーザのハードウェアは、ユーザが絶えずアップグレードに気付かなくても「アップグレード」されている。
Eliminating the need for upgrade In addition, users no longer have to worry about upgrading their PCs and / or consoles to play new games or handle new applications with higher performance. A game or application at the hosting service 210 is available to the user regardless of what type of server 402 is required for that game or application, and all games and applications are almost instantaneous (ie, , Loaded quickly from the RAID array 405 or local storage on the server 402) and properly executed with the latest updates and bug fixes (ie, the software developer runs the server 402 running a given game or application) The server configuration with the optimal driver can then be configured, and over time, the developer can update all copies of the game or application in the hosting service 210, It can give grayed repair, or the like at a time). In fact, after the user starts using the hosting service 210, the user will probably find games and applications that will continue to provide excellent experience (eg, through updates and / or bug fixes), and the user will be a year ago Discovers that a new game or application is available for a service 210 that uses a computing technology (eg, high performance GPU) that did not exist in 1 year, and thus plays the game or runs the application after 1 year You will discover that it was impossible for users to buy technology a year ago. The computing resource that plays the game or runs the application is invisible to the user (i.e., from the user's perspective, the user starts the game almost immediately, like switching TV channels) The user's hardware is “upgraded” without the user being constantly aware of upgrades.
バックアップの必要性の排除
会社、学校及び家庭においてユーザに対する別の主たる問題は、バックアップである。ローカルPC又はビデオゲームコンソールに記憶された情報(例えば、コンソールの場合には、ユーザのゲーム成績及びランキング)は、ディスクがフェイルするか、又は偶発的な消去があった場合に、失われる。PCのための手動又は自動バックアップを与えるアプリケーションは、多数入手でき、ゲームコンソールの状態をバックアップのためにオンラインサーバーへアップロードできるが、ローカルバックアップは、典型的に、別のローカルディスク(又は他の不揮発性記憶装置)へコピーして、これをどこか安全な場所に保管し組織化しなければならず、又、オンラインサービスに対するバックアップは、典型的な低コストインターネット接続を通して利用できるのがゆっくりのアップストリーム速度であるから、しばしば制限がある。図4aのホスティングサービス210では、RAIDアレイ405に記憶されるデータは、当業者に良く知られた従来のRAID構成技術を使用して、ディスクがフェイルした場合にも、データが失われず、そのフェイルしたディスクを収容しているサーバーセンターの専門家が通知を受けて、ディスクを交換し、RAIDアレイがもう一度フェイル許容となるよう自動的に更新されるように、構成することができる。更に、全てのディスクドライブが互いに近くにあり、そしてそれらの間にはSAN402を通して高速ローカルネットワークがあるので、サーバーセンターにおいて全てのディスクシステムを規則的に二次記憶装置でバックアップし、この二次記憶装置をサーバーセンターに保管するか又は離れた場所へ移すことは困難ではない。ホスティングサービス210のユーザの視点から、データは、単純に常時セキュアなものであり、バックアップについて考える必要はない。
Eliminating the Need for Backup Another major problem for users in companies, schools and homes is backup. Information stored on the local PC or video game console (eg, in the case of a console, the user's game performance and ranking) is lost if the disc fails or is accidentally erased. Many applications that provide manual or automatic backups for PCs are available and the game console state can be uploaded to an online server for backup, but local backups are typically separate local disks (or other non-volatile). Must be stored and organized somewhere safe, and backups to online services are available slowly over a typical low-cost Internet connection. Because of speed, there are often limitations. In the hosting service 210 of FIG. 4a, the data stored in the RAID array 405 is not lost when the disk fails using conventional RAID configuration techniques well known to those skilled in the art. The server center specialist who has received the disk is notified and can be configured to replace the disk and automatically update the RAID array to fail again. In addition, since all the disk drives are close to each other and there is a high speed local network between them through the SAN 402, all disk systems are regularly backed up at the server center with secondary storage, and this secondary storage. It is not difficult to store the device at the server center or move it away. From the user's point of view of the hosting service 210, the data is simply always secure and there is no need to think about backups.
デモへのアクセス
ユーザは、多くの場合に、ゲーム又はアプリケーションを購入する前にそれを試したがる。上述したように、ゲーム及びアプリケーションをデモする従来の手段があるが(「デモ」の動詞形は、デモンストレーションバージョンを試すことを意味し、これは、名詞として「デモ」とも称される)、それらの各々は、制限及び/又は不便さで悩まされている。ホスティングサービス210を使用すると、ユーザがデモを試すのが容易で且つ便利になる。実際に、全てのユーザがユーザインターフェイス(以下に述べるような)を通してモデを選択して、デモを試す。デモは、デモに適したサーバー402へほぼ瞬間的にロードを行い、そして他のゲーム又はアプリケーションと同様に実行するだけである。デモが非常に高性能のサーバー402を要求するか低性能のサーバー402を要求するかに関わらず、又、どんな形式の家庭又はオフィスクライアント415をユーザが使用しても、ユーザの観点から、デモは、きちんと機能する。ゲーム又はアプリケーションデモのソフトウェア発行者は、どんなデモをどれほど長くユーザが試すことが許されるか厳密に制御することができ、そしてもちろん、デモは、デモンストレーションされるゲーム又はアプリケーションのフルバージョンにアクセスする機会をユーザに与えるユーザインターフェイスエレメントを含むことができる。
Demo access users often want to try a game or application before purchasing it. As mentioned above, there are traditional means of demonstrating games and applications (the verb form of “demo” means to try a demonstration version, which is also called “demo” as a noun), Each of them is plagued with limitations and / or inconvenience. Using the hosting service 210 makes it easy and convenient for users to try out demos. In fact, all users try the demo by selecting a mode through the user interface (as described below). The demo loads almost instantly to the server 402 suitable for the demo and only runs like any other game or application. Regardless of whether the demo requires a very high performance server 402 or a low performance server 402, the user can use any form of home or office client 415 from the user's perspective. Works properly. Game or application demo software publishers have precise control over what demos are allowed and how long users can try, and of course, the demos have the opportunity to access the full version of the game or application being demonstrated. User interface elements that provide the user with
デモは、おそらく、価格未満又は無料で提供されるので、あるユーザは、デモ(特に、繰り返しプレイするのが楽しいゲームデモ)を繰り返し使用することを試みる。ホスティングサービス210は、所与のユーザに対してデモの使用を制限する種々の技術を使用することができる。最も単純な解決策は、ユーザごとにユーザIDを確立して、所与のユーザIDがデモをプレイすることが許される回数を制限することである。しかしながら、ユーザは、ユーザIDが無料の場合には、複数のユーザIDを設定することができる。この問題に対処する1つの技術は、所与のクライアント415がデモをプレイすることが許される回数を制限することである。クライアントがスタンドアローン装置である場合には、装置がシリアルナンバーを有し、ホスティングサービス210は、そのシリアルナンバーをもつクライアントによりデモをアクセスできる回数を制限することができる。クライアント415がPC又は他の装置のソフトウェアとして実行される場合には、ホスティングサービス210によりシリアルナンバーを指定してPCに記憶し、これを使用してデモの使用を制限できるが、PCをユーザが再プログラムでき且つシリアルナンバーを消去又は変更できるとすれば、PCネットワークアダプタ「メディアアクセスコントロール(MAC)」アドレス(及び/又は他のマシン特有の識別子、例えば、ハードドライブのシリアルナンバー、等)のレコードを保持して、それに対してデモの使用を制限するという別のオプションがホスティングサービス210に対して設けられる。しかしながら、ネットワークアダプタのMACアドレスを変更できるとすれば、これは、フールプルーフな方法ではない。別の解決策は、所与のIPアドレスに対してデモをプレイできる回数を制限することである。IPアドレスは、ケーブルモデム及びDSLプロバイダーによって周期的に再指定できるが、実際にはあまり頻繁に行われず、IPが、住居DSL又はケーブルモデムアクセスに対するIPアドレスのブロック内にあると決定できる場合には(例えば、ISPにコンタクトすることによって)、典型的に、所与の家庭に対して少数のデモ使用を確立することができる。又、家庭において同じIPアドレスを共有するNATルーターの後方に複数の装置が存在することもあるが、典型的に、住居設定では、このような装置は限定された数だけである。IPアドレスが、会社にサービスするブロック内にある場合には、1つの会社に対して多数のデモを確立することができる。しかし、結局、PCにおけるデモの数を制限する最良の方法は、上述した全ての解決策の組合せである。断固とした技術的に熟練したユーザが、繰り返しプレイされるデモの数を制限できるフールプルーフの方法はないが、多数のバリアを生成することで、トラブルの多いPCユーザがデモシステムを悪用しても価値がなく、むしろ、デモをそれらが意図されたように使用して新たなゲーム及びアプリケーションを試せるように、充分な抑止力を生み出すことができる。 Demos are probably offered below or at no cost, so some users try to use demos (especially game demos that are fun to play repeatedly). The hosting service 210 can use various techniques that limit the use of demos for a given user. The simplest solution is to establish a user ID for each user and limit the number of times a given user ID is allowed to play the demo. However, the user can set a plurality of user IDs when the user ID is free. One technique that addresses this problem is to limit the number of times a given client 415 is allowed to play a demo. If the client is a stand-alone device, the device has a serial number and the hosting service 210 can limit the number of times a demo can be accessed by a client with that serial number. When the client 415 is executed as software of a PC or other device, a serial number can be specified by the hosting service 210 and stored in the PC, and this can be used to restrict the use of the demo. A record of the PC network adapter "Media Access Control (MAC)" address (and / or other machine-specific identifier, eg, hard drive serial number, etc.), if it can be reprogrammed and the serial number can be erased or changed Another option is provided for the hosting service 210 to keep and limit the use of demos for it. However, if the MAC address of the network adapter can be changed, this is not a foolproof method. Another solution is to limit the number of times a demo can be played for a given IP address. The IP address can be periodically reassigned by the cable modem and DSL provider, but in practice it is not done very often and if the IP can be determined to be in a block of IP addresses for residential DSL or cable modem access A small number of demos can typically be established for a given home (eg, by contacting an ISP). There may also be multiple devices behind NAT routers that share the same IP address at home, but typically there are only a limited number of such devices in a residential setting. Multiple demos can be established for one company if the IP address is in a block serving the company. But in the end, the best way to limit the number of demos on a PC is a combination of all the solutions described above. There is no foolproof way for determined technically skilled users to limit the number of demos that are played repeatedly, but by creating a large number of barriers, troublesome PC users can abuse the demo system. Is not worth it, but rather can create enough deterrent so that demos can be used as they are intended to try out new games and applications.
学校、会社及び他の施設の利益
特に、図4aに示すシステムを利用する会社、学校及び他の施設に対して著しい利益が得られる。会社及び学校は、PCをインストールし、維持し及びアップグレードすることに関連して著しいコストがかかり、それが、Mayaのような高性能アプリケーションを実行するためのPCになったときには、特にそうである。上述したように、PCは、一般的に、週の時間の僅かな部分しか利用されず、そして家庭の場合と同様に、所与のレベルの性能能力を伴うPCのコストは、オフィス又は学校環境の方がサーバーセンター環境よりも遥かに高い。
Benefits for schools, companies and other facilities, particularly for companies, schools and other facilities that utilize the system shown in FIG. 4a. Companies and schools have significant costs associated with installing, maintaining and upgrading PCs, especially when it comes to PCs for running high performance applications such as Maya. . As mentioned above, PCs are generally used for only a small portion of the time of the week, and as in the home, the cost of a PC with a given level of performance capability is in an office or school environment. Is much higher than the server center environment.
大きな会社又は学校(例えば、大規模な大学)の場合には、そのようなエンティティのIT部門がサーバーセンターを設定し、そしてLANグレード接続を経てリモートアクセスされるコンピュータを維持するのが実際的である。LANを経て又はオフィス間のプライベートな広帯域巾接続を通してコンピュータにリモートアクセスするための解決策は、多数存在する。例えば、Microsoft Windowsターミナルサーバーでは、又はRealVNC社からのVNCのようなバーチャルネットワーク計算アプリケーションを通して、或いはSun Microsystemsからのシンクライアント手段を通して、ユーザは、グラフィック応答時間及びユーザ経験においてある範囲のクオリティでPC又はサーバーへのリモートアクセスを得ることができる。更に、このような自己管理型のサーバーセンターは、典型的に、単一の会社又は学校専用であり、従って、異種のアプリケーション(例えば、娯楽及び会社アプリケーション)が週の異なる時間に同じ計算リソースを利用するときに考えられる使用の重複の利点を取り入れることができない。従って、多くの会社及び学校は、各ユーザへのLAN速度ネットワーク接続を有するサーバーセンターをそれ自身で設定するスケール、リソース又は専門知識に欠ける。実際に、学校及び会社の大部分は、家庭と同じインターネット接続(例えば、DSL、ケーブルモデム)を有する。 For large companies or schools (eg, large universities), it is practical for the IT department of such an entity to set up a server center and maintain computers that are accessed remotely over a LAN grade connection. is there. There are many solutions for remotely accessing a computer via a LAN or through a private high bandwidth connection between offices. For example, on a Microsoft Windows terminal server, or through a virtual network computing application such as VNC from RealVNC, or through a thin client means from Sun Microsystems, the user can use a PC with a range of quality in graphic response time and user experience. You can get remote access to the server. In addition, such self-managed server centers are typically dedicated to a single company or school, so heterogeneous applications (eg, entertainment and company applications) use the same computing resources at different times of the week. It cannot take advantage of the duplication of use that can be considered when using it. Thus, many companies and schools lack the scale, resources or expertise to set up a server center with a LAN speed network connection to each user. In fact, most schools and businesses have the same Internet connection (eg, DSL, cable modem) as the home.
このような組織は、定常的ベース又は周期的ベースのいずれかで非常に高性能の計算の必要性を依然有している。例えば、小さな建築会社は、少数の建築家しかおらず、設計の仕事をするときに計算の必要性が比較的僅かであるが、非常に高性能の3D計算を周期的に必要とする(例えば、クライアントに対する新たな建築設計の3Dフライスルーを創作するときに)。図4aに示すシステムは、このような組織に非常に良く適している。組織は、典型的に非常に安価な、家庭に提供されるものと同じ種類のネットワーク接続(例えば、DSL、ケーブルモデム)以上のものを必要としない。それらは、安価なPCをクライアント415として利用するか、或いはPCを全く省き、制御信号ロジック413及び短待ち時間ビデオ解凍412を簡単に具現化する安価な専用装置を利用するかのいずれかである。これらの特徴は、PCの窃盗や、PC内の専用コンポーネントへのダメージに伴う問題がある学校にとって特に魅力的である。 Such organizations still have a need for very high performance calculations on either a steady or periodic basis. For example, a small building company has a small number of architects and needs relatively little computation when doing design work, but periodically requires very high performance 3D calculations (eg, , When creating new architectural design 3D flythroughs for clients). The system shown in FIG. 4a is very well suited for such tissues. Organizations do not need more than the same type of network connection (eg, DSL, cable modem) that is typically very inexpensive and provided to the home. They either use an inexpensive PC as the client 415 or use an inexpensive dedicated device that simply omits the PC and easily implements the control signal logic 413 and the short latency video decompression 412. . These features are particularly attractive for schools that have problems with PC theft and damage to dedicated components in the PC.
このような構成は、このような組織の多数の問題を解決する(そしてこれら効果の多くは、一般的な計算を行う家庭のユーザによっても共用される)。その1つとして、運営コスト(最終的に、実現可能な取引を得るためにある形態でユーザへ還元されねばならない)を非常に低くすることができる。というのは、(a)計算リソースが、週内に異なるピーク使用時間を有する他のアプリケーションと共有され、(b)組織が、必要な時だけ高性能計算リソースにアクセスする(及びそのコストを被る)ことができ、(c)組織が、高性能計算リソースをバックアップ又は維持するためのリソースを設ける必要がないからである。 Such a configuration solves a number of problems in such organizations (and many of these effects are also shared by home users performing common calculations). For one, the operating costs (which ultimately must be returned to the user in some form to obtain a feasible transaction) can be very low. This is because (a) compute resources are shared with other applications that have different peak usage times during the week, and (b) organizations access (and incur costs of) high performance compute resources only when needed. (C) the organization does not need to provide resources to back up or maintain high performance computing resources.
海賊行為の排除
更に、ゲーム、アプリケーション、双方向映画、等は、今日のように海賊行為を受けることがもはやない。ゲームは、サービスセンターで実行されるので、ユーザには、基礎的なプログラムコードへのアクセス権が与えられず、従って、海賊行為を受けるものは何もない。ユーザがソースコードをコピーする場合でも、ユーザは、標準的なゲームコンソール又は家庭用コンピュータにおいてコードを実行することはできない。これは、標準的なビデオゲームが入手できない中国のような世界の場所に市場を開く。又、中古ゲームの再販売はできない。
Eliminating piracy Furthermore, games, applications, interactive movies, etc. are no longer subject to piracy as they are today. Since the game is run at the service center, the user is not given access to the basic program code, and therefore nothing is pirated. Even if the user copies the source code, the user cannot execute the code on a standard game console or home computer. This opens the market in world places like China where standard video games are not available. Also, second-hand games cannot be resold.
ゲームの開発者にとって、今日、市場の不連続部は僅かである。ホスティングサービス210は、技術の完全に新たな世代がユーザや開発者を強制的にアップグレードさせ且つゲーム開発者がハードウェアプラットホームの適時の配信に依存する現在の状況とは対照的に、ゲームの要件が変化するにつれて時間と共に徐々に更新することができる。 For game developers, there are few discontinuities in the market today. Hosting service 210 is a game requirement, as opposed to the current situation where a completely new generation of technology forces users and developers to upgrade and game developers rely on timely delivery of hardware platforms. As time changes, it can be gradually updated over time.
ストリーミング双方向ビデオ
以上の説明は、一般的インターネットをベースとする短待ち時間のストリーミング双方向ビデオ(これは、ここで使用されるオーディオもビデオと一緒に暗示的に含む)の新規な基礎的概念により可能となる広範囲なアプリケーションを述べるものである。インターネットを通してストリーミングビデオを与える従来のシステムは、長待ち時間の双方向性で具現化できるアプリケーションを可能にするだけである。例えば、リニアビデオのための再生コントロール(例えば、休止、巻き戻し、早送り)は、長い待ち時間で充分に機能し、リニアビデオフィードの中から選択することができる。そして、上述したように、あるビデオゲームの性質は、それらを長待ち時間でプレイすることを許す。しかし、ストリーミングビデオのための従来の解決策の長待ち時間(又は低圧縮比)は、ストリーミングビデオの潜在的なアプリケーションを甚だしく制限するか、又はそれらの開発を特殊なネットワーク環境へと狭め、そしてそのような環境においても、従来の技術は、ネットワークに実質的な負担を導入する。ここに述べる技術は、インターネットを通る短待ち時間のストリーミング双方向ビデオ、特に、消費者グレードのインターネット接続を通して可能になるもの、で考えられる広範囲なアプリケーションに対してドアを開く。
Streaming interactive video The discussion above is a new basic concept of low latency streaming interactive video based on the general Internet (which also includes the audio used here implicitly with the video) Describes the wide range of applications that are possible. Conventional systems that provide streaming video over the Internet only allow applications that can be implemented with long latency interactivity. For example, playback controls for linear video (eg pause, rewind, fast forward) work well with long latency and can be selected from linear video feeds. And as noted above, the nature of certain video games allows them to be played with a long latency. However, the long latency (or low compression ratio) of conventional solutions for streaming video severely limits the potential applications of streaming video or narrows their development to specialized network environments, and Even in such an environment, the prior art introduces a substantial burden on the network. The technology described here opens the door to a wide range of applications that can be considered for low-latency streaming interactive video through the Internet, especially those enabled through consumer-grade Internet connections.
実際上任意の量の計算パワー、任意の量の高速記憶、並びにパワフルなサーバーの中の非常に高速なネットワークでユーザ経験の向上を果たすに充分な、図4cのクライアント465と同程度に小さいクライアント装置で、実際に、新しい計算の時代を可能にする。更に、帯域巾要件は、システムの計算パワーが増大するにつれて拡大しないので(即ち、帯域巾要件は、表示解像度、クオリティ及びフレームレートに結び付いているだけであるので)、ブロードバンドインターネット接続が偏在し(例えば、広く普及した短待ち時間のワイヤレスカバレージを通して)、信頼性があり、且つ全ユーザのディスプレイ装置422のニーズを満足するに充分な広い帯域巾であるときには、典型的な消費者及び会社向けアプリケーションに対して、(Windows、Linux、OSX、等を実行するPC又は移動電話のような)シッククライアントが必要か、又は(Adobe Flash又はJavaのような)シンクライアントでもよいかが問題となる。 A client as small as the client 465 of FIG. 4c, sufficient to provide an improved user experience with virtually any amount of computing power, any amount of fast storage, and a very fast network in a powerful server The device actually enables a new era of computation. Furthermore, since bandwidth requirements do not increase as the computing power of the system increases (ie, bandwidth requirements are only tied to display resolution, quality and frame rate), broadband Internet connections are ubiquitous ( Typical consumer and corporate applications when reliable and wide enough to meet the needs of all users' display devices 422 (eg, through widespread, low latency wireless coverage) On the other hand, the question is whether a thick client (such as a PC or mobile phone running Windows, Linux, OSX, etc.) is necessary or a thin client (such as Adobe Flash or Java) may be used.
ストリーミング双方向ビデオの出現は、計算アーキテクチャーの構造についての仮定を考え直す結果となった。その一例が、図15に示すホスティングサービス210のサーバーセンター実施形態である。遅延バッファ及び/又はグループビデオ1550のためのビデオ経路は、app/gameサーバー1521−1525のマルチキャストされたストリーミング双方向ビデオ出力が、経路1552を経てリアルタイムで、又は経路1551を経て選択可能な遅延の後に、app/gameサーバー1521−1525へフィードバックされる。これは、従来のサーバー又はローカル計算アーキテクチャーでは不可能であるか又は実現不能な広範囲の実際的なアプリケーション(例えば、図16,17及び20に示すもののような)を可能にする。しかし、より一般的なアーキテクチャー上の特徴として、フィードバックループ1550が与えるものは、ストリーミング双方向ビデオレベルでの反復である。というのは、アプリケーションが要求したときに、ビデオを不定にループバックできるからである。これは、従来得られなかった広範囲のアプリケーションの可能性を実現できるようにする。 The advent of streaming interactive video has led to rethinking assumptions about the structure of the computational architecture. One example is the server center embodiment of the hosting service 210 shown in FIG. The video path for the delay buffer and / or group video 1550 can be selected in such a way that the multicast streaming bi-directional video output of the app / game server 1521-1525 is selectable in real time via path 1552 or via path 1551. Later, it is fed back to the app / game server 1521-1525. This allows a wide range of practical applications (such as those shown in FIGS. 16, 17 and 20) that are not possible or feasible with conventional servers or local computing architectures. However, as a more general architectural feature, what feedback loop 1550 provides is iteration at the streaming interactive video level. This is because the video can be looped back indefinitely when requested by the application. This makes it possible to realize a wide range of application possibilities not previously available.
別の重要なアーキテクチャー上の特徴は、ビデオストリームが単一方向のUDPストリームであることである。これは、実際上、ストリーミング双方向ビデオのマルチキャスティングを任意の度合いで行えるようにする(対照的に、TCP/IPストリームの両方向ストリームは、ユーザの数が増えるにつれて前後通信からネットワークに益々大きな渋滞を生じることになる)。マルチキャスティングは、サーバーセンター内で重要な能力である。というのは、システムが、インターネットユーザ(及び実際には世界の人口)の増大するニーズに応答して、1対多又は多対多で、通信を行えるようにするからである。この場合も、ストリーミング双方向ビデオ反復及びマルチキャスティングの両方の使用を示す図16について述べた例は、可能性についての非常に大きな氷山の頂点に過ぎない。 Another important architectural feature is that the video stream is a unidirectional UDP stream. This effectively allows for streaming bi-directional video multicasting to any degree (in contrast, bi-directional streams of TCP / IP streams are increasingly congested from front-to-back communication to the network as the number of users increases. Will be generated). Multicasting is an important capability within a server center. This is because the system enables one-to-many or many-to-many communication in response to the increasing needs of Internet users (and indeed the world population). Again, the example described for FIG. 16, which shows the use of both streaming interactive video repetition and multicasting, is just the top of a very large iceberg for possibilities.
一実施形態では、ここ及び関連するステップに示す種々の機能的モジュールは、そのステップを遂行するための固定布線ロジックを含む特定のハードウェアコンポーネント、例えば、特定用途向け集積回路(ASIC)により遂行されるか、又はプログラムされたコンピュータコンポーネント及びカスタムハードウェアコンポーネントの組合せにより遂行される。 In one embodiment, the various functional modules shown here and associated steps are performed by a specific hardware component, such as an application specific integrated circuit (ASIC), that includes fixed wiring logic to perform the steps. Or performed by a combination of programmed computer components and custom hardware components.
一実施形態では、これらモジュールは、テキサスインスツルーメント社のTMS320xアーキテクチャー(例えば、TMS320C6000、TMS320C5000、等)のプログラム可能なデジタル信号プロセッサ(DSP)において具現化される。これらの基礎的な原理に適合する種々の異なるDSPを使用することができる。 In one embodiment, these modules are embodied in a programmable digital signal processor (DSP) of Texas Instruments' TMS320x architecture (eg, TMS320C6000, TMS320C5000, etc.). A variety of different DSPs that conform to these basic principles can be used.
これら実施形態は、上述した種々のステップを含むことができる。これらステップは、汎用プロセッサ又は特殊目的のプロセッサが幾つかのステップを遂行するようにさせるマシン実行可能なインストラクションにおいて実施することができる。これら基礎的な原理に関連しない種々の要素、例えば、コンピュータメモリ、ハードドライブ、入力装置は、適切な観点を不明瞭にしないために図面から除外してある。 These embodiments can include the various steps described above. These steps can be implemented in machine-executable instructions that cause a general purpose or special purpose processor to perform several steps. Various elements not related to these basic principles, such as computer memory, hard drives, and input devices, have been omitted from the drawings in order not to obscure the appropriate aspects.
ここに開示する要旨の要素は、マシン実行可能なインストラクションを記憶するためのマシン読み取り可能なメディアとして与えられてもよい。マシン読み取り可能なメディアは、フラッシュメモリ、光学的ディスク、CD−ROM、DVD ROM、RAM、EPROM、EEPROM、磁気又は光学カード、電子的インストラクションを記憶するのに適した伝播メディア又は他の形式のマシン読み取り可能なメディアを含むが、これらに限定されない。例えば、本発明は、通信リンク(例えば、モデム又はネットワーク接続)を経ての搬送波又は他の伝播メディアで実施されるデータ信号によりリモートコンピュータ(例えば、サーバー)から要求側コンピュータ(例えば、クライアント)へ転送されるコンピュータプログラムとしてダウンロードすることができる。 The gist elements disclosed herein may be provided as a machine-readable medium for storing machine-executable instructions. Machine readable media can be flash memory, optical disc, CD-ROM, DVD ROM, RAM, EPROM, EEPROM, magnetic or optical card, propagation media suitable for storing electronic instructions, or other types of machines Including but not limited to readable media. For example, the present invention transfers from a remote computer (eg, server) to a requesting computer (eg, client) via a data signal implemented on a carrier wave or other propagation medium over a communication link (eg, a modem or network connection). Can be downloaded as a computer program.
又、ここに開示する要旨の要素は、一連のオペレーションを遂行するようにコンピュータ(例えば、プロセッサ又は他の電子装置)をプログラムするのに使用されるインストラクションが記憶されたマシン読み取り可能なメディアを含むコンピュータプログラム製品として提供されてもよいことを理解されたい。或いは又、オペレーションは、ハードウェア及びソフトウェアの組合せにより遂行されてもよい。マシン読み取り可能なメディアは、フロッピー(登録商標)ディスケット、光学的ディスク、CD−ROM、及び磁気・光学ディスク、ROM、RAM、EPROM、EEPROM、磁気又は光学カード、電子的インストラクションを記憶するのに適した伝播メディア又は他の形式のメディア/マシン読み取り可能なメディアを含むが、これらに限定されない。例えば、ここに開示する要旨の要素は、通信リンク(例えば、モデム又はネットワーク接続)を経ての搬送波又は他の伝播メディアで実施されるデータ信号によりプログラムがリモートコンピュータ又は電子装置から要求側コンピュータへ転送されるようなコンピュータプログラム製品としてダウンロードすることができる。 Elements of the subject matter disclosed herein also include machine-readable media that store instructions used to program a computer (eg, a processor or other electronic device) to perform a series of operations. It should be understood that it may be provided as a computer program product. Alternatively, the operation may be performed by a combination of hardware and software. Machine-readable media suitable for storing floppy diskettes, optical disks, CD-ROMs, and magneto-optical disks, ROM, RAM, EPROM, EEPROM, magnetic or optical cards, electronic instructions Including, but not limited to, propagation media or other types of media / machine readable media. For example, an element of the presently disclosed subject matter is that a program is transferred from a remote computer or electronic device to a requesting computer by a data signal implemented on a carrier wave or other propagation medium over a communication link (eg, a modem or network connection). Can be downloaded as a computer program product.
更に、ここに開示する要旨は、特定の実施形態に関連して説明したが、本開示の範囲内で多数の変更や修正がなされ得る。従って、本発明及び添付図面は、単なる例示に過ぎず、それに限定されるものではない。 Furthermore, while the subject matter disclosed herein has been described with reference to specific embodiments, numerous changes and modifications can be made within the scope of the present disclosure. Accordingly, the present invention and the accompanying drawings are merely illustrative and are not limiting.
100:CPU/GPU
101:RAM
102:ディスプレイ装置
103:ハードドライブ
104:光学的メディアドライブ
105:ネットワーク接続
106:ゲームコントローラ
205:クライアント装置
206:インターネット
210:ホスティングサービス
211:ユーザの家屋
220:ソフトウェア開発者
221:入力装置
222:モニタ又はTV受像機
301:最大データレート
302:実際に利用できる最大データレート
303:要求されたデータレート
401:ホスティングサービスコントロールシステム
402:サーバー
403:SAN
404:低待ち時間のビデオ圧縮
405:RAIDアレイ
406:コントロール信号
410:インターネット
412:低待ち時間の解凍
413:コントロール信号ロジック
415:家庭又はオフィスクライアント
421:入力装置
422:モニタ又はHDTV
441:中央オフィス、ヘッドエンド、セルタワー、等
442:WANインターフェイス
443:ファイアウオール/ルーター/NAT
444:WANインターフェイス
451:コントロール信号
452:ユーザの家屋ルーティング
453:ユーザISP
454:インターネット
455:サーバーセンタールーティング
456:フレーム計算
457:ビデオ圧縮
458:ビデオ解凍
462:パワーオーバーイーサネット
463:HDMI出力
464:ディスプレイ能力
465:イーサネット対HDMIクライアント
466:シャッター付き眼鏡
468:モニタ又はSD/HDTV
469:ブルーツース入力装置
476:フラッシュ
480:バス
481:イーサネットインターフェイス
483:コントロールCPU
484:ブルーツース
486:ビデオデコンプレッサ
487:ビデオ出力
488:オーディオデコンプレッサ
489:オーディオ出力
490:HDMI
497:イーサネット
499:電力
100: CPU / GPU
101: RAM
102: Display device 103: Hard drive 104: Optical media drive 105: Network connection 106: Game controller 205: Client device 206: Internet 210: Hosting service 211: User's house 220: Software developer 221: Input device 222: Monitor Or TV receiver 301: Maximum data rate 302: Maximum data rate that can be actually used 303: Requested data rate 401: Hosting service control system 402: Server 403: SAN
404: Low latency video compression 405: RAID array 406: Control signal 410: Internet 412: Low latency decompression 413: Control signal logic 415: Home or office client 421: Input device 422: Monitor or HDTV
441: Central office, head end, cell tower, etc. 442: WAN interface 443: Firewall / Router / NAT
444: WAN interface 451: Control signal 452: User's house routing 453: User ISP
454: Internet 455: Server center routing 456: Frame calculation 457: Video compression 458: Video decompression 462: Power over Ethernet 463: HDMI output 464: Display capability 465: Ethernet vs. HDMI client 466: Glasses with shutters 468: Monitor or SD / HDTV
469: Bluetooth input device 476: Flash 480: Bus 481: Ethernet interface 483: Control CPU
484: Bluetooth 486: Video decompressor 487: Video output 488: Audio decompressor 489: Audio output 490: HDMI
497: Ethernet 499: Power
Claims (3)
前記第1形式のプログラムコード及びデータを、比較的短待ち時間のメモリアクセスを与える第1形式のメモリに記憶するステップと、
前記第2形式のプログラムコード及びデータを、前記第1形式のメモリに比して比較的長待ち時間のメモリアクセスを与える第2形式のメモリに記憶するステップと、
オンラインアプリケーションを実行するためのクライアント要求に応答して前記第1メモリ及び第2メモリからプログラムコード及びデータを検索するステップと、
前記アプリケーションにより発生された映像を表すストリーミング双方向ビデオストリームをクライアントへ送信するステップと、
を備えたコンピュータ実施方法。 Subdividing the program code and / or data used to execute the online application into a first format and a second format;
Storing the first form of program code and data in a first form of memory that provides relatively low latency memory access;
Storing the second form of program code and data in a second form of memory that provides a relatively long latency memory access compared to the first form of memory;
Retrieving program code and data from the first memory and the second memory in response to a client request to execute an online application;
Sending a streaming interactive video stream representing the video generated by the application to the client;
A computer-implemented method comprising:
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99965807A | 2007-12-05 | 2007-12-05 | |
PCT/US2008/085601 WO2009073826A1 (en) | 2007-12-05 | 2008-12-04 | System and method for storing program code and data within an application hosting center |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011507347A true JP2011507347A (en) | 2011-03-03 |
Family
ID=40718184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010537086A Pending JP2011507347A (en) | 2007-12-05 | 2008-12-04 | System and method for storing program code and data in an application hosting center |
Country Status (10)
Country | Link |
---|---|
EP (1) | EP2232375A4 (en) |
JP (1) | JP2011507347A (en) |
KR (1) | KR20100113503A (en) |
CN (1) | CN101918924A (en) |
AU (1) | AU2008333828B2 (en) |
CA (1) | CA2707704A1 (en) |
NZ (1) | NZ585909A (en) |
RU (1) | RU2497184C2 (en) |
TW (2) | TWI459215B (en) |
WO (1) | WO2009073826A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011077992A (en) * | 2009-10-01 | 2011-04-14 | Nec Corp | Digital data shared service terminal, method, program, and digital data shared service system |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8888592B1 (en) | 2009-06-01 | 2014-11-18 | Sony Computer Entertainment America Llc | Voice overlay |
US8613673B2 (en) | 2008-12-15 | 2013-12-24 | Sony Computer Entertainment America Llc | Intelligent game loading |
US8968087B1 (en) | 2009-06-01 | 2015-03-03 | Sony Computer Entertainment America Llc | Video game overlay |
US8147339B1 (en) | 2007-12-15 | 2012-04-03 | Gaikai Inc. | Systems and methods of serving game video |
US8926435B2 (en) | 2008-12-15 | 2015-01-06 | Sony Computer Entertainment America Llc | Dual-mode program execution |
US8506402B2 (en) | 2009-06-01 | 2013-08-13 | Sony Computer Entertainment America Llc | Game execution environments |
US8771064B2 (en) | 2010-05-26 | 2014-07-08 | Aristocrat Technologies Australia Pty Limited | Gaming system and a method of gaming |
US8560331B1 (en) | 2010-08-02 | 2013-10-15 | Sony Computer Entertainment America Llc | Audio acceleration |
EP2609520B1 (en) | 2010-09-13 | 2018-05-30 | Sony Computer Entertainment America LLC | Add-on management |
KR20170129296A (en) | 2010-09-13 | 2017-11-24 | 소니 인터랙티브 엔터테인먼트 아메리카 엘엘씨 | A method and system of providing a computer game at a computer game system including a video server and a game server |
CN102841809B (en) * | 2011-06-22 | 2016-06-01 | 联想(北京)有限公司 | Information processing method and device, mode switching method and terminal unit |
KR101319243B1 (en) * | 2011-08-24 | 2013-10-16 | 연세대학교 산학협력단 | A method for providing web-page and a computer-readable recording medium recording program for implementing the method |
US9131245B2 (en) | 2011-09-23 | 2015-09-08 | Qualcomm Incorporated | Reference picture list construction for video coding |
AU2012342192A1 (en) | 2011-11-23 | 2014-06-12 | Geonomics Global Games Limited | Systems and methods for providing and processing software objects in connection with a map-based game |
KR102247892B1 (en) | 2014-12-02 | 2021-05-04 | 에스케이플래닛 주식회사 | System for cloud streaming service, method of image cloud streaming service using application code and apparatus for the same |
KR102273142B1 (en) | 2015-01-13 | 2021-07-05 | 에스케이플래닛 주식회사 | System for cloud streaming service, method of image cloud streaming service using application code conversion and apparatus for the same |
CN105844532A (en) * | 2016-03-23 | 2016-08-10 | 努比亚技术有限公司 | Method and server for processing subscription information |
CN110110865B (en) * | 2018-07-20 | 2023-08-11 | 深圳怡化电脑股份有限公司 | Equipment maintenance method, device, server, equipment and storage medium |
US11269612B2 (en) * | 2019-12-10 | 2022-03-08 | Paypal, Inc. | Low latency dynamic content management |
CN113515255B (en) * | 2021-05-17 | 2023-02-07 | 英华达(上海)科技有限公司 | Audio playing control method, system, electronic equipment and storage medium |
CN116389970B (en) * | 2021-12-22 | 2024-09-10 | 比亚迪股份有限公司 | Independent sound channel output method of multiple types of sound sources, SOC chip and automobile |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11282631A (en) * | 1998-03-27 | 1999-10-15 | Fujitsu Ltd | Input and output control device and method |
JP2007301371A (en) * | 2006-05-10 | 2007-11-22 | Konami Gaming Inc | System and method for streaming game and service to gaming apparatus |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6909708B1 (en) * | 1996-11-18 | 2005-06-21 | Mci Communications Corporation | System, method and article of manufacture for a communication system architecture including video conferencing |
EP1135722A4 (en) * | 1998-07-27 | 2005-08-10 | Webtv Networks Inc | Remote computer access |
US6640284B1 (en) * | 2000-05-12 | 2003-10-28 | Nortel Networks Limited | System and method of dynamic online session caching |
JP3345719B2 (en) * | 2000-07-04 | 2002-11-18 | コナミ株式会社 | Game control method, game device, and recording medium |
DE60116364T2 (en) * | 2000-10-27 | 2006-09-28 | Sony Computer Entertainment Inc. | DATA PROCESSING SYSTEM WITH MULTIPLE OPERATING TERMINALS AND A DATA PROCESSING DEVICE |
SE521645C2 (en) * | 2001-04-11 | 2003-11-18 | Ericsson Telefon Ab L M | Method and mobile phone and mobile phone system that allows interruption in multi-user games when telephone calls are received |
US20030093806A1 (en) * | 2001-11-14 | 2003-05-15 | Vincent Dureau | Remote re-creation of data in a television system |
RU2283509C2 (en) * | 2002-07-23 | 2006-09-10 | Самсунг Электроникс Ко., Лтд. | Index structure of meta-data, method for providing indexes of meta-data, and also method for searching for meta-data and device, using indexes of meta-data |
JP2004128779A (en) * | 2002-10-01 | 2004-04-22 | Sony Corp | Broadcast system, recording apparatus, recording method, program, and record medium |
FI116016B (en) * | 2002-12-20 | 2005-08-31 | Oplayo Oy | a buffering |
JP3735358B2 (en) * | 2003-09-12 | 2006-01-18 | コナミ株式会社 | Video game program, video game apparatus, and video game method |
US8370888B2 (en) * | 2004-06-22 | 2013-02-05 | University Of Southern California | Hydra: high-performance data recording architecture for streaming media |
JP4615958B2 (en) * | 2004-10-15 | 2011-01-19 | クラリオン株式会社 | Digital broadcast sending device, receiving device, and digital broadcasting system |
US7751324B2 (en) * | 2004-11-19 | 2010-07-06 | Nokia Corporation | Packet stream arrangement in multimedia transmission |
WO2006100664A2 (en) * | 2005-03-21 | 2006-09-28 | Yosef Mizrahi | Method, system and computer-readable code for providing a computer gaming service |
KR100776635B1 (en) * | 2006-09-28 | 2007-11-15 | 주식회사 셀런 | Remote access method between settop box and remote server system using h.264 codec and apparatus therefor |
-
2008
- 2008-12-04 CA CA2707704A patent/CA2707704A1/en not_active Abandoned
- 2008-12-04 CN CN2008801194261A patent/CN101918924A/en active Pending
- 2008-12-04 KR KR1020107014738A patent/KR20100113503A/en not_active Application Discontinuation
- 2008-12-04 EP EP08858175A patent/EP2232375A4/en not_active Withdrawn
- 2008-12-04 TW TW097147248A patent/TWI459215B/en active
- 2008-12-04 WO PCT/US2008/085601 patent/WO2009073826A1/en active Application Filing
- 2008-12-04 AU AU2008333828A patent/AU2008333828B2/en active Active
- 2008-12-04 NZ NZ585909A patent/NZ585909A/en unknown
- 2008-12-04 RU RU2010127316/08A patent/RU2497184C2/en active
- 2008-12-04 JP JP2010537086A patent/JP2011507347A/en active Pending
- 2008-12-04 TW TW98114137A patent/TW200943078A/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11282631A (en) * | 1998-03-27 | 1999-10-15 | Fujitsu Ltd | Input and output control device and method |
JP2007301371A (en) * | 2006-05-10 | 2007-11-22 | Konami Gaming Inc | System and method for streaming game and service to gaming apparatus |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011077992A (en) * | 2009-10-01 | 2011-04-14 | Nec Corp | Digital data shared service terminal, method, program, and digital data shared service system |
Also Published As
Publication number | Publication date |
---|---|
TW200943078A (en) | 2009-10-16 |
WO2009073826A1 (en) | 2009-06-11 |
EP2232375A4 (en) | 2012-10-10 |
EP2232375A1 (en) | 2010-09-29 |
RU2010127316A (en) | 2012-01-10 |
RU2497184C2 (en) | 2013-10-27 |
KR20100113503A (en) | 2010-10-21 |
CN101918924A (en) | 2010-12-15 |
TW200937220A (en) | 2009-09-01 |
AU2008333828A1 (en) | 2009-06-11 |
NZ585909A (en) | 2013-08-30 |
AU2008333828B2 (en) | 2013-10-03 |
CA2707704A1 (en) | 2009-06-11 |
TWI459215B (en) | 2014-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6369999B2 (en) | System and method for protecting certain types of multimedia data transmitted over a communication channel | |
JP6442461B2 (en) | Video compression system and method for reducing the effects of packet loss across communication channels | |
JP6106208B2 (en) | System and method for compressing streaming interactive video | |
JP5677093B2 (en) | System to report recorded video before system failure | |
JP5568628B2 (en) | System and method for multi-stream video compression using multiple encoding formats | |
JP2015053719A (en) | System and method for encoding video using selected tile and tile rotation pattern | |
JP2011507339A (en) | A system that combines multiple views of real-time streaming interactive video | |
JP2011507340A (en) | Streaming interactive video integrated with recorded video segments | |
JP2011508478A (en) | How to multicast a view of real-time streaming interactive video | |
JP2011507350A (en) | Streaming interactive video client device | |
JP2011507344A (en) | A system to synthesize recorded application state with application streaming interactive video output | |
JP2011509546A (en) | Synthesizing linear content and interactive content compressed together as streaming interactive video | |
JP2011514017A (en) | Streaming database for real-time applications used through streaming interactive video | |
JP2011509545A (en) | System for collaborative meetings using streaming interactive video | |
JP2011507341A (en) | Virtual event hosting and broadcasting using streaming interactive video | |
JP2011507077A (en) | How to migrate user sessions between streaming interactive video servers | |
JP2011514565A (en) | System and method for intelligently allocating client requests to a server center | |
JP2011507349A (en) | Tile-based system and method for compressing video | |
JP2012521721A (en) | System and method for compressing video frames or portions thereof based on feedback information from client devices | |
JP2012521723A (en) | Temporary decoder device and method | |
JP2012521269A (en) | System and method for switching acceleration machines | |
JP2012521719A (en) | System and method for selecting a video encoding format based on feedback data | |
JP2012521718A (en) | System and method for compressing video based on latency measurement and other feedback | |
JP2012521720A (en) | System and method for compressing video using feedback including data associated with successful reception of video content | |
JP2012521268A (en) | System and method for multi-stream video compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130207 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130507 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130514 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20131018 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131114 |