現在傳統的作法就是一顆球,待會會看到,那這一顆球是多邊形做的,那多邊形有限,所以做出來有菱有腳,傳統的3D
graphics就是把每個frame handling完,一個pixel一個pixel,那到了下一個多邊形再做一次,又做一次,那大家想一想,一顆球在動,妳其實不需要分解到每個polygon,妳可以利用前一個image,
其實是用影像處理來取代傳統的graphic,一個integer的處理呢大概是language的10到20倍,像pentium
133 ,1秒鐘30個畫面,那這非常慢,如果可以用前面的畫面來產生後面的畫面。
那接下來是比較有趣的,如果妳有左邊這畫面,還有右邊這畫面,那可不可以產生中間這畫面,妳從這個和這個妳
select 它來產生這個,那這各式所謂的image based language,那這有很多在研究的,基本上觀念就是影像處理來取代graphics。
那我們看看聲音,我們知道立體聲,現在有所謂的surround sound所謂的環場音效,那環場音效基本上有兩個喇吧,人在這邊,實際上只是把音場擴張,讓聽到聲音好像在270度範圍,妳只要眼睛必起來聽,妳不知道喇吧在哪裡,那3D
sound妳必須知道音原在哪裡有所謂的position,一架飛機從後方飛到前方,那電腦必須能做到。
那我們看看系統的東西,那未來的趨勢是PC,以往都是用workstation,不管是HP或SGI
,那未來的主要趨勢是,那主要是因為PC的計算能力,還有構圖能力的提升,還有像Internet,像USP1394高速傳輸技能,那大概到2001年,有一半的系統大概都是PC的東西,那高檔的東西實際上是很少的,那目前的情況,系統的規定,中檔的東西像HP大概都要3、4百塊,那高檔的東西像SGI大概要800塊,那這還是一大筆錢,所以未來PC應該是主流。
那第二個主流是Internet,Intetnet的主要user大概7、8千萬,蓬勃發展,另外標準出來了,那VRMM97已經跟ISO被認為是公認的標準,以目前來講它有頻寬的問題,還有自動器有限,譬如妳只是改變
viewpoint,或者像是我們做的互動,就有很多的問題,其實Netscape view和Navigator都有做出來,那要真正的互動還要能參與那還早啦。
那我們這邊有個圖形,那這是VR 做的,以VR2.0我們電通所做的一個browser,那compatibility大概80幾
% ,那相當不錯, 這是Internet的一個chess,所有的模型,shading,全部都是VR做的,還有imation像這顆球會動,總和來講這是VR2.0的一個標準瀏覽器,整個來講妳在Internet上可以下3D的chess, 那這就是前面講的VR 的東西在網際網路上,我們另外一個作法把image加上去,那我們早期作的楊一風美術館,他本身是sculpture database大師,那我們要做虛擬實境的技術,把楊一風美術管重建,
基本上項環場影像360的image,在這360度環場影像妳可以任意遊玩,妳要上樓梯都可以,另外一個特色是3D影像物件,像這東西實際上user都看的到,等一下我們看神遊故宮都看的到,像翠玉白菜,那基本上這都是pictures,不是graphics,但也可做到同樣的效果,而且非常逼真。那我們也做所謂的虛擬商場,vritual mole,這百貨公司在網際網路上開,這東西實際上都是用電腦合成,這也告訴我們實際上電腦並不是解決所有問題,最大的問題是資料image檔太大,像VR 3D graphics的檔太大,雖然經過壓縮但還是很大,所以未來來講我們可能做壓縮技術,image compression,第二個做straining,image straining,這是未來的方向。
那我們看一些成果,這是image compression,這張圖片在1/480時已經出來了,他不必全部下載,1/120已經看的到,那programming是想一面傳輸一面下載,這叫漸進傳輸,這是未來的科技,怎麼樣不用壓縮,(....空白.....)前面講過paint on display,解析度不夠,解析度非常低,亮度非常窄,非常重,非常貴,而且有礙健康,解析度大概都在240*240或320*240,差 VGA一個order,另外視角30度, 人的視覺一般要80度,而且這很貴,那我們希望做到解析度640*480,視角80到100度,非常輕巧,價格便宜。華盛頓大學做出一種以雷射成像的東西成在視網膜上,把人當電視,前一陣子已經做到5色,主要是以紅色,這是paint on display。
其他我們看talking手套,像這個有很多sensor,他可以detect妳手指的彎曲度,他有很多光線經過光纖,這是一個史丹佛大學的一個老師,他兩歲時喪失聽力,當然也不會講話,那他戴上這個手套,這手套有手語的
database,經過AI,可以把他的意思經過他胸前的一個speaker發聲出來,靈巧化,這是很好的東西,另外是觸覺的東西,有一家做觸覺的公司,妳接觸到外科手術,他們希望動手術時,皮膚的touch,這個phase感覺的到皮膚的柔軟度,感覺的到表面。
那tricker,tricker就是說實際上工作範圍還是很有限譬如6到10,一般都是靠電磁波,超音波之類,工作有限,另外未來我們希望是無線,wireless,那這也是個問題。
那我們看低檔,現在電通所在做這個,這個其實對user來講有礙健康,這個帶頭盔超過一個鐘頭,會有很多問題,有人帶很久,要拿下來喝可樂,結果倒到鼻子上去了,那這東西以目前的作法就是會有礙健康,像sony做consumer hand on display,妳超過半個鐘頭他會自動switch off,這變成日常生活每人使用很難達成。
目前比較沒有問題的是這個東西,這是別人做的,這是一個房間3m*3m*3m,很高很大,一次大概7、8人可以進去,這個牆壁三邊還有地板都是非常大的螢幕,每一台的screen目前都是靠工作站來做的,像SGI,把3D graphics而且立體的東西打在上面,打在三面牆壁還有地板,那7、8個人在裡面,他是看到imertiaon,妳看到的假如是深海,深海有魚在妳四周游來游去。
人的話,甚至都可以帶tracker(追蹤器),所以人的走動都會被偵測出來。可以在虛擬世界裡,可以得知虛擬世界與真實世界的互動關係。但這還有相當的問題存在,因為這樣子的一台機器,造價非常的昂貴,造價大約在四、五千萬台幣左右。所以全世界上這種製作VR的機器,正在蓋或是已經蓋好的大約只有32座而已,台灣還沒有。美國大概已經有32座了,高速電腦中心買了一個。他們買了一個像這樣的台子,他這個台子你去看他,他會有3D的影像會浮現出來。一般的外型,都像這個手術台,因為其造價稍微便宜,而且並沒有座的很好。電通所大概花了25萬美金,蓋了這樣一座。但是我們蓋的在技術上完全不同,因為我們是用PC來作的,而不適用工作站來作的。像SGA工作站,一台要15萬。而且一次需要四五台,所以平均成本來說,用功作戰成本實在事態昂貴了,前面我們說過,PC是未來的趨勢,所以我們用PC來maintain。這些對PC來說,是屬於一些3D
Graphic的東西,所以我們把這樣的技術稱為image-based的虛擬技術。所以我們現在都在做一些kernel的東西。我們現在正在做高雄海洋博物館籌備處,預備公元2000元年開館。我們想做一個身海的魚類,因為身海的魚類要繁殖存活非常的困難。而且那溫度跟壓力要控制的相當精確才行。例如:腔棘魚這種深海魚類,全世界的海洋博物館要將這中稀有的深海魚類存活下來,是相當少的。所以我們正在跟高雄的海羊館接洽,要做一個虛擬的深海虛擬實境,這些東西我們全部都用image來作,利用一些picture來製作,經過graphic的處理,來達到一個虛擬的深海水族區,而且做出來的很逼真,而且利用這些技術,PC就能夠推的動它。但是目前還是都用3D
graphic來作,因為基本上那條魚要動。
實際上,Virtual-relaty
好好應用的話,有非常好的發展空間。但是如果沒好好運用的話,就好像割草機一樣,有力有弊,壞的甚至會影響到全世界。之前我們有提到一些未來發展的動向,我們希望能盡量著著這個方向來作,盡量去做好的一面。未來發展的方向,PC
based的VR system,internet based的VR,及image-based 的VR system。整著VR system的發展要健全,可能要到2002年才行。我們認為他會對國內的軟體造成相當大的幫助。所以現在都應用在軟體發展產業,如3D
VR電玩產業,internet產業,或是國內的軟體產業有相當正向的幫助。但是對於硬體的部分,問題還有很多,所以發展上還沒有這麼快。
接下來我們看一下電通所所做的一些實驗,南園,一個度假中心,位於新普鎮。個人好像是不能去的,團體好像要申請才可以,那是中國時報的一個休閒度假中心。但是目前來說,南園這個漂亮的休閒度假中心,現在已經漸漸的惡化掉了,因為前幾次的颱風來,所帶來的影響。已經有很多地方已經地層下陷了,雖然政府每年花了幾千萬在做維護搶修,但還是阻止不了他的惡化。如果可以利用電腦的技術來加以重建,這是一個滿不錯的idea。你們看到的homepage實際上的視覺效果是非常的豐富,基本上你們看到的都是image-based的影像處理結果。所以你們看起來跟傳統的homepage有很大的差別。在這中中你們有看到一些環場影像,這些環長影像可以360度的來旋轉,我們有算過,要達到360度的環場影像,只要用petium133就可以達到每秒鐘三十多個畫面,一般我們在對外做demo時都是帶petium
75。而且華滑鼠可以控制某衣物件,來做360度的旋轉,基本上這是real
time的,假如釋放錄影帶的,那就沒什麼稀奇的。而且你不能去操控他,不能有interaction。所以虛擬實境需要的是invertion,逼真,所以我們要實景拍攝,看起來材逼真。第二個,就是要有interaction
所以我們可以用滑鼠,來去加以控制,真正達到real time 的interaction。你們現在看的點其實是一個360度的環場影像點,一個影像點,我們要讓畫面看起來真實流暢,每一個環場影像點,我們都大概必須去拍個18張照片左右,然後把他接起來,這裡面經過的科技,有所謂的,image
routing, derouting。這些環場影像點,你們可以上下左右,甚至去做360度的觀賞都可以。我們是以一個一個的環場醒像點來做移動,所以我們是有限制的來做interaction。這整個影片大概有六七十個環場影像點供人們去參考。而且這些六七十個點,攝影師去拍大概只要1天的時間就可以完成了。所以你們在看這些環場影像的時候,會覺得前面的很亮,後面的很暗,那是因為攝影師由天亮拍到天黑的結果。環場影像中的某些物品,如花瓶,還可以去做360度的旋轉,而這些只要為著邊邊去照幾張picture就可以製成。當然這之中還需要一些科技,如壓縮啦,才能製成這個3D
object。跟多媒體的結合,我們先看跟3D graphic的結合,畫面中有一顆球在跳動,那顆球是利用3D
graphic做成的,還結合聲音。仔細看這顆球,他其實是有稜有角的,比較粗糙。他的這些陰影,其實都是3D的程式在做計算的,他計算時將光源當成是在上面,所以並不是太陽的位置就在上面。所以背景的部分是一個環場影像,而前景的部分則是一個3D
graphic,我們則將他們結合在一起。所以其實我們是結合了3D graphic並且有聲音,光源及陰影的一些設計。物體接近的時候,聲源變大聲,跑遠了便變成小聲。將電腦做成的桌子,碗及筷子,擺在環場影像中,這也是3D
graphic與環場影像的一種結合。那這種技巧可以利用在,如成屋銷售,假如我們這個是空屋,我們就可以利用電腦來做很多的裝飾品來擺設,沒有所謂擺不擺的下的問題。這些都是3D
graphic 跟VR的一種整合。畫面上你們所見到的這位導遊小姐正在做簡介,但是實際上他不是站在那裡的,他是經過影像跟VR的結合,讓人以為他是站在那裡跟我們做簡介的。還有一架多媒體的電視機,經過我們手動控制,他就會開始撥放,關掉他就停止撥放,這也是多媒體與VR結合的一項技巧。
神遊故宮,故宮基本上有很多典藏的一些精品,如翠玉白菜,清明上河圖等等。基本上我們也是在故宮裡面做實景的拍攝,來加以做成這個環場影像。像是翠玉白菜,這是3D
image的部分,我們可以click去加以放大來觀看,甚至可以用滑鼠來翻轉看看。所以變成說,在一個虛擬的博物館你來看這些東西,跟一般真正實物的博物館來做比較,虛擬的博物館不用怕去弄壞,甚至還可以拿起來加以旋轉,在真正的世界理事不可能去做這種事情的。而且他的解析度實際上可以弄得很高,而且上下左右可以來翻轉。再舉一個例子,像是肉形石也是利用同樣的技巧方法來達到跟我們的interaction,讓畫面更生動,更真實。還有清明上河圖,這其實是還有音效的。清明上河圖其實是一幅很長的圖畫,所以縮也可以用環場影像來看他。再來是中國旗袍,因為頻寬的限制,所以做的小小的。基本上他是一個立體的3D
image。整個來講,image-based 的影像處理,跟傳統的graphic技術比,他有很多好處,第一個就是說,他適用實景拍攝,並不是用3D
graphic的多媒體來建構模型,所以說他非常逼真。第二個就是說,建構時間很短,像南園六七十個點,一天就可以拍攝完成。大家知道現在建構3D模型是非常花時間,而且相當貴的。外面廣告的動畫,1秒中需要兩萬塊錢,那另外來講的話,傳統的VR graphic
based需要硬體的支援,比如說你需要3D加速卡。所以就算用PC來做也要有一百萬以上的配備來做,但是影像處理之前有說過,petium
133就能跑到1秒鐘33個畫面。變成就是說它比較有實驗性,能夠普及。像現在個人要買電腦,基本配備都已經petium
233以上的電腦了。速度非常的快。
現在的網路購物,像是在美國已經是很普遍了。台灣的話實際上整個環境面,還沒有ready。包括有沒有認證中心,沒有認證中心,其實網路上的商家,他本身的這個可信度是非常有問題的,像之前有一個case,一個學生開了一家網路訂購電腦的,可是卻送來一個烏龍茶,但是這些東西我們沒辦法去connect,所以才會有這樣子的事情發生。所以台灣環境並沒有成熟。但是網路購物已經是一個很大的business。那我們是利用影像的虛擬實境,在internet上建構一個電子的商場,我們可以透過網路進入虛擬的商場裡。這些基本上都是實物,而不是多邊形。在這裡面有很多的專櫃,讓我們去遊走。慢慢的電子錢包,或是一些shopping
card都會被設計出來,而且我們還可以連結到一些商家系統,看看他們有哪些商品要出售,我們甚至還可以用語音辨識,因為有些阿公,阿媽的不會敲key
board,所以我們可能需要一些語音辨識系統。直接用說的,比如說一個電冰箱,直接經過語音辨識,再去search電冰箱的database。甚至是我們可以做到休閒區,我們可以在休閒區跟人家下chess等等的休閒益智遊戲。所以將這些商場搬移到網路上,可以實際的去造成一個地球村,因為網路是沒有國界之分的。我們可以將購物,娛樂及休閒都建構在網路上,並且在網路上整合。這實際上是一個非常大的商機,我們估計2002年,分散式的虛擬環境在未來是一個非常大的商機。
Quest:從拍攝的過程到成品,自動化的部分有多少?或是人工技術的部分是多少?
Anser:實際上看需要的性質,我們有跟傑何建設合作,他們實際上有這個轉盤,加上數位照相機,再攜帶筆記情電腦到現場拍攝,我們只需要按一個鈕,在短短的十分鐘之內,我們就可以拍完了,而且在一兩天之內要上網,所以筆記型電腦可以利用簡單的GUI將環場影像拍攝完成,剪接及處理,接著存成所謂的IBR檔,讓我們的broswer就可以去讀取了。所以像是簡單的房屋仲介業,三房兩廳只要幾個點就好了。所以只需要幾十分鐘就分拍完了。而且我們在當場看不好的話,我們可以當場重拍,只需要一天兩天就可以結束掉了。一般的話是看他的規模的大小,所以整個就拍攝來講,是佔了比較大的時間。我們需要攝影師去現場實際的去拍。看我們要做到多複雜。所以實際上我們是在講VR但其實是在講互動式多媒體。兩個重點,一個是要真實,一個要互動性,就好像我們在做多媒體一樣,他是一個互動性的。而且其實自動化都已經做好了,只需要按幾個鈕就行了。