第九章 多媒體技術基礎
單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,/44,第九章 多媒體技術根底,9.1 多媒體技術的根本概念,9.2 多媒體計算機系統(tǒng),9.3 多媒體信息的數(shù)字化和壓縮技術,9.4 多媒體素材制作,9.1多媒體技術的根本概念 多媒體,媒體,存儲信息的物理實體,如磁盤、光盤等,信息的表現(xiàn)形式或載體,多媒體,融合兩種或兩種以上媒體的一種人機交互式信息交流和傳播媒體,使用的媒體,包括文字、圖形、圖像、聲音、動畫和視頻,。,多媒體技術,是一種基于計算機的綜合技術,包括,數(shù)字化信息的處理技術、音頻和視頻技術、計算機硬件和軟件技術、人工智能和模式識別技術、通信和圖像技術等,,是一門跨學科的綜合技術。,多媒體技術的特性,多樣性 媒體、處理方式,集成性 媒體、設備與軟件的集成,交互性 用戶與多媒體信息,數(shù)字化 媒體信息以數(shù)字的形式存儲和處理,實時性 聲音媒體和視頻媒體,多媒體信息的類型,1文本,2圖形,由直線、圓、圓弧、任意曲線等組成的畫面,以矢量形式存儲。,3圖像,通過掃描儀、數(shù)字照相機、攝像機等設備捕捉的真實場景的畫面,數(shù)字化后以位圖格式存儲。,4動畫,利用了人眼的視覺特性所得到的畫面印象。,5.視頻,來自視頻信號源的影像。,6音頻,話語、音樂以及各種動物和自然界發(fā)出的各種聲音。,多媒體信息處理的關鍵技術,1,.多媒體數(shù)據(jù),壓縮技術,節(jié)省存儲空間,,提高通信介質(zhì)的傳輸效率,使計算機,實時處理和播放,視頻、音頻信息成為可能。,2.多媒體數(shù)據(jù),存儲技術,數(shù)字化數(shù)據(jù)存儲的介質(zhì)有:硬盤、光盤和磁帶等。,CD/ROM光盤容量:,650MB左右,單面單密度DVD:,4.7GB,雙面雙密度DVD:,17GB,3.集成電路制作技術,為多媒體技術的進一步開展創(chuàng)造了有力的條件。,4.多媒體數(shù)據(jù)庫技術,研究多媒體信息的特征、建立多媒體數(shù)據(jù)模型;,有效地組織和管理多媒體信息;,多媒體信息的檢索和統(tǒng)計。,5.虛擬現(xiàn)實技術,利用計算機生成一種模擬環(huán)境,通過多種傳感設備,使人能夠沉浸在計算機生成的虛擬境界中,并能夠通過語言、手勢等自然的方式與之進行實時交互,創(chuàng)立了一種適人化的多維信息空間。,6.多媒體網(wǎng)絡與通信技術,多媒體通信技術支持是保證多媒體通信實施的條件。,資料:虛擬現(xiàn)實,多媒體技術的應用領域,1.多媒體教育,2.電子出版物,3.,多媒體網(wǎng)絡應用,互聯(lián)網(wǎng)直播,視頻點播,遠程教育,視頻會議系統(tǒng),9.2 多媒體計算機系統(tǒng),多媒體應用系統(tǒng),多媒體計算機主機、外圍設備,多媒體編輯與創(chuàng)作,工具,多媒體庫函數(shù)、素材制作工具,多媒體操作系統(tǒng),設備驅(qū)動軟件、接口程序,多媒體系統(tǒng)層次結構,MPC標準(多媒體計算機主機標準),在普通微機的根底上增加以下4類軟、硬件設備:,聲/像輸入設備:例如,話筒、錄音機、攝像機、,光驅(qū)、掃描儀等。,聲/像輸出設備:例如,音效、投影儀、刻錄光驅(qū)等。,功能卡:例如,電視卡、視頻卡(采集、壓縮、輸出)、,網(wǎng)卡等。,軟件支持:音響、視頻和通訊信息以及實時、,多任務處理軟件。,資料:多媒體的根本設備,多媒體計算機硬件系統(tǒng),多媒體計算機硬件系統(tǒng)示意圖,光盤機,掃描儀,電視機,揚聲器,顯示器,網(wǎng)絡通信,主機,音,頻,卡,話筒,音響設備,MIDI,視頻,卡,影碟機,錄像機,攝像機,打印機,網(wǎng)卡,多媒體接口卡,1.,音頻卡又稱聲卡,,是處理音頻信號的硬件,2.,圖形加速卡,圖形加速卡擁有圖形函數(shù)加速器和顯存,,專門用來執(zhí)行圖形加速任務,可以減少,CPU,處理圖形的負擔,。,工作在CPU和顯示器之間,控制計算機的圖形輸出。,現(xiàn)在的顯示卡上都集成有圖形處理芯片組,成為圖形加速卡。,資料:圖形加速卡,3.,視頻采集卡,視頻采集卡可以,獲取數(shù)字化視頻信息,,提供硬件壓縮功能,Video復合視頻接口,將亮度、彩色信號和同步信號合成一個信號。,S-Video別離視頻接口,將亮度和色度信號分成兩個獨立的模擬信號。連接模擬視頻設備。,資料:電視信號,4.,IEEE 1394卡,標準的IEEE 1394接口可以同時,傳送,數(shù)字視頻信號,以及,數(shù)字音頻信號,,相對于模擬視頻接口,IEEE 1394技術在采集和回錄過程中沒有任何信號的損失。,現(xiàn)在的IEEE 1394卡多為,PCI接口,,只要插入到計算機主板相應的PCI插槽上就可以提供視頻采集功能,信息獲取設備,數(shù)碼照像機DC,數(shù)碼照像機所拍攝到的照片是以文件形式存儲在相機內(nèi)的存儲卡中,將數(shù)碼照像機中的照片存儲到計算機中,先用連接線將數(shù)碼照像機與計算機連結起來。數(shù)碼照像機的驅(qū)動程序就會將相機的存儲卡視為計算機的一個可移動磁盤,存儲卡中的圖像會以略圖方式顯示,數(shù)碼設備,數(shù)碼照像機的性能指標:,分辨率:分辨率越高,所拍圖象的質(zhì)量也越高,顏色深度:對色彩的分辨率,現(xiàn)在一般都可以到達24位,,生成真彩色的圖象,存儲介質(zhì):閃速存儲器,數(shù)據(jù)輸出方式:輸出接口為串行口、USB接口或1394接口。,數(shù)碼攝像機DV,數(shù)碼攝像機的優(yōu)點是動態(tài)拍攝效果好,數(shù)碼攝像機使用的小尺寸電荷耦合器件CCD與其鏡頭的不匹配,在拍攝靜止圖像時的效果不如數(shù)碼照像機。,使用iLink纜線連接DV與計算機,一端連接計算機上的IEEE 1394卡上的接口,另一端接在DV In/Out接口,然后翻開DV的電源并把DV調(diào)到VCR狀態(tài),操作系統(tǒng)會自動識別DV設備。啟動采集編輯軟件,將存儲在DV帶上的數(shù)碼影像輸入到計算機。,如果要將,DV,上的數(shù)碼影像,輸出到電視機,,需要使用,RCA,線纜,。,RCA,線纜包含了三個接頭:紅色代表右邊的音頻線路、白色代表左邊的音頻線路、黃色代表視頻線路,兩端的外觀都一樣。,接右聲道,接左聲道,接視頻,多媒體計算機軟件系統(tǒng),多媒體計算機軟件系統(tǒng),多媒體應用系統(tǒng),多媒體計算機主機、外圍設備,多媒體編輯與創(chuàng)作,工具,多媒體庫函數(shù)、素材制作工具,多媒體操作系統(tǒng),設備驅(qū)動軟件、接口程序,系統(tǒng)軟件,9.3多媒體信息的數(shù)字化和壓縮技術 音頻信息,復雜的聲波由許許多多具有不同振幅和頻率的正弦波組成。,波形相對基線的最大位移稱為振幅A,反映音量;,波形中兩個相鄰的波峰或波谷之間的距離稱為振動周期T,周期的倒數(shù)1/T即為頻率f,以赫茲Hz為單位。正常人所能聽到的聲音頻率范圍為20 Hz20 kHz。,振幅,頻率,模擬信號,模擬音頻的數(shù)字化,用計算機對音頻信息處理,就要將模擬信號如語音、音樂等轉(zhuǎn)換成數(shù)字信號。,振幅,頻率,1/T,采樣點,T,振幅,1/T,T,采樣,:每隔一定時間間隔對模擬波形,上取一個幅度值。采樣頻率為,40.1kHz,可獲得原始聲音波形,,高質(zhì)量聲音。,量化,:將每個采樣點得到的幅度,值以數(shù)字存儲。,編碼,:將采樣和量化后的數(shù)字,數(shù)據(jù)以一定的格式記錄下來,模擬信號,采樣,量化,編碼,數(shù)字信號,數(shù)字音頻的技術指標,采樣頻率,:,每秒鐘的,采樣次數(shù),量化位數(shù)(采樣精度),:,存放采樣點振幅值的,二進制位數(shù),。,通常量化位數(shù)有,8,位、,16,位,,分別表示有,2,8,、,2,16,個等級。,聲道數(shù),:,聲音通道的個數(shù),,,立體聲,為雙聲道,。,每秒鐘存儲聲音容量的公式為:,采樣頻率采樣精度聲道數(shù)/8=字節(jié)數(shù),例如,用44.10 kHz的采樣頻率,16位的精度存儲,那么錄制1秒鐘的立體聲節(jié)目,其WAV文件所需的存儲量為:,44 100162/8=176 400字節(jié),聲音文件容量大小的計算,計算一首采樣頻率為22.05KHz,16位,長度為3分鐘的立體聲音頻所占空間約為多少?,Wave格式文件.Wav,記錄了真實聲音的二進制采樣數(shù)據(jù),通常文件較大。,MIDI格式文件.MID,數(shù)字音樂的國際標準.記錄的是音符數(shù)字,文件顯得更加緊湊、小。,在多媒體應用中,一般WAV文件存放的是解說詞,MIDI文件存放的是背景音樂。,MPEG音頻文件.MP1/.MP2/.MP3,采用MPEG音頻壓縮標準進行壓縮的文件。是有損壓縮,RA音頻文件.ra,流媒體,壓縮的,較小,適合網(wǎng)上實時播放,數(shù)字音頻的文件格式,WAV,文件,MIDI,文件,圖形和圖像,圖形,:矢量圖形,由,點、線等組成,的有邊界畫面,由繪圖軟件繪制的,以,矢量圖形,文件形式存儲,存放的是各個圖元的,大小、位置、形狀、顏色、維數(shù)等屬性的指令集合,,對圖形中的各個圖元進行,縮放、移動、旋轉(zhuǎn)而不失真,,占用的存儲,空間小,。,圖像,:位圖圖形,由圖像設備輸入的,真實場景畫面產(chǎn)生的映像,,數(shù)字化后以,位圖形式,存儲。存儲的是構成圖像的,每個像素點的亮度、顏色,,文件大小與分辨率和色彩的顏色種類有關,,放大和縮小要失真,,占用的空間比矢量,文件大,。,圖形,:矢量圖形,由,點、線等組成,的有邊界畫面,由繪圖軟件繪制的,以,矢量圖形,文件形式存儲,存放的是各個圖元的,大小、位置、形狀、顏色、維數(shù)等屬性的指令集合,,對圖形中的各個圖元進行,縮放、移動、旋轉(zhuǎn)而不失真,,占用的存儲,空間小,。,圖像,:位圖圖形,由圖像設備輸入的,真實場景畫面產(chǎn)生的映像,,數(shù)字化后以,位圖形式,存儲。存儲的是構成圖像的,每個像素點的亮度、顏色,,文件大小與分辨率和色彩的顏色種類有關,,放大和縮小要失真,,占用的空間比矢量,文件大,。,矢量圖形:,矢量圖形文件存儲的是描述生成圖形的指令,本身就是數(shù)字信息,因此,不必對,圖形中的,每一點進行數(shù)字化處理,。,圖像:,現(xiàn)實中的圖像是一種模擬信號,。,圖像的數(shù)字化是指將一幅真實的圖像轉(zhuǎn)變成計算機能夠接受的數(shù)字形式。,圖像數(shù)字化過程:,圖像的采樣、量化及編碼,圖形和圖像的數(shù)字化,1采樣:,圖像的采樣就是將連續(xù)的圖像轉(zhuǎn)化成離散點的過程,采用的實質(zhì)是用假設干個像素點萊描述整幅圖像,也稱為圖像的分辨率,用點的“列數(shù)行數(shù),分辨率越高,圖像越清晰,存儲量越大。,圖像數(shù)字化過程,2量化:,將表示圖像色彩濃淡的連續(xù)變化值離散化為整數(shù)值的過程。一般用8位、16位、24位、32位等來表示圖像的顏色,也稱為顏色深度。24位可表示224=16777216 種顏色,稱為真彩色。,1,3編碼:,圖像文件的分辨率和像素位的顏色深度決定了圖像文件的大小,計算圖像存儲大小公式:,列數(shù)行數(shù)像素的顏色深度/8=字節(jié)數(shù),例如:分辨率為640480的真彩色屏幕的幀存儲器的容量是:,又如:分辨率640480的256色屏幕的幀存儲器的容量是,6404808/8=307200字節(jié)。,64048024/8=921600字節(jié)。,例:12801024分辨率的“真彩色電視圖像,按每秒30幀計算,顯示1分鐘,那么需要:,計算存儲,視頻或電視圖像,大小的公式:,列數(shù)行數(shù)像素的顏色深度/8 幀/秒=字節(jié)數(shù),12801024243060/8 6.6 GB,假設每秒播放25幀畫面,每幀影像像素數(shù)為720*576的真彩方式,請計算半分鐘的該影視數(shù)據(jù)所占空間?,視頻,視頻,是將一幅幅獨立,圖像組成的序列,按照一定的,速率連續(xù)播放,,利用視覺暫留現(xiàn)象在人的眼前呈現(xiàn)出連續(xù)運動的畫面。,模擬視頻和數(shù)字視頻文件大小的計算:,分辨率,幀,/,秒,采樣深度,時間秒,640480,24 30 60/8,=1 658 880 000字節(jié),常用圖像文件格式,BMP和DIB格式文件,與設備無關的位圖格式文件,包含的圖像信息較豐富,幾乎不壓縮,Windows環(huán)境中經(jīng)常使用.,GIF格式文件,Internet上的重要文件格式之一,最大不超過64 KB,,256色以內(nèi),壓縮比較高。也有連續(xù)的動畫,JPEG格式文件.JPG,利用JPEG方法壓縮,壓縮比高,Internet上重要文件格式之一,適用于處理256色以上、大幅面圖像。,WMF格式文件,位圖與矢量圖的混合體,Windows中許多剪貼畫圖像,是以該格式存儲的。廣泛應用于桌面出版印刷領域。,常用視頻文件格式,AVIAudio-Video Interleaved文件,將視頻與音頻信息交錯地保存在一個文件中,較好地解決了音頻與視頻的同步問題,已成為Windows視頻標準格式文件。未壓縮,MOV文件,合成視頻、音頻、動畫、靜止圖像等多種素材。未壓縮,MPG(.mpg)文件,是按照MPEG標準壓縮的全屏視頻的標