Dolphin1000智能廣告監(jiān)播分析系統(tǒng)】
(智能自動截取工業(yè)級 詳情見www.zghpc.com)
1,廣告公司、電視購物公司、廣告投放量大的企業(yè)都需要解決以下問題:
實時收看將要播出的電視廣告(有線電纜內包含的全部頻道);
監(jiān)控廣告播出情況,對漏播、延播、廣告前后環(huán)境實施錄像,以便日后核對;
將同業(yè)的個別或全部產(chǎn)品廣告實施錄像,以便隨時參閱、分析、篩選產(chǎn)品和時段;
實現(xiàn)無人值守的電視廣告錄像,以提高員工工作效率;
利用系統(tǒng)自動地對電視廣告播出視頻進行廣告識別、條目登記,直接生成廣告監(jiān)播報表和分析圖表;
相關部門經(jīng)理需要在工作筆記本上隨時隨地的監(jiān)控電視廣告的播出;
鑒于以上問題,現(xiàn)將系統(tǒng)的關鍵性環(huán)節(jié)說明如下,以利于盡可能的靠近用戶的現(xiàn)實需要:
2,傳統(tǒng)的廣告監(jiān)播方式
用傳統(tǒng)的廣告監(jiān)播方式來處理一套電臺(電視)節(jié)目中廣告信息的過程通常包括下列步驟:
第一日: 用傳統(tǒng)的錄像機、錄音機錄制節(jié)目并保存
第二日: 廣告監(jiān)測人員通過回放錄音/錄象,記錄出現(xiàn)的廣告信息
第三日: 廣告監(jiān)測人員將監(jiān)看數(shù)據(jù)交監(jiān)播中心處理
第四日: 獲取監(jiān)播報告
我們通常說廣播、電視廣告監(jiān)測是大量的人力堆積起來的數(shù)據(jù),這一點都不夸張,尤其是電臺廣播,因為人的耳力無法辨別以倍速播放聲音的內容,但卻能大致看明白以倍速播放的視頻圖象。也就是說,一個監(jiān)測員若要真實可信地處理前一天全部24小時的數(shù)據(jù),就必須花26-30個小時的時間。這樣,一個電臺一個頻段每天24小時的監(jiān)測數(shù)據(jù)處理,將需要3-4個人工來完成,而后還需要人員錄入、QC,*后才能生成監(jiān)播結果報告單,總共需要4-5個人工來完成。
3,基于音頻的廣告智能監(jiān)播技術原理
在電臺或電視節(jié)目中播放的廣告普遍具有下列特征:
1、 同一版本的某個廣告的播出時間上具有重復性和連續(xù)性,時間短的會重復播放一星期,長的甚至會達到半年以上。
2、 重復播放的廣告都具有相同的音頻特征(聲紋和頻譜)。
3、 不同版本的廣告具有完全不同的音頻特征。
例如,下面看到的就是某個廣告樣本的“音頻特征波形圖”:
如果能夠通過語音識別引擎將某套節(jié)目中首次出現(xiàn)的某廣告的音頻特征信息提取出來,制作為該廣告的音頻識別樣本,就可以通過語音識別引擎用該樣本對后續(xù)數(shù)據(jù)進行連續(xù)自動識別,并將識別出的廣告記錄到數(shù)據(jù)庫中,從而實現(xiàn)基于音頻的廣告自動監(jiān)播。
實現(xiàn)基于音頻的廣告自動監(jiān)播的技術關鍵是語音識別引擎的設計,需要解決下列技術難題:
? 廣告識別準確度。如果識別準確度低于80%,系統(tǒng)的可信程度就不可接受。而識別準確度高的算法往往計算量也非常大。
? 計算能力。語音識別算法的計算量非常大,普通的CPU難以負擔,只能采用專用DSP硬件實現(xiàn)的方案。
? 處理速度。一般而言,實際的應用系統(tǒng)都需要同時監(jiān)播數(shù)十套電臺、電視節(jié)目。這對識別引擎的硬件設計提出了很高的要求。
4,ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng),
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)以99%的識別準確度為設計目標,充分利用了飛速發(fā)展的DSP技術,攻克了上述技術難題,使基于音頻的廣告自動監(jiān)播進入實用階段。
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)采用基于高速DSP高速、高精度語音識別算法,實現(xiàn)了電臺、有線電視節(jié)目中播出廣告的自動識別和分析統(tǒng)計。根據(jù)操作員預先確定的廣告樣本,本系統(tǒng)能從電臺、電視的聲音信號中準確地識別出某個廣告是否出現(xiàn)、在什么時間出現(xiàn)(精確到0.1秒),以及該廣告播放的時間長度。識別出的廣告的相關信息被自動存入數(shù)據(jù)庫。
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)除了具備廣告智能監(jiān)播功能以外,同時還具有節(jié)目監(jiān)錄功能。通過掛接大容量的海量存儲設備,ZG系統(tǒng)夠將全部節(jié)目數(shù)據(jù)保存30天以上甚至更長,以便事后查證。
4.1,語音識別工作站
語音識別工作站是整個音頻廣告自動監(jiān)播系統(tǒng)的核心設備,包括廣告識別所需的全部硬件部分和軟件,具體包括:
a,工業(yè)級的高性能專業(yè)計算平臺及相應的調度軟件,滿足系統(tǒng)24小時連續(xù)不間斷運行的需要。
b,專用的超大容量音頻數(shù)據(jù)采集硬件及相應軟件,可以同時對多達10路電臺音頻(或電視伴音信號)進行數(shù)字化,并將數(shù)字化的聲音數(shù)據(jù)和視頻數(shù)據(jù)以文件方式保存到工作站的本地硬盤或外掛的磁盤陣列上。
c,專用的視頻數(shù)據(jù)采集硬件及相應軟件,采用*先進的MPEG4壓縮技術,可以同時對多達10路輸入視頻信號進行數(shù)據(jù)采集和壓縮,將視頻數(shù)據(jù)的碼流將到了*低。
d,專用硬件構成的超級語音識別引擎,用以對輸入的原聲數(shù)據(jù)提取音頻特征。語音識別引擎使用了目前*先進的DSP芯片陣列和識別算法,可以同時對多達10路輸入原聲數(shù)據(jù)的音頻特征進行并行計算。
e,每臺識別工作站可以同時處理多達10套廣播或電視節(jié)目。
4.2,磁盤陣列
音頻、視頻信號數(shù)字化后,每天產(chǎn)生的數(shù)據(jù)量是相當可觀的。對于電臺節(jié)目,每天24小時產(chǎn)生的數(shù)據(jù)大約為1G(1000M bytes)左右;對于電視節(jié)目,采用*先進的MPEG4壓縮格式,每天24小時產(chǎn)生的數(shù)據(jù)大約為6G左右(包括聲音原聲數(shù)據(jù)和視頻圖象數(shù)據(jù))。
例如,如果需要在一臺識別工作站上同時監(jiān)測16套電視節(jié)目和16套廣播節(jié)目,并且要求聲音和圖象數(shù)據(jù)都至少保存90天,那么需要的存儲空間大約為:
6G*16*90 = 8640 G
1G*16*90=1440G
如此大的存儲要求需要使用海量存儲設備,通常是磁盤陣列。
4.3,操作員終端
本系統(tǒng)中,所有需要人工參與的工作都是在操作員終端上進行。操作員終端提供友好、方便的圖形化人機交互界面,實現(xiàn)正常節(jié)目的確定、廣告樣本的提取、廣告監(jiān)聽/監(jiān)看、自動識別、廣告識別結果的存儲和管理等功能。
操作員每天的主要任務,主要包括下列內容:
(1) 打開保存在工作站上的某套電臺或電視節(jié)目某天的錄音和錄象文件。
(2) 系統(tǒng)用前一日(或多日)的樣本庫對當日原聲進行自動預識別。識別出的廣告會自動標注到波形上,同時將相關信息保存到數(shù)據(jù)庫中。
(3) 利用終端軟件提供的工具聽取(查看)原聲數(shù)據(jù)(和圖象),從中發(fā)現(xiàn)新廣告,將新出新廣告制作成樣本。
(4) 給新樣本輸入主題詞并保存。此時終端軟件會自動在當日原聲文件中對新樣本進行自動識別,將識別出的新樣本在波形上進行標記,并記錄到數(shù)據(jù)庫中。
(5) 操作員重復步驟(3)~(4),直到完成對該日全部新廣告的提取和處理。
操作員終端按照實際需要進行配置。一般而言,如果每天24小時的數(shù)據(jù)都需要處理,每3~4套節(jié)目需要配置一臺操作員終端。
下面是操作員終端的一個操作界面:
4.4,監(jiān)播結果數(shù)據(jù)庫服務器
數(shù)據(jù)庫服務器上主要存放每套節(jié)目的樣本信息和監(jiān)播結果的數(shù)據(jù)庫。
監(jiān)播結果數(shù)據(jù)庫集中存放各套節(jié)目監(jiān)播結果。數(shù)據(jù)庫中每條記錄都包含下列信息:
? 媒體來源,如某某廣播電臺FM xx.xxxHz,某某廣播電臺AM xx.xxxHz,某某電視臺
? 廣告名稱(主題詞)
? 節(jié)目類型。對于17號令的應用而言,分公益廣告、酒類廣告、影響進食類廣告、普通廣告、禁止播放類廣告、節(jié)目
? 播出日期、時間
? 廣告/節(jié)目持續(xù)時長
用戶收益:
? 實現(xiàn)實時監(jiān)督播出的廣告播出長度,播出時間的精確性
? 可以監(jiān)督電視臺因工作過失產(chǎn)生的漏播,缺幀等情況
? 可作為電視臺是否落實廣告播出合同的依據(jù)
? 可實現(xiàn)在同一時刻內同時監(jiān)控多個廣告播出情況的功能
? 可有效地收集同業(yè)的媒介廣告播出情況,利于用戶有效地進行行業(yè)分析