【Infocomm2025】DAV專訪維海德:AI讓攝像機"會思考",智能革命直擊傳統(tǒng)會議痛點??!
來源:數(shù)字音視工程網(wǎng) (原創(chuàng)) 編輯:ZZZ 2025-04-22 10:05:24 加入收藏 咨詢

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢內(nèi)容: | |
驗證碼: |
|
2025年4月16-18日,北京InfoComm China展會于北京國家會議中心盛大啟幕,超400家頂尖品牌攜先進技術(shù)成果和創(chuàng)意產(chǎn)品方案齊聚,打造震撼視聽體驗。參展品牌中,音視頻領(lǐng)域卓越品牌—維海德表現(xiàn)驚艷,其深耕音視頻技術(shù)創(chuàng)新與應(yīng)用,此次攜AI賦能的視聽融合創(chuàng)新產(chǎn)品 重磅登場,引發(fā)行業(yè)聚焦。
著眼于展會亮點與行業(yè)趨勢,DAV數(shù)字音視工程網(wǎng)特別專訪維海德相關(guān)負責人,深入探討其創(chuàng)新實踐及行業(yè)發(fā)展方向,為讀者呈現(xiàn)展會深度解讀與專業(yè)洞察。

數(shù)字音視工程網(wǎng):維海德本次主推的廣播級PTZ攝像機、4K云臺攝像機等產(chǎn)品,在AI和智能化方面有哪些突破性創(chuàng)新?
維海德: 本次參展,維海德重點展示了企業(yè)商務(wù)會議和廣電直播兩大應(yīng)用領(lǐng)域的新產(chǎn)品和解決方案。

①在廣電直播領(lǐng)域,展出全新一代廣播級PTZ攝像機GB-VX90S 。這是一款專為賽事直播、活動直播、遠程指揮等專業(yè)級場景而設(shè)計,采用1英寸超大底CMOS傳感器,5000萬有效像素,搭配71°廣角和20x光學(xué)變焦鏡頭,可以輕松拍攝全景和特寫畫面;采用新一代無刷直流電機和OIS光學(xué)防抖,讓拍攝畫面更加順暢自然。

除此之外,在AI應(yīng)用方面,GB-VX90S搭載了ReID、FacelD、自動框選 等多種AI算法,可以輕松實現(xiàn)對目標主體的精準識別和跟隨移動拍攝,無需人工操作,確保目標焦點始終位于畫面C位,捕捉到精彩的畫面瞬間;也可識別出鏡人員數(shù)量及其位置變化,自動調(diào)整鏡頭視角和焦距確保所有人員完整入鏡,呈現(xiàn)對稱美感,適用于各類舞臺表演場景。

為了確保拍攝高速移動目標時的畫面對焦清晰、精準,GB-VX90S搭載了PDAF相位對焦技術(shù),可以實現(xiàn)對目標快速對焦,即使光線變化或目標 主體快速移動,畫面也不虛焦模糊,始終保持畫面清晰銳利, 讓每個重要時刻都能被清晰捕捉。

?、谠谄髽I(yè)商務(wù)會議領(lǐng)域,維海德展出了以雙目4K超高清USB音視頻一體機M2000S為核心的智能會議室解決方案 。

M2000S是專為中大型會議室設(shè)計,采用一體化設(shè)計,集成4K全景攝像頭、4K特寫攝像頭、陣列麥克風和全頻揚聲器 ,大幅簡化會議室布線,讓遠程開會變得簡單輕松。M2000S同樣搭載了豐富的AI音視頻功能:
與會人框選功能: 內(nèi)置人臉、人形識別和智能 選算法,可識別參會人員數(shù)量及其位置變化,自動調(diào)整鏡頭視角和焦距,確保所有人均能清晰呈現(xiàn)在畫面中,獲得最佳取景;
演講者跟蹤功能: 內(nèi)置手勢、ReID、ReFace識別技術(shù),演講者通過簡單手勢自動激活跟蹤模式,AI算法可精準識別體型、臉型等特征。當其移動時,特寫攝像機自動持續(xù)跟蹤拍攝,獲取近景畫面。

智慧畫廊功能: 開啟后,一體機憑借先進的識別算法,自動根據(jù)參會人數(shù)調(diào)整畫面布局。精準提取每位參會者畫面特寫,以等分形式清晰排列,線上參會者既能總覽會議全局,又能看清個體細節(jié)。
通過這些功能,企業(yè)參會人員無需手動操作一體機即可完成會議取景,讓參會人員可以專注會議過程,高效開會。
數(shù)字音視工程網(wǎng):AI已成視頻行業(yè)標配,維海德如何通過技術(shù)壁壘實現(xiàn)與競品的差異化競爭?
維海德: 維海德始終認為,真正的創(chuàng)新不在于技術(shù)堆砌,而在于對場景痛點的精準洞察,并通過AI技術(shù)的應(yīng)用重構(gòu)應(yīng)用場景,并探索視聽服務(wù)的邊界。

例如,在維海德打造的智能會議室解決方案中,用戶可以從會前-會中和會后體驗到全方位的智能。
會前,用戶可以通過會議日程看板(SP102)查看會議室當前狀態(tài)(空閑/已預(yù)約/忙碌中),查看會議進程及時調(diào)整時間,避免會議沖突;
進入會議室之后,用戶只需要通過會議室控制器(CP100)一鍵觸控開啟會議,通過觸摸完成會議過程管理,無需頻繁離席走動;
開啟會議后,攝像機根據(jù)與會人員的數(shù)量和位置自動調(diào)整鏡頭視角和變倍,確保所有人清晰地呈現(xiàn)在畫面中,也可以提取每位參會者的畫面特寫,以等分形式呈現(xiàn)在遠端人員面前,帶來“面對面”的溝通;當人員在會議室內(nèi)走動講話或者分享時,可通過手勢讓攝像機跟隨其移動拍攝、完成放大、拉遠拍攝動作;而無論會議室如何嘈雜,無論與會人說話聲音大小,在遠端人員耳邊聽到的始終是清晰、均衡的人聲……整個過程無需人員觸控屏幕或使用鼠標鍵盤,也不需要人員大聲講話、重復(fù)溝通,會議過程也因此更加順暢和高效。

結(jié)束會議時,僅需通過CP100一鍵完成操作即可,同步會議室日程面板釋放會議室,提高會議室的利用效率。
通過對用戶場景的深度理解與洞察,并將AI核心技術(shù)融入真實的用戶場景之中,是維海德建立行業(yè)差異化技術(shù)壁壘的實踐方向之一 。
數(shù)字音視工程網(wǎng):在AI技術(shù)賦能音視頻設(shè)備的背景下,貴司未來的發(fā)展戰(zhàn)略是什么?
維海德: 當前,視頻會議正從簡單的連接工具,向能夠提升工作效率、促進業(yè)務(wù)發(fā)展的生產(chǎn)力引擎轉(zhuǎn)變。對于視聽行業(yè)廠商而言,未來競爭不僅僅是技術(shù)層面的比拼,更是對場景痛點的深度理解和解決方案的快速響應(yīng)能力。

維海德的實踐印證了這一觀點:從企業(yè)會議的全流程智能化,到廣電直播的精準捕捉 拍攝 , 本質(zhì)上都是通過 AI 算法理解并重用戶體驗 ——技術(shù)不再是冷冰冰的設(shè)備,而是成為連接人與場景的“高效樞紐”。未來,維海德將繼續(xù)深耕用戶場景,不斷深挖用戶場景需求來推動視聽技術(shù)、產(chǎn)品和解決方案的創(chuàng)新,進而實現(xiàn)用戶體驗的優(yōu)化與升級,推動視頻會議向更多行業(yè)領(lǐng)域縱深發(fā)展。
媒體總結(jié):
在2025北京InfoComm展會上,維海德以"AI+視聽"為核心,向行業(yè)拋出了一個關(guān)鍵命題:技術(shù)創(chuàng)新的終極目標,究竟是參數(shù)內(nèi)卷還是場景解放?其展出的智能會議與廣電直播解決方案,正以"無感介入、精準服務(wù)"的邏輯,重新書寫視聽技術(shù)的價值定義。
DAV數(shù)字音視工程網(wǎng)觀察認為,維海德的實踐揭示了AI時代的關(guān)鍵趨勢:當技術(shù)足夠理解場景,硬件便會隱入環(huán)境,體驗自然升維為生產(chǎn)力。或許,這才是"智慧視聽"的真正要義。
評論comment