中華電信研究院自主研發「VLM(Vision Language Model)視覺影像分析技術」,在全球指標性競賽-2025 AI City Challenge中脫穎而出,榮獲「交通安全描述與分析(Traffic Safety Description and Analysis)」競賽項目排行榜第一名。該成果獲大會邀請,將於10月20日至美國夏威夷舉行的頒獎典禮上發表論文,充分展示中華電信於智慧城市AI應用領域深厚的研發實力與創新能量。
AI City Challenge由NVIDIA聯合多所國際頂尖大學共同主辦,為全球電腦視覺領域最具指標性的國際競賽之一。該競賽聚焦於真實世界的交通與城市AI應用,提供810 個影片和 155 個場景,邀請全球頂尖團隊共同以AI競技。參賽團隊須以AI技術描述影片中事故發生前的連續瞬間,並標註所有與周圍環境、注意力、位置以及行人和車輛行為相關的細節,影片內容涵蓋車輛與行人辨識、跨鏡頭追蹤、異常行為偵測與交通事件語意分析等關鍵主題,詮釋預警能力愈精確及快速者,將可獲得最高分數。
突破複雜場景應用瓶頸,展現「看得懂、說得出、能預警」全方位智慧管理能力
中華電信研究院CHTTLIOT團隊所研發的模型,以優越的分析預警能力,解析大會提出的各式高複雜交通場景,突破過往AI分析應用瓶頸,整合「全域–局部影像理解Keyframe-Based Global-Local View Construction」及「雙任務學習強化語境推理Dual-Task Supervised Learning」技術,深度理解與語意化分析交通事件,精準的預判能力成功於競賽排行榜中位居第一名。
深度理解交通事件、即時判斷風險事件,優越的AI描述問答準確率突破傳統表現
此技術於競賽中精準辨識行人、車輛及其互動關係,預先分析潛在的衝突情境。以自動生成精確的語意描述能力,辨識違規或危險行為,協助即時預警及輔助決策。此技術輔助影像描述及問答競賽的任務中,其較傳統模型準確率大幅超過22%,成果表現令人驚艷。
中華電信以台灣智慧交通經驗展現國際水準,驅動AI擘畫智慧新未來
中華電信研究院院長蘇添財表示:「此次CHTTLIOT團隊在AI City Challenge競賽排行榜中獲得第一名席次,證明中華電信的AI視覺語言技術已達國際領先水準,也展現台灣在智慧城市治理創新上的堅實實力。透過在地化資料進行模型優化,結合邊緣運算部署,我們將持續推動VLM技術應用於智慧交通、公共安全等多元場域,為全體市民打造更安全、即時與智慧的城市生活。」
中華電信未來將持續深化AI模型之泛化能力與即時運算效能,推動輕量化VLM模型應用於邊緣裝置,提升第一線感知反應速度,助力智慧城市加速實現。
備註:
- 全域–局部影像理解技術(Keyframe-Based Global–Local View Construction)
此技術模型可同時掌握整體場景與重點區域影像,兼具宏觀視野與細節聚焦,能更全面、精準地解析交通事件脈絡。
-
雙任務學習強化語境推理技術(Dual-Task Supervised Learning)
此技術融合影像描述與視覺問答(Visual Question Answering, VQA)雙重訓練,使模型不僅能自動生成交通語意說明,亦能即時互動判斷風險場景,大幅提升決策速度與應變能力。
- CHTTLIOT團隊來自中華電信研究院,專注於AI影像相關技術研發,成果落地於全台各縣市智慧交通、警政安防等科技化城市治理應用,近年來屢獲國內、外多項技術創新獎項,展現卓越實力。