視覺提示新突破！IDEA研究院發(fā)布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗

手機版

客戶端

融媒體矩陣

微信視頻號

快手視頻號

今日頭條

郵箱

zgc_west@126.com 復制

繁繁體

簡簡體

訂報/續(xù)訂 | 廣告服務 | PDF電子報 | 電子報

首頁港聞財經(jīng) 商聯(lián)通視聽港深合作評論綜合灣區(qū) 社團 Life Style 地方新界專刊專題

--℃

滾動新聞：

視覺提示新突破！IDEA研究院發(fā)布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗20:07 深圳首艘3000噸級海洋執(zhí)法船入列首次亮相國際海洋周20:06 港燈首次到深圳招聘深受求職者歡迎20:01 深圳調(diào)整二套住房最低首付款比例最低為40%19:51 3人涉詐騙社署及保險公司逾90萬遭廉署起訴周五提堂19:48 深圳調(diào)整享受優(yōu)惠政策普通住房認定標準19:44 【收藏「琪」觀】森羅萬象19:42 孫玉菡率團在深圳出席多項活動推廣香港大灣區(qū)人才服務港角色19:40

視覺提示新突破！IDEA研究院發(fā)布T-Rex模型解鎖「一圖勝千言」的Prompting新體驗

責任編輯：朱劍明 2023-11-22 20:07:59 來源：香港商報網(wǎng)

　繼火爆出圈的Grounded SAM之後，IDEA研究院團隊攜重磅新作歸來：全新視覺提示(Visual Prompt)模型T-Rex，以圖識圖，開箱即用，開啟開集檢測新天地!

QQ截圖20231122201315.jpg

　(動態(tài)圖)

QQ截圖20231122201324.jpg

　(靜態(tài)圖)

　拉框、檢測、完成!在剛剛結(jié)束的2023 IDEA大會上，IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋展示了基於視覺提示的目標檢測新體驗，並發(fā)布了全新視覺提示模型T-Rex的模型實驗室(playground), Interactive Visual Prompt(iVP)，掀起現(xiàn)場一波試玩小高潮。

　在iVP上，用戶可以親自解鎖「一圖勝千言」的prompting體驗：在圖片上標記感興趣的對象，向模型提供視覺示例，模型隨即檢測出目標圖片中與之相似的所有實例。整套流程交互便捷，只需幾步操作就可輕鬆完成。

QQ圖片20231122201435.png

　(動態(tài)圖)

QQ圖片20231122201445.png

　(靜態(tài)圖)

　IDEA研究院4月份發(fā)布的Grounded SAM (Grounding DINO + SAM) 曾在Github上火爆出圈，至今已狂攬11K星。有別於只支持文字提示的Grounded SAM，此次發(fā)布的T-Rex模型提供著重打造強交互的視覺提示功能。

　T-Rex具備極強的開箱即用特性，無需重新訓練或微調(diào)，即可檢測模型在訓練階段從未見過的物體。該模型不僅可應用於包括計數(shù)在內(nèi)的所有檢測類任務，還為智能交互標註場景提供新的解決方案。

QQ圖片20231122201522.png

　團隊透露，研發(fā)視覺提示技術(shù)是源自對真實場景中痛點的觀察。有合作方希望利用視覺模型對卡車上的貨物數(shù)量進行統(tǒng)計，然而，僅通過文字提示，模型無法單獨識別出每一個貨物。其原因是工業(yè)場景中的物體在日常生活中較為罕見，難以用語言描述。在此情況下，視覺提示顯然是更高效的方法。與此同時，直觀的視覺反饋與強交互性，也有助於提升檢測的效率與精準度。

　基於對實際使用需求的洞察，團隊將T-Rex設計成可接受多個視覺提示的模型，且具備跨圖提示能力。除了最基本的單輪提示模式，目前模型還支持以下三種進階模式。

QQ圖片20231122201543.png