• <ul id="w2omw"></ul>
    <strike id="w2omw"></strike>
  • <strike id="w2omw"><input id="w2omw"></input></strike>
  • 您好,歡迎來到教育裝備網!登錄注冊新賬戶

    http://www.progcable.com/zt/2022/ceeia/
    全國教育辟謠平臺
      首頁>教育資訊 > 商訊>正文

    讓數據處理更簡單?百度EasyData推出首個高級智能數據清洗功能

    http://www.progcable.com2020年09月04日 13:32教育裝備網

      在進行AI模型開發時,數據的數量與質量直接影響模型效果。在實地數據采集之后,企業往往需要從大量數據中篩選出符合訓練要求的相關數據,剔除質量差或不相關的數據,這個步驟被稱為數據清洗。

      通常來講,在清洗數據時主要會清理掉對訓練任務沒有用途的數據,例如在訓練工廠工人佩戴安全帽識別模型時,希望在視頻抽幀后的大量圖片中僅保留有工人出現的圖片進行標注訓練。在這一步驟上,傳統做法是進行人工篩選,人力投入較多且容易發生遺漏;隨著人工智能發展,目前許多平臺,如百度大腦AI開放平臺,已經提供人臉檢測、人體檢測的通用接口,用戶可以先調用接口處理數據,篩選出采集到人像的數據,再進入到具體的檢測識別步驟。那么,是否有一個集成了各項數據處理能力,盡量減少人工干預,能夠自動完成視頻數據采集、抽幀、數據清洗、智能標注,從而高效提取高質量訓練數據的解決方案呢?

      關注到有越來越多的用戶對數據處理有強烈需求,今年4月,百度全新推出智能數據服務平臺EasyData,集數據采集、數據清洗、數據標注等功能于一身,完成上述數據處理工作之后,可以在EasyDL平臺進行模型訓練、模型部署。

      針對數據清洗這一具體功能,EasyData目前上線了去相似、去模糊、旋轉、裁剪和鏡像這5種基礎的數據清洗功能。那么除了常規能力之外,EasyData還有什么業內獨家的終極秘技?

      從應用出發,高級清洗功能讓數據處理事半功倍

      在園區智能管理等場景下,需要監測工廠園區、林區中是否有人闖入,或檢查工人是否佩戴安全帽。為了滿足此類場景下的圖片清洗需求,EasyData上線了高級清洗功能,將無人臉、無人體出現的數據進行過濾。EasyData聯動百度大腦AI開放平臺提供的前沿技術能力,用戶僅需在百度智能云上開通相應的服務(人臉檢測和人體檢測都可以免費試用),就可以通過簡單的配置,在EasyData平臺上直接使用這些功能進行自動數據清洗。

      1、過濾無人臉圖片

      如果以前沒有用過百度智能云的人臉檢測服務,第一次使用高級清洗的功能會提示“申請免費試用”,點擊鏈接會進入百度智能云人臉檢測的頁面,按照提示,開通服務后,再回到EasyData的頁面就可以正常使用了。

      和基礎的數據清洗服務一樣,過濾無人臉圖片也是以數據集為單位的。在數據清洗頁面選擇過濾無人臉圖片,點擊保存,提交任務就可以進行清洗。如果勾選了“保留標簽”,那么不僅會把沒有人臉的圖片過濾,還會將人臉畫框同步至清洗后的數據集。

      提交任務時勾選保留人臉畫框

      例如下圖,清洗前的數據集除了人臉圖片,還有一些風景照、車輛等其他物體的照片,人臉過濾會把這些沒有人臉的圖片過濾,保留下來包含人臉的圖片,包括戴口罩、被遮擋的人臉也可以識別出來。

      清洗前的數據集中有人臉照片、風景照、靜物照

      清洗后的數據集只有人臉照片被保存下來

      戴口罩的人臉圖片

      2、過濾無人體圖片

      過濾無人體圖片同樣會用到百度智能云的人體檢測能力,在使用之前需要在百度智能云上開通相應的服務。過濾無人體圖片會用到兩個接口,人體檢測和屬性分析(https://ai.baidu.com/tech/body/attr)和人像分割(https://ai.baidu.com/tech/body/seg)。數據集模板為圖像分類和物體檢測的數據集會調用人體檢測和屬性分析接口,數據集模板為圖像分割的數據集會調用人像分割接口。百度智能云上的人像分割接口返回的是人像圖片對應的二值圖片(人像為1,背景為0),在后端會執行相應的標簽轉換,返回的二值圖片轉換成對應的標簽。

      清洗前的數據集中有風景圖、靜物圖和人體圖

      數據清洗過濾保留的5張人體圖片

      模板為圖像檢測的數據集清洗后的標簽

      模板為圖像分割的數據集清洗后的標簽

      關注廣泛需求,提供多種基礎數據清洗功能

      1、去相似圖片

      用攝像頭自動采集圖片的時候,由于長時間在同一個場景下,即使做了抽幀處理,還是會有大量的相似圖片。大量的相似圖片,數據價值低,而且占用了大量的存儲空間,而人工篩選,耗時費力,容易出錯。EasyData平臺推出的去相似圖片利用圖片的相似檢索特征,計算圖片的兩兩相關性,可以自動地判斷相似圖片、保留不相似的圖片,具體操作也十分簡便。

      如下圖所示,去相似前的數據集里有8張圖片,根據圖片的相似度,圖片可以分成3類。清洗完成后的數據集中有3張圖片,分別是清洗前的3類圖片中的一張。

      去相似前的8張圖片

      去相似后保留下來3張圖片

      拖拽圓點可以修改相似度分值

      2、去模糊圖片

      相機抖動、物體快速移動都會造成拍出來的圖片不清晰、產生低質圖片。通過人工挑選的方法去除模糊圖片缺乏統一的標準,容易漏刪或多刪。利用EasyData的去模糊圖片,可以輕易地去除模糊圖片。

      以示例圖片為例,清洗前有5張圖片,畫質不一,清洗后保留下來兩張高質量的圖片。此外,如果用戶認為有部分模糊圖片沒有去除,或者高質量的圖片沒有保留下來,可以考慮調整清晰度的分值,重新清洗。

      去模糊前的5張畫質不一的圖片

      去模糊后保留下來清晰圖片

      拖拽圓點可以修改清晰度分值

      對于普通清洗,可以在一個清洗任務中提交多個清洗操作,例如同時勾選去相似、去模糊功能,即可同時去除相似和模糊的圖片。

      目前的數據清洗服務所能支持的最大數據集大小是5萬張圖片。基于EasyData平臺的大數據處理平臺,對于基礎清洗服務,2萬張圖片的數據集,僅需1小時可以完成清洗;5萬張圖片的數據集,只需2小時即可完成清洗。對于高級清洗服務來說,清洗效率也可以通過配置QPS靈活調整清洗效率,更方便快捷。

      考慮到智能園區管理等場景中,有對視頻進行截幀、自動上傳的需求,EasyData平臺也免費提供SDK,供用戶進行下載,可以將SDK接入業務現場的數據采集終端,在平臺設置截幀時間與間隔,自動將原始視頻數據截為圖片數據并上傳至EasyData平臺進行后續處理。

      EasyData是百度大腦推出的業內首個提供軟硬一體、端云協同的智能數據采集與處理平臺,支持圖片、文本、音頻和視頻四類數據的處理,其中圖片數據支持了采集、清洗、標注一站式處理,覆蓋模型開發中的各類數據管理需求。EasyData處理后的數據可直接應用于EasyDL模型訓練,通過EasyDL預訓練模型和自動遷移學習機制,高效開發AI模型。

      立即體驗EasyData:https://ai.baidu.com/easydata/

      注:本文為推廣文案,非本站采編新聞稿件,不代表本站觀點。

    (來源:百度EasyData )
    聲明: 本網部分文章系教育裝備網轉載自其它媒體,目的在于信息傳遞,并不代表本網贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯系我們。
    名企展播 申請加入
    行業訪談
    第84屆中國教育裝備展示會
    2025第十一屆亞洲教育裝備博覽會
    第84屆中國教育裝備展示會-展會會刊
    主站蜘蛛池模板: 国产精品国产三级在线专区| 国产精品男男视频一区二区三区 | 99免费精品国产| 久久精品亚洲日本波多野结衣 | 香港三级精品三级在线专区| 亚洲国产成人久久精品影视 | 国产精品久久久天天影视香蕉 | 国产精品视频一区二区三区经 | 四虎成人精品永久免费AV| 久久亚洲精品无码观看不卡| 日本人精品video黑人| 国产精品久久久久jk制服| 亚洲精品国产精品乱码不卡| 国产精品主播一区二区| 日本精品一区二区久久久| 日韩精品免费视频| 97人妻无码一区二区精品免费| 麻豆精品久久精品色综合| 无码人妻精品一区二区三区久久久 | 国产a∨精品一区二区三区不卡| 亚洲欧洲自拍拍偷精品 美利坚| 国产精品99精品视频网站| 久久精品国产精品青草app| 91麻豆精品视频在线观看| 精品欧洲av无码一区二区| 最新欧美性爱精品一区二区三区| 欧美在线精品永久免费播放| 久久人人超碰精品CAOPOREN| 精品国产婷婷久久久| 国产精品乱视频| 国产日韩高清三级精品人成| 国产精品偷窥熟女精品视频| 国产精品成人国产乱一区| 国产精品美女网站在线观看| 99久久精品免费国产大片| 51久久夜色精品国产| 亚洲А∨精品天堂在线| 欧美国产精品久久高清| 日韩美女18网站久久精品| 亚洲福利精品一区二区三区| 亚洲欧美国产精品第1页|