AI數據服務進化史:Testin有數的光榮與夢想之路

2019年10月12日 14:14:18  來源:中網資訊商業
 

  人工智能早在上世紀50年代就被提出,但是卻在21世紀才被廣泛使用于各行各業,這得益于大數據技術的誕生推動了人工智能的深度學習。隨著大數據技術的應用及發展,使各行業的數據如泉涌一般產生,為人工智能奠定了堅實的數據基礎,進而促進了人工智能應用興起。

  眾所周知,人工智能是基于計算機對數據分析和深度學習的一種技術,但是只有數據對計算機來說是沒用的,因為沒有加上“標簽”的數據,計算機難以進行深度學習和優化。于是,AI數據服務應運而生,并隨著人工智能產業的迅速發展得以快速增長。

  據艾瑞咨詢最新報告顯示,2018年中國人工智能基礎數據服務市場規模為25.86億元,其中數據資源定制服務占比86.2%,行業年復合增長率為23.5%,預計2025年市場規模將突破110億元。由此可以看出,該行業整體發展較為穩健。但是,由于該行業處于成長期,所以我們仍需直面AI數據服務的行業難點。

  AI數據服務諸多痛點亟待解決

  隨著科技技術不斷更新迭代,企業變革的方向已由信息化向智能化發展,而在此過程中,如何獲取數據成為最重要的痛點。

  其實這個問題在行業轉型中早已是一個普遍現象。時間追溯到智能化時代初期,企業爭相加入信息化變革隊伍中,此時互聯網中已經積累了大量的數據信息,可供企業獲取用以人工智能訓練,但隨后人們便意識到互聯網上這些數據因為過于簡單難以滿足人工智能的發展速度,于是企業開始主動獲取采集數據。

  2005年起,以亞馬遜的Mturk為代表的一種新的數據采集服務——眾包模式席卷而來,這種眾包模式當時在硅谷被大量的公司采用,最初被用于訓練AI算法、發現假新聞、刪除社交媒體上的暴力內容等,后來在定量研究、市場調查等領域也有所應用。由于其低門檻、高效便捷的優點,一時間受到廣大AI從業者及科研人員的喜愛,在國內也掀起了一場效仿熱潮。

  但是,人們對人工智能的依賴程度逐漸提升,對AI的要求也越來越高,自然對數據的質量及精準度也就更高,這給眾包模式的數據服務商帶來了巨大考驗,同時也為AI數據服務行業帶來了新的挑戰和機遇。

  2017年,北京云測信息技術有限公司(以下簡稱“云測”)成立了AI數據服務品牌——Testin有數(原云測數據),憑借云測多年來在互聯網行業積累的豐富經驗,同時不斷扎實磨礪技術能力、打造品牌形象,Testin有數快速成長,躋身AI數據服務行業內頭部隊列。

  那這樣一家企業又是怎樣解決上面提到的難題,又是如何不斷創新,在行業發展之路上走在前列的呢?

  AI數據服務如何實現“質”的飛躍

  Testin有數總經理賈宇航認為要想攻克數據服務行業過去的種種難點,使數據服務呈場景化、精細化、質量化是必然趨勢,而Testin有數則是通過提供定制化的數據采集、高精度的數據標注等服務模式來將問題一一解決的。

  怎樣實現數據采集定制化?精準化?

  賈宇航說道,對于需要使用AI數據的公司來說,“成也數據,敗也數據”已是一個既定的事實,這里的數據不僅指數量,更多的在于精度,能否實現精細化的數據采集和多維度的數據標注對AI數據使用者來說至關重要。

  隨著人們對交互式人工智能的青睞,人工智能的深度研發成為企業發展戰略中的重要一筆。通常情況下,提高算法精度是人工智能進化的重要途徑,因此對數據的精準度也提出了更高要求。  

  為提高數據的精準度,Testin有數依照客戶需求定制化搭建了采集場景,為客戶提供多場景多形式的高精度數據,滿足不同企業對不同數據的需求。例如疲勞駕駛監測系統研發前期,駕駛員危險動作的數據收集較困難,針對這一問題,Testin有數通過搭建與之相對應的場景實驗室,利用專業的人士到駕駛艙中模擬駕駛員疲勞駕駛的相關行為動作,例如打瞌睡、玩手機等危險行為,通過專業的設配獲取精準的數據信息后,利用該組數據對人工智能進行培訓,一個減少交通事故的預警系統便隨之產生。

  然而,在數據服務這一過程中,最重要的莫過于數據采集之后高精準的數據標注。沒有精準的數據標注,那這些收集到的數據處于“死亡”狀態,并沒有激活,其價值并未體現。此時我們不得不提到“數據標注”這一職業。  

  過去,“數據標注”常被冠以“勞動力密集型”“無技術含量”的帽子,而在賈宇航看來并非如此,他認為“數據標注”現在已經成為一種“技能密集型”的行業,伴隨著人工智能的快速發展,數據標注行業正在進行快速轉型,“人工智能的老師”是他們的新名稱,他們以數據標注為己任,為人工智能實現真正智能而努力,通過不斷掌握豐富的行業知識、專業的職業技能及專業的工具的使用,做好每一項復雜的數據標注工作,使數據標注精準度從傳統的95%要上升到99%,甚至更高,確保人工智能更智能。

  例如在對車輛信息進行標注時,傳統的數據標注只能確保人工智能準確識別出車型、車身顏色等95%的信息;或者有的企業需要研究道路設置的問題因此只需要道路上基礎設施的數據,而有的企業做一個汽車行業的研究所以需要的是道路上所有經過的交通工具的數據,往往數據決定數據精準度的就是那容易被忽視到的5%,這5%需要專業的數據標注者才能完成。實現更高質量的數據標注,確保每一分數據都能助力人工智能產品實現快速落地也正是Testin有數所關注的。

  人工智能的發展離不開數據的支撐,沒有數據作為“燃料”,人工智能“舉步維艱”。

  過去的AI數據服務呈現的是并行模式,而現在逐漸形成了金字塔模式。Testin有數作為金字塔上方的數據服務商,有著自己的發展戰略。賈宇航表示,AI數據服務是一個資金、人員、軟硬件設施等投資均相對較高的行業,但是它又是人工智能產品落地的重要因素。

  Testin有數一直以來聚焦在高還原、高精度、高質量的數據,致力于幫助企業探索發展邊界。希望通過提供健康的數據,真正助力人工智能產業的穩健快速發展。

  數據服務未來可期

  人學習是舉一反三,而人工智能學習是舉三反一,這就意味著需要全面的、精準的數據以供人工智能學習、進步。2019年被稱作5G元年,由于5G技術高速度、低延遲、低功耗等特點,將為數據服務帶來新的變革。

  5G+IoT為數據獲取掃清了阻礙。物聯網設備中產生的數據依賴網絡傳輸,5G高速度、低延遲的特色可實現數據實時傳輸,并以多元化的形式獲取數據,量和速度跟上了,數據的“質”也得到日益提升,助推數據服務行業實現巨大飛躍,從而進一步提升了人工智能的智能化水平,催生出更多的AI產品,實現5G技術推動整個AI數據服務行業發展,使整個行業更加繁榮。  

  然而,有人提出質疑:“AI公司獲取數據的需求會不會隨著科技技術的逐漸完善而下降”,賈宇航給出的答案是“不會”,他認為人們在享受人工智能帶來的紅利時,對其的期望值也會日漸增長,并不會發生數據需求封頂的情況。

  例如智能手機在剛問世時便給人們帶來了很大的便利,但當時人們并沒有想到幾年后的今天,智能手機、AI應用場景會給我們帶來如此巨大的便利,AI的強大遠不能以我們當前的視角去看待。AI會逐漸強大,其數據缺口會越來越大。

  當前,Testin有數在AI數據服務的發展里程上刻下了濃墨重彩的一筆。在未來,隨著數據需求會持續上升,會有更多的“AI+”,數據服務市場規模將不斷擴大,AI數據服務行業將穩步向前發展!

  (客戶宣傳稿件,圖文均由客戶提供,僅供參考)

(責編:東 華)

推薦閱讀

關于我們 | 保護隱私權 | 網站聲明 | 投稿辦法 | 廣告服務 | 聯系我們 | 網站導航 | 友情鏈接 | 不良信息舉報:yunying#cnwnews.com(將#換成@即可)
京ICP備05004402號-6
7星彩开奖结果走势图 免费下载麻将游戏 大赢家比分足球比分即时比分 雪缘园比分网 河南22选5开奖 辽宁微乐棋牌 西安酒店小姐价格 365足球比分网 五体球发明人是谁 福州一条龙服务多少钱 新疆11选5开奖号 任达华拍过那些三级片 36选7走势图福建 日本女优伦理快播 湖北十一选五遗漏数 原千岁手机在 线观看 新贵州十一选五走势