2019-08-28 09:15:48分類(lèi):行業(yè)資訊4437
數(shù)據(jù)問(wèn)題是企業(yè)的人工智能項(xiàng)目沒(méi)有達(dá)到預(yù)期目標(biāo)的主要原因。但是,如果企業(yè)能從錯(cuò)誤中吸取教訓(xùn)并長(zhǎng)期堅(jiān)持,那么在人工智能方面的努力將會(huì)得到回報(bào)。
18個(gè)月前,Cooper公司為其客戶(hù)服務(wù)代理商推出了智能推薦系統(tǒng),以便為客戶(hù)問(wèn)題提供解決方案。該公司前身為Nationstar公司,是美國(guó)最大的非銀行抵押貸款提供商,擁有380萬(wàn)客戶(hù),因此該項(xiàng)目被視為該公司一個(gè)令人關(guān)注的節(jié)省成本的項(xiàng)目。該公司首席信息官Sridhar Sharma說(shuō),該公司花費(fèi)九個(gè)月的時(shí)間才發(fā)現(xiàn)代理商沒(méi)有使用它,又花了六個(gè)月的時(shí)間來(lái)弄清楚原因。
Sharma發(fā)現(xiàn),智能推薦系統(tǒng)提供的建議與客戶(hù)并不相關(guān),但問(wèn)題不在于機(jī)器學(xué)習(xí)算法。相反,該公司依賴(lài)于基于客戶(hù)問(wèn)題的技術(shù)術(shù)語(yǔ)描述訓(xùn)練數(shù)據(jù),而不是使用客戶(hù)自己的語(yǔ)言描述這些問(wèn)題。
他說(shuō):“我們沒(méi)有很好地確保客戶(hù)提出問(wèn)題的根源是沒(méi)有采用客戶(hù)使用的術(shù)語(yǔ),這是因?yàn)槭怯梦覀儍?nèi)部使用的技術(shù)術(shù)語(yǔ)編寫(xiě)的。”
Sharma說(shuō),此外,智能推薦系統(tǒng)的反饋機(jī)制(代理記錄通話(huà)結(jié)果)有重疊的類(lèi)別,這使得問(wèn)題更加嚴(yán)重。他拒絕透露這個(gè)項(xiàng)目給該公司造成了多大的損失。
Cooper公司陷入人工智能的困境并不是異常現(xiàn)象。根據(jù)調(diào)研機(jī)構(gòu)IDC公司最近的一項(xiàng)調(diào)查,只有約30%的受訪者表示其人工智能項(xiàng)目的成功率為90%,大多數(shù)受訪者表示其失敗率為10%到49%,而3%的受訪者表示一半以上的人工智能項(xiàng)目已經(jīng)失敗。
超過(guò)四分之一的受訪者認(rèn)為,缺乏員工以及人工智能技術(shù)具有不切實(shí)際的期望是面臨的主要挑戰(zhàn)。另有23%的人表示他們的人工智能項(xiàng)目因?yàn)槿狈Ρ匾臄?shù)據(jù)而失敗。
Sharma說(shuō):“失敗的第一個(gè)征兆是有些人想退出這個(gè)項(xiàng)目。但如果這樣做,就注定要失敗。”
Cooper公司計(jì)劃明年將重新回到客戶(hù)服務(wù)項(xiàng)目,作為其客戶(hù)關(guān)系管理(CRM)系統(tǒng)改革的一部分,企業(yè)將繼續(xù)致力于人工智能技術(shù)的開(kāi)發(fā)。其最新的機(jī)器學(xué)習(xí)項(xiàng)目涉及分析非結(jié)構(gòu)化數(shù)據(jù),已經(jīng)具有積極的商業(yè)利益,并有助于為未來(lái)創(chuàng)建更好的語(yǔ)言訓(xùn)練數(shù)據(jù)。
他補(bǔ)充說(shuō),“這些措施的成本并不低,當(dāng)事情不順利時(shí),需要企業(yè)首席執(zhí)行官和首席財(cái)務(wù)官的支持。”
缺乏數(shù)據(jù)
數(shù)據(jù)問(wèn)題是人工智能項(xiàng)目達(dá)不到預(yù)期目標(biāo)的主要原因。根據(jù)麥肯錫公司去年秋天發(fā)布的一份調(diào)查報(bào)告,限制人工智能技術(shù)應(yīng)用的兩大挑戰(zhàn)與數(shù)據(jù)有關(guān)。
首先,與Cooper公司一樣,許多公司很難獲得適當(dāng)標(biāo)記的數(shù)據(jù)來(lái)訓(xùn)練他們的機(jī)器學(xué)習(xí)算法。如果數(shù)據(jù)沒(méi)有正確分類(lèi),工作人員必須花費(fèi)大量時(shí)間標(biāo)記,這可能會(huì)延遲項(xiàng)目或?qū)е马?xiàng)目失敗。第二個(gè)數(shù)據(jù)問(wèn)題是沒(méi)有項(xiàng)目的正確數(shù)據(jù)。
普華永道公司合伙人兼全球人工智能領(lǐng)導(dǎo)人Anand Rao表示,“企業(yè)通常沒(méi)有合適的數(shù)據(jù),如果無(wú)法使用未標(biāo)注的數(shù)據(jù)建立模型,就會(huì)感到沮喪。這就是企業(yè)實(shí)施人工智能項(xiàng)目一直失敗的地方。”
美國(guó)奧杜邦協(xié)會(huì)正在使用人工智能來(lái)幫助保護(hù)野生鳥(niǎo)類(lèi)。例如,該組織在7月份發(fā)布了一項(xiàng)關(guān)于氣候變化如何影響38種草原鳥(niǎo)類(lèi)的人工智能分析結(jié)果。
奧杜邦協(xié)會(huì)保護(hù)科學(xué)副總裁Chad Wilsey說(shuō),“如果我們不采取任何措施來(lái)減緩氣候變化的速度,那么42%的草原鳥(niǎo)類(lèi)可能面臨滅絕,但如果我們能夠采取行動(dòng),那么可以將其比例降低到8%。”
并非所有奧杜邦協(xié)會(huì)的人工智能項(xiàng)目都取得了成功。去年夏天,該組織試圖利用機(jī)器學(xué)習(xí)來(lái)計(jì)算海灘上的褐鵜鶘和剪嘴鷗的數(shù)量。該試點(diǎn)項(xiàng)目基于一組志愿者收集的圖像,這些志愿者通過(guò)無(wú)人機(jī)在德克薩斯州海岸附近的一個(gè)島上進(jìn)行調(diào)查。
Wilsey說(shuō),“我們有興趣了解通過(guò)的颶風(fēng)如何影響鳥(niǎo)類(lèi)種群。”
例如,大多數(shù)可用的鳥(niǎo)類(lèi)圖片都是由地面上的工作人員拍攝的,而不是無(wú)人機(jī)直接拍攝。Wilsey說(shuō),由于這是一項(xiàng)試點(diǎn)研究,奧杜邦協(xié)會(huì)沒(méi)有資源拍攝更多的照片。
訓(xùn)練數(shù)據(jù)偏差
另一個(gè)人工智能項(xiàng)目因缺乏數(shù)據(jù)而受阻的例子是弗里茨實(shí)驗(yàn)室試圖創(chuàng)建一個(gè)模型來(lái)識(shí)別照片中人們的頭發(fā)。弗里茨實(shí)驗(yàn)室?guī)椭苿?dòng)開(kāi)發(fā)者構(gòu)建可以直接在手機(jī)上運(yùn)行的人工智能模型,而無(wú)需將數(shù)據(jù)發(fā)送回中央服務(wù)器進(jìn)行處理。
該公司首席技術(shù)官Jameson Toole說(shuō),“我們希望建立一個(gè)能夠在實(shí)時(shí)視頻中檢測(cè)頭發(fā)并實(shí)時(shí)改變顏色的功能。”
他說(shuō),起初一切看起來(lái)都很好,但算法中存在一個(gè)重大缺陷,如果系統(tǒng)公開(kāi)上市的話(huà),其問(wèn)題會(huì)非常嚴(yán)重。
Toole說(shuō),“值得慶幸的是,我們?cè)谵k公室和我們招募的人員之間進(jìn)行了大量的人工測(cè)試,我們意識(shí)到對(duì)于某些種族人群來(lái)說(shuō),這并不是一件好事,我們重新篩選了數(shù)據(jù)集,以確定數(shù)據(jù)集中沒(méi)有人是這些種族人群的一部分。”
他說(shuō),有很多圖像數(shù)據(jù)集可供訓(xùn)練,包括免費(fèi)的和商業(yè)的數(shù)據(jù)集。但是企業(yè)必須檢查是否有他們需要的特定類(lèi)型的足夠數(shù)據(jù)。
他說(shuō):“企業(yè)首先要花費(fèi)一定的時(shí)間,努力構(gòu)建自己的代表用戶(hù)群的測(cè)試用例。”
弗里茨實(shí)驗(yàn)室最終收集了丟失的圖像,并通過(guò)工作人員的處理對(duì)它們進(jìn)行注釋。Toole說(shuō),“這無(wú)疑凸顯了這樣一個(gè)事實(shí),即當(dāng)受到可用數(shù)據(jù)的限制時(shí),將偏見(jiàn)引入這樣的系統(tǒng)并不困難。”
根據(jù)普華永道公司最近的一項(xiàng)調(diào)查,一半以上的公司沒(méi)有評(píng)估人工智能偏見(jiàn)的正式流程。更糟糕的是,只有25%的受訪者表示他們會(huì)在實(shí)施之前優(yōu)先考慮人工智能解決方案的道德含義。
數(shù)據(jù)集成問(wèn)題
有時(shí),問(wèn)題不在于缺乏數(shù)據(jù),而在于數(shù)據(jù)太多。普華永道公司零售業(yè)務(wù)方面的人工智能和數(shù)據(jù)的常務(wù)董事表示,一家全球性大型銀行就面臨這種情況。
他表示,如果能夠回到過(guò)去,這家銀行就會(huì)更早地開(kāi)始將不同的數(shù)據(jù)渠道匯集在一起??。他說(shuō),“這是我們沒(méi)有做的事情,這是一個(gè)很大的錯(cuò)誤。我們收集了數(shù)據(jù),其結(jié)果是我們沒(méi)有獲得完全的全方位的客戶(hù)視圖。”
他補(bǔ)充說(shuō),該數(shù)據(jù)整合??問(wèn)題損害了這家銀行創(chuàng)建有效營(yíng)銷(xiāo)信息的能力,導(dǎo)致收入損失,該銀行現(xiàn)在正轉(zhuǎn)向多渠道客戶(hù)數(shù)據(jù)視圖,包括在線(xiàn)、移動(dòng)和面對(duì)面互動(dòng)。
他說(shuō),“我們?nèi)匀徊辉谀抢?,孤立的?shù)據(jù)是我們擁有并仍然存在的最大挑戰(zhàn)之一。這個(gè)挑戰(zhàn)不是技術(shù)問(wèn)題,而是商業(yè)問(wèn)題,第一個(gè)問(wèn)題是合規(guī)性。我們不允許混合某些類(lèi)型的數(shù)據(jù)。”
他說(shuō),“另一個(gè)問(wèn)題與企業(yè)優(yōu)先事項(xiàng)有關(guān)。還有很多其他項(xiàng)目正在運(yùn)行。誰(shuí)會(huì)為將數(shù)據(jù)混雜一起而支付費(fèi)用?這本身并不是銀行的增值業(yè)務(wù)。”他表示,這是每個(gè)銀行都必須面對(duì)的挑戰(zhàn)。
他說(shuō),“如果再次開(kāi)展這個(gè)項(xiàng)目,應(yīng)該在銀行首次開(kāi)始處理人工智能用例時(shí)啟動(dòng)數(shù)據(jù)集成過(guò)程。我不認(rèn)為我們真的會(huì)做到這一點(diǎn),因?yàn)橛刑嗟臄?shù)據(jù)來(lái)源,我不認(rèn)為都能完全完成。”
他表示,該銀行預(yù)計(jì)在未來(lái)18至24個(gè)月內(nèi)將連接其主要數(shù)據(jù)源。他說(shuō),現(xiàn)在該銀行只有10%到15%左右。
數(shù)據(jù)漂移
人工智能項(xiàng)目面臨的另一個(gè)問(wèn)題是企業(yè)依賴(lài)歷史數(shù)據(jù)而不是活動(dòng)交易數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練。埃森哲公司董事總經(jīng)理安德里Andreas Braun表示,在許多情況下,在轉(zhuǎn)換為實(shí)時(shí)數(shù)據(jù)時(shí),對(duì)單個(gè)靜態(tài)歷史快照進(jìn)行過(guò)培訓(xùn)的系統(tǒng)表現(xiàn)不佳。
埃森哲公司負(fù)責(zé)歐洲數(shù)據(jù)和人工智能業(yè)務(wù)的Braun說(shuō),“企業(yè)可以卸載一些數(shù)據(jù),訓(xùn)練一些模型,并在實(shí)驗(yàn)室中獲得相當(dāng)好的模型提升,但是一旦把它重新融入組織,就開(kāi)始出現(xiàn)問(wèn)題。”
歷史數(shù)據(jù)樣本和通過(guò)實(shí)時(shí)系統(tǒng)傳輸?shù)臄?shù)據(jù)之間可能存在顯著差異,例如,實(shí)時(shí)檢測(cè)欺詐或發(fā)現(xiàn)洗錢(qián)行為,因?yàn)檫@些模型沒(méi)有經(jīng)過(guò)訓(xùn)練,無(wú)法識(shí)別其行為的微小變化。
他說(shuō):“如果某個(gè)用戶(hù)在某個(gè)時(shí)間點(diǎn)(可能是晚上、周六或周日)復(fù)制數(shù)據(jù),那么這種情況將會(huì)凍結(jié)數(shù)據(jù)。這使得實(shí)驗(yàn)室的分析非常容易。但是,當(dāng)機(jī)器學(xué)習(xí)模型重新融入到實(shí)時(shí)系統(tǒng)中時(shí),其情況會(huì)更糟。”
Braun說(shuō),解決方案是將數(shù)據(jù)科學(xué)家從生產(chǎn)技術(shù)方面放入一個(gè)單獨(dú)的孤島中。特別是,當(dāng)使用實(shí)時(shí)數(shù)據(jù)構(gòu)建模型時(shí),將模型集成到生產(chǎn)環(huán)境中要快得多。
他說(shuō):“而且成功的情況要好得多。它完全改變了游戲規(guī)則。”
未經(jīng)處理的非結(jié)構(gòu)化數(shù)據(jù)
根據(jù)咨詢(xún)機(jī)構(gòu)德勤公司最近的一項(xiàng)調(diào)查,62%的公司處理非結(jié)構(gòu)化數(shù)據(jù)仍然依賴(lài)電子表格,只有18%的公司在分析工作中利用了產(chǎn)品圖片、客戶(hù)音頻文件或社交媒體評(píng)論等非結(jié)構(gòu)化數(shù)據(jù)。
此外,德勤公司零售和消費(fèi)產(chǎn)品戰(zhàn)略和分析實(shí)踐負(fù)責(zé)人Ben Stiller表示,該公司收集的大量歷史數(shù)據(jù)缺乏對(duì)人工智能有用的背景,或者以摘要形式存儲(chǔ)。
“數(shù)據(jù)限制當(dāng)然可以從一開(kāi)始就為失敗做好準(zhǔn)備。”他說(shuō)。
Stiller說(shuō),“然而,根據(jù)調(diào)查顯示,像Cooper這樣利用非結(jié)構(gòu)化數(shù)據(jù)的公司,其業(yè)務(wù)超出其業(yè)務(wù)目標(biāo)的可能性要高出24%。這真的需要企業(yè)對(duì)數(shù)據(jù)的看法發(fā)生根本性的轉(zhuǎn)變。”
例如,Cooper公司以大約15億個(gè)客戶(hù)文檔的形式擁有大量非結(jié)構(gòu)化數(shù)據(jù)。因此,客戶(hù)服務(wù)代理會(huì)花費(fèi)太多時(shí)間查找?guī)椭蛻?hù)所需的文檔,有時(shí)還需要與客戶(hù)溝通回訪。
因此,該公司使用機(jī)器學(xué)習(xí)技術(shù)掃描了所有15億份文件,并仔細(xì)分析了第一批1.5億份文件,這些文件屬于200種最常用的文件。
Cooper公司的Sharma說(shuō),“現(xiàn)在我們有一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目,它帶來(lái)了價(jià)值,并且現(xiàn)在正在實(shí)施中。”
當(dāng)企業(yè)重返以前問(wèn)題纏身的人工智能客戶(hù)服務(wù)項(xiàng)目時(shí),除了加快客戶(hù)服務(wù)呼叫的速度,文檔分析還幫助創(chuàng)建一個(gè)更好的語(yǔ)言字典,供將來(lái)使用。
文化挑戰(zhàn)
除了數(shù)據(jù)外,組織問(wèn)題對(duì)人工智能的成功提出了重大挑戰(zhàn)。
Sharma說(shuō),如果回到過(guò)去,他最初會(huì)專(zhuān)注于客戶(hù)在詳細(xì)解決問(wèn)題時(shí)使用的語(yǔ)言,并讓主題專(zhuān)家與人工智能開(kāi)發(fā)人員配合工作。
Sharma說(shuō),“必須讓客戶(hù)與我們的技術(shù)團(tuán)隊(duì)一起合作,這樣的場(chǎng)景始終是最重要的,你必須讓他們一起共事,并使其成為一份全職工作。”
除非企業(yè)能從這些錯(cuò)誤中吸取教訓(xùn),否則實(shí)現(xiàn)人工智能承諾的機(jī)會(huì)可能會(huì)減少,因?yàn)槭〉娜斯ぶ悄茼?xiàng)目可能會(huì)讓投資團(tuán)隊(duì)不再提供融資,并可能對(duì)員工和客戶(hù)滿(mǎn)意度產(chǎn)生負(fù)面影響。
Stiller說(shuō),“圍繞人工智能的早期失敗項(xiàng)目可能讓執(zhí)行團(tuán)隊(duì)放棄在這個(gè)領(lǐng)域的重大投資。這可能會(huì)導(dǎo)致企業(yè)落后于競(jìng)爭(zhēng)對(duì)手。”
這一切都從企業(yè)管理層開(kāi)始。正如德勤公司的調(diào)查顯示,企業(yè)高層對(duì)于人工智能項(xiàng)目的支持至關(guān)重要。Stiller說(shuō),“如果企業(yè)首席執(zhí)行官提供支持,那么其業(yè)務(wù)目標(biāo)的成功率可能會(huì)超過(guò)77%。”
因此,不要讓挫折破壞企業(yè)對(duì)人工智能的組織承諾,因?yàn)槿斯ぶ悄艿拈L(zhǎng)期方法會(huì)得到回報(bào),他說(shuō),“隨著時(shí)間的推移,企業(yè)實(shí)施的項(xiàng)目越多,投資回報(bào)率就會(huì)越高。”