人工智能的盡頭是人工?
上個月出門,發(fā)現(xiàn)十字路口的交警和輔警人數(shù)明顯增加了。我不禁有些詫異,近十年來,人工智能最成功和最有效的落地成果不就是安防和交通相關應用嗎,而十字路口往往都是視頻監(jiān)控最密集的地方?既然如此,為什么還需要那么多警力呢?
除了定期上街執(zhí)勤需要外,一個深層次的原因是,人工智能并不能百分之百包打天下。更極端情況下,人工智能的盡頭可能是人工。
--何出此言呢?其一原因是人工智能算法的評價準則。這里談論兩個指標,漏檢率和誤報率。第一個指標,漏檢率是指本應發(fā)現(xiàn)卻未被算法發(fā)現(xiàn)的問題,俗稱假陰性。
以交通違章為例,假陰性或漏檢率意味著并非所有違章現(xiàn)象都能被有效發(fā)現(xiàn)。在監(jiān)控探頭日益普及的今天,多數(shù)違章都已經(jīng)能通過人工智能算法檢測到。如早期研發(fā)的闖紅燈、高速公路超速、占用高速應急車道等,中期研發(fā)的基于云臺監(jiān)控攝像機的三分鐘路邊違停、車牌遮擋等,和近年來的實線變道、市內(nèi)禁鳴區(qū)域鳴笛等。然而,隨著駕駛員的交通安全意識的提高,這些易于監(jiān)控的違章現(xiàn)象正變得越來越少。以至于可以推測,在未來針對這類違章的監(jiān)控可能會較難被觸發(fā),甚至形同虛設。那么,交管部門和相關研發(fā)的公司就必須深化監(jiān)控系統(tǒng)的研究,將重心推向識別更為復雜的交通違章行為。比如惡劣天氣或低照度情況下的低分辨車牌識別、非機動車的違章行為。然而,這些復雜的交通違章并不見得能通過人工智能算法獲得很低的漏檢率,甚至可能無法形成應用級的實際監(jiān)控系統(tǒng)。如非機動車闖紅燈行為、以及在禁行區(qū)域行駛。盡管目前這一塊的智能監(jiān)控已經(jīng)開始試點,但當非機沒有車牌以及駕駛者戴著口罩時,算法很難自動給出確定的結(jié)論。此時,就只有依賴人工現(xiàn)場截停和處罰了。
而第二個指標,誤報率則是指不應被檢測出來、卻被錯誤辨識成真的“假問題”,俗稱假陽性。
仍以交通違章為例,假陽性高意味著會報到過多的假違章現(xiàn)象。如在高速公路上,一輛車被檢測出超速了,但實際上真車并未出現(xiàn)在該路段,結(jié)果車主收到了一張不屬于自己的罰單。再比如將公共汽車車身上的廣告人物錯判成違章的行人。這些都是假陽性。誤報率高或假陽性高,往往會導致后期人工介入工作量的增加。
除交通違章外,漏檢率和誤報率引發(fā)的問題,在很多領域的應用中都可以見到。如在醫(yī)療方面,新冠病人的漏檢有可能會造成不必要的病毒傳播,而健康人誤報為癌癥會導致人的心理狀態(tài)失。如在短視頻檢查上,疑似漏檢的違規(guī)短視頻必須通過人工審查來杜絕其傳播后造成的危害。誤報的也需要通過人工來決定是否可以放行。
近年來,大量人工智能技術的落地,表明相關應用的誤報率和漏檢率問題已經(jīng)有了顯著的改善。但需要指出的是,一旦容易實現(xiàn)的應用都完成落地或產(chǎn)品化了,剩下的可能都是難啃的硬骨頭。這些硬骨頭的潛在應用里,依賴現(xiàn)有的人工智能技術,兩個指標可能很難得到明顯的改善。它也就意味著,人工處理仍然會是這些應用需要依賴的主要手段。
事實上,漏檢率和誤報率這兩個簡單的指標,只是影響人工智能全面替代人工,以及導致人工智能最終需要依賴甚至讓位于人工的一個小因素。
其原因在于,這兩個指標主要與預測任務的性能相關。而人類智能中除了預測,還有與可解釋性和其它與預測無密切關聯(lián)的智能活動。如學生們刷題后形成的對新題的快速判斷,那是可以不經(jīng)過常規(guī)解題思路直接找到答案的快速途徑。從某種意義上來說,這是擺脫了原有學習模型后形成的一種“跳”連接,或者直覺。這種直覺,目前還無法通過數(shù)學建模方式來表示,仍然需要靠人自己的持續(xù)學習來獲得。情感也是如此,盡管我們在構(gòu)建人工智能算法中可以機械性地將情感分類并進行預測,然而這樣獲得的情感只能讓機器人更為機械化,卻無法向共情邁出質(zhì)變的一步。
即使是預測,我們也受限于對自然界的理解,而不能對人工智能技術抱以過高的期望。如氣象預報中局部地區(qū)的降雨預測,會因為對大尺度臺風的數(shù)據(jù)收集不完全而出現(xiàn)失誤。不僅是空間尺度上存在局限性,時間尺度亦如此。如氣候的變化有可能是幾十年為周期的,那么單靠十來年的數(shù)據(jù)進行氣候意義上的分析顯然是不準確的。事實上,我們在一些應用中還面臨著數(shù)據(jù)的稀少問題。如局地冰雹的預測會因為數(shù)據(jù)極其稀少、且在雷達回波上無法與大降雨云層區(qū)分開,而導致判斷失效。
我們也不能過份相信機器的預測能力。如在自動控制方面,過份相信機器的判斷,可能會導致極其危險的后果。如2019年3月埃航737 MAX8的空難,就是過份相信機器的自動駕駛,以至于駕駛員后來無法接管引發(fā)的悲劇。
能列舉的人工智能短板還有很多,我就不一一枚舉了。在這里,我更想表達的是,目前人工智能技術的落地主要是在預測能力能達到應用級的應用上,算是在享用這些應用的能有的紅利。一旦人工智能在應用層的紅利消失,剩下的可能就得靠人力了。那么自然的問題是,人工智能的紅利,在各種相關的應用上還能持續(xù)多久? 人工智能的盡頭會是人工嗎? 還是必然會走向人機混合呢?