10月29日,未來論壇八——計算機科學人工智能在北京舉行。美國斯坦福大學計算機科學系終身教授、人工智能實驗室主任、谷歌云人工智能和機器學習首席科學家、未來科學大獎科學委員李飛飛和加州大學伯克利分校計算機系教授Dawn SONG分別發(fā)表了主題演講。此外,針對科技和產(chǎn)業(yè)的結(jié)合,該論壇還邀請了學術(shù)界和工業(yè)界的六位嘉賓進行了深入探討。
據(jù)了解,AI論文發(fā)表中,有43%都是中國作者,根據(jù)高盛調(diào)研出來的數(shù)據(jù),中國在AI論文發(fā)表的數(shù)量超過美國。在風險投資領(lǐng)域,斯坦福于2015年的研究表明,從1979年開始,美國主要資本市場這些公司的市值57%是VC推動的,這些公司雇傭了大概38%的美國資本市場的勞動力,反過來這些公司成為大公司之后,又投入82%的科研經(jīng)費,今天所有這些大公司投入的這些資金,最早的一股溪水是來自VC行業(yè)。可見,AI在中國已經(jīng)掀起新一輪的高潮。
視覺技術(shù)是重要基石
視覺作為最重要的一種感觀方法和認知方法,幫助人和動物在世界當中生存下來進行溝通。人類視覺系統(tǒng)在五億年前就不斷進化和發(fā)展,也是我們大腦當中最為復(fù)雜的系統(tǒng),而且大腦中有50%的認知單位都有最為復(fù)雜和最為高級的感知系統(tǒng)。可見,視覺系統(tǒng)是非常了不起的。同樣,對于機器智能而言,視覺也是非常重要的基石。計算機科學家希望解決最為基本的問題是圖像識別問題,進過8年的發(fā)展,圖像識別錯誤率降低了10倍。
然而,圖像位置以及物體之間的關(guān)系信息是比較有限的。李飛飛表示其所在的實驗室根據(jù)深度學習,以及視覺化語言模式來預(yù)測和了解不同物體之間的關(guān)系。通過不同的標簽來對物體進行描述,然后通過圖譜建立物體間的聯(lián)系。然后,在數(shù)據(jù)庫中將非常長的描述性段落與圖像對比,其結(jié)果遠超今天的圖像搜索技術(shù)結(jié)果。李飛飛說:“另一個概念LSTM希望在語言之間建立聯(lián)系,實現(xiàn)對圖像場景的描述,這也是我們今年所做的工作。”