日韩精品国产欧美在线_嫖娼微胖老熟妇无码在线观看_不打码的成年影片免费看_免费在线欧美性爱链接_免费精品亚洲少妇视频网站_痴汉电车中文字幕_免费乱码人妻系列有码专区_日本人妻中文字幕久久一区_亚洲欧美清纯校园另类_黄色视频毛片免费

展開

阿法狗來炒股 人腦算得過機器人

      對于人工智能阿法狗,金融圈恐慌不是一兩天了。如果用阿法狗來炒股,新一代的“股神”非其莫屬!
??
??最新一代的AlphaGo Zero(阿爾法元)已經(jīng)根本不用學習幾千幾萬盤人類的棋局,而是摸清掌握了圍棋規(guī)則,它用升級版的自己和原來的自己對壘,并以100:0的成績擊敗了阿爾法狗。
??
??在人工智能的快速發(fā)展引發(fā)世界一片驚嘆之時,近日美國新出了一支交易所交易基金,由機器人挑選股票,而且到目前為止人類都不是它的對手。
??
??全球首只機器人選股ETF誕生
??
??10月18日,EquBot LLC、ETF Managers Group共同推出了全球第一只應用人工智能、機器學習進行投資的ETF:AI Powered Equity ETF(AIEQ.US)。
??
??雖然10月18日才開始交易,這支代碼為AIEQ的人工智能選股ETF卻已經(jīng)發(fā)掘出了一些大熱的股票。該基金在ibm的Watson平臺上運行自營的量化模型。
??
??數(shù)據(jù)顯示,自10月18日啟動以來,該ETF已經(jīng)提供了0.83%的回報率,而同期標普500指數(shù)上漲0.48%,納斯達克綜合指數(shù)漲幅為-0.42%。
??
??數(shù)據(jù)來源:東方財富網(wǎng)
??
??據(jù)悉,AIEQ的根本技術就是持續(xù)不斷的分析美國掛牌股票,并且每天處理大約100萬則的企業(yè)公告、季度財報以及新聞等。EquBot LLC執(zhí)行長Chida Khatua指出,EquBot AI科技與Watson的攜手合作等同打造出一支全天24小時、365天全年無休的股票研究分析團隊。
??
??這一基金推出之際,先進技術和大數(shù)據(jù)組成的洶涌大潮正以一浪高過一浪的勢頭沖向華爾街。
??
??一些大型對沖基金都紛紛開始用人工智能取代基金經(jīng)理,讓它們來協(xié)助分析師研究業(yè)績報告和推薦股票。
??
??摩根大通利用AI開發(fā)了一款金融合同解析軟件。原先律師和貸款人員每年需要360000小時才能完成的工作,這款軟件只需幾秒就能完成。而且錯誤率大大降低,還可以24小時工作。
??
??高盛的交易大廳更是縮影。2000年高盛在紐約總部的美國現(xiàn)金股票交易柜臺雇傭了600名交易員,今天只剩下兩名交易員。減少交易員的數(shù)量能幫助公司節(jié)省大量成本。截止去年9月,高盛已裁員超400人,主要是證券部門的交易員及銷售人員。
??
??德國商業(yè)銀行,到 2020年他們將會將銀行中 80%的工作都數(shù)碼化、自動化,最終將會裁掉9600名員工。
??
??荷蘭的ING銀行,宣布一個可以讓他們在未來省下近9億歐元的“數(shù)碼轉換”計劃:先砍掉5800名員工,占員工總數(shù)13%;未來再視情況讓另外1200名員工轉職或是裁掉。
??
??瑞銀集團8年前的交易大廳何其壯觀,但現(xiàn)在交易大廳成了空蕩蕩的。
??
??人工智能技術在金融交易領域最顯而易見的體現(xiàn)就是量化投資。目前,AI在全球對沖基金行業(yè)的運用已相對成熟,在中國,從業(yè)績透明的公募量化產(chǎn)品來看,量化產(chǎn)品的業(yè)績已普遍跑贏指數(shù)收益。
??
??據(jù)調研公司LCH在今年初出具的調研報告,美國業(yè)績排前20的對沖基金,包括橋水基金、索羅斯基金,全部采用計算機根據(jù)算法自動交易。
??
??或許最終會有這一天,股市在幾十只或幾百只“炒股阿爾法狗”之間進行,而交易員成為歷史。
??
??金融數(shù)據(jù)服務商Kensho創(chuàng)始人預計,到2026年,有33%-50%的金融業(yè)工作人員會失去工作。Kensho開發(fā)的程序分析工作只需一分鐘,而拿著高達35萬美元年薪的分析師們,需要40小時才能完成,而且質量還不一定比機器高。
??
??不過,也有金融從業(yè)人員在雪球上撰文指出,假設機器人炒股比例將大規(guī)模增加,人工智能是否會讓市場更理性也是一個問號。
??
??盡管人有情緒,可能放大市場危機,但是人工智能是否會因為比如技術分析判斷的趨同,導致某個時間節(jié)點,所有智能炒股策略都理性的往一個方向交易,讓市場更動蕩呢?
??
??有一天,人工智能不但交易起來得心應手,而且自我學習能力已經(jīng)很強,可以自己調整些投資策略。那么很可能就是大量基金公司都是玩人工智能,但是問題來了,大家都人工智能化了,都賺錢嗎?
??
??顯然不是,市場又將是各類人工智能技術和投資策略的競爭,說白了,很可能有回到如今主動性管理基金的狀態(tài),人工智能也分三六九等,很可能今年這款人工智能技術大賺,明年又大虧,投資者還是感覺沒譜。
??
??助手還是取代者?
??
??人工智能在金融領域到底是助手還是取代者?
??
??對此,渣打銀行中國財富管理部董事總經(jīng)理梁大偉近期對第一財經(jīng)記者表示,在深度學習方面,通過大數(shù)據(jù)、人工智能去做信息整合和分析的時候,這些人工智能和大數(shù)據(jù)在我們做出投資決定和資產(chǎn)配置方面,確實省去很多的時間,而且更精準。
??
??但人工智能只是幫助投資顧問投資的技術助手,并不能完全取代他們的工作。
??
??渣打銀行梁大偉:
??
??智能投顧并不會完全取代投資顧問,例如,去年8月渣打推出了國內外資行首個手機交易平臺,在手機平臺上就可以直接給投資者提出建議,并且附上詳細的介紹。
??
??但是,依然有超過90%的客戶在做出投資決定之前,與自己的客戶經(jīng)理或者投資顧問進行溝通,投資顧問都會根據(jù)實際情況給予相應理財建議以及調整資產(chǎn)配置。而智能投顧技術則實現(xiàn)投顧業(yè)務流暢化、財富管理數(shù)字化、跟蹤資產(chǎn)組合表現(xiàn)等功能,以輔助投顧更好服務于客戶。
??
??至于中國是否會出現(xiàn)人工智能機器人選股的情況,梁大偉認為,機構在發(fā)展智能投顧的時候,很容易把海外的經(jīng)驗搬到境內作為參考,但問題是,在海外,在美國,他們智能投顧大部分都是通過公募基金或者ETF進行資產(chǎn)配置,他們的ETF幾乎可以覆蓋所有的大類資產(chǎn)。但是在中國境內,不管是市場的廣度還是深度,都跟美國市場有很大差異。
??
??目前,中國的人工智能發(fā)展已經(jīng)進入了世界前列,擁有的三大優(yōu)勢主要體現(xiàn)在,人才、技術和基礎設施方面,但相比于美國等發(fā)達國家和經(jīng)濟體仍然存在差距。
??
??博時基金基金經(jīng)理桂征輝也提出,目前,中國的人工智能大數(shù)據(jù)在金融投資領域的確有了初步的成果,但這些成果還需要時間的檢驗,尤其是在商業(yè)模式、與傳統(tǒng)企業(yè)機構合作方式以及監(jiān)管方式等方面,還處于摸索階段。
??
??砸了40%的行業(yè)的飯碗 卻讓這些人身價跳漲!
??
??雖然這一切還只是開始,但由于科技的進步,我們身邊的業(yè)態(tài)已經(jīng)發(fā)生變化。
??
??以下這些是正在發(fā)生的事情:
??
??阿里巴巴推出無人超市,刷臉進店結算,拿了商品就可以出門,智能化的操作已經(jīng)在搶超市收銀員的飯碗;
??
??京東全球首個全流程無人倉建成,效率是人工的4-5倍,未來還要推出無人快遞,未來快遞員、司機又將失業(yè);
??
??富士康生產(chǎn)線已部署4萬臺機器人,穩(wěn)步推進“百萬機器人”計劃,機器人正逐步替代流水線工人;
??
??今年8月九寨溝地震發(fā)生的18分鐘后,中國地震臺網(wǎng)的機器,寫了篇新聞稿,用時25秒;今日頭條上,一個名叫小明的機器人截至今年5月已完成5139篇體育類報道,總閱讀超1800萬;
??
??摩根大通開發(fā)了一款金融合同解析軟件COIN。原先律師和貸款人員每年需要360000小時才能完成的工作,COIN只需幾秒就能完成。
??
??你沒看錯,讓流水線工人、收銀員、倉庫管理員、快遞員、司機、新聞記者、交易員、會計師……讓這些職業(yè)者丟掉飯碗的正是人工智能AI。
??
??人工智能正以睥睨世界的心態(tài),幾乎滲入肌理地威脅著傳統(tǒng)行業(yè),但同時,卻使這些行業(yè)的身價水漲船高。
??
??近日,一份2018屆互聯(lián)網(wǎng)校招高薪清單在網(wǎng)絡流傳,其中互聯(lián)網(wǎng)企業(yè)技術類崗位的年薪水平令人咋舌!人工智能帶火了研究深度學習、機器學習、人工智能等崗位,其應屆畢業(yè)生薪資,據(jù)說年薪25萬只是白菜價 ,30萬的年薪已是常態(tài)。
??
??由于人工智能、深度學習等領域存在較大的人才缺口,包括谷歌中國、微軟、google、騰訊、大疆、百度等互聯(lián)網(wǎng)科技企業(yè),為應屆畢業(yè)生開出了許多人奮斗四五年都達不到的年薪。
??
??在國內,谷歌中國智能崗位招收的畢業(yè)生年薪最高,達56萬元人民;其次是微軟的算法工程師崗位,年薪51萬;第三是谷歌的算法工程師崗位,年薪50萬。其實,這還不算什么。更可怕的是在美國硅谷,據(jù)李開復透露,做深度學習的人工智能博士生,現(xiàn)在一畢業(yè)就能拿到年薪200萬到300萬美元,合計1300萬到1950萬人民幣的錄用通知!
??
??由此可見,人工智能人才需求在世界范圍內,有多么的供需不平衡。
??
??此前國務院近期印發(fā)的《新一代人工智能發(fā)展規(guī)劃》指出:高等院校在加強專業(yè)建設之外,還可通過校企聯(lián)合辦學的方式來培養(yǎng)人工智能人才,豐富人工智能教育的形式,并推動人工智能教育加速發(fā)展。此外,人工智能還被寫入政府工作報告。
??
??毫無疑問,人工智能正在改變我們的生活,甚至有國外學者預測,十年之內,AI將變得足夠聰明,并消滅40%以上的職業(yè)。
??
??對此,人工智能所帶來的啟示是:要么變,要么被改變。無論業(yè)內人士,還是一般投資者,保持個人提高和調整總是應該主動去做的。
??
??從阿爾法狗元(AlphaGo Zero)的誕生看終極算法的可能性
??
??作者:杜圣東
??
??1923年,愛因斯坦在他的諾貝爾得獎感言中說到:“我欲探索一個統(tǒng)整理論的理智思維,是無法滿足于存在有兩個本質彼此完全獨立的領域之假設”。這句話有點拗口,主要意思是,愛因斯坦認為自然科學中“統(tǒng)一”的概念或許是一個最基本的法則。后來直到去世,愛因斯坦都在致力于尋求一種能將引力場與電磁場,相對論與量子論統(tǒng)一起來的統(tǒng)一場理論。后來霍金在《時間簡史》中也指出了大統(tǒng)一理論的可能性 ,他認為也許會發(fā)現(xiàn)大統(tǒng)一理論。雖然迄今為止統(tǒng)一場論都尚未得到發(fā)現(xiàn)驗證,但對常人的理解來講,通過一個簡單美妙的公式就能預測和描述宇宙萬事萬物,不異于天方夜譚。
??
??同樣,在人工智能領域,要真正實現(xiàn)專家們口中的超人工智能(SuperAI),也還有極漫長的路要走。有沒有一種終極算法,能讓人類一步到位設計出超人類的AI系統(tǒng)?這跟愛因斯坦提出的統(tǒng)一場論一樣,還面臨著理論與設計實現(xiàn)的巨大挑戰(zhàn)。
??
??今年LeCun(facebook AI實驗室負責人)曾說到:“絕大多數(shù)人類和動物的學習方式是非監(jiān)督學習。如果智能是個蛋糕,非監(jiān)督學習才是蛋糕主體,監(jiān)督學習只能說是蛋糕上的糖霜奶油,而強化學習只是蛋糕上點綴的櫻桃。
??
??現(xiàn)在我們知道如何制作“糖霜奶油”和上面的“櫻桃”, 但并不知道如何制作蛋糕主體。我們必須先解決關于非監(jiān)督學習的問題,才能開始考慮如何做出一個真正的AI。這還僅僅是我們所知的難題之一。更何況那些我們未知的難題呢?”正如LeCun所說,未來解碼人類學習方式的關鍵突破性技術,很可能會由無監(jiān)督學習來完成,因為無監(jiān)督才是人類和動物學習的關鍵模式,嬰幼兒通過少量有監(jiān)督學習訓練之后,在后續(xù)幾十年的成長過程中,能夠觀察并發(fā)現(xiàn)世界的內在結構和獲得經(jīng)驗知識,都是一種無監(jiān)督的自發(fā)主動的學習模式,而不是像小時候被父母告知每項事物的名稱和意義。
??
??要攻破無監(jiān)督學習這座AI堡壘,貌似在短期內不可能。但就在昨天,Nature發(fā)布了Deepmind關于阿爾法狗元(AlphaGoZero)的文章,在科技圈引起了不小轟動,貌似LeCun口中的“櫻桃”(強化學習)大放異彩,使得AI向無監(jiān)督自我學習進化又邁出了一大步。本文就來談談,要實現(xiàn)SuperAI和終極算法的可能性,兼論阿爾法狗元從0到1的重大意義,貌似開了一個好頭。
??
??阿爾法狗元(AlphaGo Zero)的橫空出世
??
??最近幾年,人工智能的研究和應用,從語音識別、圖像分類到基因組學和藥物發(fā)現(xiàn)等多個領域取得了快速進展。這得益于大數(shù)據(jù)和深度學習的有力支持。可以這么講,這波AI大躍進多是數(shù)據(jù)驅動的AI,沒有大數(shù)據(jù)的喂養(yǎng),沒有GPU算力的普及化,就沒有深度學習的成功。數(shù)據(jù)驅動的AI離不開大數(shù)據(jù),大數(shù)據(jù)與AI形成一種共生關系:
??
??一方面,AI基礎理論技術的發(fā)展為大數(shù)據(jù)機器學習和數(shù)據(jù)挖掘提供了更豐富的模型和算法,如深度網(wǎng)絡衍生出的一系列相關技術(深度學習、強化學習、遷移學習、對抗學習等)和方法;
??
??另一方面,大數(shù)據(jù)為AI的發(fā)展提供了新的動力和燃料,數(shù)據(jù)規(guī)模大了之后,傳統(tǒng)機器學習算法面臨巨大挑戰(zhàn),要做并行化、要加速、要改進。當前的弱AI應用都遵從這一技術路線,大數(shù)據(jù)、深度學習和GPU計算居功至偉。
??
??然而,這些利用了大量人力、物力資源和海量數(shù)據(jù)的AI系統(tǒng)。卻很難擴展到通用AI的程度,更不必說超AI了,比如ImageNet的上千萬張圖片訓練出的AI系統(tǒng),卻無法對醫(yī)療和自動駕駛領域產(chǎn)生同樣重大的作用。需要另起爐灶,重新花大量人力物力進行針對性的數(shù)據(jù)標注和AI系統(tǒng)建設。
??
??類似這些問題,對人類歷史經(jīng)驗數(shù)據(jù)太過依賴,而這種大數(shù)據(jù)知識成本昂貴,或不可靠,或根本無法使用。因此,Super AI的研究必須要能繞過大數(shù)據(jù),通過解碼人腦智能學習機理,才能創(chuàng)造出一種終極算法。而阿爾狗元的橫空出世,向我們展現(xiàn)了邁向這一目標的可能性。不需要上百萬盤歷史棋譜數(shù)據(jù),僅訓練3天(自己左右互搏490萬棋局),只需要4片TPU就戰(zhàn)勝了舊版AlphaGo 系統(tǒng),而比分是100:0;舊版阿爾法狗采用了48片TPU,需要花幾個月學習幾千萬盤棋局才完全戰(zhàn)勝人類。以致于柯潔面對新版的阿爾法狗元,發(fā)表了如下無力吐槽。
??
??阿爾法狗元的智能解碼
??
??阿爾狗元為什么能在如此短的時間,有如此驚人的進步?下面我們來分析下新版阿爾法狗元的智能“級數(shù)”。關于智能,古今中外許多哲學家、腦科學家都一直在努力探索和研究,但至今仍然沒有完全了解,可以說理解甚少。所以有,智能的發(fā)生與物質的本質、宇宙的起源、生命的本質一起被列為自然界四大奧秘。隨著腦科學、神經(jīng)心理學等研究的進展,我們對人腦的結構和功能有了初步認識,但對整個神經(jīng)系統(tǒng)的內部結構和作用機制,特別是大腦的功能原理卻知之甚少。在這樣一個大背景下,深度學習的階段性成功,可謂是誤打誤撞。深度學習也被很多專家稱為類腦學習,其實不夠嚴謹,最多算是類人腦視覺皮層學習,簡單的神經(jīng)元連接結構離完全模擬人腦還差十萬八千里。但換個角度看,才入門就有了奇效?解碼人腦的學習記憶機制才能設計出終極算法么?這個答案仁者見仁智者見智,且看后文分解。
??
??舊版AlphaGo采用的核心技術是基于深度學習+強化學習+蒙特卡洛樹決策的組合式學習方法,也可以說是學習框架,其已經(jīng)摸到了類腦學習的大門,其學習下棋分為三個階段:
??
??(1)通過對歷史棋譜的深度學習完成策略網(wǎng)絡的構建,采用深度學習技術訓練一種有監(jiān)督學習型走棋策略網(wǎng)絡,類似于我們的觀察學習獲得的第一反應。
??
??(2)通過自我對戰(zhàn)強化學習來提高博弈水平,采用強化學習技術來優(yōu)化先前的走棋策略網(wǎng)絡,通過自我博弈的強化學習迭代結果,來提升前面的策略網(wǎng)絡。即與之前的“自己”不間斷訓練以提高下棋的水平,這個過程有點類似于人類的鞏固學習和理解貫通階段。
??
??(3)通過深度回歸學習構建估值網(wǎng)絡,用來預測自我博弈強化學習數(shù)據(jù)集里局面的預期結果,即預測那個策略網(wǎng)絡的局面會成為贏家。結合蒙特卡洛樹(MCTS)搜索壓縮搜索空間,降低了搜索時間復雜度, MCTS決策有效結合了策略網(wǎng)絡和估值網(wǎng)絡,類似于人類的判斷決策過程。
??
??而新版的AlphaGo Zero做了較大改進,一是跳過了第一個階段,完全拋棄了歷史棋譜的學習,訓練學習從無到有;二是改進了原強化學習的形式,只使用一個神經(jīng)網(wǎng)絡而不是兩個神經(jīng)網(wǎng)絡,通過將這個神經(jīng)網(wǎng)絡與MCTS搜索算法相結合,通過左右互搏自娛自樂,按設定的走棋規(guī)則隨機開始圍棋小白式的學習,靠激勵、懲罰的強化學習機制來糾正學習過程中的錯誤,調整提升學習能力。這種機制已經(jīng)很接近完全無監(jiān)督學習,擺脫了對人類標注數(shù)據(jù)的依賴(歷史棋譜)。這也是為什么阿爾法狗元能以100:0戰(zhàn)勝舊版阿爾法狗的原因,只靠模仿和師傅教是很難在較短時間內超越師傅的,而周伯通能成為武林頂尖高手,就是因為他的武功只靠原創(chuàng)從不模仿。
??
??DeepMind AlphaGo項目首席研究員大衛(wèi).西爾弗(David Silver,左)與CEO德米斯.哈比斯(Demis Hassabis)
??
??有點扯遠了?;氐秸},對于阿爾法狗元,我們先提兩個問題:
??
??(1)阿爾法狗元既然能有如此進步,為什么創(chuàng)始人在原來沒有想到?
??
??(2)阿爾法狗元還有一個梗,使其還有較大的智能瓶頸,這個瓶頸是什么?
??
??第一個問題很好理解,阿爾法狗的創(chuàng)始人哈比斯(如上圖)從小就是圍棋迷,圍棋迷是很難說跳出圍棋看圍棋的,所以他設計的系統(tǒng)首先是對歷史棋譜進行有監(jiān)督訓練學習,通過吸收人類棋譜數(shù)據(jù)中的經(jīng)驗學習下棋,觀看數(shù)千場比賽,并被告知人類專家在某些位置上的特定動作,這也是一般人成為武林高手的必經(jīng)之路。而David Silver提出的改進版AlphaGo Zero使用了一種新的強化學習形式,跳出圍棋歷史經(jīng)驗來下棋,在這一過程中,全靠自學。采用一個對圍棋一無所知的神經(jīng)網(wǎng)絡,它會與自己進行數(shù)千場對弈。它所走的每一步棋就是把這個神經(jīng)網(wǎng)絡與強大的搜索算法結合起來,然后用它來選擇下一個動作。在每場對弈結束后,AlphaGo Zero實際上都訓練了一個新的神經(jīng)網(wǎng)絡,這種無師自通的學習方式能加速學習能力的迭代,所以才有如此成績。
??
??針對第二個問題,顯然AlphaGo Zero這種不參考專業(yè)數(shù)據(jù)和歷史經(jīng)驗的學習方式,消除了人類學習依靠歷史經(jīng)驗和知識的局限性,未來即使是弱AI,形勢一定比人強,理論上講,任何可以明確定義規(guī)則和設定目標的問題或工作都能被AI取代,唯一的瓶頸就是這個規(guī)則,如何有效地定義規(guī)則和目標?圍棋的走法貌似隨意但卻有通用規(guī)則,棋盤格局對于殘差卷積模塊來講也很友好,其實這個改進思想跟采用GAN自我對戰(zhàn)打游戲是類似的(OpenAI已經(jīng)開發(fā)出了一款AI,可以在沒有任何人工輸入的情況下,自學如何玩電腦游戲)。我們看不管是下棋還是玩游戲,都有容易形式化的規(guī)則,而人類的大部分工作,特別是在數(shù)字化、信息化的大背景下,未來被AI替代很可能是分分鐘的事情,如翻譯、交易、駕駛、會計、審計等等。但對需要多方博弈決策方面的事務來講,這種級別的AI還是無能為力的,當然也還談不上類腦智能。
??
??終極算法:統(tǒng)一場論的AI版
??
??要實現(xiàn)真正的AI,是否需要一種終極算法?在筆者看來,愛因斯坦的統(tǒng)一場論是為了解碼宇宙客觀事物運行的本質規(guī)律;而終極算法就是為了解碼人類智能的本體、本源和統(tǒng)一機理??恳幌盗忻嫦蛱囟ㄈ蝿盏乃惴ê妄嫶笞酉到y(tǒng)進行組合形成的智能體,當然可以在一定程度上具有智能,但要達到通用AI、超AI的水平,個人認為這條路不可行。首先我們看下傳統(tǒng)算法、機器學習算法和終極算法三者的區(qū)別:
??
??(1)傳統(tǒng)算法:將數(shù)據(jù)輸入到計算機,計算機利用設計好的算法來進行計算處理,最終輸出需要的結果,比如金融自動交易,需要設計算法實現(xiàn)交易公式、規(guī)則的計算,輸入數(shù)據(jù)按照設計好的規(guī)則進行計算處理和結果輸出;
??
??(2)機器學習:機器學習算法不需要通過編程設定計算規(guī)則,而是把數(shù)據(jù)直接輸入到模型中(包括輸入數(shù)據(jù)和標簽輸出數(shù)據(jù)),模型經(jīng)過訓練獲得預測優(yōu)化的參數(shù),最終構建好具有一定預測能力和穩(wěn)定性的機器學習模型;
??
??(3)終極算法:終極算法的一個前提假設是,所有知識,無論是過去、現(xiàn)在還是未來的,都有可能通過單個通用學習算法來從數(shù)據(jù)或環(huán)境中獲得,這種算法稱為終極算法。機器學習算法的首要任務是區(qū)別可以預測的事與不可預測的事。終極算法的目標則是學習一切能夠認知的東西,在機器學習中,復雜性存在于數(shù)據(jù)中,而終極算法要做的就是通過擬合數(shù)據(jù)或拋開數(shù)據(jù)和環(huán)境交互來消化理解這種復雜性。
??
??幾十年來,機器學習算法研究的五大門派(如上圖)一直以來都在彼此爭奪主導權。
??
??(1)符號派:使用符號、規(guī)則和邏輯來表征知識和進行邏輯推理,最喜歡的算法是:規(guī)則和決策樹。
??
??(2)貝葉斯派:獲取發(fā)生的可能性來進行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫。
??
??(3)進化派:生成變化,然后為特定目標獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法。
??
??(4)類推派:根據(jù)約束條件來優(yōu)化函數(shù)(盡可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機。
??
??(5)聯(lián)結派:使用概率矩陣和加權神經(jīng)元來動態(tài)地識別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡。
??
??上述傳統(tǒng)算法和各大門派的機器學習算法需要人類知識、規(guī)則、經(jīng)驗和數(shù)據(jù)的支持,是一種歸納和演繹學習的范疇,這種學習受限于數(shù)據(jù)本身,即使是大數(shù)據(jù)也不能全樣本覆蓋,而且包含各種噪音、錯誤或有偏見的數(shù)據(jù),這樣使得學習出來的模型也很難是最優(yōu)的。而終極算法要能進行自我創(chuàng)造和學習,根據(jù)學習目標去自我創(chuàng)造樣本、自我學習來加深對事物的理解從而獲得學習能力,這才是真正的智能。能否實現(xiàn)終極算法,怎么實現(xiàn)終極算法,下面從阿爾狗元的強化學習、人類大腦新皮層的學習機理和深度學習網(wǎng)絡三個方面的融合來進行探討分析。
??
??終極算法的可能性?類腦學習的啟示
??
??人腦由一千多億個神經(jīng)細胞(神經(jīng)元)交織在一起的網(wǎng)狀結構組成,其中大腦皮層約140億個神經(jīng)元,小腦皮層約1000億個神經(jīng)元。神經(jīng)元約有1000種類型,每個神經(jīng)元大約與100個其他神經(jīng)元相連接,形成極為錯綜復雜而又靈活多變的神經(jīng)網(wǎng)絡。人的智能行為就是由如此高度復雜的組織產(chǎn)生的。浩瀚的宇宙中,也許只有包含數(shù)千憶顆星球的銀河系的復雜性能夠與大腦相比。很多學科的研究人員試著從不同角度解碼人腦的智能,人工智能從一開始就試圖模擬、延伸和擴展人類智能,但迄今為止大部分AI研究成果還僅僅只能從行為上模擬部分智能。如何從更深入的機制上探索智能的本質及其計算實現(xiàn)的機理,是神經(jīng)計算與類腦學習面臨的主要挑戰(zhàn)。對未來終極算法的設計實現(xiàn),筆者認為有三種重要的類腦學習方法,也許能給我們一些啟示。
??
??(1)大腦新皮層
??
??Jeff Hawkins在其2004年出版的著作《On Intelligence》中,提出了一種大腦皮層運作的記憶-預測框架。闡述了大腦皮層框架運作的核心原理,提出了一種新皮層的理論,用以建立一種基于空間-時間記憶流模式的智能預測架構,而且設計實現(xiàn)了分層皮質學習算法(HTM)。Jeff Hawkins的大腦皮層理論框架與算法,目標很宏大,直指人類學習的終極算法。其中有幾個主要理論值得與大家分享:
??
??a.“大腦新皮層是一個分層的架構。在分層中的每一層或者區(qū)域,又是由密集包裹著的細胞組成的多個層。當感知信息到達大腦新皮層時,它穿過了分層架構中的各個層。在這些區(qū)域的細胞變得活躍,逐步對輸入進行抽象,得到不變的特征。然而,在架構的最底層的細胞對輸入的簡單的特征做出了最優(yōu)的反應,離架構頂層最近的細胞則對高層次的概念做出反映,比如對外表、語言、動作等。”——這跟當前深度網(wǎng)絡的逐層學習思想是一致的。
??
??b.“令人吃驚的是,在大腦新皮層中的區(qū)域,無論它們駐扎在什么地方,無論它們處理什么類型的感知信息,它們幾乎都相同的結構。視覺區(qū)域類似于聽覺區(qū)域,也類似于語言區(qū)域。大腦新皮層完全使用了通用的機制。通過了解這些機制,我們能夠模擬它們,并將它們應用運用到學習、推理、預測等多種問題中。盡管基于HTM理論還無法捕捉到大腦新皮層完整的復雜結構及學習機制,但是它已經(jīng)足夠強大到來解決一些困難且有商業(yè)價值的問題了?!薄@點也許能解釋為什么深度學習能如此有效?
??
??c.“HTM是一個記憶系統(tǒng),隨著時間變化,它通過給它的感知數(shù)據(jù)來學習它的世界,并從數(shù)據(jù)中抽象出高層的概念。抽象允許HTM網(wǎng)絡來進行一般化(generalize),并對于傳統(tǒng)計算機編程處理的嚴格規(guī)則提供靈活性和效率。例如,在不完整或是模糊不清的數(shù)據(jù)呈現(xiàn)中,模式能夠被學習并識別出來。通過組合模式學列的記憶與當前的輸入,HTM網(wǎng)絡能夠預測下一步可能發(fā)生什么。反過來,這種預測能夠使用在從猜測可能的結果到檢測欺詐等一系列的認知活動中?!薄@點出了深度學習未來的潛力,特別是跟記憶的融合。
??
??可以看出Jeff Hawkins在13年前就提出的大腦新皮層理論框架,與當今大火的深度學習有著異曲同工之妙。不過在具體算法實現(xiàn)上與深度網(wǎng)絡有較大差異,不過整套理論的核心思想就是要實現(xiàn)解碼智能的終極算法,潛力如何還有待觀察。
??
??(2)深度學習與強化學習
??
??深度學習專家們講得比較多,我就不贅述了。值得一提的是,深度學習的類腦模擬研究還很初級,神經(jīng)計算和深度學習的交叉融合其實還遠沒有開始。深度學習的加層機制來源于對人類大腦視覺分層處理的理解,而原人工神經(jīng)網(wǎng)絡也只是很初級的模擬了人腦神經(jīng)元的連接和激活。人腦實現(xiàn)學習、記憶、推理、情感等能力的生化神經(jīng)網(wǎng)絡運行原理我們根本都還知之甚少,但是,深度學習加減層、加減神經(jīng)元、加減鏈接、跨層跨連接等這些簡單的網(wǎng)絡構建方法卻是跟人腦的運行機制有類似的地方,幼兒到成人神經(jīng)元數(shù)量在增加、學習和記憶能力提升是神經(jīng)元之間鏈接的建立和加強,而能力衰退也對應于神經(jīng)元鏈接的斷裂等等…
??
??可以說,深度學習在借鑒大腦神經(jīng)網(wǎng)絡原理和人類認知過程方面,也許還沒入門,還有很多問題需要深入挖掘和拓展。比如讓Deepmind情有獨鐘的強化學習,與深度學習強強聯(lián)合之后,在很多智能研究中大放異彩。強化學習的主要目的是幫助模型形成從環(huán)境到行為映射的學習,這種學習方法不是告訴系統(tǒng)如何產(chǎn)生正確的動作,而是通過評價產(chǎn)生動作的好壞來不斷迭代改進學習能力,從而找到問題的最優(yōu)解。而且強化學習在一定程度上能解決深度學習嚴重依賴大數(shù)據(jù)的問題。
??
??總之,未來終極算法的誕生,可能是多種學習方式的深度交叉融合,機器的情感、記憶推理等高級智能,將會由基于深度特征學習和加裝存儲記憶、推理模塊的遷移學習、強化學習、對抗學習等各種學習方式的交叉融合而實現(xiàn),未來的機器學習方式可能遠不只這幾種,其本質都是在模仿人類的學習方式。遷移學習代表了我們的進化過程,學習的舉一反三、觸類旁通,強化學習、對抗學習類似周伯通左右互搏、無師自通等,以深度學習思想為主線的算法和框架技術棧將極大地拓展五大機器學習門派的功力。
??
??展望
??
??嚴格來講,傳統(tǒng)規(guī)則式AI系統(tǒng)還稱不上智能,而現(xiàn)在的深度學習也只是大數(shù)據(jù)驅動的初級智能。以前我提過一個問題,未來有沒有非數(shù)據(jù)驅動的終極智能?換句話說,如果沒有大數(shù)據(jù),除了專家系統(tǒng)和規(guī)則式AI,人工智能要通用化,要達到SuperAI的水平,能否有所突破?這取決于終極算法的能力。
??
??規(guī)則式AI更多靠人工內置的經(jīng)驗和知識驅動,它最大的問題也是要人工介入,而且很難具有學習能力,靠的知識、記憶和經(jīng)驗建立的規(guī)則體系,這種不能自學習的符號AI系統(tǒng)隨著明斯基的去世,在逐步退出歷史舞臺。而強AI的目標是機器智能化、擬人化,機器要具有和人一樣的能力,那就離不開記憶和經(jīng)驗,也離不開通過知識、經(jīng)驗和記憶建立起來的認知體系(經(jīng)驗規(guī)則、知識本體)。
??
??從這個角度講,強AI要實現(xiàn)只靠深度學習、強化學習還不夠,通過深度學習、強化學習進行環(huán)境基礎知識的初步監(jiān)督式指導學習或非監(jiān)督自我體驗學習,學習掌握的知識、經(jīng)驗必須要能存儲和記憶,再結合大腦新皮層理論的時間-記憶流預測框架,在遇到新的問題之后,就能像人一樣快速智能響應。這也許就是未來終極算法的融合誕生之路吧?
來源:自動化網(wǎng)      時間:2017-10-30 10:11:43


上一條新聞: 關于西門子變頻器的故障維修案例-四條橫杠
下一條新聞: 國務院常務會議通過《深化“互聯(lián)網(wǎng)+先進制造業(yè)”發(fā)展工業(yè)互聯(lián)網(wǎng)的指導意見》
版權所有:蘇州羅米達自動化設備有限公司    地址:蘇州工業(yè)園區(qū)唯亭浦田路75號朱家工業(yè)園E3幢    郵編:215000
推薦產(chǎn)品:KN95口罩機,視覺檢查量測系統(tǒng),干式復合機自動視覺辨識及包裝系統(tǒng),自動物料輸送系統(tǒng),非標準客制化生產(chǎn)系統(tǒng),全自動轉向機
電話:0512-6289-2918     傳真:0512-6289-2908-850    聯(lián)系人:周經(jīng)理    手機:18913759602    公司QQ:2356276066   郵箱:alex.zhou@lmd-auto.com

| 備案號:蘇ICP備14013079號-1