AI向真正“智能學(xué)習(xí)體”邁進

2021-02-25 11:02:00來源：科技日報原創(chuàng)版權(quán)禁止商業(yè)轉(zhuǎn)載授權(quán)>>

　　可回溯過去能解決復(fù)雜任務(wù)

　　AI向真正“智能學(xué)習(xí)體”邁進

　　英國《自然》雜志24日發(fā)表一項人工智能研究成果：美國團隊報告了一類增強學(xué)習(xí)，可回溯過去、解決復(fù)雜任務(wù)，真正改善了對復(fù)雜環(huán)境的探索方式，有望應(yīng)用于機器人、語言理解和藥物設(shè)計領(lǐng)域。這類算法被統(tǒng)稱為“Go-Explore”，其已經(jīng)在一款經(jīng)典游戲的算法挑戰(zhàn)中得分超過了人類玩家和先進的人工智能系統(tǒng)。該成果被認為正朝著實現(xiàn)真正“智能學(xué)習(xí)體”邁出了重要一步。

　　增強學(xué)習(xí)，可讓人工智能系統(tǒng)通過探索和理解復(fù)雜環(huán)境來進行決策，并學(xué)習(xí)如何以最優(yōu)的方式獲得獎勵。獎勵可以包括機器人抵達特定位置或是在電腦游戲中達到一定的等級。然而，當(dāng)遇到很少給予反饋的復(fù)雜環(huán)境時，現(xiàn)階段的加強學(xué)習(xí)算法就很容易碰壁，這讓人工智能專家們非常苦惱。

　　美國“OpenAI”是由諸多硅谷巨頭聯(lián)合建立的人工智能非營利組織，推動者包括美國創(chuàng)業(yè)孵化器Y Combinator總裁薩姆·阿爾特曼、美國太空技術(shù)探索公司（SpaceX）創(chuàng)始人埃隆·馬斯克等，其目標是希望能夠預(yù)防人工智能的災(zāi)難性影響，并推動人工智能發(fā)揮積極作用。此次，“OpenAI”的科學(xué)家艾德蘭·艾克菲特、朱斯特·赫伊津哈及團隊，提出了有效探索面臨的兩個主要障礙，并設(shè)計了一類算法來解決這些障礙。

　　研究人員表示，“Go-Explore”可以對環(huán)境進行全面探索，同時構(gòu)建一個檔案庫來記住它去過的地方，確保自己不會忘記通往有望成功的期中階段或是最終勝利（獎勵）的路線。其在雅達利經(jīng)典游戲中的得分，超過了人類玩家和先進的人工智能系統(tǒng)，研究人員用這類算法，解決了之前未能解決的2600個雅達利游戲，驗證了這類算法的潛力。“Go-Explore”在算法挑戰(zhàn)《蒙特祖馬的復(fù)仇》中的得分是之前的4倍，在另一個算法挑戰(zhàn)《瑪雅人的冒險》中的得分也超過了人類玩家的平均水平。而相對的，此前的算法一分都拿不到。

　　“Go-Explore”算法還能完成一個模擬機器人任務(wù)，在這項任務(wù)中，它必須用機械臂把東西撿起來并放到4個架子中的一個架子上，其中兩個架子被關(guān)在兩扇門的后面。

　　研究人員指出，記住并回到有望成功的探索區(qū)域的簡單原則是一種強大、通用的探索方法。他們認為最新的算法有望應(yīng)用于機器人、語言理解和藥物設(shè)計。

編輯：黃昂瑾

相關(guān)閱讀

Screen Shot 2021-02-24 at 10.55.25 AM.png

戴著腦電帽控制機械臂寫漢字打破人與機器界限？ 相比單人腦控，雙人協(xié)作操控機械臂要解決的問題更為復(fù)雜，需要設(shè)計合理的任務(wù)分配策略，使兩人以最高效率完成操控任務(wù)，且不能相互沖突。 2021-02-24 10:52:00

Screen Shot 2021-02-23 at 10.23.44 AM.png

AI合成主播移動流量同比增23.4%！ 2021年春節(jié)假期（2月11日至2月17日），移動互聯(lián)網(wǎng)流量達到357.3萬TB，與2020年春節(jié)7天相比增長23.4%。 2021-02-23 10:20:00

AI留下，讓愛（ài）回家今年春節(jié)AI來值班 2021年春節(jié)臨近，為“防疫情、保供給、促消費”，不僅各地干群堅守崗位，還有一群特殊的“值班人”。 2021-02-10 10:33:00

聲音

熱點專題

使劲快喷了高潮了视频,很黄很色的视频网站在线观看,末成年女啪啪免费,人妻少妇精品无码专区

AI向真正“智能學(xué)習(xí)體”邁進

AI向真正“智能學(xué)習(xí)體”邁進