老師講的案例需要巨大的算力,計算機跑不動怎么辦?AI模型需要大量的數(shù)據(jù)支撐,傳輸速度慢怎么破?下載的軟件相互不兼容,實驗進行不下去怎么辦?……AI時代教學(xué)科研出現(xiàn)了很多新煩惱。對此,天津大學(xué)著手建設(shè)AI云平臺,對課堂進行智能改造,為教育科研裝上數(shù)字大腦。

  依照國家建設(shè)新一代人工智能的總體部署而成立的天津大學(xué)智能與計算學(xué)部,集結(jié)了天津大學(xué)在認(rèn)知計算、數(shù)據(jù)科學(xué)、智能技術(shù)與應(yīng)用等高精尖專業(yè)領(lǐng)域的優(yōu)勢資源。該學(xué)部將人工智能引入日常教學(xué)中,通過集中建設(shè)CPU、GPU資源池,為學(xué)部下屬的計算機學(xué)院、軟件學(xué)院、網(wǎng)絡(luò)安全學(xué)院、人工智能學(xué)院提供統(tǒng)一的算力平臺,即天津大學(xué)人工智能科研云平臺。

  該平臺集成了高性能計算集群、GPU集群、虛擬化集群和云平臺。在高速萬兆光纖網(wǎng)絡(luò)互聯(lián)下,高性能計算集群可支持批處理模式的科研計算,GPU集群支持AI推理、演算的科研計算,云平臺的虛擬機用于前期的程序調(diào)試以及小規(guī)模實驗教學(xué),完整覆蓋項目的所有計算需求。

  “在我的唇讀研究中,有500多G的數(shù)據(jù),以往在實驗室因為內(nèi)存限制,要忍痛刪掉很多,并分批次上傳。使用AI平臺的大文件上傳,沒有帶寬和存儲的限制,500G數(shù)據(jù)2個小時左右就能一次上傳成功。”

  “實驗室雖然有不少高性能GPU卡,但需要用的同學(xué)太多,訓(xùn)練模型格外的慢,跑完一次實驗得一周左右。使用AI平臺訓(xùn)練就快多了,相同的迭代次數(shù)只需要1—2天就能完成。這對模型調(diào)優(yōu)幫助太大了。”

  “以前想要查看模型的中間結(jié)果,需要把圖片從服務(wù)器復(fù)制到本地才能查看,在AI平臺可以實時查看模型的結(jié)果。”

  對這個AI云平臺,同學(xué)們給予了“五星”好評。

  “對于高年級以及天天泡實驗室的研究生同學(xué)而言,實驗環(huán)境與科研項目的推進息息相關(guān)。自行下載的開源軟件往往面臨著插件依賴、系統(tǒng)不兼容等問題,在天津大學(xué)智能與計算學(xué)部的人工智能科研云平臺中,包含了深度學(xué)習(xí)訓(xùn)練推理、大數(shù)據(jù)挖掘、科學(xué)計算基礎(chǔ)軟件環(huán)境以及能夠支持GPU的任務(wù)調(diào)度系統(tǒng),可以為同學(xué)們提供與業(yè)界接軌的實驗環(huán)境。此外,豐富的資源類型也能滿足來自不同院系、不同學(xué)校的學(xué)生。無論是直接在框架上做訓(xùn)練,還是深入底層架構(gòu),都能一一實現(xiàn)。”天津大學(xué)智算學(xué)部教授王建榮介紹說。

  在人工智能科研云的加持下,天津大學(xué)智能與計算學(xué)部不僅能順利展開國家科技重大專項、國家自然基金以及省部級以上的各類項目,還進一步推進產(chǎn)學(xué)研轉(zhuǎn)化,促進校企結(jié)合的前沿科學(xué)研究和工程項目順利進行。

  據(jù)了解,該平臺不僅全面支撐起智算學(xué)部內(nèi)人工智能、大數(shù)據(jù)處理分析、高性能計算等相關(guān)的教學(xué)實驗和科學(xué)研究,還通過專業(yè)的運營實現(xiàn)云基礎(chǔ)設(shè)施資源的擴容,為其他院系提供支撐。(陳 曦 趙 暉 郭道鵬)