人工智能和數(shù)據(jù)科學(xué)

2022-04-18 18:30:0013:23 46
聲音簡介

作為科學(xué)皇冠上最璀璨的一顆明珠,數(shù)學(xué)是一個非常抽象但是又極其重要的學(xué)科,人們經(jīng)常問,到底什么是數(shù)學(xué)?數(shù)學(xué)到底跟日常生活有哪些關(guān)聯(lián)?從計(jì)算機(jī)到人工智能,它們?nèi)绱恕奥斆鳌钡脑蚴鞘裁矗?/span>


本期首都科學(xué)講堂之“極簡科學(xué)課”,邀請到中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院研究員劉歆,為你揭開數(shù)學(xué)與人類生產(chǎn)、生活最息息相關(guān)的分支——“最優(yōu)化”的神秘面紗。

主講嘉賓:劉歆,中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院研究員。


奇妙數(shù)學(xué):無處不在的最優(yōu)化


我們知道,數(shù)學(xué)是專門研究數(shù)量、結(jié)構(gòu)、變化、空間以及信息等概念的一門學(xué)科,是所有科學(xué)密不可分的重要基礎(chǔ)。歷史上,數(shù)學(xué)的重要性被很多人推崇和肯定,哲學(xué)家柏拉圖曾說數(shù)學(xué)“是一切知識中的最高形式”,哲學(xué)家培根也將數(shù)學(xué)形容成“通往科學(xué)之門的鑰匙”。在數(shù)學(xué)家高斯眼里,數(shù)學(xué)是科學(xué)的皇后,因?yàn)樵谒磥頂?shù)學(xué)是一門非常美的學(xué)科,二來是因?yàn)樵谖鞣降膰H象棋中,皇后的作用是非常巨大的——既能當(dāng)中國象棋中的車,橫走豎走,也可以像象一樣斜著走,是整個國際象棋中功能最強(qiáng)大的一顆棋子,由此可見,數(shù)學(xué)在高斯眼里是多么重要。


數(shù)學(xué)主要可以分成兩大類:一部分是基礎(chǔ)數(shù)學(xué),它包含了平面幾何、立體幾何、解析幾何;另外一種就是應(yīng)用數(shù)學(xué),它的分類非常廣、涉及得也非常廣,像概率統(tǒng)計(jì)、數(shù)學(xué)物理方程、系統(tǒng)與控制,而我們今天要談的最優(yōu)化也是其中之一。


作為一門古老而又青春的交叉學(xué)科,最優(yōu)化將運(yùn)籌學(xué)和計(jì)算數(shù)學(xué)交叉在了一起,那么到底什么是運(yùn)籌學(xué)、什么是計(jì)算數(shù)學(xué)呢?


提到運(yùn)籌學(xué),我相信大家應(yīng)該都知道一句話,那就是“運(yùn)籌帷幄之中,決勝千里之外”。這句話本來是劉邦對張良的評價,但是從科學(xué)的角度來看,它研究的正是千里之外的人如果想要贏,他需要做些什么、準(zhǔn)備些什么,而這正是現(xiàn)代運(yùn)籌學(xué)所思考的范疇,即在生產(chǎn)、戰(zhàn)爭或是勞動中,我們應(yīng)該如何決策,才能取得最佳的效果。


跟這個很像的還有“田忌賽馬”:齊威王喜歡賽馬,他有上等馬、中等馬、下等馬三種等級的馬匹,有個大臣叫田忌想跟王來賽馬。那很明顯,如果使用上等馬對上等馬、中等馬對中等馬、下等馬對下等馬,田忌無論如何都會輸。但是田忌人很聰明,他用自己的下等馬出戰(zhàn)齊威王的上等馬,用他的上等馬對齊威王的中等馬,用他的中等馬對齊威王的下等馬。這樣,田忌雖然第一場輸?shù)梅浅K,但后兩場他都勝了,結(jié)果就是2:1贏了齊威王。


除了田忌賽馬,著名的歐拉七橋問題也是一個很典型的最優(yōu)化問題:18世紀(jì)東普魯士有一個城市叫哥尼斯堡,這個城市被兩條河分成了四個區(qū)域,且這四個區(qū)互相之間又不連通。為了溝通方便,人們架了七座橋把這幾個區(qū)連接在一起,但后來人們就想,有沒有什么方法能一次性地把這七座橋都走一遍,但同時又不走重復(fù)路呢?基于這個問題,彼時的著名大數(shù)學(xué)家歐拉提出了“一筆畫”原理并以此得出了結(jié)論,即哥尼斯堡這個問題無解——人不可能不重復(fù)地走遍這七座橋又回到原點(diǎn)。


這些例子都告訴我們,決策在生活中是非常重要的,決策者希望選擇對自己最有利的方案,而這個最有利的方案就是優(yōu)化,就是我們這個學(xué)科的最優(yōu)化。



放到現(xiàn)代社會,運(yùn)籌學(xué)的應(yīng)用范圍就更廣泛了。在我國,山東師范大學(xué)的管梅谷教授提出了一個非常有名的國際問題叫“中國郵遞員問題”,這個問題是說,如果一個郵遞員從郵局出發(fā)開始投遞快件,他要怎么走才能一面走遍所有街道,一面還能確保他走的總路程最短?不得不說,尋找最優(yōu)化方案幾乎滲透到了我們?nèi)粘I畹姆椒矫婷?,比如說網(wǎng)購賣家應(yīng)該怎樣分配物流、分配倉儲、調(diào)配庫存?比如說如何考量是否應(yīng)該在一個城市新建一座大橋,在哪里建才能緩解交通堵塞?……這些問題的背后其實(shí)都隱藏著很多有趣的數(shù)學(xué)模型。


計(jì)算數(shù)學(xué):從理論到實(shí)踐生產(chǎn)


說過運(yùn)籌學(xué),我們再談?wù)動?jì)算數(shù)學(xué)。舉例來說,當(dāng)我們想買桌子的時候,很少有人會跟賣家說“我要一張邊長√2的桌子”,因?yàn)檫@個尺寸打造不出來,我們沒有一把尺子可以度量√2。那什么樣的尺寸是可以度量的?比如說1米——想打一張邊長1米的桌子非常容易,1.4米也容易、1.41米也還可以,但1.412米就有點(diǎn)難度了。換而言之,從1米、1.4米到1.41米再到1.412米,因?yàn)檫@些數(shù)都是有限小數(shù),所以對于工程師而言它們都是可以生產(chǎn)的,但對于√2這種無限小數(shù)、無理數(shù),尺子量不了工程師也就做不了,這個將理論和應(yīng)用連接在一起的橋梁就叫“計(jì)算數(shù)學(xué)”。


計(jì)算數(shù)學(xué)就是把數(shù)學(xué)家、物理學(xué)家們提出的一些無法從事實(shí)踐生產(chǎn)的方程,求解成小數(shù)點(diǎn)或帶若干位小數(shù)的有限小數(shù),給工程師用來實(shí)際生產(chǎn)制造。而在這個過程中,跟計(jì)算數(shù)學(xué)關(guān)系最密切的就是方程,這個方程可以是數(shù)學(xué)的方程也可以是物理的,更可能是力學(xué)方程、電磁學(xué)方程、化學(xué)反應(yīng)式。換而言之,將工程師和自然科學(xué)連接在一起的是計(jì)算數(shù)學(xué),計(jì)算數(shù)學(xué)家通過寫計(jì)算機(jī)能夠識別的語言,讓計(jì)算機(jī)計(jì)算出一個工程師需要的數(shù)學(xué)精度,而實(shí)現(xiàn)這些的算法又需要大量的數(shù)學(xué)理論支撐。


正如前文所說,運(yùn)籌學(xué)和計(jì)算數(shù)學(xué)一同構(gòu)成了最優(yōu)化,也就是要研究在一定約束下,我們想要集小化一個或者是集大化一個函數(shù),那么要如何設(shè)計(jì)計(jì)算機(jī)的算法,才能讓計(jì)算機(jī)實(shí)現(xiàn)這一點(diǎn)呢?這,就是我們最優(yōu)化所研究的范疇。


早年華羅庚在70年代推廣優(yōu)選法的時候曾提出過一個概念叫“瞎子爬山”,其實(shí)這就是我們所說的“最速下降法”。具體來說,“瞎子爬山”說的就是跟人爬山會看路不一樣,計(jì)算機(jī)摸不清山峰在哪里,不知道如何才能繞著山路走上去,它就像是個盲人一樣。那它怎么“爬”?盲人有拐杖,他站在原地,通過拐杖他就能摸清哪里地勢最高、哪里地勢最低,這樣走一步摸一步爬到山頂。類似地,最優(yōu)化里所說的“最速下降法”也是這樣——拿下降和上山相比對,當(dāng)大家極大化一個函數(shù)的時候,如果想要取這個函數(shù)的負(fù)數(shù),其實(shí)就等于去極小化一個函數(shù),這跟“瞎子爬山”是找頂峰、最速下降是找“谷底”一樣,背后的邏輯和原理是一樣的。


最優(yōu)化與大數(shù)據(jù)、人工智能


那么學(xué)好最優(yōu)化有什么用呢?談到它的應(yīng)用,我們第一個想到的應(yīng)該就是大數(shù)據(jù)和人工智能,首先我們來談一談大數(shù)據(jù)。


事實(shí)上,大數(shù)據(jù)這個詞其實(shí)在20年前都沒有聽到過,也就是最近十多年才提出來的,究其原因還是因?yàn)槿祟惈@取、存儲和處理數(shù)據(jù)的能力都獲得了提升。就拿我們經(jīng)常說的追蹤大數(shù)據(jù)來說,它的本質(zhì)其實(shí)就是人的行程,是我們手機(jī)記錄下的每個位置的軌跡形成,這樣的數(shù)據(jù)在日常生活中還充斥在各個方面,比如說銀行的、公安系統(tǒng)的、醫(yī)療問診的……可以說,這幾十年間人類獲取數(shù)據(jù)的能力都得到了巨大的提高。

其次,我們的數(shù)據(jù)存儲能力也有了非常大的提升。在過去,我們用來存儲數(shù)據(jù)的軟盤只有幾十KB,現(xiàn)如今硬盤動輒就500G,更不用說像一些大的IT企業(yè),他們還有著更高級別、存儲能力更高的數(shù)據(jù)存儲設(shè)備。因?yàn)楂@取數(shù)據(jù)、存儲數(shù)據(jù)和處理數(shù)據(jù)的能力都得到了提升,所以我們?nèi)缃癫拍苷剶?shù)據(jù)科學(xué),而后者的本質(zhì)實(shí)則跟數(shù)學(xué)建模非常類似,都是以生產(chǎn)實(shí)踐需求為基礎(chǔ),然后研究如何通過數(shù)學(xué)手段來解決這些需求。


在大數(shù)據(jù)領(lǐng)域,人工智能就是最優(yōu)化的一個典型,那么到底什么是人工智能?說得簡單一些那就是,你將自己的所見所識所感甚至是決策輸入給電腦,用這段代碼來讓計(jì)算機(jī)“熟知”人的決策過程、“感知”同樣的事件,這樣在以后,計(jì)算機(jī)就可以做出相同的決策。當(dāng)然不可否認(rèn)的是,這是人類所設(shè)想的一個人工智能的終極形態(tài),但我請大家仔細(xì)想想,想要實(shí)現(xiàn)這一目標(biāo)的前提是什么?是數(shù)據(jù)的積累,只有有海量的數(shù)據(jù)才能實(shí)現(xiàn)這種決策,而這就是所謂的機(jī)器學(xué)習(xí)——它需要你先告訴它這段代碼,比如看到紅燈要停、吃到難吃的東西要吐,讓它學(xué)習(xí)遇到這種信息之后會采取哪些決策,當(dāng)它的數(shù)據(jù)量積累到一段時間,它就可以告訴你“現(xiàn)在我知道如何對你給我輸入的情況做出正確反應(yīng)了”。


淺談人工智能中的最優(yōu)化


那大數(shù)據(jù)、人工智能又和優(yōu)化有什么關(guān)系呢?在此之前,我們可以先看一個非常有意思的表格,這個表是告訴我們10的每一個量級對應(yīng)的中文分別是什么,除了一、十、百、千、萬、億、兆,在此基礎(chǔ)上兆是10的12次方,京是10的16次方,垓是10的20次方……由此可見,從很早開始,中國人的思維就已經(jīng)不局限于日常的范疇了。

事實(shí)上,最優(yōu)化也體現(xiàn)在人工智能的應(yīng)用場景之中,譬如圖像處理。大家都知道,屏幕一般都是由一個個小顆粒組成的,這個小顆粒就叫像素、像素點(diǎn),每個像素點(diǎn)存著一個灰度值,從全黑、0到全白、255,它中間有一個變化的過程,它分了256等,就是慢慢地漸變成從黑到白。


那彩色的屏幕又是怎么實(shí)現(xiàn)的呢?大家知道有紅、綠、藍(lán)三原色,每一種原色它都對應(yīng)一種灰度值,所以說每個小像素又是三組灰度值,即紅的、藍(lán)的、綠的灰度值分別是什么,它組合在一起就是我們看到的多姿多彩的色彩了。


基于此我們可以知道,一幅圖片的本質(zhì)是一堆海量數(shù)據(jù),比如說1000×1000的圖片有100萬個像素點(diǎn),它存儲的數(shù)字實(shí)則是300萬個,分別對應(yīng)的每一個像素點(diǎn)是紅色、藍(lán)色、綠色。當(dāng)我們把這個數(shù)目再擴(kuò)大一倍——1萬像素×1萬像素,那就變成1億個像素點(diǎn),那這幅圖像的規(guī)模會更大,但人在感知上就會變得更好,圖片“看上去”就更清晰、更好。


再比如說,疫情期間也有很多事情跟最優(yōu)化息息相關(guān),比如說大規(guī)模的核酸檢測。之前新聞里說,我們能在三天之內(nèi)測1000多萬個樣本,這是怎么做到的?我們十個一組測,而不是一個一個測,十個一組有問題了我們再單獨(dú)檢測,那么檢測的樣本量就從1000萬降到了100萬份,而這個過程體現(xiàn)的就是一個最優(yōu)決策的過程。


此外還有推薦系統(tǒng),這也是我們特別熟悉的一個最優(yōu)化場景。大家可能都知道,我們同樣是用一款購物APP,它的推薦產(chǎn)品卻不是一樣的,比如女生看到的可能是衣服、化妝品,男生可能看到的是球鞋、玩具,而這些都是根據(jù)用戶的習(xí)慣來推薦的;還有豆瓣的電影評分系統(tǒng),它的背后也涉及到諸如“矩陣完整化”這樣的數(shù)學(xué)模型,而想要求解這個數(shù)學(xué)模型更需要我們尋找最優(yōu)化方案,可見,推薦系統(tǒng)和最優(yōu)化是密不可分的。


用戶評論

表情0/300
喵,沒有找到相關(guān)結(jié)果~
暫時沒有評論,下載喜馬拉雅與主播互動
猜你喜歡
人工智能

內(nèi)容重點(diǎn):本書作者韓東、陳軍,本書介紹了大量的優(yōu)秀AI應(yīng)用、Al產(chǎn)品、AI專家及AI公司的案例。選取的案例多與生活場景(如衣食住行、娛樂文藝)相關(guān),讓我們對AI...

by:德直君國學(xué)與科技

人工智能

人工智能來了,信息時代來了,我們要如何應(yīng)對挑戰(zhàn)?我們何以為人?

by:張漁頑zyw

人工智能

第四章AI時代:人類將如何變革?1從工業(yè)革命到文藝復(fù)興2AI會讓人類大量失業(yè)嗎?3哪種工作最容易被AI取代?4大部分工作將發(fā)生轉(zhuǎn)變而非消失...

by:天地風(fēng)塵

人工智能

人工智能的過去,現(xiàn)在和將來!人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、...

by:實(shí)踐牛

人工智能

人工智能的書,比較薄。

by:冷手熱心

說說人工智能

人工智能技術(shù)、資訊、自我學(xué)習(xí)心得。希望與愛好者交流!

by:藍(lán)天白云綠草