微軟識花app是一款非常智能隻需拍攝花兒照片或選取手機圖庫中的花兒圖片就能識別的手機軟件,微軟識花app支持一鍵識別25萬種花卉,微軟識花app這個智能花朵識別係統讓你隻需要通過手機拍攝一張ͼƬ,就可以辨別出這是什麼花了。微軟識花app,一位可以隨身攜帶的植物專家。
邂逅一枝美麗的花兒,卻不知道它的名字,它的特征,它的動人花語,這難道不是一件萬分遺憾的事?
微軟亞洲研究院攜手中科院植物所推出“微軟識花”app,其智能花卉識別和知識係統將成為你的“花兒百寶箱”。隻需拍攝花兒照片或選取手機圖庫中的花兒圖片,由中科院植物所專家標定的龐大花卉數據庫將快速、精確地識別花兒,並通過花語、藥用價值等信息,講述關於花兒,讓你一秒變身識花達人!
同時,微軟識花是一款離線應用,無需聯網,意味著你可以在登山途中或其它無法連接互聯網的任意場所使用。
花兒知識:花卉的名稱、分類、花語、藥用價值……所有你想知道的,都在這裏。
拍照識花:打開應用並拍照,即可馬上識別該花卉。
圖庫識花:將手機相冊裏的花卉圖片導入本應用,即可馬上識別該花卉。
【精確識別:不僅僅是人工智能】
研究員們基於以上人類觀察物體、對物體的種類進行判斷的過程,獨具創新地開發了一個自動的視覺多級注意力模型,並結合深層神經網絡技術,用於圖像的處理與識別。
【弱監督學習與大規模數據】
弱監督學習的方式既可以兼顧到數據質量的不足,又可以保證用於訓練的數據量的龐大,最終保證了入駐每個人手機中的微軟識花應用的準確性。
【攜手植物專家:跨界玩創新】
中科院植物所為微軟識花提供了大量的專業數據,微軟的技術也在不斷加速交叉學科的新突破。
【技術讓生活更便捷】
想隨身攜帶一位植物專家嗎?想聽聽Ta的花語和秘密嗎?快去試一試吧!
很多人都遇到過這種措手不及的小尷尬,尤其是帶著小孩子或者小夥伴旅遊和遛彎時,隻能一臉茫然地麵對Ta的好奇心。畢竟植物專家說,全世界已經發現的花至少有25萬種。即使你知道是什麼種類,也很難說出關於花的故事來。
而微軟亞洲研究院推出最新款智能識別應用——一位可以隨身攜帶的植物專家“微軟識花”,可以幫你花的秘密。拿出手機,打開App,拍張照片,一鍵識別,隨手解救好奇心。微軟識花應用所能識別的花卉覆蓋了中國的絕大多數花卉。微軟識花的打開方式應該是這樣的……
首先,打開微軟識花應用,現場拍攝或從手機圖庫裏打開一張花兒的照片,將花朵移動至指定位置。然後,應用會自動識別出花朵的名稱和類型,並顯示出匹配度,告訴你花的基本特征、藥用價值等。以上動作完全可以在不聯網的條件下實現!這就意味著,當你在流量捉襟見肘的情況下,照樣可以用沒有網的手機識別出新奇的花卉品種。
知道是什麼花還不過癮?別急,“微軟識花”有一個獨特的“花語”功能。
賞花要懂花語,花語是人們賦予花的一種象征,可以用來表達人的某種感情與願望。不同的花有不同的花語,在沒有了解花語時就亂送別人鮮花,結果隻會引來別人的誤會。花語雖無聲,但此時無聲勝有聲。對於每一種花,係統都會附上一段娓娓道來的花語。
比如“六道木”的花語是“對你的念想沿六條直線自下而上,終於在頂端開出了最好看的花”,是不是恰似你現在的心情呢?
一鍵分享到朋友圈,用最適合你心情的曼妙花語來表達你此刻的心意吧!
大家在使用時或許還能發現藏在應用裏的兩個彩蛋。
微軟識花應用帶有一個專門的花兒搜索包,將400種園藝花卉收錄在係統中,按字母順序排序。也許有的花你隻聽說過名字,沒見過“真容”,那麼這款應用就可以幫你提前見識一下。隻有沒聽過,沒有搜不到。400種花基本涵蓋了我國城市綠化和公園常見的花卉品種,想看哪種花都可以搜索到。
另外,如果你玩膩了識花,微軟識花還有另一個有趣的功能等待你開掘:那就是對其他常見的日常物體進行識別。拿件衣服、擺個文具來測測這款應用的“智商”,聽起來也是挺有趣的事呢!對於常用物體的識別采用了微軟亞洲研究院最先進的圖像識別技術。在內部測試中,識別精度可以達到90%。
精確識別:不僅僅是人工智能
除了大火的博物君,在微博上還有許多類似的賬號如@深山蟲吟ChenZ、@果殼自然控、@開水族館的生物男等等也吸引著大家的眼球,這些不同的賬號背後代表的通常是某一類垂直的專業知識。這些賬號的大受歡迎也從側麵說明了精細物體識別有著極高的門檻,對於人類而言需要的是長時間的訓練和知識的積累,此外還要求極為細致的觀察能力。例如對於人們來說,可能很輕而易舉地看出圖片上的植物到底是花還是草,但卻很難判斷出花兒的具體種類。而由於計算機識別圖像的方式原理與人類有所不同,因此這一類精細物體識別對計算機而言則相對簡單。
這款應用使用流程很簡單,背後的技術卻不見得那麼簡單。市場上已經有一些識貓狗等動物的應用,而相比於識貓識狗,花的識別更具有挑戰性。狗的種類不超過300種,而對花來說,已經被發現的野生植物就有幾十萬種,還有大量奇形怪狀的新品種在不斷地湧現。而微軟亞洲研究院多媒體搜索組的研究員們在精確識別技術方麵有著長久的積累,他們正希望做這樣一些有挑戰性的事情。
這款App主要應用了深度學習技術。研究員們借助中科院植物所提供的260萬張花的鑒定照片,對機器識別模型進行訓練。但是在弱監督的條件下,對260萬張圖片進行機器學習是一個相對低效率的過程,因為人的抽象能力和想象能力是計算機很難做到的。研究員傅建龍介紹道:“傳統的深度學習技術是一個自下而上的學習過程,讓計算機在底層的高維數據裏學習隱藏的高層語義表達。如果我們能在人工智能之外加入人類智能,對機器的深度學習進行指導,把自下而上和自上而下的學習過程相結合,會大大提升深度學習的精度和效率。”把人類的經驗和人工智能相結合,才能迸發出增強智能的魔力。研究員們正是在這方麵下了很大功夫。
總所周知,分類學家對種類繁多的生物界做了一個階層劃分,即製定了“界門綱目科屬種”的分類係統,做精確識別也需要一層一層遞進,才能提高識別的準確性。在識花方麵,主要是需要機器對“科-屬-種“三個基本層級有一個提前的認知。研究員先加入一個花卉本身的層級結構,將它作為一種先驗的知識,來指導機器學習。研究員們考慮到層級的信息,例如,不同的科的植物之間會不會有相關性?於是他們通過捕捉這樣一種相關性來訓練模型。
按照“科-屬-種”的層級劃分,首先確定花的“科”,再通過一些細節的特征,例如花瓣的分布、形態等來確定它歸於哪個“屬”,最後通過花瓣的顏色、紋理等更為細微的特征來具體判斷它屬於哪個“種”。一朵花就是這樣被計算機識別出來的,當然每一種花的識別過程也是“因花而異“的。
那麼人類是如何識別出花的種類的呢?假設現在擺在我們麵前的是一朵花的照片。我們首先會注意到這張圖片中花出現的區域,確定這張圖片上是否存在花,以及一共有幾朵花,並排除旁邊的草地等幹擾項。接下來,你可能會將你的注意力放在花的一些關鍵特性上,如花的顏色、形狀、大小等等。通過這些關鍵部位的特征,例如花是單朵頂生,顏色為黃色白色相見,形狀呈杯型或碗型等特征,可以大致確定這是一朵鬱金香。
研究員們基於以上人類觀察物體、對物體的種類進行判斷的過程,獨具創新地開發了一個自動的視覺多級注意力模型,並結合深層神經網絡技術,用於圖像的處理與識別。第一級是物體級別的關注,即自動關注到圖片中花所在的區域,而排除其他不相關的因素,如雜草等。第二級之後則是由粗到精的部位級別的關注,即關注到花的具體部位,然後對花朵的部位特征進行學習和識別。
眾所周知,深層神經網絡技術在處理圖像問題上的效果顯著。但一直以來,深層神經網絡都被稱之為黑盒子,大家對它了解都不算充分,深層神經網絡的理論方麵還有待突破。但當黑盒子打開之後,大家能從中學習到很多的東西。研究員們通過一些可視化的策略,了解這些網絡究竟學到了什麼樣的內容,看到每個卷積模板(filter)都代表什麼樣的語義。其實,卷積神經網絡的中間層一些部位的信息已經可以自動學出來了,我們就把這些自動學出來的的模式(pattern)自動進行歸類。這些歸類出來的每一個聚類都可以理解成是花的某一個部位的集合。雖然模型本身並不知道其中的某一個聚類究竟是花瓣還是葉子或是花蕊,但它已經知道這是屬於某個部位的信息,這樣就構建了部位檢測模型。將由原始圖像生成的每個候選框都經過每個部位檢測器,而每個部位檢測器則會自動檢測出這個候選框內最接近這個部位的區域,這樣就實現了第二級——部位級別的關注。
弱監督學習與大規模數據
提高圖像識別係統的準確度,數據量始終是一個繞不開的關鍵問題。數據量越大越準確,那麼最終訓練出來的模型準確度也會相應地提升。對於花朵識別問題,研究員們起初是邀請一些植物學家們對花的圖像進行種類標注。但研究員很快發現,這種標注數據的方式無論是從成本上還是時間效率上都算不上是一個最佳的選擇。那麼,有沒有可能通過群體的智慧來解決這個問題呢?研究員們最終選擇從由植物專家提供數據的專業網站爬取數據,並利用弱監督學習(Semi-supervised learning)的方式進行數據的訓練。
監督學習(Supervised learning)和無監督的學習(Unsupervised learning)概念大家已經不算陌生。前者會對數據進行標注,而後者則是對輸入的數據集直接進行建模。研究員們在這裏采用弱監督學習的方式是希望模型能夠生成比較準確、清晰的標注,但前期的數據並不能完全提供這一類的信息,需要模型自己去推斷。在看圖識花的這個例子裏,弱監督學習中的“弱”包含了這幾個方麵。第一點弱的地方在於用於機器學習的數據集隻有圖像級別的標注,即植物學家在標注圖片時隻標注了這張圖片上有什麼花,但是並沒有標注花在哪,也並沒有標注出最需要注意的關鍵識別區域在哪裏(但人類判斷的最關鍵的識別區域未必是計算機認為的最關鍵的識別區域)。其次,研究員使用的網絡上大規模標注的數據的時候,這些數據並不一定是準確的,而且這類數據有著很多的噪聲。此外,這些數據大多比較零散,結構化並不是很好。因此,弱監督學習的方式既可以兼顧到數據質量的不足,又可以保證用於訓練的數據量的龐大,最終保證了入駐每個人手機中的微軟識花應用的準確性。
攜手植物專家:跨界玩創新
正如前麵所言,植物專家的幫助對提高花卉的識別能力起到了基礎支持的作用。這次“微軟識花 “app的開發是微軟亞洲研究院和中國科學院植物研究所多年來學術合作的成果。中科院植物所不僅提供了260萬張花卉的識別圖片,還提供了經過專家鑒定的中國常見花列表。而微軟亞洲研究院的研究員們利用先進的技術開發出識別花卉的算法,並把識別結果挑選出來,經植物所專家鑒定。經過了兩三次迭代的過程,才得到了最終訓練機器識別的樣本集合。中科院植物所植物專家的幫助對提高花卉的識別能力起到了基礎支持的作用。此外,科學出版社為我們提供了花卉的專業知識。
這次合作緣於一次機緣巧合。去年,在中科院植物所舉辦的一次研討會上,微軟亞洲研究院常務副院長芮勇博士展示了研究院在計算機視覺方麵的最新技術,植物所的專家很感興趣,希望可以把最新的識別技術應用到我國的植物調研和科研中去。植物所的專家有這樣一個初衷,那就是了解全中國的植被分布。之前由基層調研人員通過翻閱手冊來判斷各地有哪些花,但是基層人員的專業素養不可控。如果能夠借助計算機技術幫助他們識別,那麼速度和廣度要提高很多。而微軟亞洲研究院在深度學習算法和計算機視覺方麵有著領先的技術基礎,可以幫助他們做一些目前做不到的事。同時微軟亞洲研究院的研究員們也希望借此機會,將精確識別技術更好地得到應用,並且在應用中進行進一步錘煉和創新。
跨學科的學術合作也是微軟亞洲研究院長期耕植的領域。“對於任何物種的分類都是艱難的,”芮勇表示。“關於這項技術的難點在於讓計算機如何辨別細微的差異。而真正大的數據都在跨學科領域裏產生的。我們與中科院植物所的這次合作為微軟識花提供了大量的專業數據,讓我們的計算機技術得以更好地應用。同時,微軟的技術也在不斷加速交叉學科的新突破。”
技術讓生活更便捷
一款看似簡單的應用背後卻是微軟長期以來在機器學習領域的技術積累和跨界合作的成果。微軟亞洲研究院不僅重視基礎研究的突破,還注重將基礎研究的成果應用到更加廣闊的生活和學術中去,讓技術為人們真正帶來改變。
在談及微軟識花之後的技術走向時,研究員傅建龍提到了多個發展方向。第一點是加入更多花卉的種類,將識別的範圍拓展到多個國家,並且提供多語言的產品以及提供更多的平台。今後出國旅遊也可以帶上這位植物專家,幫你識別萬千花卉。第二點是提高識別的精確度,在學術合作中推進數據庫在質量和範圍上的提升。第三點是拓展產品的科普功能,豐富關於花的知識,提供更多的互動功能,從而實現更好的科普。不僅讓你知道是什麼花,還為你拓展在博物知識方麵的涉獵,讓你離“博學之才“更近一步。第四點,研究員希望持續不斷地精進識別算法模型,並實現離線版本與在線版本的無縫切換,讓微軟識花這一類精細物體識別技術也能以API的形式開放出來,登陸在像微軟認知服務(Microsoft Cognitive Services)一樣的人工智能服務平台,造福更多的開發者們。最後一點是希望該項目能對專業研究者的科學研究帶來便利,比如幫助植物專家發現新的物種、幫助基層調研人員精確識別花卉品種等。不管你是普通大眾,還是專家學者,讓學術研究服務更多的人,一直是微軟亞洲研究院的目標所在。
1、現場拍照或從相冊選取照片;
2、移動或縮放照片,使要識別的花卉定位在虛線框內;
3、點擊絲帶,獲得匹配信息;
4、點擊卡片,獲得更多花卉信息;
5、和好友共賞您的識花結果,或者給出您的意見。
想隨身攜帶一位植物專家嗎?想聽聽Ta的花語和秘密嗎?快去試一試吧!
展開 +
收起 -