微軟又在開發(fā)新技術(shù):教會AI看圖講故事
和谷歌一樣,微軟也在開發(fā)一項造福殘疾人士的新技術(shù)。如果這項技術(shù)能順利推出,這無疑將為盲人辨識視頻和圖片信息的道路上邁出了一大步
1
科客網(wǎng)
http://m.nyphb4.com/news/11253.html
科客點評:相比國內(nèi)動不動的“黑科技”,這樣的科技才是改變生活的根本。
微軟的研究人員又有新的腦洞,他們想讓計算機以人工智能的方式,把幾張圖片里發(fā)生的事情給講述出來。今天,他們已將發(fā)表了關(guān)于這項技術(shù)的學術(shù)論文,旨在為了視覺損傷人士提供具體的圖片信息。
這項技術(shù)非常有意義,這不僅僅是遠超之前的圖片描述(Image Caption)技術(shù)。根據(jù)微軟研究員Margaret Mitchell的說法,這項技術(shù)不僅可以描述出照片的背景,而且還可以告訴你,在照片里,什么樣的人正在做了什么事。這是基于深度學習(deep learning)理論而開發(fā)的,之前微軟也把這種理論應用到語音識別和機器翻譯。目前,谷歌、Facebook和其他公司也在積極參與這項研究。
為了改善這個領(lǐng)域的現(xiàn)狀,微軟依賴人工把單張圖片的標題內(nèi)容和特定的圖片順序?qū)懗鰜?。工程師再利用已有的信息教會機器,把圖片序列發(fā)生的事情復述出來。如上圖所示,單個圖片顯示出來的信息是一群年輕人圍著桌子坐一起,而經(jīng)過序列處理后,描述出一群人在享受互相聊天的美好時光。
如果這項技術(shù)能順利推出,這無疑將為盲人辨識視頻和圖片信息的道路上邁出了一大步。關(guān)注科客網(wǎng)官方微信kekebat,獲取更多精彩資訊。(文/Poplar)
注:科客網(wǎng)原創(chuàng)文章,歡迎轉(zhuǎn)載與分享,轉(zhuǎn)載請注明出處。
如月千早
████████████看 黃 魸 手 機 瀏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!無需下載、直接欣賞,妳嬞鍀!████████████追滋