微軟的新圖像字幕算法,準確性或超人類
[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務,該功能對于增加可訪問性特別重要。微軟AI團隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會
原創(chuàng)
2020-10-18 09:46:38
來源:釘科技??

[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。

image.png

圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務,該功能對于增加可訪問性特別重要。微軟AI團隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會上說:“理想情況下,每個人都將在文檔、網(wǎng)絡、社交媒體中為所有圖像添加替代文本,因為這使盲人可以訪問內(nèi)容并參與互動。但是,人們沒有。因此,有一些應用程序使用圖像標題作為替代文本的方式”。

微軟表示,新算法效果是當前算法的兩倍,對于使用諸如微軟 Seeing AI之類的應用的用戶來說,這將意味著極大改善用戶體驗。

Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。微軟算法不僅能夠識別人和物體,還能夠識別物體之間的關(guān)系,這意味著該算法能夠?qū)⒛橙嗣枋鰹椤白谝巫由匣蜃x書”。

在9月份的一篇論文中,新算法在一個被稱為 "nocaps "的圖像字幕基準測試上取得了有史以來最高的分數(shù)。nocaps基準測試由超過166000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15100張圖片,這些圖片涵蓋了從運動到假日抓拍,再到美食攝影等等的一系列場景。 (釘科技綜合《thesouthafrican》和《theverge》消息編譯)

原創(chuàng)文章
最新文章
1
《2025智慧生活科技好物以舊換新選購指南》正式發(fā)布
2
解鎖2025CIC中國智慧生活大會五大亮點,暢享未來生活新范式
3
助力文化傳承 快手推出國內(nèi)首檔二次元IP非遺跨界綜藝《IP中國行》
4
快手電商618“星成長主播”案例合集:好方法 好內(nèi)容 引爆增長
5
北京網(wǎng)絡視聽藝術(shù)大會主題打卡活動超3000萬人次觀看,全面賦能城市副中心文旅發(fā)展
6
錨定行業(yè)發(fā)展方向,2025中國家電健康趨勢高峰論壇在京舉辦
7
海信視像榮獲“中國卓越管理公司”大獎,以長期主義詮釋中國企業(yè)成長范式
8
空調(diào)線上市場半年觀察:價格戰(zhàn)兇猛 美的格力小米居銷量前三
9
三星Galaxy Z Flip7正式發(fā)布:AI賦能輕巧機身 智能外屏煥新升級
10
三星Galaxy Z Fold7正式發(fā)布:樹立Galaxy智能手機新標桿
11
央視探訪海信空調(diào)實驗室,揭秘賽場外的黑科技
12
1-2nm 水分子革命:華帝如何用技術(shù)重構(gòu)沐浴邏輯
13
2025年“灣區(qū)杯”網(wǎng)絡安全大賽啟航 面向全國開放報名 ——守護智慧安全未來城市
14
華潤入主康佳,半導體和消費電子起飛在即?
15
快手集中整治“虛假回收”類違規(guī)行為,保護用戶權(quán)益免遭損失
16
快手直播大舞臺遍地開花,打造現(xiàn)象級文旅新爆款
17
科技副總裁宋婷婷:數(shù)字技術(shù)賦能女性發(fā)展,繁榮生態(tài)綻放“她力量”
18
第三屆北京網(wǎng)絡視聽藝術(shù)大會成功舉辦,“新大眾文藝”主題研討引熱議
19
美的格力海爾都布局的廚房空調(diào),雞肋還是剛需?
20
電商行業(yè)破局重構(gòu),"618"大促展現(xiàn)六大新趨勢
關(guān)于我們

微信掃一掃,加關(guān)注

商務合作
  • QQ:61149512