您現(xiàn)在的位置:海峽網(wǎng)>新聞中心>福建頻道>閩南新聞>廈門新聞
分享

你只需往電腦上傳一張甲骨圖片,AI(人工智能)即可完成文字識別、釋義查詢、文獻(xiàn)溯源——最懂甲骨文的AI來了!近日,廈門大學(xué)與騰訊公司、安陽師范學(xué)院聯(lián)合研發(fā)的全球首個甲骨文智能體“殷契行止”正式上線。

廈門大學(xué)人工智能研究院甲骨文研究團(tuán)隊(duì)的負(fù)責(zé)人金泰松說,這是三方三年潛心研究的一個“合集”——一直以來,甲骨文研究一直面臨“識別難、比對難、共享難”的挑戰(zhàn),“殷契行止”就是破解這些難題的智能體——AI用定制算法練就了讀懂古文的真功夫。

用大白話說,“殷契行止”使得AI首次具備了“理解古文字”的能力,最終讓每一片甲骨“讀得懂、找得到、用得上”。

目前,甲骨文智能體已面向?qū)<液凸娒赓M(fèi)開放,人人都能上手體驗(yàn)。

不過,金泰松說:“我們不是替代甲骨文研究專家,而是把專家從重復(fù)勞動中解放出來,讓他們把精力留給真正的破譯與思考。”

最懂甲骨文的AI來了!全球首個甲骨文智能體“殷契行止” 上線    

小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本組圖/小程序截圖)

能做什么

看圖識字

上傳圖片就能

精準(zhǔn)比對標(biāo)準(zhǔn)字庫

只需上傳一張含有甲骨文字的圖片,AI就能精準(zhǔn)比對甲骨文標(biāo)準(zhǔn)字庫,看圖識別出它是哪個甲骨文字,還能進(jìn)一步檢索系統(tǒng)知識庫中有關(guān)該甲骨文字的相關(guān)資料,還會給出權(quán)威釋義和參考文獻(xiàn)。

識別出某個單字后,AI會自動查找這個字在哪些甲骨和拓片中出現(xiàn)過,快速定位相關(guān)資料。

針對某個單字,快速匯聚與之相關(guān)的學(xué)術(shù)研究成果、各家釋讀觀點(diǎn)和演變歷史,省下大量翻找資料的時間。 

最懂甲骨文的AI來了!全球首個甲骨文智能體“殷契行止” 上線    

甲骨文“馬”字

全自動甲骨校重

以圖搜圖

10分鐘完成數(shù)年的工作

這個智能體還有拓片重見檢索功能:相當(dāng)于“甲骨文版以圖搜圖”。上傳一張拓片照片,AI能快速比對海量數(shù)據(jù)庫,找出同一片甲骨的不同拓片版本或有相似字形的其他甲骨,幫助研究者發(fā)現(xiàn)重復(fù)收錄的文獻(xiàn)或追蹤甲骨流傳軌跡。

甲骨拓本圖像是研究甲骨文的基礎(chǔ)。所謂“拓本”,核心是把龜甲、獸骨上的文字,用宣紙和墨“印”下來的成品,就是給甲骨上的字拍了張“黑白高清照”。從甲骨文首次發(fā)現(xiàn)至今,因?yàn)槭詹亍⒘鬓D(zhuǎn),大部分甲骨都留下了多個版本的拓本,這些拓本被稱為重片,梳理重片的工作被稱為校重。

可想而知,甲骨的拓本數(shù)量遠(yuǎn)遠(yuǎn)大于甲骨的數(shù)量,需要對這些重片進(jìn)行系統(tǒng)整理,才能理清這筆“糊涂賬”。因此,拓片校重是甲骨學(xué)一項(xiàng)重要的基礎(chǔ)性整理工作,耗費(fèi)了甲骨文研究學(xué)者大量時間。

團(tuán)隊(duì)開發(fā)的拓片校重和重見檢索系統(tǒng)有效解決了一字多版難題,讓AI學(xué)會“找字”,實(shí)現(xiàn)了全自動甲骨校重。原本需要專家耗時數(shù)年的比對工作,現(xiàn)在僅需10分鐘即可完成?! ?/p>

拓本轉(zhuǎn)化為摹本

不必借助臨摹

就能看清筆畫細(xì)節(jié)

此外,運(yùn)用AI還可以將甲骨拓本(類似碑文拓印的黑白圖片),轉(zhuǎn)化為甲骨文摹本(白底黑字的臨摹圖),方便研究者看清筆畫細(xì)節(jié)。

在此之前,甲骨文摹本需要甲骨文研究者用筆一筆筆臨摹,需要研究人員對甲骨文有較深的理解,并且非常費(fèi)時費(fèi)力。

最懂甲骨文的AI來了!全球首個甲骨文智能體“殷契行止” 上線   

甲骨文摹本

最懂甲骨文的AI來了!全球首個甲骨文智能體“殷契行止” 上線    

甲骨拓本

怎么用

小程序免費(fèi)開放

可以跟AI直接對話

更酷的是,“殷契行止”使得甲骨文走向大眾——目前,這個甲骨文智能體已面向?qū)<液凸娒赓M(fèi)開放,人人都能上手體驗(yàn)。

簡單來講,無論你是深耕古文字的研究者,還是初識甲骨文的愛好者,都能借助它與3000年前的文字對話。

如果你是甲骨文研究者,可以在PC端登錄“甲骨文AI協(xié)同平臺”,使用AI研究工具智能識別、比對與檢索甲骨文,顯著提升研究效率。比如,上傳圖片后,你可以直接提問單字的釋義,還可以問“這個字在哪里出現(xiàn)過?”AI會自動比對,快速找出包含該字的全部拓片和摹本。

如果你是古文字愛好者,只需打開微信小程序“了不起的甲骨文”,就能和智能體對話。

例如,你可以問它:“家”字的甲骨文長什么樣?它不僅會展示字形,還會告訴你,這個字里藏著殷商時代的“居住”特點(diǎn)。  

最懂甲骨文的AI來了!全球首個甲骨文智能體“殷契行止” 上線    

甲骨文“門”字

跟著“甲骨舞者”

學(xué)跳甲骨文體操

在“了不起的甲骨文”,人們還可以體驗(yàn)甲骨識讀樂趣,獲取古文字知識。

這個小程序還能讓甲骨文翩翩起舞,金泰松介紹,安陽師范學(xué)院甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室牽頭,聯(lián)合音樂學(xué)院、體育學(xué)院等編創(chuàng)了一套“廣播體操”,手機(jī)上輕輕一點(diǎn),“甲骨舞者”就翩翩起舞,時而展示側(cè)身而立的“人”字,時而表演張開雙臂的“舞”字。

金泰松說,這位“甲骨舞者”是真人,這套甲骨文“廣播體操”是為了幫助大家更好地理解和傳播甲骨文。

此外,團(tuán)隊(duì)還打造了一系列甲骨文主題游戲,讓普通人也能在有趣互動中,感受古文字的千年底蘊(yùn)。  

如何研發(fā)

三方合作

引入甲骨文針對性算法

金泰松說,隨著DeepSeek(深度求索,一種AI助手)等通用大模型的涌現(xiàn),我們意識到,AI確實(shí)能為甲骨文研究帶來實(shí)質(zhì)性的效率變革。基于這一認(rèn)識,團(tuán)隊(duì)開始研發(fā)面向甲骨文識別的專用智能體。

什么叫智能體?金泰松列舉一個例子,我們問DeepSeek:到北京的機(jī)票多少?它會告訴你價格,你還得自己去找App(應(yīng)用程序)完成訂票等工作;智能體卻可以幫助你做其他的事情——你告訴特定的智能體:我要去北京,它會去查詢相關(guān)的網(wǎng)站,調(diào)出支付的App等。表現(xiàn)在甲骨文智能體上,你上傳一個甲骨單字,它可以自動去找這個字出現(xiàn)在哪片甲骨上,給出專家研究的文獻(xiàn)等。

金泰松強(qiáng)調(diào)說,甲骨文智能體不是突然出現(xiàn)的,三年來,團(tuán)隊(duì)以AI+多模態(tài)甲骨文數(shù)據(jù)集融合為基礎(chǔ),研發(fā)出多項(xiàng)關(guān)鍵技術(shù),包括甲骨字形檢測與分類算法、AI摹本生成與字形匹配技術(shù)、甲骨校重與結(jié)構(gòu)化比對算法,以及融合圖像、文字與語義的多模態(tài)推理能力。

也就是說,現(xiàn)在相當(dāng)于引入這些針對性的算法,用智能體技術(shù)把這些成果整合在“殷契行止”。

金泰松特別介紹三方合作的起源——2022年,在廈門大學(xué)紀(jì)榮嶸教授牽線下,廈門大學(xué)多媒體可信感知與高效計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室、安陽師范學(xué)院甲骨文信息處理教育重點(diǎn)實(shí)驗(yàn)室與騰訊公司聯(lián)合組建了跨機(jī)構(gòu)研究團(tuán)隊(duì)。作為實(shí)驗(yàn)室主任,紀(jì)榮嶸在研究方向、技術(shù)路線優(yōu)化、核心技術(shù)難題的攻堅(jiān)突破中發(fā)揮關(guān)鍵作用。

金泰松是計(jì)算機(jī)專家,甲骨文智能化的研究與他參與研發(fā)的其他類型項(xiàng)目的感受是不一樣的,他說,有時你會覺得,我們是在進(jìn)行3000年文明的一場接力?! ?/p>

教AI認(rèn)字

精準(zhǔn)檢測143萬個字形

很多人疑惑的是,人工智能是如何認(rèn)識甲骨文的?難道不是要建立在“投喂”的基礎(chǔ)上?

金泰松解釋,的確,項(xiàng)目的起點(diǎn)是最基礎(chǔ)的字形識別。面對模糊不清的拓片,常規(guī)圖像檢測方法幾乎失效。“拓片噪聲干擾嚴(yán)重,筆畫斷裂,以‘庚’為例,同一個‘庚’字在不同時期形態(tài)各異,有的像鈴鐺,有的像勞動工具,有的因?yàn)榭毯厶珳\幾乎難以辨認(rèn)。”金泰松說,“這給視覺算法帶來了巨大挑戰(zhàn)。”

AI首先學(xué)會了“認(rèn)字”,從模糊的拓片中提取清晰字形。就像教孩子識字一樣,團(tuán)隊(duì)給AI展示了上千個“庚”字的拓片,告訴它:這些都是“庚”,雖然長得不太一樣,但都是同一個字。經(jīng)過數(shù)百次迭代,AI便學(xué)會了從模糊的拓片中精準(zhǔn)識別出各種形態(tài)的“庚”字。

團(tuán)隊(duì)一步一步從底層圖像處理做起,通過多尺度圖像增強(qiáng)、去噪、去模糊等技術(shù),處理破損的甲骨片,再不厭其煩地“教”AI“認(rèn)字”,最終實(shí)現(xiàn)對143萬個字形的精準(zhǔn)檢測,準(zhǔn)確率超過90%?! ?/p>

讓流失海外的甲骨

在數(shù)字世界回歸

“殷契行止”背后還有“數(shù)字甲骨共創(chuàng)計(jì)劃”,目前,它已完成1525片甲骨的數(shù)字化采集工作,其中以數(shù)字化形式“回歸”的流失海外的甲骨達(dá)950片。

也就是說,用AI讓幾千歲的甲骨文在數(shù)字世界里“團(tuán)圓”。

這里有個背景,出土的甲骨不僅在中國,還分布在世界16個國家和地區(qū)。過去幾年,“數(shù)字甲骨共創(chuàng)計(jì)劃”的研究者分赴各地,憑借一盞燈和一臺相機(jī)工作,現(xiàn)在,這些散落在海外的甲骨片都以數(shù)字形式回歸到祖國。

據(jù)介紹,通過“數(shù)字甲骨共創(chuàng)計(jì)劃”,研究團(tuán)隊(duì)已構(gòu)建起全球規(guī)模最大的甲骨文多模態(tài)數(shù)據(jù)集,包含143萬個甲骨文字形數(shù)據(jù)、1.5萬片甲骨多模態(tài)數(shù)據(jù)、3000篇研究文獻(xiàn)等。

2024年世界人工智能大會上,AI+多模態(tài)甲骨文數(shù)據(jù)集首次發(fā)布,供研究人員和公眾免費(fèi)使用?! ?/p>

責(zé)任編輯:陳錦娜

最新廈門新聞 頻道推薦
進(jìn)入新聞頻道新聞推薦
最懂甲骨文的AI來了!全球首個甲骨文智
進(jìn)入圖片頻道最新圖文
進(jìn)入視頻頻道最新視頻
一周熱點(diǎn)新聞
下載海湃客戶端
關(guān)注海峽網(wǎng)微信
?

職業(yè)道德監(jiān)督、違法和不良信息舉報電話:0591-87095414 舉報郵箱:[email protected]

本站游戲頻道作品版權(quán)歸作者所有,如果侵犯了您的版權(quán),請聯(lián)系我們,本站將在3個工作日內(nèi)刪除。

溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護(hù),謹(jǐn)防受騙上當(dāng),適度游戲益腦,沉迷游戲傷身,合理安排時間,享受健康生活。

CopyRight ?2016 海峽網(wǎng)(福建日報主管主辦) 版權(quán)所有 閩ICP備15008128號-2 閩互聯(lián)網(wǎng)新聞信息服務(wù)備案編號:20070802號

福建日報報業(yè)集團(tuán)擁有海峽都市報(海峽網(wǎng))采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報業(yè)集團(tuán)書面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播。

版權(quán)說明| 海峽網(wǎng)全媒體廣告價| 聯(lián)系我們| 法律顧問| 舉報投訴| 海峽網(wǎng)跟帖評論自律管理承諾書

友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合
国产福利在线观看无码卡一,国产精品一级毛片在线,免费国产自产一区二区三区四区,国产精品免费无码二区