99热精品69堂国产-97超级碰在线精品视频-日韩欧美中文字幕在线视频-欧美日韩大尺码免费专区-最新国产三级在线不卡视频-在线观看成人免费视频-亚洲欧美国产精品完整版-色综久久天天综合绕视看-中文字幕免费在线看线人-久久国产精品99精品国产

歡迎來(lái)到優(yōu)發(fā)表網(wǎng)

購(gòu)物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

新技術(shù)下地質(zhì)文獻(xiàn)資料工作分析

時(shí)間:2022-06-28 06:21:19

序論:在您撰寫新技術(shù)下地質(zhì)文獻(xiàn)資料工作分析時(shí),參考他人的優(yōu)秀作品可以開(kāi)闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

新技術(shù)下地質(zhì)文獻(xiàn)資料工作分析

本文將綜合探討全國(guó)地質(zhì)資料館地質(zhì)文獻(xiàn)資料的開(kāi)發(fā)利用情況及服務(wù)模式,從國(guó)外地質(zhì)文獻(xiàn)資料服務(wù)現(xiàn)狀、全國(guó)館地質(zhì)文獻(xiàn)資料服務(wù)存在的問(wèn)題及文獻(xiàn)領(lǐng)域新技術(shù)應(yīng)用幾個(gè)層面進(jìn)行分析與研究,以期對(duì)整個(gè)行業(yè)內(nèi)的文獻(xiàn)服務(wù)起到一定的參考與指導(dǎo)作用。當(dāng)今在互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展和帶動(dòng)作用下,國(guó)內(nèi)外科技期刊出版領(lǐng)域在生產(chǎn)方式、傳播方法、內(nèi)容服務(wù)模式等方面都發(fā)生了巨大變化[1]。地質(zhì)文獻(xiàn)資料作為全國(guó)地質(zhì)資料館館藏?cái)?shù)據(jù)資源的重要組成部分,是科技情報(bào)工作的基礎(chǔ),而海量文獻(xiàn)數(shù)據(jù)資源如何向用戶提供服務(wù)是數(shù)據(jù)管理者面臨的一項(xiàng)重要工作任務(wù)。全國(guó)地質(zhì)資料館是中國(guó)最大最權(quán)威的地質(zhì)資料館藏機(jī)構(gòu),近幾年來(lái),全國(guó)館每年新進(jìn)館5000余檔、約30萬(wàn)件地質(zhì)資料[2-3],年度增長(zhǎng)數(shù)據(jù)量超過(guò)40TB。其中,館藏機(jī)構(gòu)中的地質(zhì)調(diào)查成果報(bào)告承載的信息量占絕對(duì)優(yōu)勢(shì),每年接收的地質(zhì)調(diào)查成果資料涉及專業(yè)涵蓋地質(zhì)、煤炭、冶金、有色、化工、建材、石油、核工業(yè)、環(huán)境等,且資料中的文件類別多樣化,包括附圖、附表、附件、多媒體、數(shù)據(jù)庫(kù)、軟件、正文報(bào)告等。地質(zhì)調(diào)查成果資料大多是基礎(chǔ)性的野外或?qū)嵉卣{(diào)查工作,主體內(nèi)容是對(duì)地球信息的客觀記錄,不僅可以為地球的科學(xué)研究及找礦勘查工作提供第一手資料,還可以服務(wù)于經(jīng)濟(jì)、社會(huì)、政治、環(huán)境等各方面,如鐵路、公路、水庫(kù)、壩基、電廠等重大基礎(chǔ)設(shè)施工程建設(shè)中,都需查明工程地質(zhì)、水文地質(zhì)、環(huán)境地質(zhì)、地質(zhì)災(zāi)害以及區(qū)域地質(zhì)工作、礦產(chǎn)資源分布等情況,而地質(zhì)資料為以上工程建設(shè)提供了重要依據(jù)[4]。因此,地質(zhì)調(diào)查成果資料是影響面極寬、開(kāi)發(fā)利用潛力極大的文獻(xiàn)數(shù)據(jù)資源。

1國(guó)外地質(zhì)文獻(xiàn)資料服務(wù)現(xiàn)狀

1.1美國(guó)地質(zhì)調(diào)查局

美國(guó)地質(zhì)調(diào)查局(USGS)建立了科技報(bào)告文獻(xiàn)數(shù)據(jù)庫(kù)(publicationwarehouse),涵蓋USGS科學(xué)家過(guò)去100多年中撰寫的超過(guò)150000種出版物文本,包括為公眾撰寫的科普產(chǎn)品、期刊文章、系列報(bào)告、書籍章節(jié)等,并按著作年份(1855~2019年)、學(xué)科(水文、地質(zhì)災(zāi)害、生物生態(tài)系統(tǒng)、礦產(chǎn)、地質(zhì)、環(huán)境與健康等)以及產(chǎn)品類型(基礎(chǔ)地質(zhì)報(bào)告、期刊論文、圖書、會(huì)議論文、數(shù)據(jù)庫(kù)、學(xué)位論文、小冊(cè)子、講座等)構(gòu)建成不同類別的出版物系列產(chǎn)品,方便用戶檢索與查詢,且很大一部分提供免費(fèi)下載服務(wù),并在不斷地更新中,時(shí)效性較強(qiáng),能夠?qū)⒆钚碌牡刭|(zhì)調(diào)查和科研成果及時(shí)向社會(huì)開(kāi)放共享。同時(shí),多種系列出版物產(chǎn)品表明USGS對(duì)文獻(xiàn)進(jìn)行了有效的匯總、分類、篩選等處理工作,從而有利于用戶在不同文獻(xiàn)庫(kù)中查詢所需的資料。USGS的每一篇報(bào)告或論文的在線表達(dá)方式豐富,不僅包括基本的元數(shù)據(jù)信息,如標(biāo)題、作者、關(guān)鍵詞、摘要、正文目錄等,還在標(biāo)題、作者及報(bào)告的重要位置鏈接有DOI(數(shù)字對(duì)象唯一標(biāo)識(shí)符)、作者ID(ORCiD,作者身份唯一識(shí)別符,可以獲取作者的身份信息、聯(lián)系方式及出版成果信息等詳細(xì)資料)及其他輔助關(guān)聯(lián)信息,在每一篇報(bào)告鏈接網(wǎng)頁(yè)最下部還有元數(shù)據(jù)信息表,幫助用戶掌握所需報(bào)告的其他詳細(xì)信息。

1.2英國(guó)地質(zhì)調(diào)查局

英國(guó)地質(zhì)調(diào)查局(BritishGeologicalSurvey,BGS)出版物數(shù)據(jù)產(chǎn)品包括從1832年到現(xiàn)在的大部分已發(fā)表作品,還包括回憶錄和報(bào)告。出版物中包括的產(chǎn)品有出版物查看器、Earthwise數(shù)字出版、地圖門戶、圖書館目錄、NERC開(kāi)放研究檔案(NORA)等。出版物查看器中的資源包括自1835年到現(xiàn)在的出版物,可以免費(fèi)查看正式的BGS印刷出版物和最近的研究報(bào)告/開(kāi)放報(bào)告出版物系列。出版物劃分系列非常精細(xì),約有170個(gè)系列產(chǎn)品,如年報(bào)系列、公報(bào)系列、地質(zhì)報(bào)告系列、回憶錄系列、專題報(bào)告系列以及非系列出版物等。BGS提供大量開(kāi)放成果地質(zhì)資料的免費(fèi)下載服務(wù)(包括NERC開(kāi)放研究檔案)及網(wǎng)上商店中所有資料印刷版本的購(gòu)買服務(wù)等。每一篇報(bào)告的線上表達(dá)方式結(jié)構(gòu)化較強(qiáng),網(wǎng)頁(yè)上有部分版塊展示了出版物的作者信息、元數(shù)據(jù)信息和摘要信息等,部分版塊公開(kāi)了出版物的在線下載、引用以及在其他文獻(xiàn)或社交網(wǎng)絡(luò)平臺(tái)分享傳播情況的統(tǒng)計(jì)數(shù)據(jù)等。Earthwise是BGS的數(shù)字出版頻道,其目標(biāo)是傳播BGS的研究成果,促進(jìn)地質(zhì)界更廣泛地進(jìn)行自由交換信息,具體表現(xiàn):在出版物、地圖、模型和數(shù)據(jù)之間建立更強(qiáng)大的語(yǔ)義和空間聯(lián)系;靈活應(yīng)對(duì)利益相關(guān)者的各種需求,新的文化趨勢(shì)和出版領(lǐng)域的新技術(shù);鼓勵(lì)更多社區(qū)反饋和對(duì)BGS出版物的貢獻(xiàn);允許輕松詳細(xì)、豐富的Web內(nèi)容;為協(xié)助項(xiàng)目提供平臺(tái);提供免費(fèi)服務(wù)以共享信息。通過(guò)分析研究,Earthwise采用了文獻(xiàn)結(jié)構(gòu)化處理技術(shù),將每一篇報(bào)告或論文進(jìn)行碎片化處理,按類別或主題、子類別進(jìn)行分組(如分成前言、摘要、簡(jiǎn)介、方法、結(jié)果、討論、結(jié)論、附錄1~5等12個(gè)子類別),其中包含構(gòu)成主題的各個(gè)頁(yè)面的列表。在每個(gè)類別頁(yè)面上,用戶可以選擇閱讀頁(yè)面、評(píng)論頁(yè)面或撰寫自己的文字。BGS在地球科學(xué)數(shù)字出版領(lǐng)域走在世界前端,Earthwise通過(guò)利用數(shù)字出版技術(shù)傳播高質(zhì)量BGS科學(xué)并與更多的地球科學(xué)家合作,促進(jìn)地球科學(xué)信息交流,同時(shí)滿足不同層次用戶對(duì)知識(shí)資源的不同需求。

1.3加拿大地質(zhì)調(diào)查局

加拿大地質(zhì)調(diào)查局(TheGeologicalSurveyofCanada,GSC)設(shè)計(jì)了“出版物和報(bào)告(publicationsandreports)”網(wǎng)站欄目,提供廣泛的地球科學(xué)類出版物和報(bào)告,且進(jìn)行了分類,劃分為幾個(gè)大的專題出版物數(shù)據(jù)庫(kù),如加拿大自然資源、地球科學(xué)、能源、森林、礦物、金屬和采礦。其中地球科學(xué)專題數(shù)據(jù)庫(kù)為GEOSCAN數(shù)據(jù)庫(kù),包含加拿大地質(zhì)調(diào)查局、加拿大遙感中心以及部門科學(xué)家和專家撰寫的外部出版物的書目數(shù)據(jù)庫(kù),涵蓋內(nèi)容豐富,既包括大型會(huì)議報(bào)告的信息免費(fèi)下載服務(wù),又包括大量基礎(chǔ)調(diào)查報(bào)告、科學(xué)論文等出版物的免費(fèi)下載服務(wù)。通過(guò)分析研究GEOSCAN數(shù)據(jù)庫(kù)中的論文和報(bào)告,每一篇論文和報(bào)告都具有豐富的元數(shù)據(jù)信息,如作者、標(biāo)題、完成時(shí)間、DOI、出版物系列、出版者、語(yǔ)言、媒介、文件格式、區(qū)域、位置、經(jīng)緯度坐標(biāo)、主題標(biāo)簽、插圖信息、項(xiàng)目、摘要、簡(jiǎn)介、時(shí)間、GEOSCAN唯一標(biāo)識(shí)符等近20項(xiàng)數(shù)據(jù),使用戶獲取文獻(xiàn)資源的更多詳細(xì)信息,豐富的元數(shù)據(jù)信息可以幫助用戶快速發(fā)現(xiàn)文獻(xiàn)的價(jià)值。此外,與紙質(zhì)書籍和純粹PDF文件對(duì)比,GEOSCAN數(shù)據(jù)庫(kù)中每一篇文獻(xiàn)的表達(dá)方式形式多樣,可以瀏覽和下載各種電子格式的文件,如JPG、PDF、DOC、XML、HTML、XLS、RTF、KML地理信息文件等,使用戶獲取更多增值知識(shí)服務(wù)。

1.4澳大利亞地球科學(xué)局

澳大利亞地球科學(xué)局(GeoscienceAustralia,GA)通過(guò)數(shù)據(jù)和出版物(dataandpublicationssearch)搜索服務(wù)平臺(tái)自1951年至今的31373件產(chǎn)品,且在不斷更新。產(chǎn)品類型主要包括應(yīng)用程序、收集工具、數(shù)據(jù)庫(kù)、文檔、模型、非地理數(shù)據(jù)庫(kù)、軟件等,文件格式達(dá)10幾種,如DAT、ECW、GeoPDF、HTML、PDF、TIF、NETCDF、KML、JPG、NETCDF、SHP、MISC、WCS、WMS、ZIPPEDERS等。數(shù)據(jù)和出版物中的產(chǎn)品按照產(chǎn)品類型、時(shí)間、文件類型、更新頻率、狀態(tài)、服務(wù)類型、比例尺等進(jìn)行了有效分類,將數(shù)據(jù)資源進(jìn)行詳細(xì)分類可以使用戶縮小搜索范圍,快速獲取自己所需的數(shù)據(jù)資源。每一個(gè)數(shù)據(jù)產(chǎn)品幾乎都有簡(jiǎn)介、摘要、主題標(biāo)簽、元數(shù)據(jù)等信息,提供多個(gè)文件格式的下載服務(wù),且與多個(gè)社交平臺(tái)關(guān)聯(lián),可以向其他網(wǎng)絡(luò)平臺(tái)進(jìn)行資源共享。GA維護(hù)著許多在線工具,用以促進(jìn)數(shù)據(jù)的發(fā)現(xiàn)和傳遞。此外,GA與美國(guó)地球科學(xué)研究所合作,建立了AusGeoRef文獻(xiàn)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)每周進(jìn)行更新,提供的參考文獻(xiàn)來(lái)自期刊論文、會(huì)議論文、摘要、書籍、報(bào)告和地圖等。AusGeoRef提供出版物的全文搜索,用戶不僅可以搜索文獻(xiàn)的元數(shù)據(jù)信息(如標(biāo)題、作者、注釋等),還可以搜索數(shù)據(jù)庫(kù)中出版物的整個(gè)文本,以便查找所需信息,并與具有地理坐標(biāo)等信息的出版物進(jìn)行交互式地理搜索。AusGeoRef還提供了廣泛的用戶功能,如可以導(dǎo)出引文,創(chuàng)建用戶賬戶以保存查詢、引用和創(chuàng)建策劃列表,向數(shù)據(jù)庫(kù)中添加注釋、自定義標(biāo)記等。AusGeoRef的建立旨在面臨地球科學(xué)和社會(huì)交叉的問(wèn)題時(shí)幫助決策者提高地質(zhì)調(diào)查出版物的可發(fā)現(xiàn)性和使用率。這幾個(gè)國(guó)家在文獻(xiàn)資料服務(wù)方面均展現(xiàn)出多元、開(kāi)放、合作的特點(diǎn),主要體現(xiàn)在:①開(kāi)放程度高,大量數(shù)據(jù)可下載使用;②數(shù)據(jù)服務(wù)產(chǎn)品多元化,包含基礎(chǔ)地圖、地形圖、交互式地圖、3D模型、報(bào)告、文檔等;③數(shù)據(jù)格式多樣,如GeoPDF、XML、WMS等;④鏈接作者ID,提供作者相關(guān)信息及其他詳細(xì)成果資料,幫助用戶獲取大量信息,且方便用戶及時(shí)與作者進(jìn)行溝通;⑤數(shù)據(jù)庫(kù)定期更新,及時(shí)向社會(huì)提供服務(wù);⑥利用數(shù)據(jù)庫(kù)、主題標(biāo)引等技術(shù)用以增強(qiáng)數(shù)據(jù)資源的可發(fā)現(xiàn)性;⑦與其他國(guó)家研究機(jī)構(gòu)相互合作,協(xié)同整合、開(kāi)放和共享大量數(shù)據(jù)資源。但是,相比現(xiàn)在的大數(shù)據(jù)、語(yǔ)義網(wǎng)與關(guān)聯(lián)數(shù)據(jù)、云計(jì)算、人工智能等計(jì)算機(jī)技術(shù)的快速發(fā)展,國(guó)外地質(zhì)調(diào)查機(jī)構(gòu)對(duì)于地質(zhì)調(diào)查成果資料的開(kāi)發(fā)和利用還有很大的升級(jí)空間。

2我國(guó)地質(zhì)文獻(xiàn)資料發(fā)展存在的問(wèn)題

2.1館藏文獻(xiàn)量大,開(kāi)放程度較低

全國(guó)地質(zhì)資料館是中國(guó)館藏地質(zhì)資料數(shù)量最多、內(nèi)容最全的國(guó)家級(jí)館藏機(jī)構(gòu),收藏有我國(guó)自19世紀(jì)末以來(lái)形成的各類地質(zhì)資料,以區(qū)域地質(zhì)調(diào)查資料、礦產(chǎn)勘查資料、水工環(huán)調(diào)查資料、物化遙勘查資料、地質(zhì)科學(xué)研究資料為主[5]。近幾年來(lái),館藏?cái)?shù)據(jù)總量更是呈“井噴式”增長(zhǎng),每3年實(shí)現(xiàn)一次翻番,有效電子文件數(shù)近3億。然而,國(guó)內(nèi)的地質(zhì)調(diào)查文獻(xiàn)資源由于受限于涉密等因素[6],服務(wù)的開(kāi)放程度遠(yuǎn)遠(yuǎn)不夠,這與2018年4月2日國(guó)務(wù)院的《科學(xué)數(shù)據(jù)管理辦法》[7]中“開(kāi)放為常態(tài),不開(kāi)放為例外”的原則不相符。

2.2文獻(xiàn)服務(wù)方式單一

文獻(xiàn)資源作為館藏地質(zhì)資料的重要組成部分,目前服務(wù)方式主要以到館借閱服務(wù)為主[5,8],還提供電子目錄查詢、部分文獻(xiàn)資源線上閱覽和全文下載服務(wù),但總體服務(wù)方式單一、保守,與當(dāng)今信息技術(shù)發(fā)展嚴(yán)重脫節(jié),一方面導(dǎo)致用戶獲取信息量冗余,增加其閱讀量,嚴(yán)重制約了用戶的工作效率;另一方面也導(dǎo)致不能對(duì)館藏中的海量文獻(xiàn)資源進(jìn)行充分的挖掘和利用,大大降低了文獻(xiàn)資源的使用效能。

2.3文獻(xiàn)信息資源流轉(zhuǎn)周期長(zhǎng)

由于思維慣性和組織管理問(wèn)題,目前地質(zhì)資料工作還習(xí)慣性保留著以紙介質(zhì)為主的工作模式和思維方式,地質(zhì)資料在館藏機(jī)構(gòu)流轉(zhuǎn)時(shí)滯大大超過(guò)法定的90天,甚至有的地質(zhì)資料成為“死檔”,嚴(yán)重制約了地質(zhì)資料的社會(huì)化服務(wù)率和在線服務(wù)率。此外,地質(zhì)調(diào)查文獻(xiàn)資源中蘊(yùn)含的信息繁多,涉及知識(shí)面廣泛,包括基礎(chǔ)地質(zhì)情況、礦產(chǎn)資源信息、物化探調(diào)查結(jié)果等,數(shù)據(jù)類型多樣,如正文、圖、表格、公式、參考文獻(xiàn)標(biāo)注等,傳統(tǒng)的傳播方式主要以靜態(tài)的紙質(zhì)資料或單一PDF文件為主,造成用戶面對(duì)的是大量的、無(wú)序的地質(zhì)信息,不能快速?gòu)奈墨I(xiàn)中獲取所需的資料,查找資料經(jīng)常用去整個(gè)工作周期的一半時(shí)間,大大降低了知識(shí)的利用效率。

2.4文獻(xiàn)信息資源加工程度低

館藏文獻(xiàn)承載著不同歷史時(shí)期地質(zhì)工作者的智慧和經(jīng)驗(yàn)。隨著中國(guó)地質(zhì)調(diào)查事業(yè)的變革和發(fā)展,不僅館藏文獻(xiàn)資源量逐年增長(zhǎng),地質(zhì)資料文件結(jié)構(gòu)也變得更加復(fù)雜,構(gòu)成一個(gè)多維度形式的信息復(fù)合體,包括相互關(guān)聯(lián)的報(bào)告、文獻(xiàn)、表格、矢量數(shù)據(jù)、圖形等[9]。傳統(tǒng)的文獻(xiàn)目錄、索引、文摘等檢索形式已不能滿足當(dāng)前時(shí)代背景下用戶對(duì)知識(shí)資源的需求。近年來(lái),隨著計(jì)算機(jī)、數(shù)據(jù)庫(kù)、文字識(shí)別等信息技術(shù)的廣泛應(yīng)用,大量文獻(xiàn)被轉(zhuǎn)換為文本文件和數(shù)據(jù)庫(kù)等電子資源,隨著數(shù)字文獻(xiàn)的大量積累,如何對(duì)文獻(xiàn)資源進(jìn)行有效的分類、組織和檢索,成為具有挑戰(zhàn)性的問(wèn)題。目前通過(guò)人工方式對(duì)文獻(xiàn)進(jìn)行著錄和主題(標(biāo)題、關(guān)鍵詞)標(biāo)引,以提升文獻(xiàn)檢索的效率,但還不夠完善,不能檢索到全部的相關(guān)文獻(xiàn)資源,而且手工的主題標(biāo)引是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作,單憑手動(dòng)已經(jīng)難以跟上文獻(xiàn)的更新速度。

3文獻(xiàn)領(lǐng)域新技術(shù)應(yīng)用

地質(zhì)文獻(xiàn)資源資源量巨大和文件結(jié)構(gòu)復(fù)雜,如何從浩如煙海的復(fù)雜文獻(xiàn)資源中發(fā)現(xiàn)有用和有意義的知識(shí),成為地質(zhì)工作者的迫切需求,也是地質(zhì)資料工作者關(guān)注的熱點(diǎn)問(wèn)題。以網(wǎng)絡(luò)化、數(shù)字化、人工智能化為代表的新技術(shù)為地質(zhì)資料工作提供了良好的機(jī)會(huì)。

3.1文獻(xiàn)內(nèi)容結(jié)構(gòu)化

知識(shí)服務(wù)已成為當(dāng)今知識(shí)經(jīng)濟(jì)時(shí)代的必然需求。由前文可知,很多文獻(xiàn)至今還只向用戶提供靜態(tài)的PDF版本文檔,極大影響了文章的再次使用。目前,數(shù)字出版領(lǐng)域科技論文的主流格式是HTML(超文本標(biāo)記語(yǔ)言)格式[10],此格式的文檔可實(shí)現(xiàn)文獻(xiàn)的結(jié)構(gòu)化、碎片化閱讀,如用戶可以根據(jù)自己的需求選擇感興趣的部分進(jìn)行閱讀;結(jié)構(gòu)化的文獻(xiàn)具有高效的知識(shí)組織能力以及良好的擴(kuò)展性,一方面可以實(shí)現(xiàn)全文查詢和檢索,另一方面可以與文獻(xiàn)關(guān)聯(lián),上傳附件材料(supplementalmaterial),附件材料可以是矢量數(shù)據(jù),如短視頻、MapGIS、數(shù)據(jù)表格、矢量PDF等[10]。此外,結(jié)構(gòu)化的文獻(xiàn)是實(shí)現(xiàn)文獻(xiàn)內(nèi)容標(biāo)引、語(yǔ)義關(guān)聯(lián)等應(yīng)用的前提。

3.2文獻(xiàn)內(nèi)容標(biāo)引

隨著用戶對(duì)知識(shí)元層次數(shù)據(jù)資源的需求,文獻(xiàn)標(biāo)題、作者、摘要等基本信息的著錄表示已經(jīng)無(wú)法滿足用戶需求。為了表示不同領(lǐng)域和不同類型的知識(shí),同時(shí)適應(yīng)不同層次和不同需求的用戶,在知識(shí)服務(wù)過(guò)程中就需要提供不同層次和不同顆粒度的知識(shí)[11]。如借助中圖分類法和敘詞表的學(xué)科分類和主題標(biāo)引將文獻(xiàn)資源通過(guò)詞語(yǔ)、句子、段落以及文獻(xiàn)等不同層次依次進(jìn)行規(guī)范化表示,實(shí)現(xiàn)文獻(xiàn)深層次的內(nèi)容標(biāo)引。例如,在現(xiàn)有的地質(zhì)資料著錄規(guī)范中,案卷級(jí)資料經(jīng)常包括不同類型的文件級(jí)資料,每一個(gè)文件對(duì)應(yīng)不同大小的知識(shí),且分別包括文件標(biāo)題、名稱、分類號(hào)、作者、單位、摘要等信息,但用戶在應(yīng)用過(guò)程中可能需要粒度更小的知識(shí)表示,這時(shí)可以進(jìn)行知識(shí)元層次內(nèi)容的著錄和標(biāo)引,如對(duì)區(qū)域地質(zhì)調(diào)查報(bào)告中地層章節(jié)的奧陶系進(jìn)行標(biāo)引:知識(shí)編號(hào)為0001,知識(shí)大類為地層,知識(shí)小類為奧陶系,知識(shí)類型為文本,知識(shí)級(jí)別為4等。

3.3語(yǔ)義關(guān)聯(lián)技術(shù)

除了利用文獻(xiàn)著錄和標(biāo)引表示來(lái)進(jìn)行知識(shí)粒度化外,還有大量的知識(shí)需要通過(guò)知識(shí)表示規(guī)范進(jìn)行知識(shí)粒度化[11]。例如,對(duì)于“華北奧陶系”體現(xiàn)的知識(shí)粒度較大,如果想要了解華北地區(qū)奧陶系的詳細(xì)信息,就需要細(xì)化華北奧陶系在地質(zhì)演化史的地位、分布區(qū)域、巖性、古生物化石、發(fā)育礦產(chǎn)等。對(duì)于這些問(wèn)題的回答就需要借助于語(yǔ)義關(guān)聯(lián)來(lái)表示,首先對(duì)文獻(xiàn)中的關(guān)鍵數(shù)據(jù)進(jìn)行語(yǔ)義標(biāo)注,有步驟、有目標(biāo)地開(kāi)展文獻(xiàn)挖掘工作,建立多元、多維的數(shù)據(jù)表達(dá)形式,將有價(jià)值的信息全方位地展現(xiàn)出來(lái),使用戶信息檢索和分析整理資料的過(guò)程變得程序化、網(wǎng)絡(luò)化、智能化,幫助用戶快速檢索到所需的信息資源,同時(shí)可獲取其他相關(guān)文獻(xiàn)資源,大大提高用戶獲取知識(shí)的效率。針對(duì)文本中蘊(yùn)含的語(yǔ)義信息建立索引,建立文本之間的語(yǔ)義關(guān)聯(lián),利用機(jī)器自動(dòng)推理技術(shù),實(shí)現(xiàn)同義詞檢索、關(guān)聯(lián)檢索等高級(jí)檢索功能,通過(guò)一個(gè)檢索詞就能將所有相關(guān)的文獻(xiàn)資源都顯示出來(lái),無(wú)需多次重復(fù)檢索,同時(shí)可以按照下載率、引用率、完成時(shí)間等方式排序,加快檢索速度的同時(shí),為用戶提供更多資源的可選性。此外,通過(guò)關(guān)聯(lián)技術(shù)對(duì)網(wǎng)站中不同文獻(xiàn)資源之間進(jìn)行鏈接,能夠?qū)^藏“死檔”資料變“活”,增加其線上曝光率,充分發(fā)揮地質(zhì)資料的利用價(jià)值,進(jìn)而提高館藏機(jī)構(gòu)的社會(huì)化服務(wù)效能。目前新技術(shù)已經(jīng)廣泛應(yīng)用于科技期刊出版領(lǐng)域,滲透到數(shù)據(jù)資源的采集、概念識(shí)別、組織和利用等各個(gè)環(huán)節(jié)[12-13],如將數(shù)據(jù)資源內(nèi)容進(jìn)行加工處理,實(shí)現(xiàn)結(jié)構(gòu)化轉(zhuǎn)變;對(duì)數(shù)據(jù)資源進(jìn)行語(yǔ)義標(biāo)注,提取內(nèi)容中的專業(yè)術(shù)語(yǔ)、技術(shù)方法、圖、表、研究結(jié)果等;借助語(yǔ)義技術(shù)將數(shù)據(jù)資源在深層次上實(shí)現(xiàn)語(yǔ)義和概念層面的互聯(lián);使用語(yǔ)義出版技術(shù)實(shí)現(xiàn)用戶之間的交流、尋求交流對(duì)象、建立合作關(guān)系等。新技術(shù)不僅可以改進(jìn)用戶獲取文獻(xiàn)資源的體驗(yàn)方式,還能夠在數(shù)字化基礎(chǔ)上進(jìn)一步提升用戶利用地質(zhì)文獻(xiàn)資料的功能和效率。

4結(jié)語(yǔ)

當(dāng)今在互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展和帶動(dòng)下,國(guó)內(nèi)外科技期刊出版領(lǐng)域在生產(chǎn)方式、傳播方法、內(nèi)容服務(wù)模式等方面都發(fā)生了巨大變化。全國(guó)地質(zhì)資料館作為政府部門、企業(yè)、科研機(jī)構(gòu)及高等院校等的數(shù)據(jù)資源提供者,更需要緊跟時(shí)代的發(fā)展,不斷加快數(shù)據(jù)資源整合、傳播與服務(wù)進(jìn)程。館藏機(jī)構(gòu)以信息技術(shù)為依托,加強(qiáng)文獻(xiàn)數(shù)據(jù)資源的增值服務(wù),構(gòu)建智能化的數(shù)據(jù)服務(wù)模式,是促進(jìn)知識(shí)發(fā)現(xiàn)與創(chuàng)新、滿足用戶需求、提升服務(wù)效能的關(guān)鍵。綜合利用數(shù)字出版技術(shù)將復(fù)雜的館藏文獻(xiàn)資源進(jìn)行數(shù)據(jù)化、碎片化、結(jié)構(gòu)化,能夠系統(tǒng)完整地反映地質(zhì)調(diào)查成果概貌,拓展地質(zhì)資料服務(wù)價(jià)值鏈,提高館藏資料的創(chuàng)新服務(wù)水平,還可以幫助用戶快速獲取目標(biāo)知識(shí)服務(wù),充分提高用戶的工作效率。因此,利用新技術(shù)重新構(gòu)建地質(zhì)文獻(xiàn)資料的服務(wù)模式,實(shí)現(xiàn)資源共享更加多元化的表達(dá)方式變得極為必要。

作者:孟潔 賈麗瓊 李曉蕾 吳軒 李晨陽(yáng) 單位:中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心;中國(guó)地質(zhì)大學(xué);全國(guó)地質(zhì)資料館