研究數據管理

Important Tips for Managing Your Research Data

Our next webinar will share tips for managing research data quality.

How to Efficiently Manage Your Laboratory Resources

Conducting research work seamlessly hinges on the best laboratory management practices followed in a research…

Crossref:讓研究人員挖掘文字和數據

每年都有數以百萬計的書籍和期刊出版。研究人員經常都需要去回答一個問題,他們究竟如何找到他們所需要的材料?過去,研究人員習慣上從電腦螢幕上,透過擷取電腦畫面的手法來收集數據,這是一種利用電腦上網獲取數據的過程。到了今天,有一種精密複雜的工具,在Crossref等組織的推動下,讓讀者去挖掘文字和數據(text and data mining,TDM)。自從2000年Crossref成立以來,學術出版突飛猛進。該組織目前有超過5000名成員,來自各學科、學術團體、出版社和提供開放獲取的出版商。Crossref使用自然語言處理(natural language processing,NLP),更易於挖掘期刊和書籍中的資訊。什麼是文字挖掘呢?文字挖掘和數據挖掘是使用數據挖掘工具,來幫助研究人員分析和過濾數據資源,同時亦使用機器檢測其樣式和相關連結。那麼,在開放獲取內容的世界中,TDM要如何工作?   Crossref的出發點 首先,研究人員要先確定想要跟哪個期刊合作,這是一個冗長乏味的過程,因為有數以千計的期刊可列入候選。對於研究人員來說,從候選清單上,挨家挨戶去拜訪每一家期刊,是很不切實際的。它還需要某種形式的基礎平台結構來促進這個提供內容的過程,能從一個出版商傳遞數據給需要獲取內容的100位研究人員。這個過程的最終目的是從挖掘數據中收集期刊。為了方便這個過程,Elsevier等出版商已經建立了文章程式設計介面(article programming interfaces, API),這是一種批量下載內容的捷徑。由於Crossref參與了數以千計的期刊,它讓學術研究人員訂閱以及開放獲取內容,來解決與TDM相關的邏輯和技術問題。   CrossRef元數據的作用 第二,研究人員需要將TDM工具應用於所希望挖掘的一組數據。為了收集大量數據,研究人員需要從出版商和多個平台上面,批量下載這些內容。數位物件識別碼(Digital…

查無此文?善用數位物件識別號(DOI)

您可曾注意過學術文章結尾那密密麻麻的參考文獻出處?那可是研究人員的知識寶庫呢!數位物件識別號(Digital Object Identifier,簡稱DOI)由國際數位物件識別號基金會(International DOI Foundation)所建立,現已逐漸被廣泛使用。近幾年被期刊刊登的文章,都會被賦予一個DOI序號,這就像是論文的身分證字號,研究人員們只要知道這一串數字就能夠輕鬆檢索到相對應的論文,再也不用因為文獻的舊連結失效,而傷透腦筋啦! 很多人可能感到疑惑,像這樣對應論文的序號已經有很多了,如URI或Pubmed ID等等,為何還要多一個DOI呢?DOI與其他序號最大的差異處在於,它與文章的對應關係是永久存在的。不論文章的期刊名稱、分類如何改變,其DOI號都是不變的,就像我們即使搬家到了另一縣市,身分證字號也不會因此改變。這項功能的問世,大大增加收藏文獻的便利性,只要將文章相對應的DOI號存起來,就不愁日後找不到文章了。 那麼要如何利用DOI搜尋文獻呢?可以簡單地將DOI複製貼上到一般的搜尋引擎(如Google),應該就可以在前幾個搜尋結果找到文章的連結。當然,將DOI輸入學術專用的搜尋引擎也可達到目的。若上述兩者都無法有效找到文章,目前網路上也有很多DOI專用的搜尋引擎,如CrossRef或華藝DOI註冊中心,這些搜尋引擎的頁面操作簡單,將DOI貼上便會跳出相對應的文章。 DOI讓研究人員們多了一種保存、檢索文章的方法,顯著地提升學術界傳遞文獻資源的有效性。過去若要將文獻的連結分享給他人,使用期刊網址或是Pubmed ID,都有可能因為網頁改版而使連結失效或產生錯誤,而DOI能夠永久準確地保存文獻,化解了眾多研究人員的長期困擾。

數據共享會造成利益衝突嗎?

從大方向來看,整個學術界的發展仰賴的是知識共享,現在所有的科技突破都源於過往的累積,稱”現今研究人員是站在過往巨人的肩膀上”也不為過,畢竟,又有誰能宣稱自己是從來不需要任何前人研究成果的? 但話又說回來,以相同領域中的學術研究環境來看,往往經費有限、職位緊缺、研究人員數量逐年增長,研究人員所面臨的競爭是前所未有的激烈,合作與共享成了奢侈品,競爭才是現在的主流。 所以,為什麼還需要數據共享? 理由一:你不得不承認,在這個需要曝光率和存在感的年代,共享數據也代表著提高知名度,共享數據可以讓你成為更多文章的貢獻者甚至是共同作者! 理由二:數據共享很可能推動你所在領域的發展,互助合作共同研究的情況下,很有可能產生雙贏(多方受益)的局面,也可能比一個人埋頭研究更有機會將你的學術研究生涯推向另一個高峰。 理由三:以整個研究領域資源整合的角度來看,數據共享能夠避免研究上許多不必要的重複性,進而節省經費用在需要的刀刃上。 數據共享的潛在問題? 想分享,卻不是自己所能決定的事 許多研究機構和研究項目在提供研究經費之初,都以具法律效應的條款明訂研究成果和數據的歸屬,哪些能夠被出版、哪些屬於研究機構或出資機構。 如何分享數據 要分享研究數據,其實是很簡單的,表格、網站或鏈接,但具體操作時,要如何確保數據的保密性和數據規範性? 小心被挖牆角 不是沒有發生過,文章還在同儕審查階段,數據內容已經被公開到網上。問題在於,有心人士防不勝防,你又多清楚你的研究數據是怎麼被處理的? 分享部分數據 在分享數據時,應該提供相應的指導說明,如果在只能共享部分數據的情況下,應該詳細解釋清楚這是哪一部分的數據,以免數據被不當操作造成誤解或誤用的情況。

標準形同虛設,不如出版所有論文!?

標準形同虛設,不如出版所有論文!? 學術出版的審查門檻,說白了就是信任兩至三位匿名的同儕,能夠公正、客觀、全力以赴的對論文進行審查,整個審查流程中,每個環節都有其薄弱之處,全憑個人的誠信度來維持總體的科學誠信。 同儕審查以如此角度來審視,本質上賦予了研究人員極大的信賴,體制能運作至今,不得不承認學術研究人員已經比很多其他的領域更具榮譽感和自我約束能力了!但也正是因為同儕審查相對於人類社會其他眾多的體制,是沒有絕對標準和規定的,缺少了明確的獎懲和仲裁,就產生了許多〝旁門左道〞...,近年出現的吸金歛財期刊、學術不端醜聞、被出版的虛假論文和同儕審查圈等,都再三的引起大眾對於同儕審查體制的質疑,再高尚再榮譽的體制,標準形同虛設時,還有什麼存在的意義? 每次的醜聞都是學術研究界的傷 被期刊揭發或撤回的各種消息一傳出,媒體爭相報導後,醜聞一次又一次的玷污了曾經讓科學研究人員引以為傲的同儕審查體制。尤其是關於以下情況的醜聞… 逐年增加的出版論文撤回數量 各種專門利用同儕審查中薄弱環節的惡性行為 完全虛構的研究數據、研究結果、研究論文和同儕審查評論 漸漸幻滅的過程 被醜聞和各種來自社會大眾討乏之聲給淹沒的眾人,也對各種論文撤回原因、研究結果爭議開始杯弓蛇影、充滿猜忌: 這篇文章被撤回了,那麼同一個研究團隊過往的研究論文呢?是否也有類似錯誤? 期刊好像誤打誤撞才發現了的學術不端行為, 那麼還有多少是沒被發現的? 如果此一期刊審查流程不嚴謹或是出版論文有誤,是否代表同一出版商旗下的其他期刊也有類似問題? 正是因為社會大眾已經有如驚弓之鳥,而學術研究人員又想不出更好的方式來改善現行的同儕審查體制,於是呼籲廢止同儕審查的聲音開始越演越烈:〝如果同儕審查的科學誠信盡失、標準形同虛設,還阻礙出版的速度,那何不直接廢止審查,出版所有論文算了?〞…

你該不該選擇自我典藏?

你該不該選擇自我典藏?什麼是自我典藏? 早在去年的文章中就介紹過自我典藏(Self-Archiving)的概念,簡單的說就是開放取閱運動中的綠色模式,將出版於任何期刊的文章,自我進行典藏於開放獲取的線上資料庫中,以達成開放取閱的目的。這樣說完,或許還是有點太抽象,下面具體的分析一下自我典藏的優缺點: 1.     即時可用性 對於不少研究人員而言,受眾和讀者能越快獲得研究成果的資訊當然是越好的,當學術期刊出版過程出現滯後的情況時,若是能直接自我典藏到網上提供給豈不是個好方法?聽起來是個多麼簡單的做法,只要建立一個網站,將你的資料上傳於雲端伺服器上,然後提供一個下載的鏈接就好!當然啦,實際情況是有更多與程序性和法律性相關的問題需要決定… 2.     應該自我典藏哪個版本? 你可以分享預印版本或是等最終出版版本確定後再典藏。在預印版中,自然就不會有同儕審查、編輯等重新提交後的最終格式。 3.     所有權與著作權 一般在出版後,你會與期刊出版商有著關於著作權的協議,此時你需要認真了解期刊的政策。很可能期刊不會給予你自我典藏的權力,尤其是較大型出版商時常不允許不論是預印版或是最終版的典藏,但也有期刊特別允許自我典藏於私人網站,若有不清楚之處,建議研究過期刊政策之後與期刊編輯進一步詢問。 4.     自我典藏的吸引力在哪? 即時可用性雖說是自我典藏的最直接的好處,但不少研究人員來說,更重要的是對於不少開放取閱期刊收費不斐做出的反擊。這樣一來,研究人員的心血結晶可以在不用付費訂閱的情況下直接被讀者取閱, 就能夠增加讀者數量,提昇研究人員的聲望,還可以透过搜索引擎最佳化來提升頁面的訪問量,…

數據分享,你贊同嗎?

2014年初,PLOS的數據分享新政策公布,政策中要求期刊中出版所有文章都要將其數據公開分享,學術領域中的各種正反辯論至今仍在持續中,眾多觀點各有各的理「別人若是分享,那我才願意分享」、「科學領域還是有競爭關係的,如果有人不勞而穫怎麼辦?」、「聽著是好事、真正要實施還是早了點吧」。 綜合整理了所有論點,在學術領域中幾乎可以說是對於此政策初衷皆十分認同,對於執行方式、執行時機、科學分享成熟度等技術性問題更多的受到爭議。 對科學領域的好處 科學研究本身最重要的特性就是可複製性,一個可複製的成果才是有意義的、可稱之為科學研究成果的,數據分享很大程度的提供了研究成果的可複製性,與此同時,分享還大量減低科學領域作為一個整體所重複花費的時間和金錢;此外,公開的數據可以減低學術騙子出版灌水、不實文章蒙混過關的機會。 對作者的好處? 對研究人員來說,在研究前期,若是一個假說已經被證實,你可以節省大量時間和研究經費進行下一步驟的研究,並且,數據公開分享的文章所獲得的文章引用率遠大於無分享數據的文章,這應該是所有研究人員所樂見的。 [加碼推薦: 數據重複利用的好處] 大家實際的擔憂是什麼? 以長遠角度來看,分享固然好,但不少科研人員所擔心的是研究成果被竊取、被誤、被吹毛求疵找錯誤、失去了著作權、引起研究經費的不良競爭、甚至是違背了研究項目的保密條款等等。 [加碼推薦: 作者權你知多少?] 其實說白了,這就是原則和實際情況之間永遠的矛盾辯論,初衷再美好總有不足之處和鑽漏洞之人,但這不該影響科學研究從業人員作為一個整體尋覓更進步的分享方式。筆者認為,應該支持數據分享,但應該從個人情況出發謹慎入手,這是一個開端、一個循序漸進的過程,到普及且成熟分享之前,還有一段路。   參考資料:…

圖書館探索資源服務初探

檢索是很多研究員做研究工作中每天都會使用的。隨著圖書館系統的不斷更新,在線期刊和開放式數據庫的成熟發展,圖書館的資源檢索服務也面臨著許多的挑戰和新發展方向。今天,我們就來了解一下探索資源服務Discovery Services。 [加碼推薦:WorldWideScience科學搜索引擎] 讀者在使用圖書館資源時會遇到一些問題,例如現有的系統在於管理紙本館藏,在功能上沒有辦法實現數位資源的管理。如果讀者不知道正確的書刊名,資料庫名稱,或是檢索規則,在檢索已知的項目上也會存在問題。 最新的探索服務Discovery Service是提供同時檢索Pre-indexed metadata元數據及資料全文的單一搜尋平台。它與一般整合檢索的差異在於探索服務不會進行即時外部資源檢索,由於探索服務僅僅檢索自身系統中的元數據和資料全文,檢索速度較整合檢索更快。主要的探索服務有EBSCO, Ex Libris Primo Central, Serials Solutions Summon, Innovative…

網路工具讓研究過程輕鬆起來

網路時代對於學者研究過程不啻是一個福音,再不用埋頭於山一般高的書堆尋找需要的文獻,但即便是消除了地域限制和網路保證了資訊普及,也不保證在搜尋引擎上千萬筆關鍵字搜索結果中,頭一個就是你所需要的。如今出版商如雲、作者自由選擇付費取閱和開放取閱期刊,讓調查研究過程有挑戰性!因此搜索過程除了使用正確的關鍵字之外,不同的網路工具和搜索引擎也會有結果上的差異。以下就簡單介紹一些能讓研究過程輕鬆起來的一些工具: 中文論文資料搜索引擎 Google學術搜索:事實上這可以用中文和英文同時搜索,部分論文有全文,但引用前要認真看清楚引用條款,有時候需要作者同意。 台灣博碩士論文知識加值系統:裡面收錄不少台灣博碩士論文,簡單註冊就可以查詢。 CEPS論文圖書館:付費的論文資料庫,有些學校有購買權限,可以直接下載電子檔全文。 科技論文在線:簡體網站,文獻經過專人審查後才允許上線,相對有品質保障。 英文論文資料搜索引擎 PubMed:生物醫學相關論文搜索引擎,提供全文付費或免費鏈接,詳細使用方式見過往文章「PubMed期刊論文搜尋引擎」。 CiteSeerx: 電腦資訊科技相關論文搜索引擎,提供免費論文下載,算是開放取閱的先驅。 Science Direct: Elsevier的全論文搜索網站,免費註冊,部分全文需付費的論文庫,部分學校有付費權限。 Scopus :Elsevier的引用和摘要搜索網站,必須由學校或研究機構註冊後使用,如果沒有權限也可以從作者預覽頁面搜索,對於需要尋找特定論文也很有幫助。…

ASDL數位圖書館

分析科學ASDL數位圖書館是美國國家科學基金會(NSF)資助的幾個國家科學數位圖書館之一,與美國化學學會(ACS)的分析化學分會也有合作關係。此圖書館彙集了許多網絡分析化學資料,有利於化學課程設計和分析化學相關技術的查詢。 不同於其他學術搜索引擎,ASDL的資料都是經過同行專家審核和評分,具有很大的權威性和參考價值;其中每個網路資源都有具體的描述和實用價值分析,內容豐富詳實,可作為培訓、教學和科研的參考,對於在技術一線工作的科研人員和教師都有很大的幫助。 從下方ASDL的主頁截圖可以看到,ASDL主要有技術(Techniques)、應用(Applicationa)、依格式搜索(Resources by Format)、教學資源(Teaching Resources)和JASDL線上雜誌等幾項服務。我們帶您一起看看ASDL的各項功能吧!   技術(Techniques) 技術選項下,可看到所有搜尋結果的都標有作者資訊、同儕審核評價以及簡短的描述。在頁面上方還有該學科的細分類,可以依使用者目的瀏覽進一步內容。另外,ASDL還有很多開放取閱(open access)的技術書籍和數據庫可供使用者參考。   應用(applications) 應用的頁面顯示和技術很相似,但其內容更注重技術層面的資料,例如國家醫學圖書館(NLM)的環境健康和毒理數據庫、由Howard Hughes醫學中心資助的ELISA動畫虛擬實驗室、美國食品藥物管理局(FDA)資助的生化分析方法工業應用指導等。這項資源有利於提升研究者的在分析化學領域上的專業水準,並節省研究時間和精力。 格式搜索(Resources…

SAO/NASA ADS天體物理資料庫

SAO/NASA天體物理數據系統(ADS)是由美國太空總署(NASA)開發,1992年正式公開亮相,目前由Harvard-Smithsonian天體物理中心/Smithsonian天體物理觀測臺(SAO)負責系統運作。 ADS是天文學界最普遍使用的搜尋網站, 對加速全球天文研究發展一直扮演著重要的角色。     ADS有三大書目資料庫:天文和天體物理學、物理學以及arXiv電子資料;共有970多萬筆資料。其中大多數的文獻摘要都可免費線上搜尋,較舊的文獻一般有GIF或PDF的掃描版本可查看,較新的文章則可連結至該發表期刊的網頁,ADS目前共有超過9400萬的對外連結資源。 ADS主要提供兩種搜索方式,Search或Browse。使用者可以在「Search」選項下進行基本關鍵字搜索;可查的關鍵字包含作者姓名、天體名稱、標題、摘要內容等,搜尋結果一樣可以過濾或分類(如下圖右上角)。另外,查詢結果除了顯示基本的摘要外,右半邊的英文字母可連向其他許多附帶的相關資訊,例如R是reference,C是citation等等,只要把游標移到字母上便可了解其代表意義。     值得一提的是,其中的U指的是Also-read,意思是閱讀該篇文章的人也看了哪些文章;這可幫助使用者了解其他研究人員感興趣的題目是什麼。而S(SIMBAD)以及N(NASA Extragalactic Database, NED)則可提供文中分析的天體的基本觀測資訊,並可繼續連向其他關於該天體的文獻。 「Browse」選項則可依下圖中5項不同方式進行文獻搜尋,可查找期刊文獻、文件掃描檔和書籍等。  …