發佈日期:2017-03-06

人多勢眾? 淺談論文多作者現象

作者:陳明俐

科學計量書目計量學千人作者論文論文共著bibliometricskilo-authored paperco-authorship

文章圖片所有權:https://flic.kr/p/c7V2b,Created by Papa Lazarou
版權適用聲明:姓名標示-禁止改作

前言

2015年5月14日,Physical Review Letters期刊刊登了一篇總計由5,154位作者共同發表的論文,該篇論文文長33頁,但內文僅有9頁,換言之,光是列出5,154位作者的名稱與所屬機構資訊就長達了24頁的篇幅[1]。也因此,千人作者論文的現象再次受到科學計量學界的關注,更產生了kilo-authored的名詞。本文將探討千人作者論文的發表趨勢,以及說明後續衍生議題。

資料來源

本文採取的資料庫為Clarivate Analytics公司(原湯森路透公司智權與科學事業部)旗下的Web of Science,國研院科政中心根據此書目資料建置內部使用的關聯式資料庫,透過資料清整與欄位拆解,以利於後續分析工作。本文以近十五年發表的論文作為研究對象,並限縮論文文體為論文(article)、研討會論文(proceedings paper)、評論(review)、筆記(note)。

分析結果

本文首先分析歷年論文的平均作者人數,從圖1可知,2001年所發表的論文,平均為3.77位作者共同撰寫發表,平均作者數隨著年度持續上升,至2015年,論文平均作者人數已上升至5.45位。顯示單打獨鬥的論文發表現象已非主流,研究團隊的規模不斷擴張,加上各國無不鼓勵國際合作,使得論文發表已成為團隊合作活動。

圖1 歷年論文之作者平均人數

資料來源:Web of Science, STPI整理

本文接著觀察領域差異,以ESI(Essential Science Indicators)領域分布為例,圖2呈現22個領域的論文平均作者數歷年趨勢。與2001年相比,各領域的論文平均作者數皆屬於逐年上升趨勢,其中在2011年,物理學領域的論文平均作者數大幅躍升,平均為8.63位作者共同發表一篇論文,在2012年,平均值更高達11.30位。顯示物理學領域的團隊規模逐漸擴大,且須仰賴更多的合作。在2001年間,論文平均作者數最高的領域為免疫學領域,但至2015年間,物理學領域成為平均作者數最高者,第二名為太空科學,第三名為分子生物學與遺傳學領域。太空科學在2009年起,平均作者數開始超越免疫學領域,在2010年間,更是成為平均作者數最高的領域。觀察2015年論文平均作者數較高的領域可發現,皆是屬於大科學(big science)領域。大科學研究領域的研究經費為鉅額資金,且具有高度跨領域合作的特性,並伴隨著國際合作的參與,就其運作特質來看,大科學不僅是多位科學家或研究人員的集體合作,往往也是各國研究機構的合作,甚至是各國政府科研資金投入或共同補助的型態。最知名的大科學研究計畫為“Larger Hadron Collider”與“Human Genome Project”,前者為大強子對撞機,為歐洲核子研究組織(European Organization for Nuclear Research,簡稱為CERN)主導的計畫,其打造了巨大型實驗儀器(如環形隧道),希望能檢測希格斯玻色子(Higgs boson)是否存在;後者則為人類基因體計畫,由美國國家衛生研究院(NIH)與能源部所主導,試圖辨識人類基因與其序列,以破解人類遺傳相關訊息。二者大科學計畫投入的資源與人力極為龐大,旗下並分有多個研究團隊,團隊之間也會有彼此的合作,故易在學術論文發表上,產生千人作者的現象。

圖2 各領域歷年發表論文之平均作者數

資料來源:Web of Science, STPI整理

圖3呈現歷年發表論文的作者數最大值,從結果可知,目前最高人數的論文為5,154位作者於2015年所共同發表,其次為2011年的論文,為3,220位作者。而在2001至2015年間,擁有最高作者數的論文其所屬領域主要為物理領域,15年中,共有13次為物理領域屬於論文作者數最大值的領域,另外兩次則為臨床醫學與化學領域。且自2009年後,每年均有一篇作者數超過三千人的論文。

圖3 歷年發表論文的作者數最大值

資料來源:Web of Science, STPI整理

接著則檢視近五年的千人作者論文發表情況。在2011-2015年,千人作者論文共計886篇,論文文體主要為期刊論文,共佔99.66%。近五年的千人作者論文數分布如圖4所示,其中以2012年為千人作者論文數最多的一年,該年度共產生了218篇千人作者論文。近五年的千人作者論文其領域分布以物理領域為主,共佔94.58%,其餘則為化學、分子生物學與遺傳學與跨領域。若檢視次領域分布,前五名次領域分別為“Physics, Particles & Fields”, “Physics, Multidisciplinary”, “Astronomy & Astrophysics”, “Physics, Nuclear”, “Instruments & Instrumentation”。

圖4 近五年的千人作者論文數分布

資料來源:Web of Science, STPI整理

圖5為近五年的千人作者論文之作者數分布箱型圖。從結果可知,千人作者論文的規模平均為2,500位作者上下,2015年因CERN的LHC計畫而發表了史上作者數最高的論文,而使得其作者數分布與前四年略有不同。

圖5 近五年的千人作者論文之作者數分布箱型圖

資料來源:Web of Science, STPI整理

衍伸議題

隨著千人作者論文的現象越演越烈,後續引發討論的議題也愈來越多,亦是科學計量學界近年來熱門的研究主題。千人作者論文首先引發的討論為論文作者掛名現象。一般而言,對論文具有實質貢獻者,才能將其列為論文作者,然而何謂實質貢獻?卻仍有領域差異的現象存在。傳統以來的認知,主要是將研究執行者與論文撰寫者列為論文作者,並將主要研究者列為第一作者─往往是執行研究的博士生或是博士後,通訊作者則是該生的指導教授或是該實驗室的計畫主持人,實驗過程中提供數據或是協助儀器操作者,往往僅被列於致謝(acknowledgement)文中。

然而,隨著大科學合作規模越來越巨大,論文作者掛名的定義與掛名的順序也出現變革。如2015年刊登於Genes Genomes Genetics的一篇與果蠅有關的研究之千人作者文章[2],作者數共計為1,014位,其中有超過900位的作者為大學部學生,因此也受到外界質疑─是否人人都有資格被列為論文作者名單中,然而該篇論文的通訊作者則認為,基因體相關研究已是大科學研究的事實,透過眾人的大規模合作有助於研究計畫的執行[3]。另外,像是高能物理領域,由於其實驗規模極為龐大,每項實驗或是儀器操作皆是研究過程中的重要環節。以作者數高達5,154位這篇論文為例,為CERN的LHC計畫中,ATLAS與CMS兩大團隊的首次聯合發表[4],每個團隊的規模都極為龐大,來自數十個國家的研究機構的成員,該篇文章採用以作者姓氏字母(alphabetical order)作為作者排序的依據,第一作者為來自法國的科學家Georges Aad。事實上,這已非Georges Aad第一次被列為第一作者,在其參與的眾多LHC相關研究計畫所發表的論文中,因為作者排序採用姓氏字母作為順序規則,連帶使Georges Aad成為多篇千人作者論文的第一作者[5]。以姓氏字母排序作為作者順序的依據或許為一種公平起見的處理方式,然而在進行個人層級評估時,往往視第一作者的身分為研究人員的重要職涯歷程,顯示該研究員主導或帶領研究計畫的能力,故許多學校在評估教師升等時,會將申請者以第一作者身分發表的論文給予較高的權重計分。若以此案例來說,Georges Aad可獲得多篇以第一作者身分發表的論文。總歸來說,千人作者論文往往會以姓氏字母作為排序規則,導致於無法以作者排序位置作為檢視每位研究人員的貢獻依據。

另外一個議題則是在計算大學的世界排名時,現行的大學排名系統,論文表現的占比極高,各大學的論文發表數或是被引用數累積次數將影響各校排名。泰晤士高等教育世界大學排名(Times Higher Education World University Rankings)在2015年計算大學排名時,首度剔除千人作者論文[6]。換言之,倘若該機構有研究人員作為千人作者論文的作者,該篇論文將不予計算。THE Ranking認為計算千人作者論文恐怕會扭曲真正的世界大學排名結果。舉例來說,千人作者論文往往來自上百個大學或研究機構,而千人作者論文所獲得的被引用次數又極高,部分大學可能會因為校內研究人員參與大科學研究,連帶被列為千人作者論文的作者群,故使得該校所獲得的總被引用次數飆升,推進該校的世界大學排名。針對此現象,或許可在計算書目計量指標時,採取fractional count(分數式計數),而非whole count(全計數)予以解決。然而,千人作者論文一旦採用分數式計算,每個學校或是每位作者的貢獻度將被過度稀釋(如1/5,154=0.0002),因此不論採取何種計算方式,皆有其優缺點。

千人作者論文(kilo-authored paper),或可稱為hyperauthorship (由Cronin於2001年提出[7]),其名詞皆是在呈現現今論文發表的特殊現象,特別是隨著LHC計畫如火如荼地進行著,此現象只會增加而不會消弭。因此,在面對掛名資格與作者排名等議題時,重新檢討個人評估或是機構評估的計算方式勢在必行。許多大型科學研究計畫亦會在其內部指導手冊明確記載論文出版的原則,如前文所提到的以姓氏字母順序作為作者排序依據,或是如Cronin一文中所提到的,生醫領域曾思考以貢獻列表(lists of contributions)取代作者列名的模式。Web of Science亦有團體作者(Group Author)的檢索欄位,根據其定義,團體作者為某一組織或機構以著作者的身分發表論文、書籍、研討會論文或其他形式的出版品。近五年發表量最高的團體作者為LHC計畫下的ATLAS與CMS,以千人作者論文數為例,上述兩個團隊所發表的論文合計就佔了九成以上。

結語

本文試圖初步探討千人作者論文的現象與趨勢,該議題目前為科學計量學界的熱門研究主題。一般來說,論文的作者數與論文的影響力呈正向關係,當論文作者數越多,論文獲得被引用的機率也越高,所累積的被引用數也越高[8]。千人作者的論文在資料處理上可能會被視為離群值而不予計算,但隨著此現象越演越烈的情況下,在進行個人或機構層級評估勢必須考慮此議題對排名計算或是評估過程的影響。而與作者掛名有關的議題,如學術倫理等,在進行規範或撰寫指導原則時,也應考慮此一情境,預先思考千人作者論文若遇到研究不端行為(research misconduct)時,正確處理的原則為何。簡言之,科學研究的合作勢在必行,規模也隨著研究課題的複雜度而逐漸擴大,需正面看待此現象;然而,作者數與論文影響力的關係需重新檢視,相關評估或是作者掛名的準則也應重新檢討,以防範未然。

參考文獻

  1. Aad, G., Abbott, B., Abdallah, J., Abdinov, O., Aben, R., Abolins, M., ... & Abulaiti, Y. (2015). Combined Measurement of the Higgs Boson Mass in p p Collisions at s= 7 and 8 TeV with the ATLAS and CMS Experiments. Physical review letters, 114(19), 191803.
  2. Leung, W., Shaffer, C. D., Reed, L. K., Smith, S. T., Barshop, W., Dirkes, W., ... & Yuan, H. (2015). Drosophila Muller F elements maintain a distinct set of genomic properties over 40 million years of evolution. G3: Genes| Genomes| Genetics, 5(5), 719-740.
  3. Woolston, C. (2015). Fruit-fly paper has 1,000 authors. Nature. Retrieved from http://www.nature.com/news/fruit-fly-paper-has-1-000-authors-1.17555 on 2016/12/29.
  4. Castelvecchi, D. (2015). Physics paper sets record with more than 5,000 authors. Nature. Retrieved from http://www.nature.com/news/physics-paper-sets-record-with-more-than-5-000-authors-1.17567 on 2016/12/29.
  5. Hotz, R.L. (2015). How Many Scientists Does It Take to Write a Paper? Apparently, Thousands. The Wall Street Journal. Retrieved from http://www.wsj.com/articles/how-many-scientists-does-it-take-to-write-a-paper-apparently-thousands-1439169200 on 2016/12/29.
  6. Grove, J. (2015). Is mass authorship destroying the credibility of papers? Retrieved from https://www.timeshighereducation.com/news/mass-authorship-destroying-credibility-papers on2016/12/29.
  7. Cronin, B. (2001). Hyperauthorship: A postmodern perversion or evidence of a structural shift in scholarly communication practices?. Journal of the American Society for Information Science and Technology, 52(7), 558-569.
  8. Tahamtan, I., Afshar, A. S., & Ahamdzadeh, K. (2016). Factors affecting number of citations: a comprehensive review of the literature. Scientometrics, 107(3), 1195-1225.