安全圈 | 专注于最新网络信息安全讯息新闻

首页

介紹

作者 landy 时间 2020-02-27
all

更新2017-9-22

親愛的,團隊合併的截止日期是9月30日下午23:59(UTC)。

更新2017-9-15

尊敬的參賽者,比賽組織者决定在原來的30000美元獎金池的基礎上新增10000美元的中級獎金,以獎勵那些在9月29日(UTC時間下午23:59)之前付出努力的選手。獎金為:第一名,3000美元;第二和第三名,每隊1500美元;第四到第七名,每隊1000美元。請注意,該獎項是根據9月29日(UTC時間下午23:59)的公共排行榜頒發的。

再次,我們為網頁錯誤預先道歉。

更新2017-9-12

許多參與者為第一個任務發送了關於URL問題的査詢。如果無法打開URL,請嘗試將“ifang.ml”替換為“166.111.7.106”。例如,如果url是“http://ifang.ml:8081/53f439f1dabfaeb22f491c74.html”,請嘗試使用“http://166.111.7.106:8081/53f439f1dabfaeb22f491c74.html”打開它。

由於這個問題,我們决定將截止日期延長到UTC 10月7日24:00。我們將在UTC 10月8日0:00發佈最終測試集。所有參與者必須在UTC 10月8日23:59之前提交最終測試集的結果(最多5次)。囙此,更改團隊的截止日期現在是UTC 10月0日0:00。

感謝您的理解,祝比賽順利!

2017年開放學術數據挑戰賽簡介

近年來,隨著全球學術論文總數超過3億篇,學術研究人員達到1億人,學術數據呈指數級增長。然而,只有3%的學術數據包含語義標注。語義標注資訊的嚴重缺乏,極大地制約了學術大數據的服務能力和產業發展。2017開放學術數據挑戰賽就是在這樣的背景下舉辦的,致力於新增學術資料庫中的語義標注資訊。

由清華大學、微軟研究院、中國工程院知識中心、中國科學院國家科學圖書館主辦,清華大數據產業協會、IEEE電腦學會協辦,2017年開放學術數據挑戰賽旨在通過挖掘學者的描述、研究興趣和學術影響力,創建準確的學術檔案,並探索前沿的學術檔案科技。

根據著名學術資料挖掘系統AMiner.org和微軟學術圖提供的數据集,要求參與者選取學者的個人描述,分析研究興趣,預測論文被引用次數,以便更好地提供相關專家的資訊,評估他們的研究成果,監測一定的科研進展,為學術界呈現學術發展趨勢。

數據提供者:AMiner.org:一個全方位的科學大資料挖掘和深度服務提供者微軟學術圖:一個全新的學術語義搜尋引擎

任務介紹

任務1:選取一個學者的個人資料資訊每個學者的個人資料資訊包括他或她的主頁地址、性別、職位等。隨著互聯網的使用越來越廣泛,與學者相關的網頁比以前多得多,也複雜得多。當前學者的網頁通常包含大量的冗餘資訊。一種潜在有效的學者分析科技是將互聯網上各種來源的學者資訊進行綜合,建立機器學習模型,獲取學者的準確資訊。

任務2:預測學者的研究興趣標籤研究興趣是學者簡介的一個重要組成部分,它不僅表明了學者自己的研究經驗或研究方向,而且可以洞察不同背景的學者對某一研究領域熱點或熱點的關注和敏感度學科的研究趨勢。與第一個任務類似,參與者可以通過綜合互聯網上來自多個來源的大量資訊來確定某個學者的研究興趣。

任務3:預測學者的未來影響力學術影響力是衡量學者在專業理論和科技領域影響力的一種方法。常用的學術影響力評估名額包括論文引文數、期刊影響因數和h指數,其中論文引文數是衡量學術影響力最重要、最直接的名額之一。在這項任務中,參與者被要求根據當前有關學者的學術數據,預測未來一段時間內某一學者論文的總被引次數。

任務描述

要求每個小組利用給定的學者數據完成以下三項任務:

任務1:選取一個學者的個人資料資訊一個學者的名字,組織,以及Google返回的緩存的第一頁的URL,關鍵字是“學者的名字+組織名稱”(靜態頁面,通常顯示10個搜索結果)。參與者可以訪問所有10個搜索結果的連結以及這些頁面上的連結。在這項任務中,參與者需要選取學者個人主頁的URL、其頭像圖片的URL、其電子郵寄地址、性別、頭銜/職位列表以及學者組織的當前位置(國家)。請仔細閱讀任務1的詳細規則。

例子

輸入:學者姓名:嘉威機構名稱:UIUCsearch結果頁面:http://xxx.xxx/xxx.html

輸出:主頁:http://hanj.cs.illinois.edu/(注:從搜索結果中蒐索主頁)pic:http://hanj.cs.illinois.edu/images/hanj_tour.jpg(注:從主頁中蒐索圖片)email:hanj[at]cs.uiuc.edu(注:按照主頁上的格式)gender:m(注:m :male,f:女性)職位:Abel Bliss教授(注:按主頁格式填寫)職位:美國(注:按主頁格式填寫)

注:1。如果學者個人主頁上缺少某些資訊,我們的範本答案中的這些資訊將留空,囙此請不要在您的答案中包含這些資訊。從網頁中選取的資訊需要遵循網頁上的格式。請仔細閱讀以上任務1的詳細規則。

任務2:找到學者的研究興趣標籤給出了學者的論文資訊和合著者關係網絡,要求參與者在學者身上貼上5個興趣標籤。所有候選標籤由組織者提供。

例子

輸入:姓名:韓佳薇

輸出:研究興趣:資料挖掘、資料庫、資訊網路、知識發現、機器學習(注:興趣標籤的順序對結果沒有影響)

任務3:預測學者的未來影響力。參與者在2013年底前獲得學者的所有論文數據(包括論文參攷關係的詳細描述)。請參閱“數據”[需要連結]部分),並要求預測截至2017年6月該學者的總引用次數。

例子

輸入:姓名:韓佳薇

輸出:引文編號:126147